成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

流利說統一可觀察性平臺實踐

開發
隨著 90 年代互聯網的引入,在線教育產品也依托于互聯網誕生。隨著互聯網技術的發展,在線教育產品也開 始了出現新的模式。在線教育從最初單純的文字形式,開始往圖片、音頻方面開始發展。 教育在線化也進一步促進了數據化的發展,內容作為教育企業的核心資產,無論是數據化程度還是數據化規模都在不斷提升。

在線教育行業現狀

隨著 90 年代互聯網的引入,在線教育產品也依托于互聯網誕生。隨著互聯網技術的發展,在線教育產品也開 始了出現新的模式。在線教育從最初單純的文字形式,開始往圖片、音頻方面開始發展。 教育在線化也進一步促進了數據化的發展,內容作為教育企業的核心資產,無論是數據化程度還是數據化規模都在不斷提升。同時用戶使用時長的提升,又為教育 AI 提供了大量源數據。據統計今年 3 月份在線教育用戶日均在線 時長,超過 200 萬天。如此海量的數據為行業的智能化發展提供了良好的土壤,推動了教學內容、課程營銷、師資 管理、質量評估等智能分析的發展。

流利說公司介紹

流利說是世界領先的科技驅動的教育公司,作為智能教育的倡行者,流利說擁有一支業內領先的人工智能團隊,經過多年積累,流利說已擁有巨型的“中國人英語語音數據庫”,累積實現記錄大約 37 億分鐘的對話和 504 億句錄音。

2013年流利說推出了第一款產品“英語流利說”,集成了語音識別、打分和自適應學習等多種核心技術。具有上下文情景對話、發音指導課程等豐富內容,并提供人工智能英語老師和游戲化的學習體驗,為用戶在英語學習中獲得更多樂趣。這款有趣又有效的產品很快就占領了當時的市場并獲得了用戶的高度認可。

但業務快速發展,用戶數大幅度增長,平臺的用戶數量已從當初的百萬級,增長至過億,因此業務的高低峰期數據流量變化、業務復雜度和分析難度都給給 IT 架構帶來了巨大的挑戰。

流利說統一監控平臺的相關挑戰

作為一個沒有單獨運維部門的公司,基礎平臺的統一監控平臺主要由cloud-infra團隊的研發來完成,而團隊的核心訴求也不僅僅是SLA、性能的監控、告警和提供問題定位的相關數據,還包括cloud-infra的技術價值運營,例如利用率、成本節約、業務關系網絡等。在這些核心訴求下,對于統一監控平臺會具高的要求:

1.采集、監控各種異構數據源,包括K8s、ECS上的機器指標、利用率、Istio相關的調用日志、自建中間件相關指標、云服務提供的指標、業務的Trace數據等,此外還要包括各類成本數據的實時采集。
2.各類資源的動態發現與動態采集,包括組織關系等部門相關的數據也需要實時更新,以便能夠實時反饋出最準確的相關指標和歸屬關系。
3.大規模的數據存儲與分析,由于流利說的業務規模大,使用的各類云資源以及業務產生的數據量非常巨大,每天在數十TB,方案需要滿足在此規模上的實時分析和展現的能力。
4.監控平臺負責的是穩定性問題,本身的穩定性也需要做好,因此需要消除各個部分的單點問題,并且具備異常快速恢復的能力。

技術選型

統一監控平臺不僅僅是時序相關的數據,其中非常核心的業務可用性數據需要通過各類日志進行計算和分析,因此整體上需要選擇Logs和Metrics兩種數據方案。對于這兩類數據都分別有不同的社區方案或商業方案,例如ES、Loki、SLS、Prometheus、OpenTSDB、InfluxDB等。最終日志方案選擇了阿里云SLS,時序方案選擇了Prometheus+SLS,主要的原因如下:

1.SLS具備各類數據統一存儲、分析的能力,能夠在SLS上去關聯到Metrics、Logs數據,這是其他平臺所不具備的
2.SLS平臺能夠適應非常大的數據規模,相比ES來說性能要好很多,也是免運維的服務,省去了自己維護ES高可靠的問題
3.時序方案以Prometheus為主,Prometheus的生態非常完善,而且PromQL使用起來也簡介。SLS的時序庫可以作為Prometheus的遠端高可靠存儲,能夠解決Prometheus的可靠性問題
4.SLS的方案中有數據加工的功能,可以和外部的數據源去做Join分析和加工,能夠更好的來處理各種復雜的日志,把日志加上catalog相關的信息

整體架構

當前流利說統一監控平臺的架構如上圖所示:

1.為了能夠實現自動化,我們開發了一套適用于云上場景的IaaS、PaaS資源動態發現的機制,能夠實時將新購買、創建的資源加入到監控、采集中,避免大部分的人工操作

2.日志相關:

不同業務的日志直接通過SLS的Logtail采集到不同的日志庫中
并不是所有的日志都需要長時間存儲和索引,因此我們對于日志進行歸類,對于其中需要有審計需求的,會投遞到OSS上做長期存儲;業務排查問題的日志只保存2周,并開啟全文索引;AccessLog只開啟部分字段的索引,可以節省很多的索引費用。
對于需要計算SLA、PXX指標的NGINX訪問日志,會使用數據加工,配合已經在RDS中存儲的一些映射規則、部門、應用等Catalog信息,將NGINX訪問日志中的URL映射成對應的部門、應用、方法等。

3.監控相關

監控方案選擇了Prometheus,針對于流利說的場景,我們開發了一些Exporter用于從各類云上產品、自建組件中獲取Metrics
同時為了更好的使用Prometheus,和內部的CICD系統集成,我們在Prometheus上增加了一個Sidecar,監聽Git倉庫的變更,并根據變更動態的Reload Prometheus配置
Prometheus上為了提高查詢速度,配置了各類Recording Rule,這些都統一使用Git管理
AlertManager的告警直接對接內部的告警中心,可以做排版、升級等高級功能
為了解決Prometheus單點的問題以及后面和Catalog進行關聯分析的問題,我們使用SLS的時序庫,直接讓Prometheus Remote Write到SLS的時序庫中

4.指標計算

核心指標的計算一部分來源于NGINX的AccessLog,從入口就可以拿到各個業務的QPS、錯誤率、Latency(平均、PXX等),對于業務沒有任何的侵入性
資源利用率、中間件、基礎設施等指標來源于Prometheus寫入的時序庫,基于Catalog可以聚合計算出每個部門、業務的相關指標
計算完成后的指標信息,由于數據量非常小,可以很容易的存儲在MySQL、ES中,并且投遞一份到OSS上備份

相關成果

目前這套監控平臺幾乎承載了公司所有的核心監控,在上線后一直穩定運行,并且在各類活動期間也能夠非常輕松的應對數據量的突增。整體的業務價值主要體現在:

1.監控:監控的第一價值是做各類的監控和告警,尤其是SLA相關,由于將數據已經關聯到了具體的部門和業務應用,可以很容易的得到每個部門、應用的SLA,并進行公司范圍內統一的推進和改進
2.問題排查與故障隔離:基于Istio的訪問日志,配合Catalog信息,可以計算出每個應用的調用關系,因此可以實時的生成業務關系網格,并能夠知道每個關系(邊)的質量情況。了解到業務的關系后,在出現問題的時候也可以快速的定位根源和故障隔離
3.FinOps:在Cloud Infra部門,被挑戰最多的就是開銷問題。因此成本優化也是我們的一個核心工作,主要的做法是:計算每個部門、團隊的資源利用率,包括平均利用率以及各類PXX的利用率(入下表格所示),以此能夠判斷每個部門的資源使用情況,推進各部門優化成本。

流利說統一監控背后的技術

流利說統一監控基于阿里云SLS進行構建,SLS定位為云原生觀測分析平臺,為Log/Metric/Trace等數據提供大規模、低成本、實時平臺化服務。一站式提供數據采集、加工、分析、告警可視化與投遞功能,全面提升研發、運維、運營和安全等場景數字化能力。其中統一監控使用到了多種SLS的核心功能,主要包括:

全方位日志采集

SLS支持Log/Metric/Trace統一采集,支持服務器/Kubernetes/應用/移動設備/網頁/IoT等數據源接入,支持阿里云產品/開源系統/云間/云下日志數據接入,核心特點有:
1.便捷:40+成熟接入方案,多客戶端統一采集,支持內網、公網、全球加速傳輸等多種傳輸方式

2.可靠:阿里經濟體自用基礎設施,歷經多次雙十一,春晚活動考驗。支持斷點續傳,可根據業務流量實現彈性伸縮

3.開放:多協議(HTTP/Syslog/Prometheus/OpenTelemetry)無縫接入,完整對接開源生態

Prometheus時序方案

SLS時序存儲從設計之初就是為了解決阿里內部與眾多頭部企業客戶的時序存儲需求,并借助于阿里內部多年的技術積累,使之可以適應絕大部分企業級時序監控/分析訴求。SLS時序存儲的特點主要有:

1.豐富上下游:數據接入上SLS支持眾多采集方式,包括各類開源Agent以及阿里云內部的監控數據通道;同時存儲的時序數據支持對接各類的流計算、離線計算引擎,數據完全開放
2.高性能:SLS存儲計算分離架構充分發揮集群能力,尤其在大量數據下端對端的速度提升顯著
3.免運維:SLS的時序存儲完全是服務化,無需用戶自己去運維實例,而且所有數據都是3副本高可靠存儲,不用擔心數據的可靠性問題
4.開源友好:SLS的時序存儲原生支持Prometheus的寫入和查詢,并支持SQL92的分析方法,可以原生對接Grafana等可視化方案
5.智能:SLS提供了各種AIOps算法,例如多周期估算、預測、異常檢測、時序分類等各類時序算法,可以基于這些算法快速構建適應于公司業務的智能報警、診斷平臺

實時數據分析

查詢分析提供關鍵詞、SQL92、AIOps函數等多種方式,支持面向文本+結構化數據實時查詢分析,異常巡檢與智能分析。主要特點如下:

1.高性能:秒級分析十億級數據,且完整支持SQL、PromQL等分析接口,HTTP、Kafka、JDBC、Prometheus等協議
2.穩定可靠:企業級設計,多租戶隔離,PB級容量設計,數萬企業用戶選擇
3.智能:經過阿里經濟體實踐的AIOps能力,支持智能異常巡檢與根因分析數據加工

數據加工通過靈活語法,在不編寫代碼情況下支持各種復雜數據提取、解析、富化、分發等需求,支持結構化分析。數據加工的主要特點如下:

1.靈活:提供豐富算子、開箱即用的場景化UDF(Syslog、非標準json、AccessLog UA/URI/IP解析等)??蓴U展語法應對各種復雜格式
2.免運維:全托管云上服務,無須投入額外運維資源。支持自動根據流量彈性伸縮
3.可擴展:支持多層嵌套、分流等邏輯,支持復雜的數據分派與編排需求

在云原生時代,數字化正在各行業推動業務創新。只有提升用戶體驗、加速創新、更新基礎設施與架構、利用好多樣化的數據,才能在整體大環境中脫穎而出。阿里云推出的智能運維平臺,不僅僅是要幫助工程師減少工作量,更多的是希望讓運維工程師們從各種機械化的工作中解脫。我們將會包攬所有的“臟活累活”,讓故障的時間大幅縮小,讓運維人將更多創造力,放在數字創新以及企業業務創新上,為企業提供提供更優的競爭力。

原文鏈接:http://click.aliyun.com/m/1000282429/

責任編輯:梁菲 來源: 阿里云云棲號
相關推薦

2021-11-14 22:14:08

人工智能機器學習工具

2023-06-12 16:45:20

數據管理

2024-06-11 00:11:00

2021-06-06 22:39:48

網絡安全監控網絡攻擊

2021-01-26 09:11:16

數字體驗DEM網絡可觀察性

2022-08-12 06:26:54

微服務架構

2023-08-24 08:00:00

開發Java可觀察性

2023-02-23 19:28:09

ODD測試

2021-06-27 17:18:23

網絡可觀察性網絡網絡運營

2022-07-18 13:37:56

云計算云原生可觀察性

2022-12-29 10:16:12

觀察性系統監視

2025-05-14 18:05:05

DataStream大數據可觀察性

2025-05-07 11:54:05

2024-06-18 10:16:49

2021-09-26 09:50:21

開發技能程序

2023-03-10 14:03:57

2023-03-23 13:48:00

工具應用場景選型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲网站在线播放 | 91视频在线观看免费 | 久久久久国产一区二区三区四区 | 亚洲天堂av在线 | 久久久激情 | 中文字幕91av| 精品国产第一区二区三区 | a级免费视频 | 色妹子综合网 | 亚洲一区二区三区欧美 | 精品国产一区二区三区久久久久久 | 午夜精品一区二区三区在线视频 | 欧美伦理一区 | 亚洲欧美激情国产综合久久久 | 91久久国产综合久久 | 亚洲激情一区二区三区 | 视频在线一区二区 | 别c我啊嗯国产av一毛片 | 91网站在线播放 | 天天视频一区二区三区 | 久久机热| 成人av免费在线观看 | 精品久久久久久久久亚洲 | 国产精品99久久久精品免费观看 | 精品一区二区三区不卡 | 国产日韩欧美二区 | 中文字幕二区 | 久久久91| 黄色一级特级片 | 成人片免费看 | 日韩国产一区二区 | 成人激情视频免费观看 | 日韩一区二区av | 91精品国产91久久久久久 | 国产精品久久久久久52avav | 欧美精品一区二区免费 | 亚洲一区视频在线 | 亚洲精品888 | 在线观看视频中文字幕 | 日本超碰 | 欧美1页|