成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

千萬(wàn)QPS毫秒響應(yīng):快手?jǐn)?shù)據(jù)中臺(tái)建設(shè)實(shí)踐

開(kāi)發(fā) 架構(gòu) 開(kāi)發(fā)工具 中臺(tái)
本文整理自快手?jǐn)?shù)據(jù)平臺(tái)部,數(shù)據(jù)服務(wù)化中臺(tái)負(fù)責(zé)人倪順發(fā)表的《快手?jǐn)?shù)據(jù)中臺(tái)建設(shè)-大數(shù)據(jù)服務(wù)化之路》的演講。

 本文整理自快手?jǐn)?shù)據(jù)平臺(tái)部,數(shù)據(jù)服務(wù)化中臺(tái)負(fù)責(zé)人倪順發(fā)表的《快手?jǐn)?shù)據(jù)中臺(tái)建設(shè)-大數(shù)據(jù)服務(wù)化之路》的演講。

[[378386]] 

圖片來(lái)自 Pexels

他圍繞數(shù)據(jù)資產(chǎn)服務(wù)化,服務(wù)于業(yè)務(wù)產(chǎn)生商業(yè)價(jià)值進(jìn)行了分享:

  • 第一部分是背景介紹,包括數(shù)據(jù)開(kāi)發(fā)的痛點(diǎn)。
  • 第二部分是介紹大數(shù)據(jù)服務(wù)化平臺(tái),包括平臺(tái)架構(gòu)以及關(guān)鍵細(xì)節(jié)詳解。
  • 第三部分是經(jīng)驗(yàn)總結(jié)和未來(lái)思考。

數(shù)據(jù)開(kāi)發(fā)的痛點(diǎn)

快手是一家數(shù)據(jù)驅(qū)動(dòng)的公司,數(shù)據(jù)扮演了非常重要的角色,而數(shù)據(jù)的生產(chǎn)加工主要依靠數(shù)據(jù)開(kāi)發(fā)工程師,其工作內(nèi)容會(huì)涉及多個(gè)方面。

數(shù)據(jù)開(kāi)發(fā)工程師則首先根據(jù)業(yè)務(wù)需求開(kāi)發(fā)好高質(zhì)量的數(shù)據(jù),通常是結(jié)構(gòu)化數(shù)據(jù)(數(shù)據(jù)表);其次,開(kāi)發(fā)穩(wěn)定可靠的數(shù)據(jù)服務(wù),并通過(guò) API 方式交付給業(yè)務(wù)方使用。

數(shù)據(jù)開(kāi)發(fā)工程師有兩個(gè)痛點(diǎn),這其中包括:

  • 開(kāi)發(fā)數(shù)據(jù)服務(wù)門檻高
  • 重復(fù)開(kāi)發(fā)數(shù)據(jù)服務(wù)

開(kāi)發(fā)數(shù)據(jù)服務(wù)門檻高

數(shù)據(jù)開(kāi)發(fā)工程師除了開(kāi)發(fā)完數(shù)據(jù)表外,通常還需要思考如下問(wèn)題:

①數(shù)據(jù)如何交付:業(yè)務(wù)通常期望使用數(shù)據(jù)接口方式來(lái)使用數(shù)據(jù),而非數(shù)據(jù)表,這會(huì)更加靈活、解耦、高效。數(shù)據(jù)開(kāi)發(fā)工程師因此需要建立對(duì)應(yīng)的數(shù)據(jù)服務(wù)。

②服務(wù)如何開(kāi)發(fā):數(shù)據(jù)服務(wù)有多種形式,通常要求開(kāi)發(fā)工程師有微服務(wù)知識(shí)、服務(wù)發(fā)現(xiàn)注冊(cè)、高并發(fā)等。

③權(quán)限、可用性問(wèn)題:開(kāi)發(fā)完數(shù)據(jù)服務(wù)后,需要考慮權(quán)限問(wèn)題,確保數(shù)據(jù)資源能被安全的訪問(wèn);此外還需要考慮可用性問(wèn)題,要以多種手段保障數(shù)據(jù)訪問(wèn)的穩(wěn)定性。

④運(yùn)維問(wèn)題:數(shù)據(jù)服務(wù)本身涉及多種運(yùn)維問(wèn)題,如擴(kuò)容、遷移、下線、接口變更、服務(wù)報(bào)警等。

以上問(wèn)題都需要數(shù)據(jù)開(kāi)發(fā)工程師去解決。這要求數(shù)據(jù)開(kāi)發(fā)不僅僅是開(kāi)發(fā)出數(shù)據(jù)表,還需要將數(shù)據(jù)表包裝成一個(gè)獨(dú)立的、靈活的、高可用的、安全的數(shù)據(jù)服務(wù)。

這對(duì)于數(shù)據(jù)開(kāi)發(fā)工程師要求很高:除了具備基本的業(yè)務(wù)需求捕獲、數(shù)據(jù)建模、SQL 開(kāi)發(fā)等能力外,還要具備開(kāi)發(fā)高可用、高性能的數(shù)據(jù)服務(wù)能力(包括 Java 開(kāi)發(fā)、微服務(wù)等)。

 

重復(fù)開(kāi)發(fā)數(shù)據(jù)服務(wù)

快手很多業(yè)務(wù)線(如支付業(yè)務(wù)、直播業(yè)務(wù)、賬戶業(yè)務(wù)等),都存在數(shù)據(jù)需求,各業(yè)務(wù)線都做著:

①數(shù)據(jù)同步到線上數(shù)據(jù)庫(kù)和緩存。

②建設(shè)微服務(wù)等開(kāi)發(fā),其中不同業(yè)務(wù)線下,數(shù)據(jù)同步和微服務(wù)通常有很多共同之處,重復(fù)煙囪式的開(kāi)發(fā)意味要重復(fù)開(kāi)發(fā)數(shù)據(jù)服務(wù),造成了人力資源浪費(fèi),而且開(kāi)發(fā)效率低,從數(shù)據(jù)開(kāi)發(fā)到最終交付數(shù)據(jù)服務(wù),需要經(jīng)歷較長(zhǎng)的周期。

 

基于上述痛點(diǎn),我們開(kāi)始建設(shè)統(tǒng)一的數(shù)據(jù)服務(wù)化平臺(tái)。由此開(kāi)啟一個(gè)新模式去解決問(wèn)題。

大數(shù)據(jù)服務(wù)化平臺(tái)

數(shù)據(jù)平臺(tái)本身的定位是一站式自助數(shù)據(jù)服務(wù)平臺(tái)。用戶通過(guò)平臺(tái)來(lái)創(chuàng)建數(shù)據(jù)服務(wù)接口、運(yùn)維服務(wù)、調(diào)用服務(wù)。

平臺(tái)秉承“配置即服務(wù)”的理念:數(shù)據(jù)開(kāi)發(fā)工程師不再需要手寫數(shù)據(jù)服務(wù),只需要在平臺(tái)上進(jìn)行簡(jiǎn)單配置,平臺(tái)便可自動(dòng)生產(chǎn)和部署數(shù)據(jù)服務(wù),從而提升效率。

系統(tǒng)架構(gòu)

大數(shù)據(jù)服務(wù)化業(yè)務(wù)架構(gòu)如下所示,Data Lake 數(shù)據(jù)湖中存儲(chǔ)原始數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)開(kāi)發(fā)之后,形成按主題域組織的數(shù)據(jù)資產(chǎn)。

此時(shí)數(shù)據(jù)資產(chǎn)通常是在數(shù)據(jù)倉(cāng)庫(kù),訪問(wèn)速度較慢,因此需要通過(guò)數(shù)據(jù)加速到更高速的存儲(chǔ)介質(zhì),最后經(jīng)過(guò)多場(chǎng)景服務(wù)接口,服務(wù)于業(yè)務(wù)。

 

在技術(shù)架構(gòu)方面,數(shù)據(jù)接口形式有 RPC 和 HTTP 兩類接口。

RPC 接口不需要重復(fù)建立鏈接,且傳輸數(shù)據(jù)時(shí)會(huì)被高效序列化,適用于高吞吐場(chǎng)景下的微服務(wù),實(shí)現(xiàn)負(fù)載均衡、流控、降級(jí)、調(diào)用鏈追蹤等功能。相對(duì)而言,HTTP 接口傳輸效率低一些,但使用非常簡(jiǎn)單。

關(guān)鍵技術(shù)一:配置即開(kāi)發(fā)

平臺(tái)用戶分為兩類角色:其一是數(shù)據(jù)服務(wù)生產(chǎn)方,其二是數(shù)據(jù)服務(wù)調(diào)用方。數(shù)據(jù)服務(wù)生產(chǎn)方只需要配置,做到“配置即開(kāi)發(fā)”。

配置包括:

  • 數(shù)據(jù)源
  • 數(shù)據(jù)加速到何處
  • 接口形態(tài),訪問(wèn)方式
  • 配置獨(dú)立的測(cè)試環(huán)境,訪問(wèn)隔離的測(cè)試數(shù)據(jù)

當(dāng)配置完畢后,數(shù)據(jù)服務(wù)平臺(tái)便會(huì)根據(jù)配置清單,完成接口的自動(dòng)化生產(chǎn)和部署。

生產(chǎn)和部署完畢后,調(diào)用方在平臺(tái)申請(qǐng)服務(wù)權(quán)限調(diào)用。通過(guò)自動(dòng)化生產(chǎn),達(dá)到配置即開(kāi)發(fā)的目的,從而極大的提升效率。

 

關(guān)鍵技術(shù)二:多模式服務(wù)形態(tài)

數(shù)據(jù)服務(wù)有多種服務(wù)形態(tài),包括:

①KV API:簡(jiǎn)單點(diǎn)查,可以支撐百萬(wàn) QPS、毫秒延遲。這類 API 是通過(guò)模板自動(dòng)化創(chuàng)建出來(lái),支持單查、批量查詢等接口,返回的結(jié)果是 Protobuf (PB) 結(jié)構(gòu)體,從而將結(jié)果自動(dòng)做了 ORM,對(duì)于主調(diào)方更加友好。

典型場(chǎng)景包括:根據(jù) IP 查詢 geo 位置信息、根據(jù)用戶 Id 查詢用戶標(biāo)簽畫像信息等。

②SQL API:復(fù)雜靈活查詢,底層基于 OLAP/OLTP 存儲(chǔ)引擎。通過(guò) Fluent API 接口,用戶可自由組合搭配一種或若干種嵌套查詢條件,可查詢?nèi)舾珊?jiǎn)單字段或者聚合字段,可分頁(yè)或者全量取回?cái)?shù)據(jù)。

典型場(chǎng)景包括:用戶圈選(組合若干用戶標(biāo)簽篩選出一批用戶)。

③Union API:融合 API,可自由組合多個(gè)原子 API,組合方式包括串行和并行方式。

調(diào)用方不再需要調(diào)用多個(gè)原子 API,而是調(diào)用融合 API,通過(guò)服務(wù)端代理訪問(wèn)多個(gè)子查詢,可以極大降低訪問(wèn)延遲。

 

關(guān)鍵技術(shù)三:高效數(shù)據(jù)加速

前面提及的數(shù)據(jù)資產(chǎn),通常是存在于低速的存儲(chǔ)引擎中,無(wú)法支撐線上業(yè)務(wù)高訪問(wèn)流量。因此需要以系統(tǒng)化的方式進(jìn)行數(shù)據(jù)加速。

目前有兩種加速方式:

  • 全量數(shù)據(jù)加速
  • 多級(jí)緩存(部分?jǐn)?shù)據(jù)加速)

全量數(shù)據(jù)加速:從多個(gè)數(shù)據(jù)源攝入原始數(shù)據(jù)(如 Kafka,MySQL、線上訪問(wèn)日志等),進(jìn)行加工建模后,得到數(shù)據(jù)資產(chǎn)。

數(shù)據(jù)資產(chǎn)經(jīng)由獨(dú)立的數(shù)據(jù)同步服務(wù),同步至其他更高速的存儲(chǔ)引擎,如 Redis、Hbase、Druid 等。

數(shù)據(jù)同步支持一次性或者周期性(小時(shí)、天、周等)將數(shù)據(jù)從 Hive 同步至其他存儲(chǔ)中,數(shù)據(jù)同步本身是基于分布式的調(diào)度系統(tǒng),內(nèi)核是基于 datax 進(jìn)行數(shù)據(jù)同步。

大數(shù)據(jù)服務(wù)化平臺(tái)單日同步的數(shù)據(jù)量達(dá)到 1200 億條,數(shù)據(jù) size 達(dá)到 20TB。

 

多級(jí)緩存:大數(shù)據(jù)服務(wù)化平臺(tái)會(huì)使用 Redis、Hbase、Druid、Clickhouse 等方式存儲(chǔ)所有數(shù)據(jù),但是部分存儲(chǔ)如 Hbase 速度可能較慢,針對(duì)熱點(diǎn)數(shù)據(jù)需要使用額外的熱點(diǎn)緩存來(lái) Cache 數(shù)據(jù)。

熱點(diǎn)緩存是多級(jí)緩存,針對(duì)每個(gè) API 接口,用戶可自由搭配組合多級(jí)緩存、靈活設(shè)置緩存策略。

此外,針對(duì)數(shù)據(jù)較大的 API,還可配置數(shù)據(jù)壓縮,通過(guò)多種壓縮方式(如 ZSTD,SNAPPY,GZIP 等),可將數(shù)據(jù)量顯著減少(部分 API 甚至能減少 90% 的數(shù)據(jù)存儲(chǔ)量)。

 

關(guān)鍵技術(shù)四:高可用保障

服務(wù)可用性是微服務(wù)領(lǐng)域內(nèi)的一大核心,服務(wù)的高可用通常需要組合多種手段來(lái)保障。

快手?jǐn)?shù)據(jù)服務(wù)化平臺(tái)通過(guò)多種方式來(lái)達(dá)到高可用的目的,主要包括:

  • 彈性服務(wù)框架
  • 資源隔離
  • 全鏈路監(jiān)控

彈性服務(wù)框架

數(shù)據(jù)服務(wù)是部署在容器云環(huán)境,容器云是快手自研的彈性可伸縮的容器服務(wù),部署在其中的 RPC 服務(wù)會(huì)注冊(cè)到 KESS (快手自研服務(wù)注冊(cè)與發(fā)現(xiàn)中心),供主調(diào)方去調(diào)用,如有離群壞點(diǎn),會(huì)自動(dòng)摘除。

服務(wù)調(diào)用是基于 RPC,全鏈路都有監(jiān)控,包括服務(wù)可用性、延遲、QPS、容器CPU、容器內(nèi)存等情況。

 

資源隔離

資源隔離是可用性保障的常見(jiàn)手段之一,通過(guò)隔離將意外故障等情況的影響面降低。

不管是微服務(wù),還是存儲(chǔ),我們都按照業(yè)務(wù)+優(yōu)先級(jí)(高、中、低)粒度隔離部署,獨(dú)立保障,業(yè)務(wù)之間互不影響、業(yè)務(wù)內(nèi)不同級(jí)別也互不影響。

同一業(yè)務(wù)線內(nèi)可能有多個(gè)不同數(shù)據(jù)服務(wù),通過(guò)混合部署,提高資源使用率。

 

全鏈路監(jiān)控

服務(wù)很難避免出現(xiàn)問(wèn)題或者故障,一旦出現(xiàn)問(wèn)題,及早發(fā)現(xiàn)及早介入是非常重要的。

服務(wù)平臺(tái)構(gòu)建了全鏈路監(jiān)控,包括:

  • 數(shù)據(jù)同步:對(duì)數(shù)據(jù)資產(chǎn)同步至高速存儲(chǔ)的過(guò)程進(jìn)行監(jiān)控,包括數(shù)據(jù)質(zhì)量檢測(cè)(過(guò)濾臟數(shù)據(jù))、同步超時(shí)或者失敗檢測(cè)等。
  • 服務(wù)穩(wěn)定性:構(gòu)建一個(gè)獨(dú)立的哨兵服務(wù),來(lái)監(jiān)測(cè)每個(gè) API 的運(yùn)行指標(biāo)(如延遲、可用性等),客觀的評(píng)估健康度。
  • 業(yè)務(wù)正確性:數(shù)據(jù)服務(wù)需要確保用戶訪問(wèn)的數(shù)據(jù)內(nèi)容和數(shù)據(jù)資產(chǎn)表內(nèi)容是一致的,因此哨兵服務(wù)會(huì)從數(shù)據(jù)一致性層面去探查,確保每個(gè) API 的數(shù)據(jù)一致性。

 

總結(jié)和展望

大數(shù)據(jù)服務(wù)化平臺(tái)從 2017 年演化至今,已經(jīng)支持多類應(yīng)用場(chǎng)景,涵蓋直播、短視頻、電商、商業(yè)化等在線業(yè)務(wù),生產(chǎn)者中臺(tái)等準(zhǔn)在線業(yè)務(wù),運(yùn)營(yíng)系統(tǒng)等偏內(nèi)部數(shù)據(jù)系統(tǒng)等,目前平臺(tái)在線業(yè)務(wù)總 QPS 達(dá)到 1000W,平均延遲在毫秒級(jí)。

對(duì)于準(zhǔn)在線業(yè)務(wù)和內(nèi)部數(shù)據(jù)系統(tǒng),基于 CH、Druid 等多種數(shù)據(jù)引擎,支持多種靈活查詢。

數(shù)據(jù)服務(wù)平臺(tái)支持了多種模式 API,很好滿足了多元化需求。此外數(shù)據(jù)服務(wù)平臺(tái)也支持服務(wù)權(quán)限、API 市場(chǎng)等豐富功能,進(jìn)一步賦能業(yè)務(wù)。

 

大數(shù)據(jù)服務(wù)化平臺(tái)未來(lái)進(jìn)一步發(fā)展方向主要包括:

①貼近業(yè)務(wù)需求:數(shù)據(jù)服務(wù)平臺(tái)本身是為業(yè)務(wù)服務(wù),通過(guò)賦能業(yè)務(wù)而對(duì)企業(yè)帶來(lái)價(jià)值,業(yè)務(wù)本身在不斷發(fā)展,未來(lái)也會(huì)有更多的需求出現(xiàn),因此數(shù)據(jù)服務(wù)平臺(tái)本身會(huì)不斷抽象和沉淀出公共數(shù)據(jù)服務(wù)能力。

②深耕數(shù)據(jù)資產(chǎn):數(shù)據(jù)資產(chǎn)是數(shù)據(jù)服務(wù)之根本,如果沒(méi)有完善的數(shù)據(jù)資產(chǎn)建設(shè),上面就很難構(gòu)建出結(jié)構(gòu)化的統(tǒng)一的數(shù)據(jù)服務(wù),針對(duì)數(shù)據(jù)資產(chǎn)有較多內(nèi)容,包括資產(chǎn)注冊(cè)和審核、資產(chǎn)地圖、資產(chǎn)標(biāo)簽、資產(chǎn)管理、資產(chǎn)開(kāi)放和服務(wù)。

 

大數(shù)據(jù)服務(wù)平臺(tái)的能力建設(shè)會(huì)朝著統(tǒng)一的 OneService 體系前進(jìn)。

主要包括三個(gè)方面:

  • 支持豐富的數(shù)據(jù)源:包括大寬表、文本文件、機(jī)器學(xué)習(xí)模型(模型也是一種數(shù)據(jù)資產(chǎn)),來(lái)構(gòu)建完善的數(shù)據(jù)服務(wù)。
  • 支持多樣取數(shù)方式:除了支持同步快速取數(shù)之外,還支持異步查詢?nèi)?shù)、推送結(jié)果、定時(shí)任務(wù)等多樣化方式,以滿足業(yè)務(wù)多種場(chǎng)景需求。
  • 建設(shè)統(tǒng)一的 API 網(wǎng)關(guān):集成權(quán)限管控、限流降級(jí)、流量管理等于一體,不僅平臺(tái)創(chuàng)建的服務(wù)可以注冊(cè)進(jìn) API 網(wǎng)關(guān),用戶自己開(kāi)發(fā)的 API 也可注冊(cè)進(jìn) API 網(wǎng)關(guān),從而享受已有的基礎(chǔ)網(wǎng)關(guān)能力,為業(yè)務(wù)提供數(shù)據(jù)服務(wù)能力。

作者:倪順

簡(jiǎn)介:本碩畢業(yè)于北京大學(xué),曾就職于 Hulu,從事視頻領(lǐng)域大數(shù)據(jù)研發(fā)工作,包括視頻播放質(zhì)量的數(shù)據(jù)建設(shè)以及基于數(shù)據(jù)驅(qū)動(dòng)的播放體驗(yàn)提升。目前就職于快手,從事數(shù)據(jù)中臺(tái)領(lǐng)域工作,主要負(fù)責(zé)大數(shù)據(jù)服務(wù)化基礎(chǔ)平臺(tái)建設(shè)。目前平臺(tái) QPS 達(dá)到千萬(wàn)級(jí),已經(jīng)支持內(nèi)部多個(gè)業(yè)務(wù),包括直播、推薦、風(fēng)控等,在快手支持 2020 年春晚紅包活動(dòng)中起到重要作用,成功扛住流量洪峰。

編輯:陶家龍

出處:轉(zhuǎn)載自公眾號(hào)壹佰案例(ID:Top100Case)

 

責(zé)任編輯:武曉燕 來(lái)源: 壹佰案例
相關(guān)推薦

2024-07-30 08:54:03

2019-05-28 23:00:45

數(shù)據(jù)中臺(tái)大數(shù)據(jù)開(kāi)源工具

2020-07-07 10:17:24

快手QPS QUIC集群

2023-08-14 07:28:02

2023-11-15 13:36:00

數(shù)倉(cāng)建設(shè)數(shù)據(jù)中臺(tái)

2024-08-13 08:14:55

2023-12-29 13:48:00

數(shù)據(jù)中臺(tái)

2024-10-29 08:09:18

2023-07-04 07:11:30

數(shù)據(jù)分析中臺(tái)

2019-06-19 11:11:21

2024-04-22 07:56:32

數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)中臺(tái)數(shù)據(jù)服務(wù)

2023-10-07 07:35:35

數(shù)據(jù)中臺(tái)數(shù)據(jù)源

2020-06-06 12:37:37

數(shù)據(jù)中臺(tái)Gartner企業(yè)

2022-12-30 11:46:00

數(shù)據(jù)中臺(tái)

2024-06-04 07:29:13

2023-04-07 07:31:17

渠道數(shù)據(jù)

2021-03-31 22:37:03

數(shù)據(jù)中臺(tái)企業(yè)技術(shù)

2024-09-22 10:18:24

數(shù)據(jù)飛輪技術(shù)應(yīng)用

2020-08-19 11:21:14

數(shù)據(jù)中臺(tái)數(shù)據(jù)時(shí)代Gartner

2024-02-22 08:51:46

大數(shù)據(jù)白盒化治理數(shù)據(jù)治理
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 天堂一区在线观看 | 欧美不卡一区二区三区 | 日本亚洲欧美 | 日本精品在线观看 | 精品在线免费观看视频 | 亚洲人成在线播放 | 亚洲午夜精品 | 中文久久| 日韩欧美一二三区 | 99久久久99久久国产片鸭王 | jizz在线看片 | 99精品在线 | 丁香久久 | 日韩中文字幕在线免费 | 欧美黄色小视频 | 日韩一区二区三区在线 | 亚洲中午字幕 | 在线免费观看a级片 | 四虎网站在线观看 | 成人免费观看男女羞羞视频 | 国产欧美精品 | 亚洲成在线观看 | 国产精品无码久久久久 | 在线国产小视频 | 9999久久 | 国产一区二区三区欧美 | 精品免费视频一区二区 | 免费毛片在线 | 久久精品视频网站 | 国产成人一区二区 | 特黄视频 | 精品真实国产乱文在线 | 青春草在线 | 国产精品久久九九 | 久久天天| 亚洲精品一区二区三区中文字幕 | 欧美性大战xxxxx久久久 | 国产成人一区二区三区 | 黄色av观看| 国产精品免费在线 | 国产高清免费视频 |