成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用TensorFlow實現ML模型并調優:每秒可做3億次預測

新聞 機器學習
用 TensorFlow 實現機器學習模型,并使用各種優化技術降低延遲,模型的速度最快能夠達到多少?

[[425184]]

TensorFlow 是目前使用最廣泛的機器學習框架之一,它加快了研究速度,并減少了新模型的生產時間。在一篇論文中,來自原生程序化 DSP 公司 Zemanta 的數據科學總監 Davorin Kopič和工程師 Jan Hartman 展示了將在線廣告生態系統中的大規模機器學習模型轉換為 TensorFlow 框架的過程,并將在 TensorFlow 框架中實現的機器學習模型擴展到每秒超過 3 億次預測。因此,該研究的主要內容是在 TF 中實現模型并使用各種優化技術以低延遲有效地為其提供服務。

用TensorFlow實現ML模型并調優:每秒可做3億次預測

論文地址:https://arxiv.org/abs/2109.09541

該研究使用的案例是線上廣告的點擊預測。在 RTB (實時競價)中,多個 DSP(競標者)通過在網頁的加載過程中實時競標來競爭在線廣告空間。廣告空間是按廣告印象出售的,這使得以市場價值出售虛擬廣告空間成為可能。通過使用機器學習,RTB 還使廣告商能夠最大化其 KPI,例如點擊率 (CTR)。估算廣告的點擊率是 RTB 的核心問題之一,擁有一個好的點擊預測模型非常重要。

在 Golang 中實現的基于自定義邏輯回歸和分解機 (FM) 的模型,其表達能力受限,并且需要手動實現所有學習程序,這些都會減慢實驗速度并限制模型的預測性能。因此,研究者決定采用 TensorFlow 框架,并用表達能力更強的模型替換現有模型。

面臨的挑戰

基于廣告競標這一具體用例,該研究遇到了一些挑戰,共分為實現、服務和優化三個方面。

一方面,為每臺機器配備一個或多個頂級 GPU 的成本會高得令人望而卻步;另一方面,只有一小群 GPU 的機器將迫使研究過渡到基于服務的架構。鑒于這兩種選擇都不是特別可取,而且該研究的模型與其他深度學習領域(例如計算機視覺或自然語言處理)的 SOTA 模型相比相對較小,因此該研究不在生產中使用 GPU 進行推斷。并且由于該研究的模型使用稀疏權重,其用例也不適合 GPU 工作負載。

實現

為了給 TF 模型實現有效的訓練循環,該研究實現和測試了多種方法。高吞吐量在線訓練和在 TF 中服務的案例研究很少,而且文檔往往不夠具體,這迫使研究者必須通讀源代碼和基準原型才能發現實現過程中的陷阱。

TF 提供了一個龐大的生態系統和大量具有 SOTA 算法實現的庫。選擇功能豐富的已有實現非常容易,但是研究者發現這些實現大多未經優化,因此他們決定自己實現算法。TF 具有不同抽象級別的 API,不過,一些 API 雖然易于使用,但通常是效率低下的最底層操作(例如 Estimator API)。研究者最終選擇了 Keras3,因為它是一個圍繞底層 TF 操作的瘦包裝器(thin wrapper),并具備高水平的性能,且易于理解。由于 TF 是一個功能和資源都非常豐富的庫,因此該研究還必須考慮要在其中實現多少機器學習 pipeline。研究者選擇暫時擱置特征轉換和交互,僅實現學習算法——盡管它們是最小的可替換部分,但卻具備最大的改進潛力。

由于 Golang TF 包裝器僅支持預測,因此必須在 Python 中實現訓練循環。腳本通過將其標準輸入作為子進程實現與 Golang 數據 pipeline 的連接。數據以高效的二進制格式發送而無需解析,與 CSV 格式相比,該方法的速度提高了 25%。然后在后臺線程中讀取數據,以防止模型在等待數據時空閑。基于此,該研究實現了在整個訓練 pipeline 中保持高吞吐量。事實證明,高效的輸入和輸出也是低延遲預測的關鍵,該研究通過將所有輸入特征連接到單個張量(tensor)中,顯著減少了在序列化和復制輸入數據上花費的時間。

用TensorFlow實現ML模型并調優:每秒可做3億次預測

服務

研究者發現,由于計算密集型神經網絡的存在,在使用 Golang TF 裝飾器的情況下,DeepFM 模型的 CPU 使用率要高得多。盡管帶來了指標的顯著提升,但將這種方法擴展到 100% 的流量會帶來大量的硬件成本。由于當前全球面臨芯片短缺的問題,這意味代價是困難和昂貴的。

顯然,降低計算成本是很有必要的。然而縮小神經網絡模型規模的同時,也會降低模型的預測性能。在深入研究了 TF 之后,研究者發現如果在計算批處理時增加示例的數量,計算效率會大大提升。這種低線性增長是由于 TF 代碼被高度向量化了,TF 也會產生每次計算調用的開銷,然后將其分批攤銷。考慮到這一點,如果希望減少計算調用的數量,就需要將許多請求連接到一個計算中。

研究者構建了全部包含在一個運行的 bidder 實例的自動批處理系統,以避免網絡調用。由于每個實例每秒鐘接收數千個傳入請求,因此可以保證連接來自眾多請求的計算,創建更大的批次。研究者通過一些批處理線程實現了這一點,這些線程接收來自傳入請求的數據,創建批處理并在批處理完成后初始化計算。計算過程中,每隔幾毫秒即初始化一次以避免超時,因為批處理可能在這個時間窗口中沒有填充。這種實現是高度優化的,將計算調用的數量減少到五分之一,同時將 TF 計算的 CPU 占用量減半。

雖然在批處理器線程沒有獲得 CPU 時間的極少數情況下,會發生請求超時,但只有不足 0.01% 的請求會出現這種情況。研究者觀察到平均延遲略有增加(平均約 5 毫秒),流量高峰時可能會更多一些。因此他們實施了 SLA(服務等級協議)和適當的監控手段,以確保延遲的穩定性。鑒于沒有大幅增加超時的百分比,這些方法仍是非常有效的,也是這一 TF 服務機制的核心。

[[425186]]

本文作者之一 Davorin Kopič

優化

研究者在 TF 中實施的模型最初比定制的 FMs 慢得多,為了尋找加速空間,研究者大量使用內置的 TF 分析器來尋找執行時間最長的操作,并盡可能進行了改進。最常見的是各種冗余的 reshape 或轉換運算。其中一個更有趣的發現是 Adam 優化器比 Adagrad 慢得多 (大約 50%),盡管二者運算數量上的差異很小。分析器顯示,對稀疏權值進行梯度更新需要大量計算時間。這是因為模型的權重是稀疏的 (特征大部分是分類的,因此非常稀疏) ,而優化器沒有考慮到這個事實。

由于用 Adagrad 替換 Adam 意味著深度模型性能的顯著降低,研究者也尋找了其他解決方案:切換到 Lazy Adam 的優化器被證明是非常有效的,因為它可以非常有效地處理稀疏權重問題。結果顯示,其整體加快了超過 40% 的訓練速度,與 Adagrad 相接近。

由于使用了自適應優化器(比如 Adam),這也需要存儲權重矩和方差,每個參數將存儲三個值,將保存的模型大小增加了三倍。然而,這些值實際上并不用于預測,只用于訓練。研究者利用這一點構建了優化過程,去掉了這些值的模型,減少了 66% 的數據量,并降低了內存使用量和成本。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2022-08-01 11:50:47

PySpark流失預測模型

2022-10-31 11:33:30

機器學習參數調優

2020-05-27 11:31:43

Python 開發程序員

2018-02-24 16:15:03

PythonHTTP

2017-04-24 14:39:01

PythonHTTP語言

2022-08-09 13:44:37

機器學習PySpark M數據分析

2012-01-10 14:35:08

JavaJVM

2017-11-24 08:00:06

深度學習TensorFlow預測股票

2017-07-21 08:55:13

TomcatJVM容器

2011-05-20 14:23:01

Oracle調優

2021-03-04 08:39:21

SparkRDD調優

2024-05-07 14:09:54

Meta模型token

2020-11-17 17:28:29

機器學習技術人工智能

2020-01-16 15:13:40

AI預測天氣預報

2021-09-10 16:53:28

微軟瀏覽器Windows

2011-03-10 14:40:54

LAMPMysql

2010-05-24 14:24:27

MySQL查詢

2010-07-19 09:39:53

SQL Server

2011-04-18 13:36:32

數據庫游標

2019-01-23 11:12:42

機器學習機器模型預測工資
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久成 | 台湾a级理论片在线观看 | 99久久精品免费看国产高清 | 亚洲精品乱码8久久久久久日本 | 亚洲精品黑人 | 国产精品久久久久久二区 | 亚洲综合色视频在线观看 | 天天射影院 | 日日噜噜噜夜夜爽爽狠狠视频, | 亚洲精品高清视频在线观看 | 亚洲成人天堂 | 日韩2020狼一二三 | 天天操夜夜骑 | 日本久久一区 | 狠狠操狠狠操 | 毛片a区| www成人免费视频 | 一区二区三区在线 | 国产最好的av国产大片 | 第一区在线观看免费国语入口 | 精品国产一区二区三区性色 | 欧美在线视频二区 | 一区二区在线免费观看 | 日本久久精品 | 日韩一区二区在线播放 | 91成人在线视频 | 91婷婷韩国欧美一区二区 | 99re视频精品 | 天天看天天操 | 日韩精品一区二区三区视频播放 | 久久一级大片 | 亚洲九色| 亚洲综合视频一区 | 伊人二区 | 久久99精品视频 | 国产永久免费 | 久久精品亚洲国产奇米99 | 亚洲看片 | 91精品国产一区二区 | 国产探花 | 一区在线播放 |