美團技術沙龍第79期:美團搜索/推薦/廣告稀疏模型的端到端實踐
2023年11月25日 14:00 ~ 2023年11月25日 17:30
線上活動
| 關于美團技術沙龍
本期活動由清華大學-美團數字生活聯合研究院和深圳市美團機器人研究院聯合出品,美團技術團隊和美團科協主辦,每期沙龍邀請美團及其他互聯網公司的技術專家分享來自一線的實踐經驗,覆蓋各主要技術領域。
/出品人/
興星,美團高級研究員
2016年初加入美團,從0到1搭建外賣商業團隊及技術體系,應用于外賣/閃購/醫藥的搜索/推薦/品牌展示等多個廣告場景,多次獲得BG業務和技術突破獎。曾在搜狗商業、百度鳳巢任職,早年也曾獲得多項數據競賽冠軍。
| 活動簡介
AI時代,數據、算法、算力是三大核心要素,而算法工程作為運作載體,提供AI能力的業務價值變現。
美團作為一家科技零售公司,很早就在搜索、推薦、廣告方向踐行用AI“幫大家吃得更好,生活更好”,持續打磨算法體系和算法工程系統,以追求極致的用戶體驗。
本次技術沙龍,我們將與大家分享稀疏場景下的算法工程內容,包括訓練、特征、推理三個方向遇到的系統挑戰與取得的階段性成果。
| 日程安排
外部議程
| 分享介紹
黃軍,美團研究員
目前從事深度學習基礎架構工作,曾從事大數據基礎架構工作。
分享議題:《美團搜索/推薦/廣告場景的訓練引擎實踐》
介紹美團通用大規模深度學習訓練引擎的演進過程,關鍵演進技術包括:大規模稀疏參數支持,千億樣本訓練,異構硬件加速,大規模集群部署等。
王敬宇,北京郵電大學教授/博導
從事深度學習模型編譯、加速與分布化的工作,北京市青年英才,主持完成國家級項目10余項。
分享議題:《稀疏模型推理加速在美團推薦系統中的實踐》
在線推薦類模型中算子粒度過小,模型中使用的定制算子往往并未被主流的優化工具支持,這使得TVM等推理加速工具難以對整個模型進行加速,造成模型的對應圖結構零碎,效率不高。本次分享主要介紹報告引擎優化工作,以系統化的方式提供計算圖算力密度的評估機制,以及更多通?的算子融合與替換策略,獲得比手工優化策略更通用的優化策略,已經部署于美團的真實業務,實現了深度學習推理服務加速。
亞劼,美團高級技術專家
曾帶領團隊從0-1建設了廣告特征、模型推理系統,在算法工作流、數據流、模型加速優化有豐富的經驗。
分享議題:《美團外賣廣告特征平臺實踐》
特征、樣本作為算法工作流程中重要的一環,數據質量、數據生產效率直接影響了模型產出的好、快。本次分享,主要介紹美團外賣廣告在算法數據高時效、大規模驅動下,特征平臺的演進,尤其是在超長序列下,特征回溯、特征存儲的解決方案。
玉磊,美團高級技術專家
負責搜推機器學習引擎工作,在GPU加速訓練和推理方面有多年經驗,帶領團隊完成搜推機器學習訓練、推理從CPU到GPU的切換。曾就職于百度鳳巢模型團隊。
分享議題:《美團搜索/推薦推理引擎實踐》
推理引擎是模型應用的核心架構,也是影響模型交付效果的最后一環。隨著模型復雜度的進一步提高,面向稀疏特征場景、以CPU為算力基礎的傳統稀疏模型推理引擎架構,在算力上面臨著巨大的短板;同時,稀疏特征的規模也成為傳統搜推模型采用新硬件進行加速的核心制約因素。本次分享主要介紹美團搜索、推薦采用GPU進行推理加速的新架構,內容主要包括搜推模型的在線學習、稀疏特征加速處理、模型優化、模型分發等推理引擎核心議題。