?盒馬供應鏈算法實戰
一、盒馬供應鏈介紹
1、盒馬商業模式
盒馬是一個技術創新的公司,更是一個消費驅動的公司,回歸消費者價值:買的到、買的好、買的方便、買的放心、買的開心。
盒馬包含盒馬鮮生、X 會員店、盒馬超云、盒馬鄰里等多種業務模式,其中最核心的商業模式是線上線下一體化,最快 30 分鐘到家的 O2O(即盒馬鮮生)模式。
2、盒馬經營品類介紹
盒馬精選全球品質商品,追求極致新鮮;結合品類特點和消費者購物體驗預期,為不同品類選擇最為高效的經營模式。盒馬生鮮的銷售占比達 60%~70%,是最核心的品類,該品類的特點是用戶預期時效性高,非常適合盒馬鮮生這種將門店開到用戶周邊的業態。
3、不同供應鏈模式的物流與庫存成本
在考慮使用什么樣的供應鏈模式前,需要均衡物流成本和庫存成本。相同數量的商品,整件物流成本遠低于包裹物流,冷鏈差異更加明顯(暫時不考慮送貨時效和規模效應)。反之庫存越分散,需求不確定性越大,如果不能準確把握消費者需求,就提前將庫存布局在門店,會導致很高的缺貨和損耗,即庫存成本高。
4、盒馬供應鏈網絡
為了實現高效供需匹配,多種業務模式需要有配套的供應鏈支撐,盒馬多種業務模式后端融合,盡量共享干線網絡和庫存,大幅提高資源利用率,提高供應鏈效率。
二、供應鏈算法定位
供應鏈算法本質上是在傳統供應鏈方法上,借助算法和數據的力量提高效率。
1、電商行業供應鏈算法定位
電商行業算法主要分為基礎算法和業務算法。
基礎算法包括圖像、語音、文本等。電商業務算法直觀地分為三種,一、從前端(流量,用戶*商品維度)來說,和視頻網站和資訊網站區別不大,采用搜索、廣告、推薦方法;二、從中端(零售,商品維度)來說,包括商品、價格和庫存等預測與決策算法;三、從后端(物流,訂單維度)來說,包括履約、倉儲、配送等優化算法。廣義的供應鏈算法包括,中端(零售和商品預測與決策)和后端(物流和訂單優化),狹義的供應鏈算法只包括中端算法。
2、零售商供應鏈算法優勢
“牛鞭效應”是指供應鏈上的一種需求變異放大現象,使信息流從最終客戶端向原始供應商傳遞時,無法有效地實現信息共享,使得信息扭曲而逐漸放大,導致了需求信息出現越來越大的波動,此信息扭曲的放大作用在圖形上很像一個甩起來的牛鞭,因此被形象地成為“牛鞭效應”。
零售商是最接近消費者的企業,最能夠感知與把握消費者需求,最有能力通過數據和算法來應對市場波動。
3、盒馬供應鏈算法邏輯
零售本質上是人貨場的匹配。在企業日常運營中,首先公司內部會推出銷售計劃與策略,銷售計劃決定供應,供應能力決定庫存,通過庫存和履約能力決定短期銷售上限,從而對銷售進行調控,下一輪的銷售計劃參考以上歷史信息,實現了完整的商業運行閉環。
三、生鮮自動補貨系統
1、盒馬生鮮自動補貨背景
高品質的商品是盒馬一貫的追求。為了滿足顧客極致的新鮮體驗,盒馬商品的貨架期非常短,甚至還提供僅滿足每日所需的只售一天的日日鮮系列商品,涵蓋牛奶,蔬菜,肉禽等日常消費品類,成為行業標桿。即時的生鮮服務非常切合消費者需求,但是對供應鏈提出了很高的要求。
更短的售賣期,意味著更容易發生缺貨或者損耗,對此,盒馬供應鏈算法根據生鮮零售的特點,考慮天氣、季節性、節假日、商品替代性、營銷活動,線上線下陳列展示等因素,構建了一系列具有盒馬特色的高精度需求預測模型,通過仿真系統優化庫存,實現了高度自動化的訂貨系統,大幅降低人力成本的同時優化了庫存指標。
2、盒馬生鮮自動補貨系統算法模塊
盒馬生鮮補貨系統包括需求預測、庫存模型、動態調控三個模塊。需求預測部分由于數據量比較多,特征處理復雜,工作量占比最大;庫存模型主要目的是平衡用戶需求和庫存成本,實現利益最大化;動態調控針對不符合銷售預期的商品,自動生成營銷活動與流量調控,降低庫存水位,優化周轉與損耗。
3、盒馬生鮮自動補貨系統主要成就
在技術深度和創新上,成功將時空異構圖神經網絡模型引入到商品銷量預測需中,解決了復雜營銷活動信息損失過大等問題,使得預測準確率顯著提升。
從算法效果來說,盒馬預測算法在阿里集團時序預測比賽主要數據集上獲得冠軍和亞軍的好成績,整體準確度高,通用性強。
從業務結果來說,生鮮訂貨系統算法建議采納率穩定在 96% 以上,訂貨人效提升 70%,損耗率降低 30%,缺貨率降低 25%。
行業影響力方面,盒馬集成預測、庫存、價格與調控于一體的算法解決方案,成功入圍 2022 年 Franz Edelman 杰出成就獎總決賽。
4、盒馬銷售預測算法迭代路徑
盒馬銷售預測算法迭代路徑分為簡單模型、機器學習模型、深度時序模型、時空圖網絡模型四個階段。簡單模型貼近業務理解,確保覆蓋全量 SKU;機器學習模型比較穩定,異常值較少,但是大量依賴特征工程,時序擴展性差;深度時序模型不依賴特征工廠,原始時序信息遺漏少,時序拓展性強;時空圖網絡模型考慮商品間的關聯性和跨樣本間的影響等。
5、盒馬銷售預測十大難點
6、時空異構圖神經網絡銷量預測模型框架
在預測時,預測的主要信息是商品銷量,考慮到活動對商品銷量有影響,因此可以將商品和活動建立圖關系;此外,其他對商品銷量有影響的因素也可以納入到圖模型中;對于該模型來說,在每一個時間窗上就構成了一張商品銷量和各種特征的異構圖。在計算過程中,首先利用 GraphSage、GATNE 等算法提取每個時間切片上的圖信息,由此獲取到點的更新信息,往下傳遞獲取到整個時序的信息。在實際應用中,圖信息是輔助信息,主要的信息依然是時序信息;同時,時序模型可以根據不同的場景替換成不同的時序模型。
7、基于仿真的庫存模型
庫存模型主要分為兩部分,首先是單個 SKU 的庫存量,其次是多個倉庫的匯總量問題。新零售獨有的場景,安全保留量是指當線上和線下共享庫存時,線上的顧客是先下單后拿實物,線下的顧客是先拿實物后下單,這樣會發生線上的顧客先下單的貨物被線下的用戶拿走了的問題,由此導致線上訂單無法履約。因此在這樣的場景中,需要通過控制參數,當庫存小于某個值時,線上就不進行售賣,防止發生無法及時出貨的風險。
8、庫存算法系統架構
在進行訂貨量決策時主要分為三步,首先是進行業務目標拆分,根據業務目標和場景差異,確定某個商品是應該側重保缺貨還是保損耗等;第二步是庫存批次推斷,例如我們倉庫中有 10 件商品,其中有 5 件是臨期產品,如果沒有及時訂貨可能會由于臨期產品過期而產生缺貨,因此需要進行庫存批次推斷;第三步最優訂貨量計算,支持各種模型進行訂貨量預估。
9、庫存動態調控系統
由于生鮮商品保質期較短,雖然銷售預測和庫存模型會最大力度提升模型性能,但是依然存在少量商品訂多或者訂少的情況,尤其是訂多的情況會帶來很大的損耗。因此通過建立庫存動態調控系統,實時監控銷量并更新預測結果,進行庫存預警,通過線上促銷活動,APP 流量傾斜、線下門店折扣調整庫存,盡量避免由于庫存積壓產生的損耗。該系統的難點在于流量和價格的聯合調控,需要實現高頻的流量決策和低頻的價格決策全局最優。
四、問答環節
Q1:預測評價標準是什么?
A1:行業通常使用的是加權的 MAPE,即準確率= 1-(商品池的總誤差/總真實銷量)*100%。該誤差是帶有權重的,比如說某個商品真實銷量較大,產生的誤差也大,對于全局誤差貢獻也大,這樣符合業務認知。
Q2:時空異構圖 paper 鏈接?
A2:主要參考了這篇時空同構圖論文思想,結合自身場景,使用了異構圖。Huang Y, Bi H K, Li Z, et al. STGAT: Modeling spatial-temporal interactions for human trajectory prediction[C]//Proceedings of the IEEE International Conference on Computer Vision. 2019: 6272-6281.
Q3:簡單模型使用的是哪個?會用于做其他模型的標桿算增值嗎?
A3:使用什么簡單模型不是關鍵,主要是能夠覆蓋全量 SKU,用于做兜底策略。常見的包括簡單移動平均法,上周同期等。