數據科學+造型師,顛覆傳統服裝零售業購物方式
原創在購物時,你是否有這樣的煩惱:要么不想去逛街,沒那么多時間;要么商場中的衣服雖然很多,但是中意的沒有幾件;又或者干脆選擇在線購物,可以盯著屏幕眼都花了,合心意合身的衣服沒有幾件,而且效果不知如何……
這可怎么辦呢?有沒有一種可以快速購買到合適的衣服的方法呢?
我們生活在互聯網越來越發達的今天,很多問題都能夠從計算機,從網絡中,從大量的數據信息中找到答案。一家美國的公司Stitch Fix,實現通過數據科學和造型師結合來為用戶挑選商品,并送貨到家免費試用。那么,Stitch Fix是如何做到為用戶精準快速的推薦商品的呢?
在WOT2016移動互聯網技術峰會上,Stitch Fix數據科學總監/前Twitter美國總部技術主管王建強的精彩演講中,介紹了美國下一代購物方式的領頭羊stitch fix的商業模式,Stitch fix顛覆傳統服裝零售業固有的實體店經營的模式,剔除購物中用戶往往最頭疼的”選擇難”的環節。
【講師簡介】
Stitch Fix數據科學總監/前Twitter美國總部技術主管 王建強
王建強,中科大管理科學學士,2008年獲 Iowa State University統計學博士。曾任科羅拉多州立大學(Colorado State University)統計系客座教授,美國國家統計院(National Institute of Statistical Sciences)和美國農業部的聯合培養的博士后,惠普研究院(Hewlett-Packard Labs)擔任高級科學家,推特廣告組數據科學家。現任stitch fix數據科學總監。有多年數據分析及建模經驗,涉及領域有需求預測,供應鏈管理,廣告點擊率預測,廣告排序,推薦算法,統計預測模型。對數據科學教育,互聯網廣告和新興的零售業模式有興趣。
通過Stitch Fix的商業模式看下一代購物方式
2010年10月,Katrina Lake創辦了Stitch Fix。Stitch Fix是一個在線個性化服裝推薦公司,目前擁有上千位業余造型師,他們一般都有比較豐富的時尚界工作經驗,為用戶量身打造衣服。目前,Stitch Fix的產品主要是服裝類的,除了衣服還有飾品,最近又新增了女鞋和孕婦裝以及超小號。未來,Stitch Fix還將增加男裝。
Stitch Fix的工作模式是怎樣的呢?作為一名新客戶,注冊時要填寫個人資料,主要包括:身材、買衣服的顏色偏好、喜歡衣服的種類、以及所能承受的衣服的價位。Stitch Fix根據這些資料,通過推薦算法與造型師結合的方式,幫用戶挑選五件衣服,并將衣服寄往用戶家里,用戶可以試穿后決定買哪些衣服,免費退回哪些衣服。Stitch Fix主要面對的客戶群主要為沒有時間購物的用戶,喜歡新樣式的衣服的用戶,以及追求時尚的人群。
這里有兩大創新:一是,通過基于推薦的電子商務,購物時無需自己瀏覽挑選衣服。而僅需填寫一份資料,Stitch Fix就能自動為您挑選衣服。二是,Stitch Fix在提供服務的時候是通過數據科學或者推薦算法跟造型師結合的方式。
Stitch Fix的四大服務方式
Stitch Fix目前提供的服務方式主要有四大類:訂閱式服務、及時請求服務、基于造型師與用戶關系的服務以及延遲性服務。最普通的服務模式是訂閱式服務和及時請求服務兩種方式。用戶選擇訂閱式服務后,用戶可以每個月或者每個季度收到一盒衣服;選擇及時請求服務,需要先注冊個人資料,有需求時發送請求即可。
此外,Stitch Fix對于基于關系的和有延遲的兩種服務。Stitch Fix主要是想致力于做基于造型師與用戶關系的服務,通過用戶跟造型師建立依賴關系,可以更新對用戶的了解,以此增強用戶的粘度。而延遲性服務是指接收到用戶請求后,經過造型師推薦、倉庫管理,訂單配送等環節后,約7-10天后將衣服送至 用戶手中。用戶在service的時候需要交20塊錢styling fee,如果不買任何衣服就要支付20塊錢styling fee,如果是買一件以上衣服這20塊錢styling fee可以付到衣服里面,另外如果五件衣服全買有七五折。
如何通過數據科學和造型師結合來為用戶挑選衣服?
第一步:根據用戶提供的信息進行首輪篩選,剔除用戶不喜歡的顏色,不喜歡的樣式,最終符合每個用戶需求的衣服大概5000-7000件。
第二步:根據算法進行篩選推薦,挑選一批匹配度較高的衣服,約為50-100件。
第三步:將第二步中篩選出的衣服交給造型師,由造型師進行精細的篩選。
我們這里首先著重說說算法推薦,算法推薦的本質是一個計算用戶和衣服匹配的過程。通過用戶數據以及商品數據,對每個用戶和每件商品計算匹配度。
用戶數據:主要包含結構化數據和非結構化數據。結構化數據是指靜態的用戶數據和用戶行為數據,非結構化數據是指用戶填寫請求,填寫的商品評價等信息。
商品數據:對于衣服來說,主要對其進行特征分類。常見的特征主要包含三類,分別是:衣服的顏色,衣服的圖案,衣服的材質。其他的特征包含:是否有口袋,口袋的位置,真口袋/假口袋等等。
有了用戶數據和商品數據,通過推薦系統來實現推薦商品的功能。這里常見的算法有:邏輯回歸、Elastic net、協同濾波、Factorization machine、LDA(Latent Dirichlet Allocation),NLP和computer vision等。
那么,如何計算用戶和衣服的匹配度呢?
因為用戶數據中包含用戶請求等非結構化數據,對于這些數據的處理離不開人,因為在這方面人遠強于機器。所以,Stitch Fix設計了人機交互系統。在這個系統里是靠推薦算法跟造型師結合起來進行推薦的,算法有比較強的計算能力。有一個用戶Style rainbow,有一個商品Style rainbow,比如要算這兩個rainbow之間的預先距離,普通人是很難在短時間內算出這兩個rainbow之間的預先距離,但是計算機可以很容易做到。另外,造型師在推薦的時候一般會看之前給用戶推薦過哪些衣服,盡量避開跟以前衣服比較類似的。所以,這時可以用計算機來實現,篩選掉一些跟過去推薦的非常類似的衣服。
另外,算法還可以從大規模數據中尋找規律。比如針對某個年齡層,某個收入階層的用戶,他們一般喜歡什么樣的風格,而這個造型師雖然可能會有一些直覺,但是他的直覺不一定是有數據支撐的。所以,在有了數據跟算法后,可以糾正他一些直覺上的錯誤。這些有經驗的造型師會根據直覺進行推薦,例如他看到30歲的用戶住在MN,身材尺寸是多少,他腦袋里面就會浮現出一幅圖,可以立馬想到庫存里面的一些衣服,可能會跟這個用戶比較匹配,這方面其實是個人的一些直覺,這個很難用一些簡單的model來model。另外,造型師也可以與用戶建立個人關系,增加用戶的黏性。
注:本文由王建強于2016年8月,在WOT2016移動互聯網技術峰會主會場《Stitch Fix -- 數據科學+造型師顛覆傳統服裝零售業購物方式》主題演講整理而成。WOT2016大數據峰會將于2016年11月25-26日在北京粵財JW萬豪酒店召開,屆時,數十位大數據領域一線專家、數據技術先行者將齊聚現場,在圍繞機器學習、實時計算、系統架構、NoSQL技術實踐等前沿技術話題展開深度交流和溝通探討的同時,分享大數據領域最新實踐和最熱門的行業應用。了解WOT2016大數據技術峰會更多信息,請登陸大會官網:http://wot.51cto.com/2016bigdata/