嘉賓 | 楊洋
撰稿 | 黃顯東
8月6日-7日,??AISummit 全球人工智能技術(shù)大會(huì)??成功舉辦。本屆大會(huì)以“驅(qū)動(dòng)?創(chuàng)新?數(shù)智”為主題,覆蓋“計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、算法與模型、推薦系統(tǒng)、機(jī)器學(xué)習(xí)、智慧金融”等技術(shù)領(lǐng)域。
在《機(jī)器學(xué)習(xí)性能優(yōu)化之路》專(zhuān)場(chǎng)中,滴滴首席工程師楊洋通過(guò)《個(gè)性化推薦在數(shù)據(jù)運(yùn)營(yíng)中的創(chuàng)新應(yīng)用》的主題分享,為開(kāi)發(fā)者分享了機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營(yíng)中的探索應(yīng)用。
數(shù)據(jù)運(yùn)營(yíng)的價(jià)值與挑戰(zhàn)
數(shù)據(jù)運(yùn)營(yíng)離不開(kāi)數(shù)據(jù)體系。在理想的數(shù)據(jù)體系全景中,預(yù)期的主要看數(shù)方式包括數(shù)據(jù)產(chǎn)品、數(shù)據(jù)服務(wù)、數(shù)據(jù)倉(cāng)庫(kù),以及基礎(chǔ)性的臨時(shí)需求。數(shù)據(jù)產(chǎn)品主要用來(lái)支持運(yùn)營(yíng)等非技術(shù)人員的看數(shù)需求;數(shù)據(jù)服務(wù)是通過(guò)API的方式對(duì)接各種各樣的業(yè)務(wù)系統(tǒng);數(shù)據(jù)倉(cāng)庫(kù)是通過(guò)資產(chǎn)化方式,對(duì)有一定技術(shù)能力的人員提供SQL的取數(shù)方式。
完整的看數(shù)過(guò)程中,數(shù)據(jù)運(yùn)營(yíng)是貫穿始終的,一方面可以充當(dāng)溝通渠道,對(duì)內(nèi)指導(dǎo)數(shù)據(jù)建設(shè);另一方面可以告知用戶(hù)我們擁有的數(shù)據(jù)內(nèi)容,持續(xù)向用戶(hù)進(jìn)行培訓(xùn)和宣貫。
在理想的情況下,通過(guò)產(chǎn)品化的方式來(lái)滿(mǎn)足大多數(shù)的看數(shù)需求,這樣便可以將整體的研發(fā)人力從臨時(shí)需求中解救出來(lái),投入到資產(chǎn)化的工作當(dāng)中,從而持續(xù)提升數(shù)據(jù)指標(biāo)。
不過(guò),理想和現(xiàn)實(shí)總是有差距的。在日常工作中,總會(huì)遇到各種各樣的數(shù)據(jù)易用性問(wèn)題或者數(shù)據(jù)一致性問(wèn)題。這些問(wèn)題的背后也是整個(gè)數(shù)據(jù)體系的熵增定律,任何體系的架構(gòu),它在孤立無(wú)外力的情況下,都會(huì)隨著時(shí)間的推移逐步腐壞。
同時(shí),在產(chǎn)業(yè)互聯(lián)網(wǎng)的發(fā)展階段也為數(shù)據(jù)運(yùn)營(yíng)帶來(lái)一些新的挑戰(zhàn)。從生產(chǎn)視角上看,多數(shù)業(yè)務(wù)場(chǎng)景正處于線上化探索期的產(chǎn)業(yè)互聯(lián)網(wǎng)會(huì)導(dǎo)致數(shù)據(jù)迭代頻繁。從消費(fèi)視角來(lái)看,產(chǎn)業(yè)互聯(lián)網(wǎng)的整個(gè)組織架構(gòu)也更復(fù)雜多元。這兩個(gè)視角都會(huì)造成多樣化和個(gè)性化的看數(shù)視角。
此外,傳統(tǒng)的數(shù)據(jù)運(yùn)營(yíng)推廣和培訓(xùn)的方式,也面臨時(shí)效性差、延續(xù)性差和針對(duì)性不足的痛點(diǎn),這些都會(huì)對(duì)運(yùn)營(yíng)效果產(chǎn)生影響。
個(gè)性化推薦的探索落地
那如何基于個(gè)性化推薦技術(shù)來(lái)解決數(shù)據(jù)運(yùn)營(yíng)的挑戰(zhàn)和痛點(diǎn)呢?
要解決這些問(wèn)題,首先要對(duì)數(shù)據(jù)運(yùn)營(yíng)的目標(biāo)場(chǎng)景做一個(gè)特點(diǎn)分析。典型的數(shù)據(jù)運(yùn)營(yíng)場(chǎng)景可以分成三大類(lèi):第一類(lèi)是用戶(hù)冷啟動(dòng)場(chǎng)景,占比大概為20%,例如新人入職、業(yè)務(wù)變化、組織調(diào)整等;第二類(lèi)是內(nèi)容冷啟動(dòng)場(chǎng)景,占比60%,例如數(shù)據(jù)線上化或者分析功能迭代;然后通過(guò)數(shù)據(jù)運(yùn)營(yíng)的手段觸達(dá)用戶(hù);第三類(lèi)場(chǎng)景是常態(tài)化的運(yùn)營(yíng)場(chǎng)景,通過(guò)常態(tài)化的運(yùn)營(yíng)手段,持續(xù)提升業(yè)務(wù)的數(shù)據(jù)化運(yùn)營(yíng)程度,以及實(shí)現(xiàn)一些運(yùn)營(yíng)經(jīng)驗(yàn)的復(fù)用。
通過(guò)目標(biāo)場(chǎng)景的特點(diǎn)分析,可以得出一些典型的特點(diǎn)。從內(nèi)容方面上來(lái)看,數(shù)據(jù)內(nèi)容推薦可以使用OneDate的指標(biāo)體系,實(shí)現(xiàn)更高程度的規(guī)范性和結(jié)構(gòu)化。從推薦用戶(hù)的角度來(lái)看,數(shù)據(jù)內(nèi)容推薦可以針對(duì)性的獲取企業(yè)內(nèi)部用戶(hù)比較規(guī)范完整的組織架構(gòu)信息。從推薦目標(biāo)上來(lái)看,數(shù)據(jù)內(nèi)容推薦更加關(guān)注準(zhǔn)確性,同時(shí)消費(fèi)成本也更高。
基于以上分析,可以構(gòu)建出數(shù)據(jù)內(nèi)容推薦算法的設(shè)計(jì)思路。對(duì)于用戶(hù)冷啟動(dòng)場(chǎng)景可以使用組織架構(gòu)的熱度信息,構(gòu)建一個(gè)的推薦的策略;對(duì)與內(nèi)容冷啟動(dòng)場(chǎng)景可以基于OneDate+指標(biāo)血緣的content-based推薦,對(duì)內(nèi)容和用戶(hù)實(shí)現(xiàn)精準(zhǔn)的雙向匹配。對(duì)于常態(tài)化的推薦可以基于用戶(hù)行為策略+業(yè)務(wù)階段方向,實(shí)現(xiàn)高可控和高可解釋性的推薦策略
有了初步的算法設(shè)計(jì)思路,可以基于此將一個(gè)全周期的數(shù)據(jù)運(yùn)營(yíng)系統(tǒng)落地。具體包括三方面:首先根據(jù)算法實(shí)現(xiàn)一個(gè)具備用戶(hù)生命周期策略和推薦策略的數(shù)據(jù)服務(wù)推薦引擎;其次是打通觸達(dá)渠道,對(duì)郵件、辦公軟件等實(shí)現(xiàn)智能觸達(dá),并提供手動(dòng)觸達(dá)作為補(bǔ)充;最后是對(duì)前面的兩個(gè)能力做工具話(huà)和產(chǎn)品化的封裝,以服務(wù)更多的場(chǎng)景。
機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營(yíng)領(lǐng)域的未來(lái)規(guī)劃和展望
未來(lái),機(jī)器學(xué)習(xí)在數(shù)據(jù)運(yùn)營(yíng)領(lǐng)域也會(huì)有廣闊的發(fā)展空間。短期內(nèi)產(chǎn)生價(jià)值的可以基于業(yè)務(wù)線、主題等個(gè)性化搜索排序,進(jìn)行數(shù)據(jù)檢索工具的集成,可以更高效地幫助用戶(hù)找到數(shù)據(jù)。
基于數(shù)據(jù)推薦反向指導(dǎo)數(shù)據(jù)建設(shè)這個(gè)發(fā)展方向還需要進(jìn)一步探索。在數(shù)據(jù)建設(shè)的整體決策階段,可以預(yù)先使用推薦來(lái)預(yù)估潛在的用戶(hù)量和潛在的訪問(wèn)量,為數(shù)據(jù)建設(shè)提供相對(duì)數(shù)據(jù)化的量化參考。此外在內(nèi)容設(shè)計(jì)和可視化方面,也可以根據(jù)數(shù)據(jù)化的分析來(lái)提供更加科學(xué)和數(shù)據(jù)化決策指導(dǎo)。