WOT講師專訪:大數(shù)據(jù)技術(shù)讓你不再錯(cuò)過(guò)約會(huì)女友
伴隨著近兩年O2O熱潮的持續(xù)升溫,互聯(lián)網(wǎng)O2O的觸角幾乎延生到了所有行業(yè)。其實(shí),O2O并沒(méi)有那么高大上,它的紐帶無(wú)非是企業(yè)借助互聯(lián)網(wǎng)轉(zhuǎn)型,滿足消費(fèi)者不斷更迭的需求,打造***的用戶體驗(yàn)。
缺失了大數(shù)據(jù)分析能力就談不上真正的O2O。對(duì)從互聯(lián)網(wǎng)中獲取的海量用戶信息進(jìn)行分析的挖掘,利用標(biāo)簽來(lái)進(jìn)行識(shí)別和精細(xì)化運(yùn)營(yíng),成為走出O2O迷霧的突破口。那么大數(shù)據(jù)與O2O怎樣才能實(shí)現(xiàn)更好的融合呢?在信息質(zhì)量不高的前提下,如何提高O2O基礎(chǔ)信息的精準(zhǔn)度,使用戶獲得更好的體驗(yàn)?zāi)?
帶著這些問(wèn)題,51CTO記者采方到WOT2015“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)技術(shù)峰會(huì)的特邀演講嘉賓美團(tuán)網(wǎng)高級(jí)經(jīng)理任化偉,從技術(shù)的角度一一進(jìn)行解讀。
任化偉,2006年西安交通大學(xué)畢業(yè),早期創(chuàng)業(yè)做汽車(chē)領(lǐng)域的搜索引擎,后續(xù)經(jīng)歷了12530的音樂(lè)搜索和百度的圖片搜索服務(wù),在垂直搜索領(lǐng)域積累了豐富的經(jīng)驗(yàn);離開(kāi)百度后在品眾互動(dòng)做了2年的技術(shù)總監(jiān),對(duì)廣告領(lǐng)域也有較深認(rèn)識(shí);目前在美團(tuán)網(wǎng)負(fù)責(zé)商家數(shù)據(jù)中心的建設(shè);
020的核心是為消費(fèi)者提供便利
任化偉告訴記者,O2O 不僅僅是團(tuán)購(gòu),但團(tuán)購(gòu)可以說(shuō)是發(fā)展最為成熟,人們接受度***的O2組成部分。從“貓眼電影”到“美團(tuán)酒店”再到“美團(tuán)外賣(mài)”,在團(tuán)購(gòu)業(yè)務(wù)的積淀下,美團(tuán)網(wǎng)開(kāi)始全面進(jìn)軍O2O市場(chǎng)。
互聯(lián)網(wǎng)時(shí)代,O2O模式之所以能夠成為下一個(gè)掘金點(diǎn),是因?yàn)槔没ヂ?lián)網(wǎng)進(jìn)行更加充分、完善信息溝通,相較于傳統(tǒng)電B2C/C2C的平臺(tái)架構(gòu)設(shè)計(jì),O20的進(jìn)步體現(xiàn)在它不僅非常重視線下團(tuán)隊(duì)和商家的接觸,還需要將系統(tǒng)資源進(jìn)行有效整合,打通“人-店-商品”間的數(shù)據(jù)關(guān)聯(lián),形成線上線下的交易閉環(huán)這種方式,使消費(fèi)者和商家所獲得的信息實(shí)現(xiàn)***程度的對(duì)等,從而為消費(fèi)者提供便利,并刺激其持續(xù)消費(fèi),使商家盈利。
大數(shù)據(jù)技術(shù)讓O2O基礎(chǔ)信息更靠譜
基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性直接影響著消費(fèi)者的體驗(yàn)。任化偉說(shuō):“我自己也被地圖導(dǎo)航坑過(guò)。一次我根據(jù)導(dǎo)航來(lái)到約定的聚餐地點(diǎn),卻怎么也找不到商家,***在朋友的電話指揮之下才找到地方,這種情況對(duì)用戶的傷害還是很大的”。
基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性是非常重要的,提升基礎(chǔ)數(shù)據(jù)質(zhì)量的道路是艱難的;比如評(píng)估一個(gè)數(shù)據(jù)源的質(zhì)量只有80%,但是上線的質(zhì)量要求是95%;事實(shí)上因?yàn)闃?biāo)準(zhǔn)非常嚴(yán)苛,95%是經(jīng)過(guò)培訓(xùn)之后運(yùn)營(yíng)同學(xué)清洗之后所能達(dá)到的質(zhì)量標(biāo)準(zhǔn);在這種情況下,為了上線這批數(shù)據(jù),就需要人工全部清洗一遍數(shù)據(jù);也就是說(shuō)為了提升15%的數(shù)據(jù)質(zhì)量,需要付出100%的運(yùn)營(yíng)資源,而其中80%的工作是不必要的。
在這種情況下,研發(fā)同學(xué)提出了自動(dòng)化校準(zhǔn)的思路,當(dāng)然前提條件是達(dá)到和運(yùn)營(yíng)同學(xué)清洗后一樣的質(zhì)量效果;具體的過(guò)程,和大家通常判斷一個(gè)信息是否正確地思路是類(lèi)似的,會(huì)經(jīng)過(guò)信息收集、信息清洗、信息關(guān)聯(lián)、信息決策這幾個(gè)步驟;不同的是,我們面臨的是判斷海量信息的正確性。
信息校準(zhǔn)是一個(gè)持續(xù)不斷的過(guò)程
大數(shù)據(jù)技術(shù)不是***的,在信息不完整時(shí),人工也很難判斷。比如你從不同渠道獲取了兩條門(mén)店信息,兩條信息的門(mén)店名稱是一樣的,地址是兩個(gè)相鄰的街道,距離偏差一千米;你是原意相信其中一個(gè)渠道的信息搞錯(cuò)了呢,還是原意相信物理世界上是存在兩家門(mén)店呢?如果是五***大酒店,相信大家都會(huì)判斷其中一個(gè)信息錯(cuò)了,如果是沙縣小吃呢?如果不到實(shí)地勘察一下,估計(jì)很難判定。
如果我們獲取了更多信息,比如我們獲取了上述例子中門(mén)店的遷址信息,并且地址也能匹配上,就可以對(duì)兩條信息給出一個(gè)明確的判斷;所以校準(zhǔn)是隨著信息不斷完善而逐步迭代的過(guò)程;另外客觀上也存在著商家不斷開(kāi)展、遷址、倒閉的過(guò)程,所以信息校準(zhǔn)也是一個(gè)持續(xù)不斷追求和物理世界保持同步的過(guò)程。
WOT大數(shù)據(jù)技術(shù)峰會(huì)上將分享我們踩過(guò)的那些“坑”
外行人在看待技術(shù)時(shí),往往會(huì)產(chǎn)生一種高大上的“錯(cuò)覺(jué)”,而實(shí)際上,真正涉及到業(yè)務(wù)層面的流程和機(jī)制設(shè)計(jì)時(shí),往往是非常瑣碎的,而且在沒(méi)有經(jīng)驗(yàn)的前提下,很難做出一些有價(jià)值的思考。
在11月28日由51CTO主辦的位于深圳的WOT2015“互聯(lián)網(wǎng)+”大數(shù)據(jù)技術(shù)峰會(huì)(http://wot.51cto.com/2015bigdata/)任化偉將和大家分享他們?cè)谝劳写髷?shù)據(jù)技術(shù)進(jìn)行信息自動(dòng)化校準(zhǔn)中的過(guò)程中的經(jīng)驗(yàn),特別是在數(shù)據(jù)質(zhì)量不高的前提下,他們都踩過(guò)哪些坑,解決方案是什么,最終達(dá)到了什么樣的效果,希望給大家?guī)?lái)一些啟發(fā)。