WOT2016易觀CTO郭煒:大數(shù)據(jù)時(shí)代的數(shù)據(jù)分析攻略!
原創(chuàng)【51CTO.com原創(chuàng)稿件】WOT2016大數(shù)據(jù)峰會(huì)將于2016年11月25-26日在北京粵財(cái)JW萬豪酒店召開,屆時(shí),數(shù)十位大數(shù)據(jù)領(lǐng)域一線專家、數(shù)據(jù)技術(shù)先行者將齊聚現(xiàn)場(chǎng),在圍繞機(jī)器學(xué)習(xí)、實(shí)時(shí)計(jì)算、系統(tǒng)架構(gòu)、NoSQL技術(shù)實(shí)踐等前沿技術(shù)話題展開深度交流和溝通探討的同時(shí),分享大數(shù)據(jù)領(lǐng)域最新實(shí)踐和最熱門的行業(yè)應(yīng)用。
51CTO記者對(duì)即將參加大會(huì)演講的易觀CTO郭煒老師進(jìn)行了專訪,讓我們先睹為快,探聽企業(yè)實(shí)時(shí)分析方面的心得。
講師簡介 :郭煒 畢業(yè)于北京大學(xué),曾經(jīng)在Teradata,IBM,中金工作,后來任萬達(dá)大數(shù)據(jù)部總經(jīng)理、聯(lián)想大數(shù)據(jù)總監(jiān),后加入易觀。在本次大會(huì)上郭煒老師將會(huì)為我們帶來關(guān)于企業(yè)實(shí)時(shí)分析的歷程、實(shí)時(shí)分析解決了企業(yè)的哪些痛點(diǎn)、企業(yè)建立實(shí)時(shí)分析平臺(tái)時(shí)走過那些坑、為什么說實(shí)時(shí)分析是企業(yè)實(shí)施AI的必經(jīng)之路等內(nèi)容的演講。
易觀的特性是分析,具有行業(yè)很多深入的模型。數(shù)據(jù)每個(gè)企業(yè)都有,但是能把分析做好的企業(yè)不多,而易觀正是這不多的企業(yè)之一。數(shù)據(jù)、技術(shù)是需要結(jié)合適當(dāng)?shù)姆治霾趴梢詫?shí)現(xiàn)最終業(yè)務(wù)價(jià)值,在大數(shù)據(jù)時(shí)代先需要把小數(shù)據(jù)做到極致。
在大數(shù)據(jù)時(shí)代數(shù)據(jù)成為企業(yè)的核心,易觀的主要數(shù)據(jù)來源是合作伙伴覆蓋的手機(jī)上的SDK,幫助易觀獲得大量的用戶對(duì)于APP使用的相關(guān)信息,再根據(jù)這些數(shù)據(jù)形成的用戶畫像標(biāo)簽與相關(guān)分析報(bào)告。
大數(shù)據(jù)時(shí)代數(shù)據(jù)安全問題成為了企業(yè)重視的問題之一,易觀的數(shù)據(jù)從采集、加工、展示,每層都有QC(數(shù)據(jù)質(zhì)量監(jiān)控)的規(guī)則和監(jiān)控,同時(shí),易觀也有專業(yè)技術(shù)人員結(jié)合分析師的業(yè)界經(jīng)驗(yàn)給出的邊界模型,通過數(shù)據(jù)治理體系可以針對(duì)279個(gè)領(lǐng)域每個(gè)不同的APP發(fā)生的異動(dòng)合理性進(jìn)行自動(dòng)監(jiān)測(cè)與辨識(shí)并自我交叉驗(yàn)證,以確保每個(gè)指標(biāo)都是精準(zhǔn)的反應(yīng)移動(dòng)互聯(lián)網(wǎng)的一舉一動(dòng)。技術(shù)上,除了網(wǎng)絡(luò)防火墻措施、堡壘機(jī)、token設(shè)置之外,更多的是技術(shù)管理流程和核心數(shù)據(jù)加密,易觀現(xiàn)在也在做一個(gè)更復(fù)雜的加密措施,讓關(guān)鍵數(shù)據(jù)離開了生產(chǎn)環(huán)境很難重新被復(fù)原。
數(shù)據(jù)云化成為趨勢(shì),易觀使用了混合云來實(shí)現(xiàn)自己的大數(shù)據(jù)平臺(tái),大數(shù)據(jù)集群選用了私有云來保證高效處理,產(chǎn)品服務(wù)選用了公用云來應(yīng)對(duì)客戶的迅速增長。云服務(wù)已經(jīng)由過去的IAAS更變?yōu)镻AAS,給企業(yè)提供了更便利的服務(wù)。當(dāng)然,對(duì)于大數(shù)據(jù)等高CPU高IO的服務(wù),目前公有云使用上還需要進(jìn)一步提升,我們也希望未來能有更好的云服務(wù),將我們的底層大數(shù)據(jù)平臺(tái)全部按需購買共有云服務(wù)。
大數(shù)據(jù)技術(shù)其實(shí)在采集、并發(fā)、大數(shù)據(jù)云遷移以及大數(shù)據(jù)Ad-hoc查詢上都遇到過挑戰(zhàn),現(xiàn)在易觀每日數(shù)據(jù)量級(jí)在150億條左右,并發(fā)接收非常頻繁,如何能收發(fā)自如的控制采集端將數(shù)據(jù)有時(shí)效性的上傳到服務(wù)器上,服務(wù)器端如何結(jié)合這樣的高并發(fā)請(qǐng)求,都是有挑戰(zhàn)。特別是在年初做pb級(jí)別的大數(shù)據(jù)遷移時(shí),也遇到系統(tǒng)并行要求每日100億條數(shù)據(jù)要通過互聯(lián)網(wǎng)實(shí)時(shí)復(fù)制到不同的云,也是比較大的挑戰(zhàn),最近解決的技術(shù)難題是怎么高性價(jià)比地在秒級(jí)響應(yīng)百億條數(shù)據(jù)的匯總查詢,前面也有相關(guān)的技術(shù)分享講解如何解決這些問題。
易觀有千帆、方舟、博閱、萬象四個(gè)產(chǎn)品,每個(gè)產(chǎn)品其實(shí)都有它獨(dú)特創(chuàng)新的部分:千帆可以以T+2的方式讓你看到全移動(dòng)互聯(lián)網(wǎng)的動(dòng)態(tài),每個(gè)APP的活躍情況和粘性等等;方舟可以讓你做到對(duì)自身的運(yùn)營分析,用戶從哪里到到哪里去,他們的畫像是如何的;廣告萬象可以讓你在選擇目標(biāo)人群后,選擇哪個(gè)渠道更適合廣告;博閱可以通過分析報(bào)告的方式讓你迅速了解全互聯(lián)網(wǎng)的行業(yè)動(dòng)態(tài)。每個(gè)產(chǎn)品宗旨其實(shí)都是對(duì)大數(shù)據(jù)的一個(gè)落地場(chǎng)景的應(yīng)用,還是那句話,數(shù)據(jù)本身沒有價(jià)值,只有數(shù)據(jù)分析之后才有價(jià)值。
數(shù)據(jù)是一種新能源,易觀一直的目標(biāo)是做數(shù)據(jù)時(shí)代下的煉油廠和加油站,數(shù)據(jù)就像原油,從各方而來,經(jīng)過易觀的處理和分析提煉,可以成為各種汽油、柴油為企業(yè)所用。大數(shù)據(jù)分析我一直非常看好,無論是過去通過人、現(xiàn)在通過算法模型,還是未來通過人工智能,將各種各樣的數(shù)據(jù)變?yōu)橛杏玫闹R(shí),變成機(jī)器與人之間的反饋交互,都是整個(gè)數(shù)據(jù)行業(yè)附加值最高的一部分,也希望更多的企業(yè)加入大數(shù)據(jù)分析的行業(yè),把這個(gè)行業(yè)做的更好。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】