助你所在團(tuán)隊(duì)走上大數(shù)據(jù)路途的六大規(guī)則
原創(chuàng)【51CTO.com原創(chuàng)稿件】大數(shù)據(jù)概論
“大數(shù)據(jù)”是近兩年來(lái)各界最熱議的話題之一。那么大數(shù)據(jù)究竟是什么?
據(jù)我個(gè)人理解,大數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)(Structured Data)和非結(jié)構(gòu)化數(shù)據(jù)(Unstructured Data)。數(shù)據(jù)來(lái)源包括傳統(tǒng)交易如企業(yè)ERP、財(cái)務(wù)、CRM系統(tǒng)和潛在海量的數(shù)字來(lái)源如網(wǎng)頁(yè)、移動(dòng)應(yīng)用用戶行為、教育視頻點(diǎn)播和媒體資源。
由于“大數(shù)據(jù)”的熱點(diǎn)集中和可以處理海量數(shù)據(jù)如大規(guī)模并行計(jì)算(massively parallel computing)、云計(jì)算、Hadoop和MapReduce。因此,Oracle、IBM、微軟、SAP和其他大廠家目前共同在推動(dòng)相關(guān)對(duì)話。但光談技術(shù)解決不了中國(guó)非500強(qiáng)企業(yè)所面臨的行業(yè)競(jìng)爭(zhēng)和混亂。這些企業(yè)已了解轉(zhuǎn)型的必要性和緊迫性,關(guān)注的話題包含集合傳統(tǒng)數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)產(chǎn)生的洞察和如何形成研究問(wèn)題。當(dāng)然非500強(qiáng)企業(yè)也了解B744引擎放不進(jìn)拖拉機(jī),所以偏向先建立扎實(shí)的數(shù)據(jù)分析基礎(chǔ),優(yōu)化用戶體驗(yàn)。
我也堅(jiān)信大數(shù)據(jù)確實(shí)帶來(lái)新業(yè)務(wù)機(jī)遇,但目前更關(guān)注數(shù)據(jù)如何驅(qū)動(dòng)企業(yè)實(shí)際價(jià)值。本文將分享Countly與客戶合作所獲取的經(jīng)驗(yàn)。
大數(shù)據(jù)的六大規(guī)則。
從Countly累計(jì)的經(jīng)驗(yàn),我整理了一些規(guī)則適合“小”和“大”的數(shù)據(jù)領(lǐng)域。當(dāng)你開(kāi)始你的大數(shù)據(jù)路途,這些規(guī)則將會(huì)幫你縮短學(xué)習(xí)曲線,并獲得更大的價(jià)值:
1、在早期階段,先建立數(shù)據(jù)燈塔再考慮大數(shù)據(jù)。
好好規(guī)劃你的數(shù)據(jù)項(xiàng)目。在最初期,建議“失敗快,但往前跌”(fail faster while failing forward)的規(guī)劃。不要花24個(gè)月搭建海量的大數(shù)據(jù)環(huán)境,后期再發(fā)現(xiàn)這是你***的錯(cuò)誤。
你可以相當(dāng)快開(kāi)始采集數(shù)據(jù)、建立非完善的數(shù)據(jù)倉(cāng)庫(kù)和做數(shù)據(jù)分析。這種組建可稱為數(shù)據(jù)燈塔,先關(guān)注三大趨勢(shì):
- 發(fā)現(xiàn)以前未知的走勢(shì)或關(guān)鍵驅(qū)動(dòng)因素
- 摸索異常的記錄
- 理解數(shù)據(jù)中的相關(guān)性
覆蓋率有可能不完善,但獲取一些立竿見(jiàn)影的成果和指引后期的擴(kuò)展。關(guān)鍵是一開(kāi)始得考慮規(guī)劃擴(kuò)展性和靈活性的選擇。
2、建立大數(shù)據(jù)思考。
Avinash Kaushik,一位數(shù)字分析的專家,倡導(dǎo)采用框架的數(shù)字營(yíng)銷計(jì)量模型確保數(shù)據(jù)分析項(xiàng)目針對(duì)公司最重要的業(yè)務(wù)(請(qǐng)查看Avinash所整理的以下例子)。此外,你必須與高層有共識(shí),不需太細(xì),但在一頁(yè)面總結(jié)明確的業(yè)務(wù)目標(biāo)與實(shí)現(xiàn)。
數(shù)字營(yíng)銷核心指標(biāo)
當(dāng)你通過(guò)數(shù)據(jù)燈塔掌握這些數(shù)據(jù),你所獲取的見(jiàn)解將帶給你驚喜。你對(duì)企業(yè)的影響將是巨大的,因?yàn)樵诤芏嗥髽I(yè)還沒(méi)集合傳統(tǒng)數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)。
3、如果大數(shù)據(jù)思考比大數(shù)據(jù)技術(shù)更重要,那么在技術(shù)方面我們又能做些什么呢?
當(dāng)你的公司使用免費(fèi)的用戶分析平臺(tái),如Google Analytics或友盟,你的數(shù)據(jù)將是產(chǎn)品,為廠家建立附加值(如谷歌Adsense)。由于虛擬商業(yè)模式抄襲是市場(chǎng)最隆重的贊美,自部署或在私人化的部署越主流以保障數(shù)據(jù)安全和靈活融合數(shù)據(jù)。
讓我們繼續(xù)討論數(shù)字?jǐn)?shù)據(jù)解決方案。由于你需要評(píng)估成本、二次開(kāi)發(fā)靈活性、可擴(kuò)展性、數(shù)據(jù)所有權(quán)和性能,可考慮開(kāi)放的平臺(tái),如Countly用戶行為分析平臺(tái)和其他推薦數(shù)據(jù)可視化和其他實(shí)用的Javascript軟件。
4、先追求正確的時(shí)刻獲取數(shù)據(jù),而不是實(shí)時(shí)數(shù)據(jù)。
另外,建議你先徹底了解你的公司目前如何組織數(shù)據(jù),然后把數(shù)字?jǐn)?shù)據(jù)融入現(xiàn)有流程。始終目標(biāo)是如何匹配數(shù)據(jù)傳化成見(jiàn)解和洞察。如果實(shí)時(shí)數(shù)據(jù)沒(méi)創(chuàng)造業(yè)務(wù)價(jià)值,你何必投入資源實(shí)現(xiàn)呢?而且你的公司將省很多錢(qián),因?yàn)楹A康膶?shí)時(shí)數(shù)據(jù)肯定不便宜!
數(shù)據(jù)采集過(guò)后,你的公司需要任何人工處理嗎?如果答案是需要,那么你不需要實(shí)時(shí)數(shù)據(jù),你需要正確的時(shí)刻獲取數(shù)據(jù)。如果你有智能或規(guī)則驅(qū)動(dòng)的自動(dòng)化系統(tǒng),那么你可考慮獲取實(shí)時(shí)數(shù)據(jù)的“原材料”。
5、數(shù)據(jù)質(zhì)量差,但還是得做業(yè)務(wù)決定。
我們的目標(biāo)應(yīng)該是盡可能地采集、處理和存儲(chǔ)數(shù)據(jù)。這流程可能不完善,但數(shù)字?jǐn)?shù)據(jù)仍然具有價(jià)值。因?yàn)橄鄬?duì)于任何的傳統(tǒng)來(lái)源,數(shù)字?jǐn)?shù)據(jù)讓你建立最完善的用戶畫(huà)面與傳化。
數(shù)字?jǐn)?shù)據(jù)質(zhì)量確實(shí)有優(yōu)化的空間,如何處理視頻或眼花繚亂的社會(huì)媒體平臺(tái)。但市場(chǎng)不會(huì)等你做這些優(yōu)化,所以開(kāi)始憑數(shù)據(jù)做小決定。記住,即使這些決定將是革命性的,因?yàn)閿?shù)字與傳統(tǒng)數(shù)據(jù)集在好多公司從來(lái)沒(méi)集合!隨著經(jīng)驗(yàn)的累計(jì)和了解數(shù)據(jù)的限制,你將可以做更多附加值的決定。
6、消除噪音比找到信號(hào)更有價(jià)值。
到目前為止,我們查詢的目標(biāo)是從所有噪音摸索有價(jià)值的信號(hào)。以掌握正確的信號(hào),前提包括清晰的研究問(wèn)題、數(shù)據(jù)規(guī)模較小、數(shù)據(jù)集更完整。前美國(guó)國(guó)防部長(zhǎng)DonaldRumsfeld所謂的已知的已知(Known Knowns)和已知的未知(Known Unknowns)。Rumsfeld采用這概念討論反恐情報(bào)的噪音,但也適用于分析和研究(請(qǐng)查看以下模式),做明智的業(yè)務(wù)決定。當(dāng)然,“未知”的象限需要你的公司累計(jì)經(jīng)驗(yàn)才可以比較進(jìn)行有效探討。
已知的已知模式(來(lái)自TextOre)
以建立數(shù)據(jù)燈塔和面臨大數(shù)據(jù)時(shí)代,你必須知道如何消除海量數(shù)據(jù)量的噪音,才可能開(kāi)始尋找信號(hào)。
六個(gè)簡(jiǎn)單的規(guī)則,讓你們革命者遵循,確保,革命成功。
這六條規(guī)則正在解決***執(zhí)行官的問(wèn)題,而不是CIO或CTO。因此,所思考的的問(wèn)題較宏觀。此外,討論大數(shù)據(jù)之前,我建議先建立扎實(shí)的基礎(chǔ),通過(guò)大數(shù)據(jù)思考并搭建數(shù)據(jù)燈塔。
你覺(jué)得以上的框架有價(jià)值嗎?它會(huì)驅(qū)使你改變對(duì)大數(shù)據(jù)的處理方式嗎?關(guān)于以上的規(guī)則,哪一條規(guī)則最實(shí)用?你從經(jīng)驗(yàn)中分享的***的數(shù)據(jù)建議是什么?期待回音!
作者介紹
陳俊勛是Countly的中國(guó)與亞太區(qū)的市場(chǎng)經(jīng)理。Countly 代表一種新類型的互動(dòng)協(xié)作技術(shù),從而為技術(shù)型和非技術(shù)型利益相關(guān)者提供一條求知和創(chuàng)新之路。Countly建立了一個(gè)開(kāi)放的Web和移動(dòng)解決方案,允許公司掌握自己的數(shù)據(jù),回答針對(duì)不同領(lǐng)域需求的問(wèn)題。因此,Countly 的格言相當(dāng)簡(jiǎn)單,“贏在定制” 。如果你有意向分享自己公司在數(shù)據(jù)分析的不平凡之路,歡迎隨時(shí)聯(lián)系 Countly(hello@count.ly)。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】