“量化一切”移動大數據伴你左右
原創 IT技術給我們帶來最大的變化就是從PC轉向移動設備,比如在2012年第四季度,每天通過移動設備訪問Facebook的人數首次超過了通過PC訪問的數量。同時,智慧城市的建設當然也離不開“移動”這個主題。在我們實施的智慧城市系統中,無一例外都要建設無線城市門戶,要求所有的智慧系統提供手機客戶端系統。
移動互聯網產業發展迅速,據工信部相關數據,移動互聯網用戶超過4億,相關產業規模超過9000億元,中國已經成為第一大智能手機和平板市場,潛力巨大。
需求方的轉移 促使移動大數據快速發展
過往幾年,是移動大數據上升的階段,各行各業對數據的需求越來越強烈,同時對數據的質量要求也越來越高、越來越靈活。
TalkingData CTO肖文峰表示:移動大數據市場發展很快,在2014年上半年的時候,我們需要出去找客戶談需求。但是2014年下半年,很多客戶拿著需求來找我們。同時,我們已經組建專門獨立的數據采集、數據計算、數據存儲、數據挖據、以及數據可視化的團隊。
市場開始要求大數據公司的研發體系具備很靈活的資源配置以應對業務需求。對于過去的大數據公司而言,其研發團隊一般是按照產品線區分的,有通用統計分析產品線、有特定行業的運營分析產品線、有廣告監測產品線以及數據的產品線,這些產品線都是互相獨立的,每一塊配制相對獨立的資源,互相之間缺乏共享。
為了應對移動大數據市場靈活的變化,數據公司的研發團隊開始向功能模塊服務化的方向遷移,從數據采集SDK、數據收集、數據初加工,再到數據的可視化都成為服務模塊。
移動大數據的要求更高
本質上來講,移動大數據和PC大數據的技術棧應該是差別不大,但是服務等級不同。移動大數據有多樣性的特征,比如通過手機收集的數據與PC端不一樣,PC端上沒有傳感器,但是智能手機上有位置傳感器、有加速度傳感器、有光感、有聲音、有磁場等,這些信息都是對用戶的刻畫,給移動大數據帶來新的價值。
另外,移動數據也具備實時性的特征,比如地理位置信息是不斷變化的,有衰減的特性,需要數據不斷更新,以拿到最新的用戶畫像。
正因為移動數據具有多樣性和實時性的特性,所以才導致數據在量級和復雜度上比PC端上大很多,對數據的處理性能也要求更高,其技術架構也會面臨更多壓力。
移動大數據的新戰場:SDK
針對移動大數據來說,絕大部分行業和公司還沒有重視傳感器信息,比如廣告精準投放,位置信息再加上操作系統信息是現在的普遍做法,這與真正的“精準”還存在距離。對于移動大數據的“精準”,應該與智能手機用戶的場景關聯起來,應適應景應人,所謂沒有場景就談不上精準。
對此,TalkingData帶來了場景感知SDK。這個SDK能做什么事兒?它可以將用戶手持智能手機時的步態數據,例如靜止、走路、跑步或駕車等,通過API的方式提供給App訪問。這樣一來,App就可以知道用戶當時是在飯店吃飯,還是在健身房健身。另一方面也提供地理圍欄的觸發功能,讓開發者能判斷用戶地理位置相關的場景,比如用戶是否是快要到家了。通過場景感知,App可以對用戶有更清晰深刻的認識。
對于一些O2O的App來說,場景感知可以決定在什么時候推送什么樣的功能、內容和服務。比如上班的路上,在咖啡廳附近推送一杯咖啡的優惠券;下班的路上經過花店,推送一束鮮花的優惠。基于場景,功能和服務的轉換率和效果會大大增高。
TalkingData CTO肖文峰:TalkingData始終聚焦于移動大數據,我們希望通過各種各樣的數據把智能設備后面那個人刻畫出來,刻畫的越細越好,越細價值越大。
#p#
做務實的移動大數據團隊
研發人員,尤其一線研發人員,很容易頭腦發熱,什么熱門學什么,什么熱門用什么,但是學得用的都不扎實。比如,很多工程師簡歷里面都寫著,掌握了各種大數據的技術,實際上深入后可能會發現,他們掌握的其實非常淺,比如能夠部署Hadoop成功,會說自己精通Hadoop。每一項技術,引入都很容易,但是一旦深度使用,就會發現各種各樣的坑,這些都需要對這項技術有很深的了解才可能解決。從MongoDB到Redis,從Hadoop到Kafka,甚至是硬件,在更大量級的數據壓力下,都可能出現新的問題,需要不斷投入資源去應對。
采用何種技術,還需要根據需求來確定。數據變化導致需求變化,需求變化才是技術更新的原因所在,對于大數據,尤其是移動大數據來說,一次次技術的創新才是對數據梳理、整合、拆分以及分析、挖掘最有的放矢的處理辦法。
TalkingData CTO肖文峰:TalkingData技術團隊是一個務實的團隊,從來不會為了引進新技術而引進新技術。同時,我們也是一個開放的團隊,我們團隊會有20%左右的時間做前沿技術的研究,也會定期和技術社區以及硅谷的技術專家作交流和分享,確保我們能夠充分理解新的技術,以準確判斷新技術對業務的影響。
移動大數據的未來
對于移動大數據未來的發展,我們借用一下TalkingData的核心價值來說:用數據去改變企業做決定的方式,用數據去幫助人們了解周圍的環境。
基于這兩點,對于移動大數據需要聚焦在兩個方向上:一是如何讓數據能夠像水一樣高效流動,并加快流動的效率。在移動大數據市場上,線上、線下的數據需求非常強烈,包括數據的提取、加工、交換,需要一個公共的框架能夠成為數據的“水庫“,匯聚從各個不同的數據源流入的數據,并加工成不同質量的”水“,然后提供給不同行業來滿足不同需求。
二是了解周圍環境,這需要對智能手機傳感器進行研究,包括處理傳感器數據的算法。場景化能夠幫助開發者把應用做得更加智能,幫助他們去判斷用戶當前的狀態和目的。如果知道是什么樣的人,在什么時刻做什么事情的話,就能觸發一些更有針對性的功能、服務和內容,提升用戶體驗。
世界的本質就是數據,萬物皆可被數據化——而移動互聯網時代為此提供了更加可行的方案。過去,只有客觀世界才能用數據描述,實現定量分析的目標,而現在,大數據甚至可以描述人類精神、社會行為等主觀世界。移動大數據,將通過“量化一切”來實現數據的無處不在!