大數據行業洞察:未來2-3年或迎數據時代的真正高潮
從2012年的“用戶標簽”到2014年的“用戶畫像”,從2015年的“大數據”到2017年的“人工智能”,大數據正在從神壇走向現實。
- “標簽”到“畫像”,代表著數據在數量和維度上,逐漸在豐富;
- “大數據”到“人工智能”,表明從原始數據到本體認知的過渡。
- 無論是數據積累的量變到質變,還是數據到認知層面的過渡,大數據已經開始在一些特定領域和場景下為客戶解決實際問題,創造價值。
本文將從產業鏈、市場、誤區、挑戰四個部分對大數據市場現狀以及下一步的發展提出自己的觀點與洞察。
產業鏈
在2017年初的時候,根據產業的發展我將2016年認為的產業鏈中四個環節壓縮至了兩個,即數據服務平臺提供商和數據解決方案提供商。

(圖片說明:實際的產業鏈以及2018年可能的演進)
通過過去一年的觀察發現,雖然市場上確實以這兩種角色為主體,但在具體項目中,這二者并沒有形成上下游產業鏈的局面。在一些行業市場中,數據服務平臺提供商向前跨越,直接面對行業客戶,向他們提供其所擁有的外部數據(往往本身就擁有海量的2C數據入口,可以源源不斷地生產2C數據)的粗加工產品(如用戶的標簽數據等);而在另一部分行業市場中,數據解決方案提供商,基本使用用戶自身的數據,通過數據處理服務,為行業客戶提供某個方向的解決方案。
上面兩個角色之間基本沒有合作、沒有交集,很少在市場上直接競爭。
究其原因,個人認為有兩個方面。一個是市場的成熟度決定的,還有一個就是由法律或者說政策環境決定的。
首先,這是由市場的成熟度決定的。目前行業應用市場還處于早期,部分行業用戶的需求集中在外部數據的簡單加工層面,還沒有滲透到行業縱深,與行業的核心業務沒有形成深度耦合,對數據服務提供商還沒有很深的行業經驗要求;另一方面,現階段大多數“解決方案”提供商,基本采用客戶自身的數據,依靠數據處理能力為客戶提供數據集成服務。現在的“解決方案”提供商,大多還停留在數據服務的層面,并沒有大量應用外部數據的經驗,與行業的深度需求耦合還遠遠不夠,自然也沒有形成“殺手”級的產品,行業的可替代性很強,與數據服務平臺提供商的能力差異并沒有充分表現出來。這些,都從不同程度,反映了市場發展成熟度不足的問題。
其次,數據的交易目前在我國還是一個敏感的話題。雖然數據服務平臺提供商擁有海量的2C數據,可如何與第三方合作,為行業客戶提供他們所需要的解決方案,還是個無法觸碰的禁區。6月1日生效的個人隱私安全法(下面簡稱隱私法),只說明了“干什么”不行,但并沒有規定“如何做”才是可以的。而這個“如何做”才行的體系,需要經過幾年時間的建立才可能完成。法律環境的滯后,也限制了行業的進一步發展,資源將進一步向掌握數據的巨頭集中。雖然這樣做便于管理,數據集中在幾個巨頭手里好監管,不會產生隱私數據滿天飛的亂象,但缺點也是顯而易見的。數據無法打通,就會形成一個個信息孤島;數據無法流動,就使數據應用受到很大局限。這一點,恐怕是監管部門最應該盡快解決的問題。
百行征信的出現從某一個角度說明了解決這個問題的必要。

(圖片說明:實際的產業鏈以及2018年可能的演進)
上圖的上半段就是現在實際的產業鏈情況,而下半段是根據現在市場發展的態勢。我認為2018年可能會出現的演進。隨著大數據被應用到各行各業,大多數行業的數據準備并不充分,數據基礎薄弱。要想使數據產生價值,發揮更大的作用,勢必需要大量的數據歸集與治理,這就是數據優化商的角色。由于增量市場的出現,僅靠現有的解決方案提供商和數據服務平臺提供商自身的力量是不夠的,這就為獨立的第三方數據優化商出現,并存在創造了客觀上的空間。所以說,對于大多數行業而言,要想充分發揮數據的價值,首先要從數據的歸集與治理開始,磨刀不誤砍柴工!
另一個會發生的變化,是解決方案提供商將逐漸拉開與數據服務平臺提供商在行業的差距,向行業縱深走,形成差異化的產品和解決方案,成為真正的某一行業的解決方案提供商。而數據服務平臺提供商反而會回縮,專注自己的服務平臺,支撐眾多方向的解決方案提供商以及客戶的需要,逐漸完成與解決方案提供商的上下游產業鏈。
這都是市場在逐漸成熟的標志,分工進一步細化。
市場
經過了過去4-5年的積累,無論在數據上,還是在數據處理技術上,大數據正在某些局部由量變轉為質變。在很多領域和場景下已經可以做出很明顯的效果。或者幫助客戶解決他們的原來解決不了的問題;或者改善原有的方法,提高效率、降低成本;也或者開辟了新的渠道,形成創新的業務模式。
總之一句話,大數據就是生產力!
大數據正在被應用到各個領域。這其中當然有很多亂象,存在著很多“誤解”,但數據思維驅動的數據應用是大趨勢,不可逆轉。
從市場對象來劃分,可以分為大B(商業體,Business)和高成長性行業的中小B。無論是解決方案提供商還是數據服務平臺提供商大多集中在大B領域,如銀行、保險、醫療、教育等。這是由他們的公司體量決定的,必須要做對等體量,且確定性較高的市場,才可能保證固定的產出,這是正確的。
除此之外,另一個群體,高成長性中小B也非常值得關注。高成長性行業雖然有很多不確定性,尤其是在現在的經濟環境下,中小企業甚至很難生存,但也不是完全沒有機會。就在人們普遍認為BATJ壟斷下的互聯網很難有新貴出現,但這幾年依然出現了今日頭條、滴滴。所幸,我就在2016年抓住了出行行業(Uber、易到等)的機會,依靠大數據的反刷單解決方案在這一領域迅速地打開局面,并發展壯大,形成了每年數千萬的業務。
這就是高成長性中小B的魅力。首先它增長迅速,也會帶動生態鏈上的其他企業快速增長,想象空間很大;其次,中小B本身沒有很復雜的決策鏈,決策周期很短,一般2-4個月,比較容易試錯,這對于初創團隊是非常關鍵的;再者,高成長性中小B在高速發展中,不可能完全依靠自己的力量解決所有的問題,這就為建立生態鏈創造了客觀的土壤。這一點,在去年9月參加的一次大數據峰會上,聽到了興業金服的一位負責人也表達了類似的觀點。
大數據不同于以往的IT項目,不能單純地以甲乙方的形式存在,已經超出了傳統的建設和被建設的關系。取而代之的,是一個合作共贏,長期共存的生態鏈。
由于資源(外部數據)的局限,客戶不可能通過服務提供商的一次建設,就能夠完全掌握并獨立運營。時代的發展也不允許客戶有時間去慢慢消化、學習、獨立運營所有的系統,他們必須要引入數據服務合作伙伴,整合雙方的資源,而迅速地形成生產力。社會的成熟,分工進一步細化,“TIME to Market”決定了你沒必要也不可能每一件事兒都自己去做。行業客戶將注意力更好地聚焦在自己的主業上,而數據部分,會依賴數據合作伙伴來一起參與,共同經營。
所以,客戶對外部數據合作伙伴的訴求,是“外部數據”+數據處理”(包括數據處理系統以及數據處理能力)+“數據融合”(這并不等同于數據處理,主要側重于數據應用;不但需要數據服務提供商具有豐富的數據應用經驗,還需要數據服務提供商具有豐富的行業經驗,即真正的數據解決方案提供商)。
誤區
在幾年的數據應用實踐中,發現了很多誤區。
- 一是很多客戶認為大數據就等于買數據,在應用的過程中生搬硬套;
- 二是對大數據的不切實際的預期,要么是將其神話,要么就對應用的過程缺乏耐心;
- 三是認為有很多數據就應該能馬上產生價值,但實際情況是數據準備不足,基礎薄弱。
誤區一:大數據等于買數據
很多行業客戶最初對外部數據的認知是從購買外部數據開始。無論是用戶畫像,還是做其他用途的數據。客戶還延續了IT建設的思維,認為所缺的只是外部的數據。有了外部數據,依靠自身的力量也完全可以完成大數據在所在行業的應用。別人搞大數據做用戶畫像,就也來畫像;別人提大數據能精準營銷,那也來搞精準營銷。并沒有從認知層面建立數據思維,對大數據有一個全面的有高度的理解。這種生搬硬套的做法也從某種程度上導致了數據應用效果不好的局面,沒有真正將數據發揮其應有的價值。
外部的數據應用是屬于跨域的數據應用,需要很強的專業性。這一工作既需要了解市場上各類數據的屬性,也需要了解如何將數據加工才能滿足行業的需求。并不是每個數據都能為行業的某個需求做出明顯效果的;也不是經過一次的采購就能完成的事情。也許,三五年后,當外部數據種類穩定且成熟,行業內部自身的數據專家也可以主動地去選擇外部的數據,依靠自身的力量完成與內部數據的融合,去滿足業務的需求;但在今天,可能更多地還要依賴外部專業數據團隊的幫助。
誤區二:大數據是萬能的
在外部數據應用的過程中,還有一個主要的誤區就是對數據應用的不切實際的預期。要么是將大數據、人工智能神話,要么就對數據應用的過程缺乏耐心。
首先,大數據本身是一門技術,它與其他技術一樣都有著它的局限;大數據不是萬能的,但是數據思維是可以創造很大價值的。
其次,外部的數據產生的業務場景與行業不同,因而在使用的過程中,就要仔細甄別,不斷調整。距離行業需求越近的數據質量越高,做出的產品就越好。但無論多近,外部數據始終是外部數據,其產生的環境與行業的需求大多不會100%契合,所以就需要專業數據團隊的進行加工、處理,經過幾個輪回的迭代才可能取得好的效果,要有足夠的耐心。
誤區三:有大量的數據就馬上能產生價值
有很多行業用戶,依靠多年的積累形成了大量的數據。他們認為有大量數據就能馬上產生價值。先不說這些數據的維度和質量能產生多大價值,首先面對的是大量的數據格式混亂,數據字段不一致,要想發現其價值就如從雜草堆里挑出一根針。
對于大多數行業客戶而言,首先都面臨數據的歸集與治理的工作,磨刀不誤砍柴工。
無論是“大數據等于買數據”,還是對“大數據是萬能的”,還是“有大量數據就能產生巨大價值”都反映了數據應用在大數據在行業的應用尚屬初級階段。
挑戰
數據缺失
盡管大數據已經經歷了五六年的發展,數據無論在維度上還是數量上都已經比幾年前有了很大的改變。但是客觀上講,還沒有達到質的飛躍。由于相關的法律建設沒有完成,大量數據被滯留在少數流量入口處,形成了一個個數據的孤島。還沒有形成數據的有效打通、流轉,更談不上創造新的價值。
我依然堅持2017年初的判斷,數據僅在局部市場,特定的場景已經成熟,可以為客戶創造很大的價值。但還沒有辦法形成規模化市場,這是由于數據發展的成熟度決定的。
數據的缺失,并不能靠高明的算法彌補。這與統計模型,大數據還是人工智能都無關系。只能面對這一現實,去尋找先期成熟的市場,盡可能地立足現在的數據以及算法幫助客戶解決他們的實際問題,創造價值,形成商業閉環;同時積極地關注其他市場的成熟。數據應用市場與其他早期市場并沒有不同,都是由點及線,最后再到面的。這是個螺旋上升的過程,沒有捷徑可循。
數據思維的建立
與數據的缺失相比,一個更大的挑戰在于數據思維的建立。我們正在經歷一個從IT到DT的跨越的時代。大數據、機器學習、人工智能都是這一跨越中的工具。但不幸的是,很多用戶甚至從業者還是沉迷于技術本身,把大數據等同于一個普通的技術,沒有上升到數據思維。
數據思維絕不只是技術部門的事情,而是整體戰略的問題。數據思維要滲透到每一個部門,每一個環節,用數據去輔助決策,讓數據去重構業務流程,數據應用才能發揮其最大的價值。只有將數據思維貫徹到企業的每一個環節中,數據才能真正轉化成生產力,數據的價值才能真正得以體現。
大數據技術是戰術,而數據思維是戰略。
2017年,產業格局越來越清晰。無論是數據服務平臺提供商,還是數據解決方案提供商,都在正確的方向上走出了堅實的一步,其價值已經得到了各自市場的認可,進入了良性的循環。雖然,我認為大數據的真正高潮還未到來,短時間內還處于投入大于產出的局面,但曙光在前,已經在一個量變到質變的積累過程當中。隨著技術和數據的進一步成熟,隨著行業的深入,相信不遠的未來(可能是2-3年)將會迎來數據時代的真正高潮!