為什么這兩年,“大數據”談得越來越少了 ...
在最近做數字化項目的過程中,不管是和客戶交流還是看一些項目的技術方案,都發現有一個曾經很火的概念,突然很少出現了。
不錯,這個概念就是“大數據”(Big Data)。
大數據這個詞曾經引領了數字化轉型的第一波潮流,讓人們覺得數據中蘊含著大量的寶藏。對于數據來說,the more, the better,幾乎成為行業鐵律。
暫且不談那個經典的“啤酒尿布”的例子,光5V這個概念就已經成為千萬數字化廠商的堅定價值信條。
于是,很多技術創業項目開始沉迷于對海量數據進行收集和開發,大規模地投入到建設算力中心,建設存儲中心,打造監測平臺等事項中。
然而,在實踐過程中,人們發現“大數據”的價值遠遠沒有達到預期的水平,就像互聯網出現的早期一樣,人們開始滿懷期待,但是并不知道如何變現 ...
僅僅追求數據的規模,并不會讓人們從中得到更多的“實惠”。
同時,由于數據質量良莠不齊,與業務相關性差,導致“大浪淘金”的數據分析模式,浪費了大量的人力物力。
“大數據中,蘊含了跨業務、跨場景的用戶商業洞察,有利于精準決策和業務創新。” 這句話雖然是大數據精神的內核,但是并不好落地。
絕大多數企業,只掌握供應鏈上的一個環節,很難做到跨域關聯。
如果想通過整合廠商的數據資源來開拓新場景,數據服務成本以及和數據服務關聯的商務成本,都是不可低估的。
例如,在支付行業,銀行交易數據和消費側數據如果想達到業財合一,需要服務商、商戶、支付機構多方協調,業務推進十分困難 ...
因此,大數據的實踐思路一般只適合互聯網原生企業,因為這些企業更容易從平臺側逐漸輻射到供應鏈的兩端。
從數據量的角度,平臺側數據量更大,在關于數據融合需求的博弈方面,具有更強的話語權。
反之,對于絕大多數企業,都是非平臺型企業。要么只負責生產,要么只負責銷售。
想要實現跨域的大數據場景,既缺乏專業能力,也缺乏資金方面的有效保障。
當前,還有一種思路是基于開源的大數據來進行“數據場景”強化。這個思路后來驗證也行不通,或者說“投入產出比”不高。
開源的大數據在數據質量上很低,同時與業務的相關性差,這就意味著單位數據投入產出的業務價值非常有限——數據價值密度低。
盡管在學界一直對于開源大數據的建模和分析比較癡迷,營造了一種開源數據價值含量更高的假象,其主要原因還是在于“拿不到”產業數據。
在這種情況下,更多的傳統企業開始反思,應該聚焦于將數據挖深、做透,而不是單純地追求數據規模的大。
如果大數據不能帶來直接有效的價值,那么對于企業來說是負債,而不是資產。
基于上述的這些討論,并不是說大數據不重要,而是說大數據并不適合每一個數字化企業對數據資產的投資。
數據的獲取渠道,已有數據和所需數據的比例,數據的治理效率和開發效率,都是應該慎重考慮的決策門檻。
與其盲目拓展新的數據,去探索難以得到驗證的未知規律,還不如在現有的業務架構中把現有的數據資源規整、加工、治理,先滿足當下的業務需求。
換句話說,大數據是一個數字化企業發展到比較高級階段的任務,對于數字化基礎還不夠強的傳統企業或中小企業,還是應該以傳統數據分析任務為中心開展數據方面工作。