數據創新:數據創新的關鍵成功因素
數據創新的窘境
這是一個真實的案例。
某大型多業態地產集團,其業務涵蓋地產、商業、物業三大領域,同時也在開辟和擴展商業的邊界,在租賃、電商領域也有所試水。對于一個地產項目來說,最重要的一個環節就是在投研階段。在哪里買地,花多少錢買地,買了地蓋什么類型的房子?這三個問題直接決定了一個項目是否能成功。而這么重要的一個環節,過去這么多年,靠的都是以人的經驗為主的決策方法,很難找到一個相對客觀,可度量可描述的投研方法。該企業希望建立數據驅動的投研的體系,所有的一切決策都是有數據支撐的,比如在標的地塊所在地區的經濟發展水平,周邊的消費生態,居民結構,競品情況等。
一個智能投研的項目啟動了,自然語言識別、統計學、數據挖掘加機器學習的多個科技服務公司都蜂擁而至做POC,從政府公開數據、社交數據、歷史交易數據、第三方數據等多方面采集數據,構建消費者畫像,競品畫像,預測沙盤等眾多模型, 希望構建一個全方位的能夠從多維度做銷量預測的投研模型。但是,即使是在POC階段,大家也發現了眾多難以解決的問題:
1、業務目標模糊,領域太寬
這個地段應該蓋什么類型的房子?看上去這個***很清晰,但是拆解后就會發現這個業務目標非常模糊,領域太寬。業務度量的標準是什么?潛在用戶的范圍應該如何界定?是周邊還是全市,還是全省,還是全國?如何利用數據產生比常識更加精準的結論?如果把這個業務目標所有的可能性都列舉一遍,會發現基本上會涵蓋所有的業務領域,是很難用一個模型就能夠清晰的定義出一個***實踐的。
2、需要的數據集太廣,大部分數據處理較復雜
投研本身是一個非常寬的業務領域,所需要的數據集非常的廣泛,從宏觀政策數據、市場行情數據、交易數據、消費者數據等多方面,而且數據之間的相關性較弱。而通過前期的POC,我們會發現,如果要讓這些數據都能夠被建模,這過程中的數據處理會非常的復雜,基本上會涉及所有的人工智能技術的應用場景。
3、項目范圍龐大,建設周期長,業務見效慢
經過兩周左右的POC,大家都發現,這樣的一個業務***本身是一個研究領域,如果作為一個項目來做,哪這個項目的范圍會非常的龐大,周期也會變得無法控制的長。而這也就意味著,項目的投資需要很長的時間才能看到業務上的回報。
所以***客戶放棄了這樣的一個項目。
數據驅動創新的幾個關鍵成功因素
通過這個POC的過程,我們發現要成功的利用數據產生新的洞察來做創新,支撐決策,需要具備以下幾個關鍵成功因素:
1、清晰的業務愿景和目標
一定要制定清晰的業務愿景和目標。
在現狀調研,數據分析這樣的具體的工作開始之前,首先要定義可理解,簡單,簡短和可以衡量的目標,這一點非常重要。這些目標可以以問題的形式列出,比如“我們的用戶轉化率能否提高到40%以上?”和“如何能夠提升高端產品銷量?”。
當然,很多時候我們會發現,我們的業務愿景本身是挺復雜的,不可以被衡量,那我們需要將這個愿景,相對模糊的目標分析,拆解成可理解,簡單和可衡量的目標。
這個環節非常重要,定義問題本身是產生有價值的創新的基礎,否則就是漫無目的的探索,那可能帶來的是資源的浪費和無效的投入。
2、能夠帶來價值的業務場景
在定義了清晰的目標以后,為了達到這個目標,一定要探索出有價值的業務場景。業務場景是可被實現,可落地,與真實業務可以緊密結合的端到端的一系列流程的組合。這個場景一定要與業務相關聯,能夠為業務產生價值。也就意味著通過數據關聯、分析產生的洞察是能與具體的業務掛鉤的,而不是一個飄在空中的不可實現的幻想和空想。
3、可實現的數據資產和技術支撐
有價值的創新場景需要被實現,這里面就需要數據和技術支撐。我們需要在一開始的時候就有頂層設計的思路,把這些創新場景所需要的數據集,技術的支撐,對于工具平臺的要求從架構層面列示清楚,然后在實現過程中快速迭代,只有這樣才能保證體系上一開始就是可實現的,是集成的。
【本文為51CTO專欄作者“凱哥”的原創稿件,轉載請通過作者微信公眾號shikai590獲取授權】