從0到1構建數據生態系列:數據價值挖掘
這估計《從0到1構建數據生態系列》的***一篇,主題是數據價值。
在之前,我們所有做的一切一切,都是基礎,那么其最終的目的是什么?
當然,結果很明顯,就是數據價值,那么,作為數據生態的最上層,所謂的數據價值又是以什么形式體現的呢?
BI體系
在 大數據職位畫像–看看你是不是白混了賊多年 這篇對于大數據職位分析的文章中,我們知道,大數據中很大一部分人的角色定位就是“數據分析”。
對應的職位崗位的名稱也多樣,“數據分析師”,“大數據分析師”,“BI數據分析”,“BI工程師”等等,五花八門。
這些崗位對應所創造的最上層數據應用價值就是,意圖通過數據分析的手段,來帶數據化的運營監測,數據化的決策指導,以及趨勢性的預測等等。
對于前一點,即數據化的運營,這是最常規的應用手段,通過數據的反饋情況,進行運營策略的動態修正,以期獲取***化運營效果。
對于上層來說,他需要把控公司企業整體的事態走向,來制定未來的戰略規劃,這也是數據分析帶來的好處。
通常,我們在構建起數據生態鏈路之后,***需要支撐的就是BI分析體系,用于運營以及決策。
此外,結合分析以及深化一些的數學模型,我們還可以做到一些趨勢性的預測,對于未來的策略做更進一步的指導,這就屬于BI體系更深入的應用了。
畫像體系
除了BI體系之外,畫像體系是上層應用的重要核心支持,在此之上可以演變各種有效的實際業務應用。
所謂畫像體系,即一方面是指針對于公司用戶構建起能夠全面描述用戶特征的用戶畫像,另一方面,對于實體目標,即除了用戶之外的實體,我們同樣可以構建起畫像,例如品牌畫像,內容畫像,產品畫像等等。
基于這些畫像,我們其實是可以做很多事的。
例如針對于電商,我們可以結合推薦系統,做更個性化的商品推薦;結合活躍時段,地域,購物特征等,進行更加個性化的推送服務,以及做個性化的EDM等;又諸如品牌畫像,可以更好的為品牌進行制定推廣策略;針對產品畫像,剖析產品結構,優化產品內部邏輯,指導產品快速迭代等等。
畫像是基石,在基石之上可以做更多可擴展性的實際應用,當然,前提是你的畫像維度足夠豐富,屬性足夠準確。
并且,需要注意的一點就是,我們在構建畫像體系的時候,對于畫像維度進行分層次的拆解,有助于我們填充畫像屬性,以及更好的實用指導。
至于說如何填充畫像的屬性,其實方法就很多了,部分是很明顯的屬性,部分是統計維度的屬性,部分是需要通過機器學習以及挖掘的手段進行獲取。
當然,更多的細節我們就不放在這里討論了。
推薦系統
在網絡興起之前,用戶能夠接觸到的信息實體(所謂信息是泛指,商品之類的也算)都是通過線下的實際展示,能夠直接獲取的范圍有限。
在網絡興起之后,虛擬空間的概念興起,信息實體可以放在虛擬空間中,這意味著實體(包括商品等一系列相關實體)的數量可以***擴充。
在很早之前,用戶獲取信息的主要手段有兩種:結構化的目錄導航,搜索。
但在虛擬空間的興起之后,隨著海量實體的增長,這種以用戶主動觸發為主的獲取實體模式弊端越來越大:篩選時間變長、可選項增大帶來選擇困難現象。
在時間成本越來高的現在,必然追求更加高效的實體信息獲取方式,最本質的目的是:縮短用戶與目標實體之間距離,減少無效信息的獲取,以及提升效率。
所以,以個性化被動信息推動為模式的推薦系統則受到了歡迎。
而推薦系統,在是建立在數據的基礎上,融合適應場景的各種模型算法,最終以精準信息推送為目的,提升用戶的點擊轉化,或者其他更明確的商業目的。
推薦系統是數據得以應用的最常見的方式之一,也算是在國內應用的相對成熟的場景。
數據時代的搜索引擎
就信息檢索來說,搜索引擎早就存在,而且一直存在,但早期的搜索引擎只有一個目的,那就是檢索與檢索詞相關的信息。
這里所說的相關,純屬于信息實體屬性相關。當然,這樣做當然是無可厚非的,信息檢索的本質本來就是檢索相關的信息。
但隨著數據進一步應用,以及機器學習等技術的推廣,搜索引擎的模式也在悄然發生改變,只是你或許并沒有過多關注而已,只是感覺搜索越來越好用了。
我們知道,中文博大精深,一句話,稍微改動一下,或者說重新組織一下,意思都可能發生巨大的變化,甚至是相同的一個詞,理解的角度不同,其意義都是不相同的。
在過去,這種情景是很難處理的,而如今,隨著對數據的進一步應用,以及算法模型的進一步開發,搜索意圖識別已經算是“正經”搜索引擎的標配了。
除此之外,還有諸如搜索糾正,相關搜索推薦等基本的優化點,用于提升用戶的體驗。
***的改變在于,過去的搜索是一個“點”,而現在的搜索結果是一個“面”。
所謂的“點”即是你所搜索直接關注的目的,也就是信息本身,而“面”則是一個多維結構,在你關注的點的同時,擴散所有的相關信息。
這就是知識圖譜在搜索中的應用,產生的搜索結果是一整個相關的知識圖譜結構。
實現業務的數據化、自動化、智能化
相對于上面描述的幾個相對明確的數據價值應用,這里描述的就相對于偏業務層,并沒有說具體涉及到某種模型,具體的算法,而是一種業務驅動模式。
我們希望通過數據,能夠構建起業務驅動的自動化流程,并且這整個業務流程是可數據化觀測的,然后在一些關鍵環節是可以智能化運作的,這樣就能夠提升業務的精準性。
當然,更重要的是提升商業轉換價值。
期間,我們可以利用各種統計分析的手段,讓業務流轉是可以數據可觀測的,也可以通過諸如畫像屬性的進一步業務化,也可以使用諸如推薦、預測等相關相對底層的技術,甚至是可以利用更復雜的神經網絡深度學習等自動學習、自動優化的手段。
關鍵在于使用數據,再結合機器學習的手段來優化整個流程,這才是我們所需要的。
結語
***,隨著數據的價值在逐漸被挖掘,上層將會越來越多的應用模式被探索出來。
但可以預見的是,數據價值的使用,必然會從單純的數據本身價值,逐漸延伸到更多的其他方面,而作為數據價值探索的手段,機器學習相關的技術和數據的結合也會越來越緊密。