從“數(shù)據(jù)科學”視角,看懂數(shù)字化轉型
數(shù)字化轉型是數(shù)字經(jīng)濟時代下重要的產業(yè)實踐,其背后有沒有方法論來指導呢?自然是有的。方法論主要來自于三個方面,分別是:業(yè)務視角、IT視角、數(shù)據(jù)視角。
業(yè)務視角,不言自明,基礎是傳統(tǒng)的管理學方法論,既包括企業(yè)的戰(zhàn)略制定、人力資源、財務管控,也包括一切和數(shù)字化項目實施落地相關的項目管理活動等。
IT視角,方法論大多來自于傳統(tǒng)信息化建設相關的方法沉淀,比如:系統(tǒng)需求分析、系統(tǒng)架構設計、軟件設計模式、產品設計、UI\UE設計等。
數(shù)據(jù)視角,是數(shù)字化建設獨有的方法論視角,把數(shù)據(jù)作為“本體”,一切活動圍繞數(shù)據(jù)來看待數(shù)字化轉型實踐。
通過認識和挖掘數(shù)據(jù)的本質、規(guī)律、價值、活動,實現(xiàn)對數(shù)字化轉型的系統(tǒng)規(guī)劃并展開具體的方案設計。
數(shù)據(jù)科學是關于數(shù)據(jù)的學科,數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)預處理、數(shù)據(jù)檢索、數(shù)據(jù)建模、數(shù)據(jù)架構設計都屬于數(shù)據(jù)科學的技術細分領域。
數(shù)據(jù)科學的數(shù)字化視角,是一個理論的觀察視角,從數(shù)據(jù)科學看數(shù)字化應用場景,類似于基于物理公式的視角來看自然界客觀的物理現(xiàn)象,如雷、電、雨、雪 ...
數(shù)據(jù)科學可以讓“數(shù)字化”活動抽象化、清晰化、本質化、結構化,在解決數(shù)字化問題時,通常需要把“業(yè)務域”中具體的經(jīng)營問題或生產問題動態(tài)映射到“數(shù)據(jù)域”,得到等價的“數(shù)據(jù)科學問題”,在“數(shù)據(jù)域”中對原問題進行求解。
上述過程,實際上也是廣義上“數(shù)字孿生”想要達到的產業(yè)實踐意義。
值得注意的是,業(yè)務域問題變成數(shù)據(jù)域問題,總是近似等價的,期間可能要忽略掉很多非數(shù)據(jù)域可描述或定義的“細節(jié)”,比如:外部風險、情緒干擾、操作性誤差、系統(tǒng)性誤差、財務約束、系統(tǒng)性能約束等。
盡管如此,從數(shù)據(jù)科學的角度來解釋、預測、控制一項數(shù)字化活動,仍有巨大的借鑒意義:
一是可提供理論上的價值邊界。
站在數(shù)據(jù)科學的視角,可以借助統(tǒng)計學、信號學等基礎學科理論,清晰地定義和量化從數(shù)據(jù)中產生的價值,了解數(shù)據(jù)價值鏈的形成路徑,評估數(shù)據(jù)給業(yè)務帶來增長的程度。
例如,采用Value of Information(VoI)分析,一種基于貝葉斯統(tǒng)計框架的量化模型,從不確定性減少的預期收益方面,評價數(shù)據(jù)收集實驗的必要性和經(jīng)濟性。
在此基礎上,可以有效地評估數(shù)據(jù)的價值潛力,以及數(shù)字化項目在收益上的必要性,更好地開展數(shù)字化項目實施決策。
二是可聚焦業(yè)務上的實施范疇。
通過把業(yè)務問題抽象成數(shù)據(jù)問題,對業(yè)務場景進行建模,尋找“數(shù)據(jù)驅動”的業(yè)務解決方案。在數(shù)據(jù)模型圖、數(shù)據(jù)流程圖的基礎之上,可以更清晰、更精準地識別目標業(yè)務問題關聯(lián)的核心業(yè)務域,更加有效地聚焦數(shù)字化項目的重要業(yè)務范疇。
通過數(shù)據(jù)建模手段,可以構建結構化的業(yè)務條線組織形式,有效地梳理數(shù)字化項目相關的業(yè)務單位、部門,以及組織內外的重大“干系人”。
在此基礎上,還可以明確地定義業(yè)務活動中的責任關系、利益關系,開展更為科學、公平的業(yè)務決策。
三是可凝練技術上的求解路線。
有時,很多業(yè)務問題難以在業(yè)務域中直接找到解決方案,而通過把業(yè)務問題轉化為等價的數(shù)據(jù)科學問題,相當于拓展了求解問題的技術手段,提高了處理業(yè)務需求的能力上限。
大數(shù)據(jù)的方法可以運用于傳統(tǒng)問題的求解,充分發(fā)揮計算機技術的強大算力優(yōu)勢,彌補了人在面向信息量大、決策維度復雜、低延時等場景的復雜決策問題的能力短板。
例如:通過將非結構化的文本數(shù)據(jù)轉化為稠密數(shù)值空間的向量數(shù)據(jù),實現(xiàn)文本信息的深度語義融合與匹配,使得機器可以識別和理解“人”感知不到的信息,并完成在海量數(shù)據(jù)庫中進行內容匹配的復雜任務。
四是可揭露內容上的特殊線索。
數(shù)據(jù)科學提供了一系列統(tǒng)計函數(shù)和分析模型,通過在數(shù)據(jù)對象上進行各種不同的模式變換操作,可以實現(xiàn)信息的深度線索提取,強化凸顯原先在業(yè)務域視角中被隱蔽埋藏的信息。
例如,通過離群點分析算法,可以在海量數(shù)據(jù)集中快速識別到與“總體”分布不一致的特殊數(shù)據(jù)樣本,背后可能反映了異常的用戶行為或產品質量。
再例如,通過圖數(shù)據(jù)分析,建立業(yè)務對象之間的關聯(lián)關系,在圖上進行路徑挖掘算法,計算識別“長距”節(jié)點,挖掘潛在的語義或社會關系關系。
綜上,數(shù)據(jù)科學可以為業(yè)務分析提供評價能力、解釋能力、分析能力,以及信息強化能力,基于數(shù)字化的業(yè)務應用也只有在數(shù)據(jù)科學的加持下,才能真正高效能地釋放數(shù)據(jù)要素綜合價值。