數據匹配在大數據業務戰略中的作用
在整合大數據的同時設計業務戰略時,數據匹配和質量的作用勢在必行。在這篇文章中閱讀更多內容。
盡管大數據分析聽起來很有希望,但公司對其數據的期望與現實之間仍然存在巨大差距。在公司喜歡大數據但缺乏有效使用大數據的策略的文章中,哈佛商學院分享了他們教給高管的一些見解:
“問題是,在很多情況下,大數據沒有得到很好的利用。公司更擅長收集數據——關于他們的客戶、關于他們的產品、關于競爭對手——而不是分析這些數據并圍繞它設計戰略。”
這不僅突出了對大數據的需求,而且強調了學習如何設計包含大數據的業務戰略。
大數據:利用高級分析
大數據是一種消耗大量空間(體積)、以前所未有的速度(速度)并以不同格式(種類)存在的東西。大數據本身并不能為您的業務流程或戰略增加價值。您必須“用好它”才能從中提取所有見解和好處。
如果您的大數據使用得當,那么它可以幫助您:
- 通過利用收集到的有關產品、客戶和市場的洞察來優化運營和業務流程。
- 遵守政府標準并降低風險。
- 設計更好的個性化客戶體驗。
- 發現新的收入機會。
讓我們談談組織如何使用大數據來實現業務目標。
制定結合大數據的有效商業戰略
BillSchmarzo(被稱為大數據院長)在他對使用大數據實現業務目標的過程進行逆向工程時對此做出了最好的解釋。他給出了如何完成的5步方法。我將在此處簡要概述這些步驟。
(1) 確定預期的業務成果
您必須首先確定您的業務所需的業務成果。嘗試考慮能夠改變您的業務的舉措,或使其離成功更近一步。例如,在未來12個月內將在線商店銷售額增加10%。
(2) 確定支持用例
此步驟是關于了解哪些用例將幫助您實現第一步中列出的業務成果。例如,如果在線銷售額增加10%是期望的業務成果,那么其支持用例將是:在高流量網站上做廣告促銷、開展電子郵件營銷活動、增加在線潛在客戶生成等。
一旦實現了每個業務成果的支持用例,您需要評估每個用例的財務影響、其潛在價值和實施風險。
(3) 優先考慮用例
在此步驟中,您的組織需要對所有用例進行優先級排序,以便您可以一次專注于一個用例。這可以通過根據業務價值繪制用例的實施可行性來完成。
(4) 確定每個用例的數據源
每個用例的實現都需要使用數據來完成。例如,為了提高客戶交叉銷售,您需要來自社交媒體、購物籃、站點流量信息等數據。在這一步中,每個用例都與一個或多個數據源相關聯,以實現哪個源用于任何用途案例實施。
(5) 計算每個用例的經濟價值
一旦您了解了成功執行每個用例所需的數據源,您現在就可以計算數據源所擁有的財務價值。這是通過匯總將使用此數據源的所有用例實現的財務影響來完成的。
有那么簡單嗎?
剛剛看到了每個數據源如何擁有經濟、財務價值,以及如何使用它來成功執行任何有助于您實現預期業務成果的用例。每個組織都可以訪問其數據。它一定很簡單,每個人都應該這樣做,對吧?有什么問題?這是數據質量。
數據源具有這種經濟價值,因為它們衡量數據質量的6個關鍵維度:數據準確性、有效性、一致性、唯一性、完整性和及時性。
有一個挑戰比其他挑戰更復雜,它是在所有數據源中擁有獨特的數據記錄。
很多時候,需要來自多個來源的數據才能完全執行單一用例。為此,數據首先被合并和整合,以便它存在于一個地方,并且可以用于分析。
公司通常在他們的數據庫中有許多關于同一個人/實體的數據記錄。這是因為將同一個人的工作和個人電子郵件地址存儲為單獨的聯系人,完整信息導致您創建新聯系人而不是更新現有聯系人,或者信息存儲在不同的系統中,例如網站跟蹤應用程序、電子郵件活動工具等
不管是什么原因,這是降低大數據分析結果準確性的最常見障礙。例如,如果您的數據包含與同一個人相關的重復記錄,您最終可能會向個人發送兩次電子郵件活動。這不僅會損害您品牌的客戶體驗,還會使用例結果不準確。您可以多次計算來自同一個人的點擊率,并高估了電子郵件活動的有效性。
介紹數據匹配
當不同的數據集被合并和清除在一起時,數據值會變得重復和不一致。如果您將大數據業務戰略建立在不準確的數據記錄上,則會產生有偏見的結果。另一方面,如果您執行數據匹配技術,您可以輕松地利用這些數據來執行任何用例或業務流程。
數據匹配如何工作?
當數據集包含唯一標識符(例如社會保險號、國民身份證號等)時,數據匹配非常簡單。在這種情況下,您可以簡單地比較兩個記錄的標識符并將它們分類為匹配或不匹配。
當數據集中沒有唯一標識符或由于保密目的而無法使用時,事情就會變得復雜。在這種情況下,多個變量被分配權重,然后一起評估以對匹配和不匹配進行分類。
組織采用各種數據匹配技術,例如語音、數字、模糊匹配或其他專有算法。匹配后,您可以決定合并記錄或清除它們,以便大數據中的每條記錄僅與單個實體相關。此過程也稱為實體解析。
結論:數據匹配在大數據業務戰略中的作用
在整合大數據的同時設計業務戰略時,數據匹配和數據質量的作用勢在必行。當我們規劃制定這些策略的過程時,我們注意到每個數據源如何擁有財務價值,并且它對您希望通過支持用例實現的業務成果產生重大影響。