為什么改善數據供應鏈是一種責任?
?如今,企業擁有比以往任何時候都要多的數據,數據架構師、分析師和數據科學家在所有業務職能部門中變得越來越普遍。然而,隨著企業招募經驗豐富的分析師以利用數據做出更好的決策,他們往往無法改善數據供應鏈和由此產生的數據質量。如果沒有可靠的數據供應鏈管理實踐,數據質量往往會受到影響。
糟糕的數據質量被認為是計劃未能實現其預期價值的主要原因,高達60%的業務計劃會由于數據質量問題而失敗。隨著企業轉向支持人工智能/機器學習的決策制定,數據質量成為一個更加緊迫的問題。如果用于推動人工智能/機器學習模型的數據不準確、不完整或過時,則模型將無法提供預期的結果。
數據是分析和決策的關鍵原材料。每位出色的業務領導者都會問:“我們如何提高數據質量,以便能夠做出最好的決策?”其答案是改善企業數據供應鏈的結果,以確保它不會影響分析能力。
那么如何改善數據供應鏈的成果?
- 了解第一公里/最后一公里的數據影響。
- 降低供應鏈復雜性/成本。
- 改進對數據質量的監控和報告。
供應鏈由三個主要部分組成:
(1)第一公里/最后一公里的影響
第一公里/最后一公里面臨的挑戰需要從獲取數據(上游)開始全面解決供應鏈問題。擁有可用于分析和決策的數據的緊迫性,促使企業在“最后一公里”投入更多精力——將數據傳遞給下游的客戶。在數據供應鏈的案例中,客戶當然需要對數據進行分析、報告的內部部門或團隊。面臨挑戰是從一開始就正確捕獲數據源,并確保在跨數據供應鏈移動時不會降低數據質量。
用于評估實體供應鏈績效的一個關鍵供應鏈管理指標是按時全部交付(OTIF),達到這一指標可以提高價值,并產生顯著的效果,因為它直接關系到最終客戶及其執行工作的能力。例如,如果企業需要10個屬性來生成客戶滿意度分數,但只有9個可用,則無法執行計算。利用關注數據質量和可用性對下游流程的影響的指標,可以幫助提高企業的意識。
推薦的行動計劃:創建數據供應鏈地圖。供應鏈可見性和采購的概念適用于數據供應鏈以及實體供應鏈管理。了解數據來源、發生的任何轉換活動以及“客戶交付周期”有助于企業識別和降低風險。實施指標來評估企業滿足客戶需求的程度有助于提高改進重點。
(2)供應鏈復雜性
供應鏈復雜性是用于描述滿足下游需求所需的能力網絡的術語。企業所需的供應商、業務部門和分銷商的數量越多,就越復雜。
供應鏈中的每一個額外元素都會增加復雜性,而復雜性越高,越會增加可變性。可變性是質量的主要挑戰。在實體供應鏈中,企業尋求降低上游復雜性。在數據供應鏈中,內部和外部數據的來源多種多樣(來自數據代理、社交媒體/情感分析等),就像實體供應鏈一樣,降低數據供應鏈的復雜性有助于提高整體質量。
降低復雜性如何提高質量?更少的系統意味著更少的數據轉換,從而提高了數據的可用性和準確性。
推薦的行動計劃:清點可供下游使用的數據,并映射到源系統(內部與外部)。在通常情況下,在多個系統中創建公共屬性,這增加了復雜性。對于每個數據元素,確定/選擇一個單一的下游消費系統,并建立一個“記錄系統”(SOR),其目的是從盡可能少的系統中獲取數據。
(3)數據監控和報告
數據質量應該是當今大多數企業的關鍵績效指標(KPI)。輸出的質量取決于輸入的質量。例如可以回想以往吃過的美餐,以及是什么讓它變得如此美味;當然,企業和環境很重要,但材料的質量直接影響結果——例如新鮮的海鮮總是比冷凍的要好。
企業內部評估數據質量的方法和頻率往往各不相同。企業中的不同職能部門可能會使用不同的方法來評估質量;例如,會計部門可能比營銷部門更嚴格。然而,為什么不同的職能應該得到不同的評估?良好的決策依賴于高質量的數據,難道不是每個職能部門都應該盡可能做出最佳決策嗎?
推薦的行動計劃:建立衡量數據質量的通用公式,并在所有職能部門(數據質量得分)中一致地使用這一衡量標準。評估的數據量要求抽樣和估計,并且其方法應該是一致的。一種方法可以是抽取100條記錄,檢查每條記錄并找出任何錯誤,然后統計無錯誤記錄以了解正確創建的數據百分比。
對于許多企業來說,數據供應鏈是一個新興且不斷發展的概念。尋找和留住人才以幫助改善數據供應鏈成果對于企業的競爭優勢至關重要。當然,有形產品和無形產品之間存在差異,但許多來自實體世界的概念和工具都可以應用于數據,其結果將與改善實體供應鏈一樣具有影響力。