大多數數據倉庫項目都失敗了,這里有避免失敗的靈丹妙藥
譯文譯者 | 羅輯
審校 | 孫淑娟
在數據驅動現實的今天,數據倉庫變得對所有行業的公司都更加關鍵。然而盡管公司投入了大量的時間和金錢,大約80% 的數據倉庫項目最終都沒能達成它們的目標。這沒有什么可恥的;事實上,類似失敗比你想象的發生得更加頻繁。當行業巨頭出現問題的時候,這會成為新聞頭條。但是對大多數企業而言,居高不下的項目失敗率通常不為人知。
意識到你需要一個穩固可靠的數據倉庫僅僅是冰山一角。后續發生的事情是投入可觀的時間和金錢進行數據倉庫的創建,組織和數據管理的安全維護,而你想讓你的項目成為少數規劃良好并能取得成功的項目。
下面分享我們對于數據倉庫項目高失敗率的見解,以及幫助你成功的策略。
設定符合實際的項目和回報率預期 - 不要期望太高,太快
數據倉庫的好處顯而易見:更高的效率和可靠性,更快的交付,更好的預測和對市場變化的更好的適應能力和潛在機會的更好響應能力。
然而,想要證明數據倉庫的市場回報率是不現實的??疹^支票,浮夸的目標和大規模的投資不一定能夠帶來明顯的短期收益。一年過半,項目可能仍然讓人覺得是個難以產生可視目標的信仰。
因為這一可怕的因素, 項目需求通常被設計用來精密的跟蹤項目的復雜性和進度?!爸灰覀兡軌蜃C明項目仍然在推進, 我們將有能力保證外部資金的注入并且最終完成項目,”有些人也許會這么說。但是,那些不能從實際角度出發解決組織商業目標的項目,注定要失敗。
解決方案:從可行性角度賦能商業用戶,并且從小處做起
審查你的數據倉庫項目需求應當從給最了解業務目標的人賦能開始 - 而不是從賦能精通數據倉庫的專家開始。
從在腦海中定義一個清晰的商業目標開始,你可以對你需要完成的任務報告逐條進行逆向工程。然后你可以設計數據倉庫來達成目標。然后,用結構化的方式一點一滴的構建數據倉庫。
例如,你可以從連接你資金流的核心數據源開始,這樣你就可以匯報你的核心金融 KPI。久而久之,你可以迭代和擴張, 然后你的數據倉庫可以包括和連接人力資源部門, 運營部門, 銷售部門,質量管理部門等等,直到你添加了你所需要的所有的數據源。
在 Cohelion 公司,我們喜歡從為和我們合作的每一個客戶制定數據藍圖起步。他們有什么樣的數據源,數據源里數據的顆粒度是怎樣的,他們主要的 KPI 是什么 - 不管是在現階段還是在將來? 這幫助我們有能力構建快速響應用戶核心匯報需求的數據倉庫,也幫助我們設計出與他們業務需求與時俱進的數據倉庫。然后,我們利用短短幾周的時間為客戶創建出數據倉庫原型。然后,我們連接新的數據源,新的辦公室,新的地區等等,以滿足客戶需求的速度不斷增加數據倉庫復雜性。
還有另外一個幫助你的數據倉庫獲得商業用戶的關鍵因素:利用數據驅動的公司文化創建信任價值觀 - 以及由此帶來的洞察力。你們公司的關鍵數據指標需要滿足實時性,可變性, 并且使公司意識到數據會使公司具備未來的競爭力。這一點對于確保公司人盡其才,物盡其用, 以便于你構建數據倉庫非常重要,而這一點也能讓組織對你們數據驅動未來的想法充滿熱情。
找到一個愿意給你們商業目標真正投資的項目伙伴
通常,對技術不敏感的組織會碰南墻。他們知道他們需要數據倉庫,但是他們連怎么著手開始的基本概念都沒有 - 而唾手可得的定制化數據倉庫在市場上數不勝數,讓人不知所措。
這讓許多公司選擇特定的專家路線。你苦苦尋找能夠為你構建可運行的數據倉庫的專家(因為供不應求,他們可能工資高并有增長趨勢)。找到你自己的專家可能讓你倍感輕松 - 但是準備好被他的專業能力所綁定。自然地,每一個專家都有個人傾向,他們會據此為你構建你的數據倉庫:開源, 微軟, 甲骨文或者優選的混合方案。
還有另外一個需要注意的地方。作為技術專家,他不太可能具有和你行業相關的商業目標一致的專業知識。假設你在管理一家貨運公司,你知道你需要構建一個可運行的數據倉庫。你可能決定去雇傭一個數據架構師來啟動項目,但是你挑選候選人的標準是什么?當你找到一位專家的時候, 他是最能勝任的。但是他可能對你的行業或者數據倉庫對應的 KPI 一無所知。
解決方案: 和了解你行業的數據伙伴齊心協作
和了解你行業的數據伙伴合作是明智之舉。這一內部知識將幫助他們構建一個圍繞你核心 KPI 的數據倉庫, 保證你可以快速和可信的基于數據倉庫生成報告。
當你擁有一個了解你業務領域的數據伙伴的時候, 你可以快速前行。他們將指導你如何迭代,擴張和增強你的數據倉庫。而他們選擇的方式符合你行業的演進過程,機會和合規需求。
確保給你的數據倉庫輸入高質量數據 - 輸入垃圾意味著輸出垃圾
設想一下: 你為數據倉庫項目投入了大量的時間和金錢,但是沒有人能確信最終會成功?,F在到了生成數據倉庫第一份數據報告的時刻了。當我們審計報告的時候,有人對數據準確率提出了嚴重質疑。這相當于是給項目宣判了死刑。
然而這一現象經常發生。這一點都不奇怪, 因為即便是在數據倉庫項目設想被提出之前, 對于公司的數據就存在不同的意見。例如,可能會產生讓職員覺得離譜的數據。內部爭斗, 對于細節的粗心,甚至是合規的想法都能產生讓公司無法公開透明討論數據的數據孤島。這在商業世界是很正常的, 然而如果這些問題進入了你的數據倉庫,你就注定會失敗。
解決方案: 在你的數據領地內優化準確率
想要成功,你的數據倉庫項目必須有高質量的數據。我們支持我們的客戶采用結構化的數據工作流,以便創建一個及時檢驗,平衡和審核的系統來提升數據準確性。
構建這些核心功能使得專家可以審計相關數據集合。這也有利于按需求追蹤數據的誤差和改動,幫助創建一種負責任和可信賴的文化以便確保你的數據倉庫是可靠的。
自信地啟動你的數據倉庫項目
數據驅動是今年的流行詞匯,我們經常發現我們的客戶需要穩固,可靠和可擴展的的數據倉庫以便實現數據驅動。
從更準確即時的 KPI 報告,到審計合規,到滿足數據治理, 數據安全和可持續報告的需求, 數據倉庫是組織必不可少的資產。
原文標題:Most data warehouse projects fail. Here’s how not to.,作者:GerbrandCasteleijn