使用數(shù)據(jù)倉(cāng)庫(kù)BI的六種策略
數(shù)據(jù)倉(cāng)庫(kù)可以作為數(shù)據(jù)存儲(chǔ)的輔助工具,幫助數(shù)據(jù)的集成、匯總和轉(zhuǎn)換,以便更容易地為業(yè)務(wù)智能進(jìn)行分析。團(tuán)隊(duì)可以通過采用云架構(gòu)的新策略,最大限度地使用數(shù)據(jù)倉(cāng)庫(kù)。
隨著云計(jì)算和用于數(shù)據(jù)集成、存儲(chǔ)和管理的新型數(shù)據(jù)基礎(chǔ)設(shè)施的興起,數(shù)據(jù)倉(cāng)庫(kù)的性質(zhì)和用途都發(fā)生了巨大的轉(zhuǎn)變。即使一些企業(yè)醞釀使用數(shù)據(jù)湖來(lái)存儲(chǔ)一切,數(shù)據(jù)湖仍然在為常規(guī)分析提供更快的訪問和更一致的結(jié)構(gòu)方面提供了很大的價(jià)值。
此外,用于流分析、數(shù)據(jù)準(zhǔn)備和主數(shù)據(jù)管理的新工具可以幫助企業(yè)采用更好的數(shù)據(jù)倉(cāng)庫(kù)策略。這里有六種策略,可以幫助企業(yè)充分使用新的云數(shù)據(jù)倉(cāng)庫(kù)。
1. 識(shí)別過程中的瓶頸
數(shù)據(jù)分析咨詢公司Bartlett System的首席執(zhí)行官和創(chuàng)始人Adam Nathan,他參與實(shí)施BI系統(tǒng)已經(jīng)超過15年了。雖然在這期間,他發(fā)現(xiàn)了漸進(jìn)式的進(jìn)展,但他表示,“云服務(wù)的進(jìn)步可能會(huì)從根本上改變BI專業(yè)人員挖掘數(shù)據(jù)倉(cāng)庫(kù)的方式,從而使BI受益。”
Nathan指出,“獲取數(shù)據(jù)、清理數(shù)據(jù)、準(zhǔn)備數(shù)據(jù),并將其與不同的數(shù)據(jù)源進(jìn)行集成,一直是IT團(tuán)隊(duì)中數(shù)據(jù)工程師遇到的難題。”使這一挑戰(zhàn)變得更加嚴(yán)重的是,數(shù)據(jù)的所有者,那些真正了解信息語(yǔ)義價(jià)值的人,與數(shù)據(jù)本身是隔絕的。
他認(rèn)為,“那些幾乎沒有時(shí)間幫忙,而且只了解數(shù)據(jù)的人,恰恰無(wú)法快速得到我需要的東西。”
2. 賦予數(shù)據(jù)工程師權(quán)力
團(tuán)隊(duì)現(xiàn)在可以在SQL中進(jìn)行更多的數(shù)據(jù)準(zhǔn)備活動(dòng),包括大數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。根據(jù)Nathan的說(shuō)法,隨著SQL技能變得無(wú)處不在,數(shù)據(jù)工程已經(jīng)變得大眾化了。
由于這些工具變得更容易使用,并且需要更少的分散技能,因此不太需要熟悉多種語(yǔ)言和技術(shù)的集中式專家。Nathan認(rèn)為,“這導(dǎo)致了數(shù)據(jù)工程師的崛起,反映了應(yīng)用開發(fā)、分析和其他領(lǐng)域的類似趨勢(shì)。”
數(shù)據(jù)共享也越來(lái)越容易。例如,Snowflake用戶可以將數(shù)據(jù)集以離散的、精心策劃的集合,公開給數(shù)據(jù)消費(fèi)者,包括:合作伙伴、客戶、供應(yīng)商和其他人。
Nathan解釋說(shuō),“如果我是一名在人力資源方面擁有良好SQL技能的分析師,我就可以在不需要外部支持的情況下管理和分享我的團(tuán)隊(duì)的數(shù)據(jù)。”
這一點(diǎn)很重要,因?yàn)樗薎T在數(shù)據(jù)準(zhǔn)備過程中的瓶頸。IT團(tuán)隊(duì)有更多的時(shí)間專注于準(zhǔn)備原始數(shù)據(jù)。
3. 建立分布式管理
接下來(lái),團(tuán)隊(duì)需要簡(jiǎn)化正確的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的方式。隨著IT部門的退出,團(tuán)隊(duì)可以開始考慮將其數(shù)據(jù)作為企業(yè)中每個(gè)小組的個(gè)人、策劃、掌握和認(rèn)證數(shù)據(jù)集的集合。
想要人力資源數(shù)據(jù)的人可以去找人力資源部門共享的數(shù)據(jù)集。人力資源部門的專家了解如何收集數(shù)據(jù),為什么要收集數(shù)據(jù),保持這些數(shù)據(jù)的更新,管理工作,并可以為其他部門的用戶提供適當(dāng)?shù)谋尘埃M褂眠@些數(shù)據(jù)進(jìn)行不同的分析。Nathan認(rèn)為:“實(shí)際上,每個(gè)部門都在提供數(shù)據(jù)價(jià)值。”
其他人可以請(qǐng)求訪問權(quán)限,但無(wú)法更改。這種框架還可以更容易地集成來(lái)自給定部門的數(shù)據(jù),或者與企業(yè)內(nèi)可用的其他數(shù)據(jù)集,甚至外部數(shù)據(jù)集集成。
策劃管理策略將數(shù)據(jù)質(zhì)量監(jiān)督從一個(gè)中央部門轉(zhuǎn)移到單獨(dú)的團(tuán)隊(duì),可以提供更大的監(jiān)督效果。因此,我們可以相信,最好的人力資源數(shù)據(jù)來(lái)自于人力資源共享站點(diǎn)。“這是一個(gè)很小的問題,也更易于管理。”Nathan說(shuō)道。
4. 制定數(shù)據(jù)合同
分布式管理也帶來(lái)了一個(gè)全新的挑戰(zhàn),即數(shù)據(jù)集需要保持一致,并以極其謹(jǐn)慎和安全的方式進(jìn)行更改。“如果對(duì)數(shù)據(jù)的治理實(shí)施得不好,就會(huì)成為一種自由競(jìng)爭(zhēng),這可能是最大的風(fēng)險(xiǎn)。”Nathan說(shuō)。
數(shù)據(jù)管理團(tuán)隊(duì)需要與每個(gè)部門合作,幫助制定數(shù)據(jù)合同,為他們提供的數(shù)據(jù)建立服務(wù)級(jí)別協(xié)議。合同有助于確定每個(gè)人對(duì)可靠性和及時(shí)性的期望。Nathan表示,“這可能會(huì)使IT部門感到痛苦,因?yàn)橹卫韱栴}和角色的減少。”
5. 考慮不同的觀點(diǎn)
Capgemini公司全球洞察力和數(shù)據(jù)副總裁Avneet Dugal說(shuō),“數(shù)據(jù)倉(cāng)庫(kù)有一個(gè)令人質(zhì)疑的名字,那就是它是大型的、難以操作的數(shù)據(jù)存儲(chǔ)庫(kù),因此不適合實(shí)時(shí)分析和決策。”
她看到的挑戰(zhàn)是,團(tuán)隊(duì)正在試圖將所有數(shù)據(jù)移入數(shù)據(jù)倉(cāng)庫(kù)。將大量的數(shù)據(jù)轉(zhuǎn)移到另一個(gè)平臺(tái),并重建經(jīng)驗(yàn)上可信的數(shù)據(jù)是一項(xiàng)復(fù)雜的工作。例如,企業(yè)可以通過根據(jù)業(yè)務(wù)重點(diǎn)(供應(yīng)鏈、財(cái)務(wù)或營(yíng)銷)來(lái)組織數(shù)據(jù),使其更容易查看和使用。
Dugal還發(fā)現(xiàn)將“增量”更新構(gòu)建為核心處理能力的一部分是有幫助的,這使得數(shù)據(jù)變化更容易出現(xiàn)在各種分析用例中,并減少了對(duì)所有數(shù)據(jù)的更改,以包括最后一天的更新需求。
6. 簡(jiǎn)化數(shù)據(jù)工作流程
ScienceSoft的數(shù)據(jù)分析部門負(fù)責(zé)人Alex Bekker表示,“考慮戰(zhàn)略和戰(zhàn)術(shù)層面的管理之間的差距也很重要。”其中一個(gè)方面是建立一個(gè)精心設(shè)計(jì)的數(shù)據(jù)治理框架,以確保數(shù)據(jù)倉(cāng)庫(kù)攝入高質(zhì)量的數(shù)據(jù),這些數(shù)據(jù)被安全地處理和存儲(chǔ),并且只能根據(jù)用戶角色來(lái)訪問。
選擇具有大量集成功能的數(shù)據(jù)倉(cāng)庫(kù)軟件也是很有幫助的,比如預(yù)建的數(shù)據(jù)源連接器和開放式API,以確保數(shù)據(jù)倉(cāng)庫(kù)的可擴(kuò)展性。這有助于添加新的數(shù)據(jù)源以解決不斷變化的業(yè)務(wù)需求。
另一個(gè)方面是圍繞集成、質(zhì)量、安全和備份,實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)維護(hù)和管理活動(dòng)的自動(dòng)化。這降低了數(shù)據(jù)倉(cāng)庫(kù)的運(yùn)營(yíng)成本,并確保高性能和可用性。
Fivetran公司首席分析技術(shù)產(chǎn)品經(jīng)理Veronica Zhai也建議,將關(guān)鍵業(yè)務(wù)邏輯集中到一個(gè)地方。例如,關(guān)鍵的業(yè)務(wù)邏輯,如 “什么是凈收入?”應(yīng)該在代碼中定義一次,放在一個(gè)有版本控制的地方,所有分析師和業(yè)務(wù)用戶都可以重復(fù)使用這段代碼。這也節(jié)省了時(shí)間,并確保報(bào)告的一致性。