CIO必須警惕的六大數(shù)據(jù)風(fēng)險
對于希望充分利用數(shù)據(jù)驅(qū)動決策的IT領(lǐng)導(dǎo)者而言,從誤分類數(shù)據(jù)到缺乏充分質(zhì)量保證的AI應(yīng)用,他們有諸多需要擔(dān)憂的問題。
CIO們面臨著提供預(yù)測分析并用智能體改造員工隊伍的壓力,然而,對數(shù)據(jù)治理、數(shù)據(jù)運營和數(shù)據(jù)安全的投資——這些一直以來都非常重要的領(lǐng)域——卻常常因業(yè)務(wù)驅(qū)動的舉措而被忽視,導(dǎo)致如今AI的成功前景變得不確定。
為了彌補這一差距,并確保數(shù)據(jù)供應(yīng)鏈得到足夠的高層關(guān)注,CIO們已經(jīng)聘請或與首席數(shù)據(jù)官(CDO)合作,委托他們解決數(shù)據(jù)債務(wù)問題、自動化數(shù)據(jù)管道,并轉(zhuǎn)型為專注于健康指標(biāo)、數(shù)據(jù)質(zhì)量和數(shù)據(jù)模型互操作性的主動數(shù)據(jù)治理模式。
但是,CIO們在委托過多數(shù)據(jù)治理責(zé)任或僅從旁觀者角度觀察數(shù)據(jù)運營改進時必須謹(jǐn)慎,那些重新思考數(shù)字化轉(zhuǎn)型戰(zhàn)略并希望從AI投資中交付業(yè)務(wù)價值的CIO們,需要更加關(guān)注那些可能破壞這些目標(biāo)的數(shù)據(jù)風(fēng)險,一種方法是向IT主管詢問數(shù)據(jù)管理實踐,以感知哪些領(lǐng)域需要更多的領(lǐng)導(dǎo)關(guān)注。
我之前曾寫過關(guān)于CIO們應(yīng)該極度擔(dān)憂的IT風(fēng)險和錯過的GenAI機會的文章。以下是CIO們應(yīng)該審查并確保其團隊有補救策略的六個數(shù)據(jù)風(fēng)險,這些策略最好能將危險轉(zhuǎn)化為戰(zhàn)略機遇。
誤分類數(shù)據(jù)和缺乏參與的數(shù)據(jù)所有者
詢問任何數(shù)據(jù)治理領(lǐng)導(dǎo)者關(guān)于他們在提高數(shù)據(jù)質(zhì)量和遵守法規(guī)方面所面臨的主要挑戰(zhàn)時,識別并吸引數(shù)據(jù)所有者參與制定和遵守數(shù)據(jù)政策幾乎總是名列前茅。沒有積極參與的數(shù)據(jù)所有者,數(shù)據(jù)可能未被分類并在AI中被使用,從而可能違反數(shù)據(jù)隱私規(guī)則和其他法規(guī)。
在AI時代,未分類數(shù)據(jù)帶來了第二個挑戰(zhàn):數(shù)據(jù)科學(xué)家是否應(yīng)在沒有所需合規(guī)性的情況下將這些未分類數(shù)據(jù)集用于AI模型,還是數(shù)據(jù)治理應(yīng)阻止任何人使用這些數(shù)據(jù)?
“企業(yè)必須對其內(nèi)容進行分類,以便安全基礎(chǔ)設(shè)施的各個組件能夠采取適當(dāng)?shù)男袆樱盢etwoven的首席執(zhí)行官Niraj Tenany表示,“手動分類耗時費力,而自動分類則存在顯著的誤報率,因此適當(dāng)?shù)钠胶馐浅晒Φ年P(guān)鍵。”
參與數(shù)據(jù)治理倡議的CIO們往往更能有效地說服部門負(fù)責(zé)人指派數(shù)據(jù)所有者,對于公民數(shù)據(jù)科學(xué)能力和渴望獲得AI業(yè)務(wù)優(yōu)勢的需求如此之大,以至于領(lǐng)導(dǎo)者們很難拒絕承擔(dān)責(zé)任,此外,一旦這些數(shù)據(jù)所有者參與進來,就有更多機會讓他們參與AI治理并合作試點智能體。
暴露給AI的知識產(chǎn)權(quán)
許多CIO擔(dān)心“影子AI”,即員工使用未被批準(zhǔn)的公共大型語言模型(LLM)和其他GenAI工具進行實驗,與AI工具共享誤分類數(shù)據(jù)和暴露知識產(chǎn)權(quán)是CIO們應(yīng)該極度擔(dān)憂的風(fēng)險。
一個擔(dān)憂是員工在AI提示中使用數(shù)據(jù)、代碼、品牌指南、合同和敏感文檔的部分內(nèi)容,另一個是數(shù)據(jù)科學(xué)家在未經(jīng)所需批準(zhǔn)和保障措施的情況下,將知識產(chǎn)權(quán)納入AI模型,包括為LLM設(shè)計的檢索增強生成(RAG)和用于智能體的數(shù)據(jù)。
“數(shù)據(jù)是公司擁有的最有價值資產(chǎn)之一,必須像保護其他資產(chǎn)一樣保護它,”Rimini Street的全球CIO Joe Locandro表示,“CIO們應(yīng)該警惕員工對數(shù)據(jù)的處理不當(dāng)、AI工具的誤用以及不良的網(wǎng)絡(luò)衛(wèi)生習(xí)慣,優(yōu)先進行員工教育、在核心系統(tǒng)中實施數(shù)據(jù)掩碼以及定期進行數(shù)據(jù)安全審計是保護敏感信息的必要步驟。”
The Modern Data Company的首席執(zhí)行官Srujan Akula補充說:“營銷團隊未經(jīng)通知就采用ChatGPT,數(shù)據(jù)科學(xué)家用他們能找到的任何信息構(gòu)建模型,突然間敏感的客戶數(shù)據(jù)可能就被輸入到了公共AI工具中,這給CIO們帶來了數(shù)據(jù)泄露和合規(guī)問題等風(fēng)險,這些問題可以通過清晰、實用的政策和安全的內(nèi)部替代方案來解決。”
為了降低風(fēng)險,Akula建議CIO們從經(jīng)過整理、可信的數(shù)據(jù)集中創(chuàng)建數(shù)據(jù)產(chǎn)品,并明確所有權(quán)和治理。
CIO們還可以通過贊助數(shù)據(jù)素養(yǎng)計劃和促進開放創(chuàng)新(任何員工都可以提交想法)將這種風(fēng)險轉(zhuǎn)化為優(yōu)勢,這些計劃的結(jié)合鼓勵了學(xué)習(xí)和問題解決,同時企業(yè)也能從一線員工那里獲得更多倡議的可見性。
第三方數(shù)據(jù)源
美國企業(yè)預(yù)計在2025年將在營銷數(shù)據(jù)上花費261億美元,這些數(shù)據(jù)通常用于客戶細(xì)分、個性化營銷活動和改進歸因分析。
盡管確保內(nèi)部數(shù)據(jù)實踐符合法規(guī)要求和數(shù)據(jù)治理政策已經(jīng)夠難了,但跟蹤第三方數(shù)據(jù)源的合規(guī)性則更具挑戰(zhàn)性。
“一個最常被忽視的風(fēng)險是依賴第三方數(shù)據(jù)管道或豐富服務(wù),而沒有驗證他們?nèi)绾潍@取數(shù)據(jù),”SOAX的產(chǎn)品負(fù)責(zé)人Luis Lacambra表示,“如果這些數(shù)據(jù)是通過不可靠或不符合規(guī)定的方法從公共來源抓取或聚合的,你的企業(yè)可能會面臨監(jiān)管審查或運營盲點。”
審查第三方數(shù)據(jù)合規(guī)性應(yīng)成為由CDO管理的、不可協(xié)商的數(shù)據(jù)治理要求。
CIO們還可以采取另一種方法來應(yīng)對第三方數(shù)據(jù)風(fēng)險,公司采購并集成了許多未被充分利用、與其他數(shù)據(jù)源提供重復(fù)信息或提供邊際業(yè)務(wù)價值的來源,尋求成本降低機會的CIO們應(yīng)該對第三方數(shù)據(jù)源進行成本效益審計,審查利用率并量化風(fēng)險,機會在于通過消除低價值、高風(fēng)險的來源來降低成本。
數(shù)據(jù)管道可觀測性差
大多數(shù)企業(yè)會在投資于強大的數(shù)據(jù)集成和管道之前,先投資于終端用戶分析工具,如數(shù)據(jù)分析平臺和文檔處理工具。隨著各部門越來越依賴實時數(shù)據(jù)進行決策,數(shù)據(jù)管道的可靠性和性能可能成為一個運營噩夢,特別是當(dāng)數(shù)據(jù)管理員必須定期修復(fù)數(shù)據(jù)問題或數(shù)據(jù)滯后導(dǎo)致決策失誤時。
“CIO們必須敏銳地意識到威脅企業(yè)完整性、安全性和決策有效性的數(shù)據(jù)相關(guān)風(fēng)險,”RecordPoint的首席技術(shù)官Josh Mason表示,“一個關(guān)鍵領(lǐng)域是對數(shù)據(jù)管道和使用模式缺乏足夠的可觀測性,其中不足的可觀測性可能隱藏潛在問題,如延遲、數(shù)據(jù)漂移、管道故障以及敏感數(shù)據(jù)的位置。”
數(shù)據(jù)運營(DataOps)中的可觀測性包括監(jiān)控數(shù)據(jù)管道、自動化響應(yīng)和跟蹤性能,DataOps指標(biāo)包括管道可靠性、自動化率、異常率和處理吞吐量。
對于集成許多數(shù)據(jù)源并使用數(shù)據(jù)結(jié)構(gòu)來集中訪問的CIO們來說,減少DataOps事件可以節(jié)省成本,但更重要的驅(qū)動力是,不可靠的數(shù)據(jù)集成會侵蝕信任,而這可能會減緩部門領(lǐng)導(dǎo)者對更多AI和數(shù)據(jù)驅(qū)動實踐的投資。
數(shù)據(jù)質(zhì)量差距
CIO們一直在努力通過指派數(shù)據(jù)管理員、自動化數(shù)據(jù)清理程序和衡量數(shù)據(jù)健康狀況來提高數(shù)據(jù)質(zhì)量,但是,大部分工作都集中在ERP、CRM和數(shù)據(jù)倉庫中的結(jié)構(gòu)化數(shù)據(jù)源上。AI擴大了這項工作的范圍,因為RAG和智能體利用非結(jié)構(gòu)化數(shù)據(jù)源和文檔存儲庫來訓(xùn)練模型并提供上下文相關(guān)的響應(yīng)。
“RAG為企業(yè)提供了訪問企業(yè)知識的途徑,但并非沒有風(fēng)險,包括數(shù)據(jù)隱私漏洞、幻覺和集成挑戰(zhàn),”Pryon的首席執(zhí)行官Chris Mahl表示,“實施需要投資于數(shù)據(jù)質(zhì)量、建立治理框架和創(chuàng)建評估系統(tǒng),然后再進行擴展。從RAG中獲得真正價值的企業(yè)不僅訪問信息更快——他們還通過找到創(chuàng)新與保障之間的正確平衡來做出更好的決策。”
為了解決數(shù)據(jù)質(zhì)量差距,CIO們應(yīng)考慮將原始數(shù)據(jù)集中存儲在數(shù)據(jù)湖中,提供數(shù)據(jù)清理作為共享服務(wù),并通過數(shù)據(jù)結(jié)構(gòu)和客戶數(shù)據(jù)平臺啟用訪問。由于存在許多數(shù)據(jù)質(zhì)量和管理工具,開發(fā)一個專注于數(shù)據(jù)質(zhì)量的共享服務(wù)是解決企業(yè)對清潔AI數(shù)據(jù)源的更大業(yè)務(wù)需求和擴大非結(jié)構(gòu)化數(shù)據(jù)源清理范圍的有效方法。
過度依賴AI輸出而缺乏嚴(yán)格的質(zhì)量保證
定義AI治理的七個問題包括關(guān)于業(yè)務(wù)價值、工具選擇、合規(guī)性和數(shù)據(jù)治理的問題,但最重要也是今天最具挑戰(zhàn)性的一個問題是:員工應(yīng)如何驗證和質(zhì)疑LLM的響應(yīng)或智能體的建議?
對于希望開發(fā)智能體的CIO們來說,這個問題更為重要,因為測試LLM的質(zhì)量保證實踐仍在發(fā)展中,并且往往依賴于手動測試。
“CIO們必須持續(xù)監(jiān)控AI生成輸出的準(zhǔn)確性和可靠性,”Pendo的首席產(chǎn)品官Trisha Price表示,“因為AI系統(tǒng)不是確定性的,定義質(zhì)量變得更加復(fù)雜,工程、質(zhì)量保證和產(chǎn)品之間的界限變得模糊,這種轉(zhuǎn)變要求團隊之間更緊密的合作,以確保AI驅(qū)動的體驗是可信的、符合用戶需求的,并能夠推動真正的業(yè)務(wù)成果。”
CIO們歷來難以證明對質(zhì)量保證(QA)的投資是合理的,因為向業(yè)務(wù)部門推銷增加開發(fā)人員或提高運營和安全彈性更容易,但是,隨著更多軟件開發(fā)者使用AI代碼生成器且IT運營變得更加自動化,CIO們可能會發(fā)現(xiàn)更大的需求和預(yù)算機會來投資于QA和AI測試能力。
對于CIO們來說,對風(fēng)險、尤其是圍繞知識產(chǎn)權(quán)和新興AI能力的風(fēng)險保持一定程度的擔(dān)憂是健康且重要的。最優(yōu)秀的CIO們不僅會制定緩解計劃,還會尋求將風(fēng)險轉(zhuǎn)化為戰(zhàn)略機遇的選項。