五步構建AI應用實戰框架
譯文【51CTO.com快譯】 據Gartner研究,約有37%的組織正在實施某種形式的人工智能。然而,根據知名咨詢公司安永的調查,僅有20%的公司能將人工智能發展為企業的戰略能力。極少有組織能成功駕馭AI真正的力量來創造有意義的影響。
如何利用人工智能?實現框架應該是什么樣的?由麥肯錫全球研究所(MGI)發布的這篇論文提出了組織需要集中關注的五個領域。
這些領域彼此關聯,每一個領域都需要共同協作才能展現出可見的影響。我將在本文中詳細闡述實現這個框架的可行方法。
1. 識別正確的用例
當一個組織決定開始人工智能之旅,首要任務就是識別正確的用例。在這一方面,發散-收斂法屬于經過驗證的、行之有效的方法。通過頭腦風暴探索盡可能多的AI用例,完成后就能匯總候選列表,找出其中排名前三的用例。
問題的關鍵是:如何匯總用例?重點要考量哪些維度?
建議從以下三個方面入手:
業務影響:這個用例是否有實際的業務影響?對其進行量化。
技術可行性:當前的技術環境是否支持這個用例的實現?創建一份技術圖譜。
數據有效性:是否有相關的數據點來支持這個用例?好好做一下研究。
以這三個要素構成一張基準圖,就可以用來判斷用例的可行與否。以下圖為例:
可以看到,在這張圖表上,橫縱軸分別表示業務影響和技術可行性,圓圈的大小則表明數據有效性。用例7和用例6在三個要素上均表現出較高水準。用例3雖然在其中一個維度表現欠佳,但相較其他用例,綜合來看可以列為下一個候選。
這里其實涉及到一個繞不過去的問題:到底多少數據算夠?
這個問題其實并沒有一個確切的答案。解決這個問題的經驗之談是先回答下面這個問題:有效數據是否足以支撐建立一個最小規模的可行模型?如果答案是肯定的,那么建議可以繼續努力,好好考量這一用例的發展潛力。
2. 創建高效的數據平臺
數據是新型“石油”,在組織中呈“滿溢”之勢,如何從中提取價值就成為每個組織都面臨的挑戰。而人工智能和數據是共生關系,需要彼此來互相成就。
長久以來,組織機構就試圖創建一個數據分析平臺,從數據庫、數據倉庫一直到數據湖,都試圖馴服這只“野獸”。而新的數據結構模式隨著數據技術的發展應運而生。2017年,我在博文《揭秘數據湖架構》中重點提到了——實用的AI數據平臺的組成要件。數據技術雖然在不斷進化,但核心還是不變的,這些概念依舊可用。
但有個問題有必要做一下深入思考:數據平臺利用人工智能的原則是什么?
以下是我的三條建議:
?。?)以原始格式存儲所有數據:數據的本質是復雜的。只有當你在真正使用時才能了解這些數據的用法。最好的策略是將它們全部以原始格式存儲,不做任何變動。云技術的出現降低了數據存儲的成本。存儲在云中的數據可能根據其生成方式、處理方式以及在生存期內的訪問方式而有所不同。以Azure為例,Azure存儲提供了不同的訪問層,包括熱訪問層、冷訪問層、存檔訪問層。用戶所存儲的數據0-50TB是按平均每月每GB 0.044美元計費,約為每月每TB 4.4美元,花銷還比不上星巴克的一杯中杯摩卡。這里有一條建議,對企業來說,我建議至少存儲過去5年的數據,那之后如果發現沒什么用,再歸檔也不遲。
?。?)解耦存儲和計算:存儲和計算這兩種負載對計算機資源的訴求完全不同,解耦存儲和計算有助于系統負載均衡調度。處理引擎可以面向批處理,也可以面向流處理。按需處理在一定程度上可以控制成本。根據所需的處理類型構建適當的處理引擎,任務完成后可以中止或銷毀處理引擎。解耦計算和存儲節省了大量的支出,還提供了很大的靈活性。
?。?)對數據進行編目和管理:防止數據湖變成交換平臺的一個最關鍵的原則是對數據進行詳盡的編目和管理。作為一條經驗法則,任何非瞬時化的內容都會被編目。對于業務分析人員、數據科學家或任何希望以正確格式找到正確數據的人來說,積極編目有利于輕松搜索數據元素,因此再怎么強調積極編目的重要性都不為過。編目和管理決定了數據分析平臺的成敗。
3. 采用正確的工具、過程和技術
除了識別正確的用例、創建高效的數據平臺之外,選擇合適的工具和技術來實現AI也非常重要。要推動人工智能的蓬勃發展,這里有三個原則需要遵循:
利用規模優勢:數據與人工智能之間密切相關,通常來說,要訓練的數據越多,就意味著模型越可用。過去由于存儲和計算能力有限,訓練模型的能力也因此受限。而在過去的二十年里,存儲和計算技術持續進化,云平臺不斷創新,存儲和計算成本變得可控,在可接受的范圍內進行規?;臄祿幚砗湍P陀柧氈饾u成為可能。
關注功能而不是技術:構建一個靈活的數據架構,每個組件都滿足特定的功能,但可用的技術特性并不會與組件綁定。基于功能是恒定的而技術是不斷變化的,云平臺的一大優勢就凸顯出來。云平臺的創新往往意味著可以不斷引進新技術,以更低的成本提供相同或更好的功能。
擁抱數據項目中的敏捷性:著名統計學家George Box曾打趣道:“所有模型都有謬誤,但依然有一些是有用的。”因為模型都建立在一定的假設上,超出特定范圍就可能出現紕漏。而找到有用的模型就是一個迭代的過程,每次迭代都是向那個有用的模型邁進的一步。記住,不要在AI項目中追求“絕對答案 ”。完美的模型就是烏托邦,以此為目標對于既定現實來說已經完全足夠了。
4. 在過程中整合AI決策
任何基于AI的項目的最終目標都是創造積極的影響。但是很多大有可為的人工智能項目在襁褓中就夭折了,自此不見天日。因此,一個AI項目從孵化階段開始就需要全程觀察。
有一點我需要再三強調:AI項目并不是純技術項目,而是注重影響力的項目。所有項目都需要一個結果。
這意味著,當你展望一個AI項目的前景時,不應該是關于模型和算法的,而必須是關于結果的,一個會給最終用戶帶來利益的結果。因為每個流程都是環環相扣的,所以需要回答這樣一些問題:
AI會影響流程中的多少步?
——這推進了流程自動化嗎?
——這加強了流程建設嗎?
再根據答案畫出正確的路線。
5. 構建實驗文化
文化是所有變化的基石?,F代管理學大師彼得•德魯克曾經說過:“文化能把戰略當早餐吃掉。”對于AI項目來說,此話非常精辟。決定成敗的往往不是技術,而是價值觀。對于AI實現來說,反復灌輸實驗文化至關重要。根據定義,實驗是一種驗證或推翻假設的過程。并不是所有的實驗都會成功,但所有的實驗都有收益。這種實驗文化需要滲透到公司的靈魂中。以下三條準則可以幫助公司構建實驗文化。
1、衡量指標。組織中的每個部門都需要衡量以下三個指標:在給定的時間內嘗試的實驗數量;在給定的時間內業務工作流中采用的的實驗數量;給定時間范圍內正在進行的實驗數量。
2、擁抱敏捷。敏捷是人工智能的出路。考慮到AI的本質,迭代方法最適合人工智能。敏捷理念中的三個核心教義:持續改進、信息透明和深度協作應該滲透到公司的DNA中。
3、樹立員工對AI的正確認知。關于人工智能的宣傳可以說鋪天蓋地,與這種炒作相伴而生的是一種恐懼,恐懼被取代,恐懼因此而失業。這種擔心其實沒有任何依據。在公司中建立對AI的理智認知非常重要。員工需要清醒地認識到AI能做什么、不能做什么。樹立了正確的認識后,員工對AI的接受度更高,也更容易運用AI來提升他們的工作技能。
總結
采用負責任的人工智能是不可避免的,所有人都應該接受這一現實。人工智能不是萬能靈藥,但是有了正確的框架,AI就有潛力產生積極的影響。
原文:https://medium.com/swlh/a-practical-framework-for-ai-adoption-a-five-step-process-ed8349977695
參考文獻:
Technology Review: The growing impact of AI on business
https://www.technologyreview.com/2018/04/30/143136/the-growing-impact-of-ai-on-business/
ZDNET: Enterprise adoption of AI has grown 270 percent over the past four years
https://www.zdnet.com/article/enterprise-adoption-of-ai-has-grown-270-percent-over-the-past-four-years/
McKinsey Global Institute: Artificial Intelligence The Next Digital Frontier
https://www.mckinsey.com/~/media/McKinsey/Industries/Advanced%20Electronics/Our%20Insights/How%20artificial%20intelligence%20can%20deliver%20real%20value%20to%20companies/MGI-Artificial-Intelligence-Discussion-paper.ashx
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】