如何避免又一個AI寒冬?
盡管過去幾年中,人工智能取得了長足的進步,但相信很多人都還記得20世紀90年代,由于開發者過分夸大承諾以及最終用戶不切合實際的期望所導致的AI寒冬。現在有行業內部人士(例如Facebook的AI負責人Jerome Pesenti)預測,AI很快又會陷入困境,這次的原因是缺乏語義理解。
Pesenti說:“深度學習和當前的AI技術有很多局限性。我們離實現人類智能還非常非常遠,并且有一些批評實際上是有道理的:AI可能會傳遞人類的偏見,不容易解釋,不具備常識,更多的是模式匹配,而不具有魯棒性的語義理解。”
還有一些計算機科學家認為,人工智能正面臨“可再現性的危機”,因為很多復雜的機器學習算法都是“黑匣子”,無法輕易復制。McGill計算機科學教授Joelle Pineau指出,復制和解釋AI模型的工作原理可以提供AI透明性,有助于未來的技術創新和研究工作,當算法取代人工決策來決定誰被判入獄、誰被批準抵押,這一點就變得至關重要。”
下面就讓我們看一下如何避免另一個“AI寒冬”的出現。
從符號主義AI開始
無法解釋和重現AI模型是我們需要克服的一大障礙,我們需要讓AI既可信賴又實用。要解決這個問題,我們可以退后一步,考慮利用符號主義AI,然后采取兩個措施,將符號主義AI(經典知識表示、基于規則的系統、推理、圖形搜索)與機器學習結合起來。
符號主義AI通過使用本體和分類法為數據添加了含義或者語義。基于規則的系統是符號主義AI的一項主要技術。這些系統非常依賴于這些本體和分類法,因為這些方法有助于制定正確的、有意義的if/then規則。使用規則和基于規則的系統,好處在于提供了一致且可重復的結果,有助于獲得可解釋的結果。
消除數據孤島
為了讓AI滿足當前的期望,我們還需要消除跨IT系統查詢的孤島,發布更精細的聚合查詢,自動執行模式和數據驗證措施,以獲取準確的分析結果。
為機器學習模型聚合各種不同的訓練數據集,要求能夠跨數據庫進行查詢,或者迅速為此整合各種不同的來源。語義圖數據庫通過基于標準的方法支持統計AI的這一先決條件,在這個方法中,圖形的每個節點和邊緣都具有唯一的、機器可讀的全局標識符。
因此,企業組織可以將不同的數據庫連接在一起,以便在這些數據庫之間進行查詢,同時合并各種常見用例的來源,例如預測個人的下一個健康問題或者及時的供應鏈管理。
這種聯合查詢可以確保數據始終保持相關性,并且對任何新興技術都具有前瞻性。在這個需要AI和分析進行實時決策的時代,企業組織根本沒有時間在孤島數據庫之間重建架構和術語。
自動驗證數據
模式概念與數據驗證本質上是相關,這對于信任查詢結果從而進行分析來說是至關重要的。語義知識圖通過自然發展的數據模型、自描述模式和按需模式選項(例如JSON、JSON-LD和SHACL)實現所有模式的標準化。
SHACL之類的框架對于驗證數據來說是至關重要,這是通過確保數據形狀一致來自動驗證的。現實情況是,如果沒有明確的機制,就幾乎不可能在不編寫過程代碼的情況下針對數據質量這一基本方面來驗證數據,這個過程可能是非常費時(取決于任務規模)。
人工智能時代,自動化已經迫在眉睫。手動生成用于數據驗證措施的腳本是非常浪費時間的,而這個過程就像認知計算本身一樣是可以自動化和可以重復的。
詞匯標準化有助于聚合查詢
操作型AI要求的查詢精細度是極高;但是,知識圖形中的詞匯表和分類法標準化支持順序查詢聚合,這些聚合很難在其他設置中復制。一旦企業組織對不同概念的詞匯及其含義實施了標準化,那么不僅可以創建各種分類法,還可以通過鏈接進行查詢。
例如在醫療領域,你可以查詢所有患有某種疾病的患者,該疾病的特定治療方法,在接下來的三個月內要進行移植,以及為患者開具的特殊藥物。通過查詢不同分類法將各種查詢聚合為單個查詢以獲得特定結果,這一能力一定程度上有助于這種復雜的、臨時的查詢操作。
在不久的將來,跨數據庫的查詢、自動驗證數據、匯總查詢會變得越來越常見。人工智能將成為企業必不可少的一大要素,那些采用語義知識圖譜方法的企業一定會脫穎而出。