作者丨MichelleZhou
翻譯丨李睿
策劃丨孫淑娟
【51CTO.com快譯】重復使用預先構建的人工智能解決方案和組件以及無需編碼即可對其進行自定義,最終將允許企業創建人工智能解決方案,而無需雇傭人工智能專業人士或采用成本昂貴的 IT 資源。
人工智能技術先驅、麻省理工學院教授 J.C.R. Licklider 于 1960 年在他撰寫的一篇名為《人機共生》開創性論文中對于未來世界進行了設想:“在預期的共生伙伴關系中,人類將設定目標、制定假設、確定標準,并進行評估。計算機將完成程序化工作,為技術和科學思維中的洞察力和決策鋪平道路。”
在當今世界,這種計算機被稱為“人工智能助理”。然而,開發人工智能助理是一個復雜、耗時的過程,需要深厚的人工智能專業知識和復雜的編程技能,更不用說收集、清理和注釋訓練此類人工智能助理所需的大量數據的工作。因此,在不同的應用程序和領域中重用人工智能助理的全部或部分內容是非常必要的。
人工智能學習人類技能很難
訓練人工智能助理很困難,因為此類人工智能助理必須具備一定的人類技能,才能與人類協作并幫助人類完成有意義的任務,例如確定醫療保健治療或提供職業指導。
人工智能必須學習人類語言
為了切實地幫助人類,人工智能助理必須掌握最重要的技能或許是人類語言,這樣人工智能才能與用戶交互、解釋他們的自然語言輸入,以及采用自然語言響應他們的請求。然而,由于多種原因,教授機器學習人類語言并非易事。
首先,人類表達是高度多樣化和復雜的。如圖 1 所示,例如,在人工智能助理(也稱為人工智能聊天機器人或人工智能面試官)采用開放式問題面試求職者的應用程序中,求職者對此類問題的回答多樣化并且十分復雜。
圖 1. 一位人工智能助理在求職面試中提出一個開放式問題(“你在工作中面臨的最大挑戰是什么?”)。求職者的回答非常多樣化和復雜,這使得訓練人工智能正確識別和響應此類回答變得非常困難
其次,求職者可能會通過提出澄清性問題或提供不相關的回答來偏離主題。下面的示例(圖 2)顯示了考生對上述同一問題偏離主題的回答。人工智能助理必須正確識別和處理此類響應,才能繼續對話。
圖 2. 人工智能助理必須識別并正確處理三種不同的用戶偏離主題回答,才能繼續對話
第三,用戶的表達可能模棱兩可或不完整(圖 3)。
圖 3. 顯示用戶對人工智能問題的模棱兩可回答的示例
人工智能必須學習人類的軟技能
讓機器學習人類技能變得更加困難的是,人工智能還需要學習人類的軟技能才能成為人類的得力助手。就像具有軟技能的優秀人類助手一樣,人工智能必須能夠讀取人類的情緒,并在敏感情況下具有同理心。
一般來說,教授人工智能學習人類技能(語言技能和軟技能等)很困難的原因,主要有三個:
首先,它通常需要人工智能專業知識和 IT 編程技能來弄清楚需要哪些方法或算法以及如何實施這些方法來訓練人工智能。
例如,為了訓練人工智能正確響應用戶對開放式問題的高度多樣化和復雜的響應,如圖 1 和圖 2 所示,必須知道可以使用哪些自然語言理解 (NLU) 技術(例如可以使用數據驅動的神經方法)或機器學習方法(例如監督或無監督學習)。而且,必須編寫代碼來收集數據,使用這些數據來訓練各種 NLU 模型,并連接不同的訓練模型。正如人工智能專家 Ziang Xiao 等人在這篇研究論文中所解釋的那樣,整個過程非常復雜,需要大量人工智能專業知識和編程技能。即使使用現成的機器學習方法也是如此。
其次,為了訓練人工智能模型,必須有足夠的訓練數據。通過上面的例子,Ziang Xiao 等人為每個開放式問題收集了數以萬計的用戶回答,以訓練人工智能助理在面試對話中使用此類問題。
第三,正如在研究中所描述的那樣,從頭開始訓練人工智能助理通常是一個反復且耗時的過程。這個過程包括收集數據、清理和注釋數據、訓練模型和測試訓練模型。如果訓練后的模型表現不佳,則需要重復整個過程,直到訓練后的模型合格為止。
然而,大多數組織沒有內部人工智能專業知識或復雜的 IT 團隊,更不用說訓練人工智能助理所需的大量訓練數據。這將使此類組織很難采用人工智能解決方案,從而造成潛在的人工智能鴻溝。
多級可重用、基于模型的認知人工智能
為了讓人工智能得以廣泛的應用,一種解決方案是預訓練人工智能模型,這些模型可以直接重用或快速定制以適應不同的應用程序。與其完全從頭開始構建模型,不如將其從預制部件拼湊起來會更容易、更快捷,就像采用發動機、車輪、制動器和其他組件組裝汽車一樣。
在構建人工智能助理的背景下,圖 4 顯示了一個基于模型的認知人工智能架構,其中三層人工智能組件相互疊加。每一層的人工智能組件都可以預先訓練或預先構建,然后重用或輕松定制以支持不同的人工智能應用程序。
圖 4. 基于模型的認知人工智能架構,在多個層次中具有可重用的人工智能
重用預訓練的人工智能模型和引擎(人工智能助理的基礎)
包括人工智能助理在內的任何人工智能系統都建立在人工智能 / 機器學習模型之上。根據模型的用途或訓練方式,它們可分為兩大類:
- 可用于不同人工智能應用程序的通用人工智能模型;
- 經過訓練的專用人工智能模型或引擎特定的人工智能應用。會話代理是通用人工智能的一個例子,而物理機器人是專用人工智能的一個例子。
人工智能或機器學習模型包括數據驅動的神經(學習模型或符號模型。例如,BERT 和 GPT-3 是通用的、數據驅動的模型,通常在維基百科等大量公共數據上進行預訓練。它們可以在人工智能應用程序中重復使用來處理自然語言表達。相比之下,諸如有限狀態機之類的符號人工智能模型可以用作句法解析器,以識別和提取更精確的信息片段,例如,特定概念(實體),例如來自用戶輸入的日期或名稱。
出于多種原因,通用人工智能模型通常不足以為特定的人工智能應用程序提供動力。首先,由于此類模型是在通用數據上訓練的,因此它們可能無法解釋特定領域的信息。如圖 5 所示,預訓練的通用人工智能語言模型可能“認為”表達式 B 更類似于表達式 A,而人類會識別出 B 實際上更類似于表達式 C。
圖 5. 顯示預訓練語言模型缺失的示例。在這種情況下,在通用數據上預訓練的語言模型將表達式 B 解釋為與表達式 A 更相似,將其解釋為與表達式 C 更相似
此外,通用人工智能模型本身不支持特定任務,例如管理對話或從對話中推斷用戶的需求和愿望。因此,必須構建專用人工智能模型來支持特定應用程序。
以聊天機器人形式的認知人工智能助理的創建為例。認知人工智能助理建立在通用人工智能模型之上,由三個額外的認知人工智能引擎提供支持,以確保與用戶進行有效和高效的交互。特別是,主動聆聽對話引擎使人工智能助理能夠正確解釋用戶的輸入,包括場景中不完整和模棱兩可的表達(圖 6a)。它還使人工智能助理能夠處理任意用戶中斷,并維護對話場景以完成任務(圖 6b)。
圖 6a. 示例展示了認知人工智能對話引擎如何處理不同響應場景中的相同用戶輸入
圖 6b. 展示了認知人工智能對話引擎如何處理對話中的用戶中斷并能夠維護場景和聊天流的一個示例
雖然對話引擎確保了富有成效的互動,但個人洞察推理引擎則可以更深入地了解每個用戶,并實現更深入的個性化參與。作為個人學習伙伴或個人健康助理的人工智能助理可以鼓勵其用戶根據他們獨特的個性特征堅持學習或研究課程,這是他們的獨特之處(圖 7)。
此外,對話特定的語言引擎可以幫助人工智能助理在對話過程中更好地解讀用戶表達。例如,情感分析引擎可以自動檢測用戶輸入中表達的情感,而問題檢測引擎可以識別用戶輸入是問題還是需要人工智能助理做出響應的請求。
構建在這里描述的任何人工智能模型或引擎都需要巨大的技能和努力。因此,非常需要使此類模型和引擎可重復使用。通過精心設計和實施,討論過的所有認知人工智能引擎都可以重用。例如,主動傾聽對話引擎可以用對話數據進行預訓練,以檢測不同的對話場景(例如用戶正在找借口或澄清問題)。該引擎可以預先構建優化邏輯,在處理用戶中斷時始終嘗試平衡用戶體驗和任務完成。
同樣,結合項目反應理論 (IRT) 和大數據分析,個人洞察引擎可以根據個人數據進行預訓練,這些數據體現了他們的溝通模式與其獨特特征(例如,社交行為或現實世界的工作之間的關系表現)。然后,只要對話是用自然語言進行的,就可以重用該引擎來推斷任何對話中的個人見解。
重用預建的人工智能功能單元(人工智能助理的功能)
通用人工智能模型和特定人工智能引擎可以為人工智能助理提供基礎智能,而完整的人工智能解決方案需要完成特定任務或提供特定服務。例如,當人工智能面試官就特定主題(如圖 1 所示)與求職者交談時,其目標是從求職者那里獲取有關該主題的相關信息,并使用收集到的信息來評估求職者是否適合某個工作角色。
因此,需要各種人工智能功能單元來支持特定的任務或服務。在認知人工智能助理的背景下,一種服務是與用戶交互并滿足他們的需求(例如完成交易)。例如,可以構建特定主題的人工智能通信單元,每個單元都可以讓人工智能助理與用戶就特定主題進行交流。因此,對話庫將包含多個人工智能通信單元,每個單元都支持特定任務。
圖 7 顯示了一個示例人工智能通信單元,它使人工智能助理能夠與用戶(例如求職者)就特定主題進行對話。
圖 7. 以人工智能通信單元為例,它使人工智能助理能夠與其用戶討論特定主題。它包括多個條件操作(響應),人工智能助理可以根據用戶在討論期間的操作來執行這些操作。在這里可以檢測用戶動作,并且能夠使用預訓練的語言模型(例如架構底部兩層提到的模型)生成人工智能動作
在基于模型的架構中,可以對人工智能功能單元進行預訓練以直接重用。它們也可以通過合并新的條件和相應的動作來組合或擴展。
重復使用預先構建的人工智能解決方案(人工智能助理)
基于模型的認知人工智能架構的頂層是一組端到端的人工智能解決方案模板。在制作認知人工智能助理的背景下,這個頂層由各種人工智能助理模板組成。這些模板預先定義了人工智能助理要執行的特定任務流,以及在交互過程中支持人工智能功能的相關知識庫。例如,人工智能求職面試模板包括一組人工智能助理與求職者交談的面試問題,以及用于回答與工作相關的常見問題解答的知識庫。類似地,人工智能個人健康管理員模板可以概述人工智能助理需要執行的一組任務,例如檢查健康狀況以及提供護理說明或提醒。
這樣的模板可以直接重用以創建人工智能助理,還可以快速定制以滿足特定需求。
可重用的人工智能支持無代碼人工智能
在創建人工智能解決方案時,可重用的人工智能組件或系統不僅可以節省時間和精力,還可以快速、無代碼地定制可重用的組件。由于每個人工智能解決方案都可能需要進行某些定制,因此無代碼人工智能進一步促進人工智能的應用,并加快了人工智能系統的上市時間。以下是幾個無需編碼即可自定義可重用人工智能組件的示例。
人工智能解決方案模板無代碼定制
假設人力資源招聘人員希望創建人工智能面試官。招聘人員可以重復使用人工智能面試官模板,即編輯模板中的面試問題或與工作相關的常見問題解答以構建自定義人工智能面試官(圖 8a)。模板重用和無代碼定制極大地簡化了端到端人工智能解決方案的創建,特別是對于不知道如何編碼或缺乏深厚 IT 技能的工作人員來說。
圖 8a. 人工智能面試官模板的無代碼定制,因此人工智能可以詢問人力資源招聘人員設計的特定問題。在這里,招聘人員添加了“你最喜歡目前工作中的什么?”這個問題,現有的人工智能通信單元將自動處理有關此主題的討論
人工智能功能單元無代碼定制
繼續以上面的例子為例,假設招聘人員希望人工智能面試官問求職者這個問題 “你最喜歡目前工作中的什么?”,如果應聘者的回答是“與客戶互動”,那么招聘人員希望人工智能面試官提出一個后續問題,“你能舉一個喜歡與客戶互動的例子嗎?”
由于沒有任何預先構建的人工智能通信單元處理這種特定情況,招聘人員將需要自定義人工智能通信。如圖 8b 所示,招聘人員可以通過指示用戶響應和相應的人工智能面試官操作,包括后續問題來輕松做到這一點。同樣,所有定制都可以在沒有編碼的情況下完成。
圖 8b. 人工智能通信單元的無代碼定制。在這里,如果用戶在“你最喜歡目前工作中的什么?”問題的回答類似于“客戶交互”,則人工智能面試官會回答并提出后續問題
上述示例展示了可重用人工智能模板或組件的無代碼定制如何讓任何非 IT 人員快速創建定制的人工智能解決方案。
無代碼、可重用人工智能的未來發展方向
無代碼、可重復使用的人工智能使強大的人工智能解決方案的創建和采用民主化,無需雇傭人工智能專業人員或采用成本昂貴的 IT 資源。為了使無代碼、可重用的人工智能成為開發和采用人工智能解決方案的主要模式,必須在多個領域取得進展。
第一個領域是使可重復使用的人工智能組件和系統變得可解釋。為了幫助非 IT 人員重用預先訓練或預先構建人工智能組件和解決方案,至關重要的是打開“黑盒”并解釋每個組件或解決方案內部的內容,包括優缺點。可解釋的可重用人工智能不僅可以幫助人類更好地理解和利用現有的人工智能組件和系統,還可以幫助避免潛在的人工智能陷阱。例如,人力資源招聘人員在使用這種人工智能能力來推斷求職者的見解之前,了解如何推斷個人見解會很有幫助。
第二個方面是支持自動人工智能調試。隨著人工智能解決方案變得越來越復雜,在多樣化和復雜的情況下很難人工檢查潛在的人工智能行為。非 IT 用戶尤其需要幫助來評估人工智能解決方案(例如人工智能助理)并在正式部署之前對其進行改進。盡管有一些關于分析人工智能助理的初步研究,但未來還需要做更多的研究。
第三個領域是確保負責任地使用人工智能,特別是考慮到人工智能的民主化。例如,如果有人可以簡單地重用人工智能功能單元來從用戶那里獲取敏感信息,那么誰來保護用戶及其敏感信息,如何進行保護?除了測量準確性和穩健性等典型的人工智能性能之外,還需要采用新的措施和使用指南,以確保創建和部署值得信賴和安全的人工智能解決方案。
原文標題:How no-code, reusable AI will bridge the AI divide,作者:Michelle Zhou
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】