如何衡量對話型人工智能聊天機器人的成功
譯文【51CTO.com快譯】組織應該致力讓數據分析成為聊天機器人開發過程的一部分,并根據用戶的需求改進功能,特別是在醫療保健領域。
在去年,當聊天機器人開發商Quovantis Technologies公司在為一家醫療保健用戶構建對話式人工智能聊天機器人時,認為難以滿足其用戶的需求。該公司通常開發的是2級人工智能機器人(對話型人工智能最高為5級)。但是這家用戶希望構建一個場景/協商型人工智能驅動的聊天機器人。
人們關心的是,聊天機器人如何理解最終用戶的問題?可以構建哪些功能來使其更加人性化?它能成功地取代人類的關懷和同情嗎?它會有同樣的同情和關心的情緒嗎?
即使Quovantis Technologies公司成功完成了所有工作,那么如何知道對話式人工智能聊天機器人是否按照設計的方式工作?如何定義計劃的“成功”?
當《福布斯》雜志發布了一篇有關聊天機器人由于笨拙的對話和有限的學習能力而導致客戶體驗不佳的文章時,這種憂慮變成了現實。
Quovantis Technologies公司產品總監Sumeet Mehta為此指出,“開發的人工智能聊天機器人的功能并不能達到客戶要求,這讓人沮喪。在我使用Skyscanner聊天機器人時,它經常誤解我的請求。更讓人惱火的是,使用聊天機器人的客戶似乎對這個問題不屑一顧。”
問題出現在那些只看到數據分析在聊天機器人的重要性的組織或管理層身上。而如何了解用戶的行為,是什么讓客戶失望和高興,這些事項超出了他們的工作范圍。由于有了這種心態,聊天機器人的開發和應用通常會面臨失敗的情況。
有沒有解決的辦法?
確實有解決辦法,因為人類將掌握聊天機器人的未來。為了使聊天機器人對用戶更加友好,不僅需要使其軟件方面(工程設計、用戶體驗、安全性等)更加強大,還應該努力使數據分析成為開發過程的一部分,即必須不斷監控聊天機器人對話的有效性,并根據用戶的需求改進功能。
如何衡量聊天機器人的效率?
構建良好的對話型人工智能聊天機器人是一項艱巨的任務。即使在將其作為一項服務推出之后,也不能確定它是否成功。這就是衡量與最終用戶的每次交互是至關重要的原因。
有一些特定的指標可以跟蹤,以查看聊天機器人是否獲得成功。為此需要提出以下問題:
- 聊天機器人是否能夠處理用戶查詢,并給出滿意的答案?
- 聊天機器人是否能夠理解用戶的意圖?
- 與聊天機器人對話的平均會話時長是多少?
- 用戶最常查詢的問題是什么?
- 最常見的對話路徑是什么?
- 聊天機器人在每天/每周/每月中接收/發送多少條消息?
- 聊天機器人有多少次無法回答提出的問題?
- 聊天機器人是否能夠成功將對話移交給人類?
- 聊天機器人是否檢測到用戶的高風險意圖?
- 聊天機器人在給定時間處理多少活躍用戶/經常性用戶?
- 對聊天機器人的客戶評價是什么?
根據聊天機器人的類型,還可以定義許多其他指標。
為了衡量這些指標,現在市場上推出幾種聊天機器人分析工具。以其中三個聊天機器人為例,它們都有一些優點和缺點。
1.Botanalytics
如果組織正在尋找一種可以概述用戶生命周期的工具,那么Botanalytics非常適合。這是一個識別用戶從接觸產品到離開產品整個過程的很好的工具。可以深入研究每個對話(每個對話都可以使用腳本),并查看聊天機器人未能響應的地方。
組織可以設置各種目標,并將聊天分類為對話路徑。這是一項很好的功能,因為它可以幫助組織檢查哪些對話達到了目標,哪些沒有達到目標。
例如,如果組織的目標是讓用戶通過聊天中提供的鏈接下載其移動應用程序,則這個工具將向其顯示完成該目標的會話數量。
組織還可以設置對話路徑,并檢查聊天機器人成功處理了多少對話。
2.Grafana
Grafana并不是聊天機器人分析工具。與其相反,它是一個開放源代碼平臺,可以用來監視應用程序、網站,甚至自定義數據源。用戶可以將其與聊天機器人平臺集成,將其作為聊天機器人分析工具。
使用Grafana的優點之一是很容易進行自定義,可以調整其儀表板以適應其需求。
如果組織采用一個聊天機器人,其中有很多數據需要理解、分析和剖析,那么必須探索Grafana。并且它是高度可定制的免費軟件。組織可以根據評估人員和利益相關者的需要創建儀表板、添加面板、更改可視化效果。
3.Chatbase
Chatbase是一個基于云計算的免費工具,可讓組織將聊天機器人集成到分析平臺中。 Chatbase的最佳功能之一是可以幫助組織分析和優化聊天機器人。
在分析功能方面,Chatbase具有組織可以想象到的所有的功能:會話流、創建漏斗、未處理消息的分組、聊天記錄等等。儀表板的用戶界面(UI)與Google Analytics非常相似。因此, Google Analytics用戶會發現它更容易使用。
在優化部分,Chatbase通過跟蹤用戶的行為以及對用戶有效(或無效)的方式提供洞察力,以了解用戶。當組織希望針對特定的受眾,并且希望根據分析工具的特定輸入改進其消息和促銷時,這尤其有用。
結論
在構建聊天機器人時,包括分析在內的策略通常被忽略,而這被認為是一種容易規避的額外責任。但是,衡量聊天機器人的性能指標必須包含在開發策略中,因為這是組織定義聊天機器人是否按其想象的那樣工作的唯一方法。
希望組織可以集成這些工具,并使用分析為最終用戶增強聊天機器人的體驗,并找到適合其需求的最佳工具。
原文標題:How To Measure the Success of a Conversational AI Chatbot,作者:Sumeet Mehta
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】