成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

智能虛擬助理如何助你在 2022 年成倍提高工作效率

譯文 精選
人工智能
它們可以幫你訂比薩,找到優惠票價,并讓你意識到娛樂花銷要比投資更多。我們說的正是人工智能虛擬助理,它們如今已成為我們日常生活中熟悉的一部分。但是,人工智能助理背后有哪些技術,你又如何在業務中使用它們呢?本文將逐一解答。

譯者 | 張業貴

審校 | 孫淑娟 梁策

智能虛擬助理市場洞察

智能虛擬助理 (IVA, Intelligent Virtual Assistants) 也稱為智能個人助理 (IPA, Intelligent Personal Assistants) ,是由人工智能驅動的代理,能從客戶元數據、先前對話、知識庫、地理位置、以及其他模塊化數據庫和插件等環境中提取信息,并生成個性化響應。據 Mordor Intelligence 稱,智能虛擬助理市場將在 2020 年代快速增長,預計 2026 年將達到 62.7 億美元。

人工智能助理技術在很多方面類似于傳統的聊天機器人,但集成了下一代分析、機器學習、AR/VR 和數據科學。雖然傳統的聊天機器人可以基于馬爾可夫鏈和其他類似過程處理響應請求,但其靜態響應能力無法與智能虛擬助理的動態洞察力相比。

蘋果的 Siri 是最著名的虛擬助理之一,它是一款面向消費者的個人助理產品。其他的智能虛擬助理還有亞馬遜的 Alexa、微軟的 Cortana 和谷歌的 Google Assistant。像Siri 這樣的虛擬助理通過語音提示幫助客戶輕松執行命令,自動執行在智能手機上設鬧鐘、使用文本轉語音技術朗讀電子郵件、播放和搜索音樂以及發送短信等任務。智能虛擬助理在智能手機中得到廣泛普及,使得汽車制造商也廣泛采納。

就智能虛擬助理而言,亞太地區是一個值得關注的重要市場,其在醫療保健、技術和金融領域都有著顯著增長。該行業的重量級企業包括蘋果、Inbenta Technologies、IBM、Avaamo 和 Sonos 公司。

使用智能虛擬助理技術的用戶遍布醫療保健、電信、旅游和酒店、零售和 BFSI 領域。消費產品包括智能揚聲器、智能手機、汽車、商用車、家用電腦、家庭自動化電器等等。

IVA 和 IPA 所依賴的基礎技術包括機器學習、認知計算、文本朗讀、語音識別、計算機視覺和 AR。后文將詳述這點。

為什么公司要創建 AI 助理?

如果你是蘋果用戶,你可能無法想象沒有 Siri 的生活。亞馬遜 Alexa、谷歌助理、三星 Bixby——大多數大品牌都在投資開發AI助理。那么企業為什么要這樣做呢?

使用人工智能創建此類解決方案的主要優勢在于,人工智能可以高效、快速地處理大量數據、發表見解并提供智能建議。在語音采集和語音識別的支持下,AI助理將執行多種日常任務變得容易,例如在日歷中添加事件、設置提醒或跟蹤每月支出。據Statista數據,到 2024 年,全球使用的數字語音助理將超過 80 億個,大致相當于世界人口規模。

為業務構建虛擬助理的主要好處有:

  • 改進客戶支持服務 ,減少對人工客服的呼叫和服務請求數量。借助 AI 助理,你可以實現與客戶交互的業務流程自動化。這將使你的員工能夠專注于更復雜的任務,而不是將時間浪費在可以自動處理的請求上。
  • 關鍵數據收集的便利性。通過傳統的客服電話或聊天收集的客戶體驗數據,要求分析師通過海量電話對照客服專員收集和記錄的信息進行清理。使用智能虛擬助理,客戶的請求和相關信息可以立即歸檔、分類以供分析,而無需依賴客服專員的詳細記錄。
  • 個性化的用戶體驗。AI助理可以根據每個用戶的需求提供高質量的個性化服務。例如,智能個人助理可以記住用戶的姓名和偏好。這有助于提高用戶參與度,并提高客戶滿意度和忠誠度。

公司將客戶支持和公司工具鏈的復雜部分(如樂高積木一般)集成的能力是智能虛擬助理的主要優勢。通過二次開發,虛擬助理可以連接任何數據庫或任何資源,以提供關鍵信息并優化各個級別的工作流程。

AI虛擬助理的類型

AI虛擬助理包括:聊天機器人、語音助手、AI 化身和特定領域的虛擬助理。

  • 聊天機器人自創建以來一直是電子商務領域的支柱,但現代聊天機器人是由人工智能提供支持,這使得它們能夠思考客戶問詢,而不是通過一系列靜態事件來滿足客戶需求。
  • 語音助手使用語音識別和自然語言處理響應語音請求,例如著名的 Siri 和 Google助理。
  • AI 化身是模仿人類的3D模型,用于娛樂應用程序,或為虛擬客戶支持交互提供人性化的觸感。來自英偉達等公司的尖端技術能夠實時生成幾乎逼真的人類形象。
  • 特定領域的虛擬助理是專為特定行業設計的高度專業化的人工智能虛擬助理實現,比如針對旅游、金融、工程、網絡安全和其他具有嚴苛要求的行業的高性能需求進行了優化。

此外,我們還可以找到為特定任務創建的虛擬助理技術。例如,基于人工智能和3D建模的ATP(Avatar to Person)技術可以讓殘障人士執行“虛擬人臉重建”、“語音生成模擬”等任務,實現在線自由交流。

AI助理背后的技術

假設你想創建就像Siri這樣的個人虛擬助理,你會怎么做呢?最容易的一個選擇是將 Siri 直接集成到你的應用程序中。除了Siri,Cortana 和 Google助理也被開發人員廣泛集成使用。2016 年,蘋果發布了 SiriSDK。通過這個開發工具包,程序員可以將自己應用程序的功能集成為 Siri 可以執行的任務。SiriSDK 使用Intent 作為用戶意圖的標簽,并將意圖與自定義類和屬性相關聯。

如果你的公司不想依賴現有的 AI 助理選項,你需要一個由 AI 工程師組成的專家團隊來構建你自己的解決方案。下面讓我們深入了解智能虛擬助理背后的關鍵人工智能技術。

語音轉文本和文本轉語音

如果我們談論智能虛擬助理,它們至少需要語音轉文本 (STT,SPEECH-TO-TEXT) 和文本轉語音 (TTS,TEXT-TO-SPEECH) 功能。

語音轉文本 (STT) 的基本原理是將人類語音轉換為數字信號。當你說話時,空氣中會產生一系列的振動。該軟件使用模數轉換器 (ACD) 將它們轉換為數字信號并提取聲音,然后對它們進行分段并將它們與現有音素相匹配。音素是語言中能夠區分不同單詞的聲音的最小單位。基于復雜的數學模型,系統將這些音素與單個單詞或短語進行比較,并創建你所說內容的文本。

文字轉語音 (TTS) 則相反,該技術將文本轉換為語音輸出。TTS 是使用機器學習將文本轉換為人類語音的計算機模擬技術。該系統經過三個步驟,首先需要將文本轉換為單詞,然后進行語音轉寫,然后將轉寫轉換為語音。

語音轉文本 (STT) 和文本轉語音 (TTS) 用于虛擬助理技術的作用是確保用戶和應用程序之間的順暢高效溝通。要將使用靜態命令的基本語音助理轉變為可用的 AI 助理,你還需要讓程序能夠通過智能標記和啟發式方法來解釋用戶請求。

計算機視覺

計算機視覺 (CV,Computer vision) 是一種人工智能技術,可以從數字圖像或視頻等視覺輸入中提取有意義的信息。計算機視覺是創建可視化虛擬助理不可或缺的一部分。這些助理不僅僅可以響應聲音,也可以響應開發者生成的視頻,從而極大地增強了用戶體驗。

CV使系統能夠識別對交流非常重要的肢體語言。視覺虛擬助理通過攝像頭采集數據,并利用實時面部檢測來捕捉有人看向屏幕的時段,驅動系統的其它部分工作,將用戶的語音轉換為文本。

CV 還可以通過將用戶所說的內容與用戶面部和嘴巴的運動進行比較,從而大大提高語音識別的準確性。

噪音控制

噪音控制是關乎語音助理準確性的另一個關鍵功能。雖然許多智能手機都包含基于軟件的噪音控制和抑制功能,但你不能指望所有客戶都適用。為了彌補車載噪音抑制軟件的不足,頂級藍牙耳機還包括硬件噪音抑制功能,但這也不能保證你的 AI 助理能夠準確檢測到客戶在吵鬧的列車上到底在說什么。通過集成的噪音控制包,你可以最大限度地降低誤解語音查詢的風險。

語音壓縮

你的 AI 助理需要臨時存儲語音信息以進行處理,除非你打算讓語音數據填滿客戶的本地硬盤。因此語音壓縮很關鍵,但開發人員要小心謹慎。因為音頻文件可能被壓縮得很小,導致保真度低,從而難以或無法恢復處理過程中所說的內容。壓縮技術在飛速發展,語音助理的音頻編解碼器和壓縮解決方案也需要繼續深入研究。

自然語言處理

AI 助理需要處理和解釋獲得的語音數據,然后執行請求的命令,而自然語言處理(NLP ,Natural Language Processing) 則簡化了語音識別過程。盡管許多 AI 工具包都在無數小時的語音樣本上進行了預訓練,但你仍然需要足夠的客戶數據來調整用例的精度。如果你的 AI 助理想做到口頭響應,你將需要諸如 Google Cloud 等頂級語音合成解決方案,它可以產生逼真而清晰的聲音。

但是,語音處理不足以得出一個人的實際意圖并維持正常的對話。要將該請求正確解釋就需要自然語言理解發揮作用。

自然語言理解

自然語言理解 (NLU,Natural Language Understanding) 是自然語言處理的一種不同方法,被大多數計算機和數據科學家認為是 NLP 的一個分支。雖然 NLP 方法將自然語言解析、標記和標準化為用于命令處理的標準化結構,但 NLU 解釋自然語言而不對其進行標準化,并通過識別上下文從查詢中獲取含義。簡而言之,NLP 處理語法、結構并補償用戶的拼寫錯誤,而 NLU 檢查請求背后的實際意圖。

自然語言生成

自然語言生成 (NLG,Natural Language Generation) 產生自然語言輸出。有了這項技術,用戶可以從虛擬助理和聊天機器人那里收到類似人類的響應。用于 NLG 的模型和技術取決于項目的目標和開發方法,最簡單的一種方法是模板。模板具有預定義結構,且只需要填充少量數據。填充數據可以是電子表格中的某行數據,也可以是數據庫中的某條記錄等等。

另一種方法是動態 NLG,它不需要開發人員為每種特殊情況編寫代碼,系統能夠自行做出反應。這是一種更高級的依賴機器學習算法的方法。

深度學習

基于文本響應的聊天機器人比語音助理簡單得多。因為你不必解釋語音轉換的文本,所以在構建聊天機器人時也不需要那么多工具。下一代文本生成技術(例如 GPT-3)不僅能夠生成對基本請求的響應,還能夠從“種子”生成整個新聞故事。 深度學習使之成為現實。

由深度學習算法驅動的虛擬助理和聊天機器人,可以從自有數據和人們的對話中學習,檢查客戶和支持人員之間的交互過程,創建匹配的消息和響應,并修改用戶的拼寫錯誤和語法錯誤。

增強現實

增強現實 (AR, Augmented reality) 允許你在現實世界中疊加 3D 對象以獲得身臨其境的體驗。基于 AR 的移動聊天機器人和 AR 化身是使用這項技術的絕佳示例。例如,Arcade 為東倫敦的 Ragged School 博物館創建了一個名為 Miss Perkins 的移動 AR 化身聊天機器人。該助理為博物館參觀者提供指南,同時提供小測驗以增進交互式用戶體驗。

另一個智能移動 AR 聊天機器人的例子是維也納科技博物館的,其功能包括導覽和回答用戶關于文本、圖像、視頻和音頻格式的特定項目的問題。

元宇宙和 VR 技術的興起自然也引向了虛擬助理:3D AI 化身。結合人工智能,AR虛擬助理突破了現有AR工具的限制,變得更加實用。例如,深度學習允許智能虛擬助理實時捕獲用戶行為,驅動神經網絡自主訓練,提高虛擬助理的性能。

生成對抗網絡

作為使用神經網絡的算法架構, 生成對抗網絡(GAN,Generative Adversarial Networks)創建了合成數據的新方法。GAN 由輸入識別器的真實圖像樣本和生成器組成,為 AI 化身和 3D 助理生成逼真的 3D 面部。

GAN技術已被用于許多視頻游戲和產品,以創建逼真的人物形象。GAN 還可用于將靜止圖像轉換為全深度 3D 圖像。迄今為止,最先進的 AI 化身集成工具可能是英偉達的 Omniverse Avatar項目Maxine,它實現了面對面說話的逼真的實時效果。

情緒智能

當談到AI 化身或 3D 虛擬助理時,重要的不是聲音,而是肢體語言和人類情感。智能個人助理借助 AI支持的情緒智能 (EI,Emotional Intelligence) ,可在交流時實時跟蹤用戶的非語言行為并做出相應反應。借助 Emotion AI 跟蹤面部表情、肢體語言或語音來監控人類情緒,這將使響應速度更快。

Emotion AI 的核心是計算機視覺和機器學習算法。它使用標準網絡攝像頭或智能手機攝像頭拍攝面部,使用計算機視覺算法識別人臉的主要特征點并跟蹤他們的動作以解釋情緒。接下來,系統通過將收集的數據與模板圖像庫進行比較,根據面部表情的組合來確定人的感受。Affectiva 或 Kairos 等解決方案可以衡量以下情緒指標:快樂、悲傷、憤怒、蔑視、厭惡、恐懼和驚訝。

我們還可以從語音中識別情感。一些軟件不僅能分析人們所說的內容,還能分析人們是怎么說的。軟件提取有助于識別音調、音量、節奏變化的副語言特征,將其解釋為人類情感。

虛擬AI助理技術的挑戰和未來

虛擬助理技術的應用無疑也會遇到一些挑戰。未來人工智能輔助技術的一個主要問題是數據存儲和使用的法律。不受限制地使用客戶數據開展人工智能訓練很容易受到世界各國數據安全法律變化挑戰。在人盡皆知的舉報人丑聞事件發生后,Meta(前 Facebook)等公司有爭議的數據處理政策引發了人們對公司過度擴張和隱私問題的擔憂。

因此,在開發人工智能助理應用程序時,要考慮到隱私和數據保護的要求,例如歐盟頒布的《通用數據保護條例》(GDPR) 。你需要確保你的應用完全合規。

此外還有來自安全部門的安全保護問題。端到端加密、雙重認證和生物識別等安全機制是保護 AI 助理應用程序的一些最佳手段。此外,經驗豐富的 AI 工程師團隊可以幫助你開發機器學習算法驅動的定制安全系統。

盡管存在挑戰,但AI助理技術的未來看起來一片光明。技術的進步也在推動更智能的虛擬助理的發展。隨著 NLP 流程的不斷發展,虛擬助理將能夠執行更復雜的任務。特別是智能虛擬助理將能夠基于自學習算法提出主動建議,這對用戶更有幫助。

元宇宙的發展也與人工智能虛擬助理密切相關。AI 化身是在 3D 世界中展現用戶身份的最佳方式,AI將使我們的形象更逼真。基于對身體運動的研究,該模型可以學習并根據你的耳機和控制器的位置準確預測肩膀和肘部的位置。

譯者介紹

張業貴,51CTO社區編輯,從事企業信息化建設多年,致力于信息集成、數據治理和人工智能應用等,主要關注服務標準化、軟件過程改進,助力企業進行效率提升和價值創新。

原文標題:??How Machine Generated Virtual Assistants can 10x Your Productivity in 2022??,作者:Evgeniy Krasnokutsky

責任編輯:華軒 來源: 51CTO
相關推薦

2018-06-11 10:38:56

Vim使用技巧

2025-02-18 10:56:18

2009-05-14 11:43:56

2016-09-23 20:22:51

WordPressMarkdown工作效率

2011-03-22 14:57:58

2009-05-15 16:36:34

EclipseIDE效率

2011-09-13 19:46:57

2012-03-12 13:35:10

開發

2014-03-20 16:18:30

碼農工作效率

2020-11-26 10:29:01

Redis

2023-10-24 17:45:31

AI

2021-06-07 14:36:58

iPadSiri辦公

2023-09-01 07:31:41

工具工具類網站

2019-04-03 09:58:00

GitHub代碼開發者

2012-07-04 15:42:22

Web

2009-07-06 13:38:29

JSPInitJSPDestory

2019-12-29 15:41:42

終端命令Unix系統

2013-05-23 09:24:03

BYODBYOD策略思科BYOD

2019-07-17 05:02:14

物聯網工作效率IOT

2019-08-30 14:25:03

Vim命令Linux
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品国产三级国产aⅴ原创 | 九九久久精品视频 | 丝袜 亚洲 另类 欧美 综合 | 国产福利视频 | 在线观看免费毛片 | 日韩在线成人 | 91麻豆精品一区二区三区 | 日韩在线免费视频 | 欧美国产激情二区三区 | 91精品国产色综合久久不卡98 | 国产一区精品 | 四色成人av永久网址 | 欧美在线亚洲 | 国产精品污www在线观看 | 亚洲精品成人网 | 精品视频一区二区三区 | 欧美黄色片| 婷婷在线网站 | 992tv人人草 久久精品超碰 | 亚洲性视频 | 美女视频黄的免费 | 亚洲国产精品人人爽夜夜爽 | 狠狠狠色丁香婷婷综合久久五月 | 另类二区 | 欧美h视频 | 99热首页 | 久久精品免费观看 | 久久久久久久网 | 欧美日韩一区二区视频在线观看 | 久久蜜桃精品 | 欧美精品video | 国产超碰人人爽人人做人人爱 | 国产蜜臀97一区二区三区 | 欧美视频一区二区三区 | 免费看黄视频网站 | 谁有毛片 | 国产精品二区三区 | 91婷婷韩国欧美一区二区 | 精品免费国产一区二区三区四区 | 成人不卡| 国产69精品久久99不卡免费版 |