成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

很遺憾,自然語言理解是AI尚未攻克的領域

人工智能 語音識別
短短幾年之內,深度學習算法得到了長足發展,不僅在棋類游戲中擊敗了全球很優秀的選手,也能夠以等同于、甚至超越人類的準確率識別人臉。但事實證明,人類語言仍是一項獨特且深邃的難題,亦是AI技術所面對的最為艱巨的挑戰之一。

短短幾年之內,深度學習算法得到了長足發展,不僅在棋類游戲中擊敗了全球很優秀的選手,也能夠以等同于、甚至超越人類的準確率識別人臉。但事實證明,人類語言仍是一項獨特且深邃的難題,亦是AI技術所面對的最為艱巨的挑戰之一。

[[377044]]

 

但是,突破能否如期而至?

一旦計算機可以有效理解人類語言內容,則必將徹底顛覆全球各品牌、企業與組織之間的交互方式。如今,大多數企業拿不出充裕的資源為每位客戶提供一對一解答服務。但在語言AI真正成熟之后,企業將能夠在任意時間通過任意渠道聽取、理解并回應每一個問題。這是一項激動人心的發展愿景,但距離達成目標仍有漫長的道路要走。

直到2015年,人們才構建出一種足以在準確率方面與他類相匹敵的人臉識別算法。Facebook的DeepFace準確率為97.4%,僅略低于人類的97.5%。作為參考,FBI以往的人臉識別算法準確率僅為85%,意味著其做出的判斷有超過七分之一概率是錯的。

FBI算法是由一組工程師手工開發而成。其中每項特征(例如鼻子大小以及眼睛的相對位置)皆由手動編程而來。Facebook算法則真正實現了特征學習,其利用一種被稱為卷積神經網絡的特殊深度學習架構,模擬出人類視覺皮層通過復雜的多層結構處理圖像內容。事實上,我們并不清楚這些皮層之間是如何聯系的,因此一切“奧秘”都由算法自主探索得來。

Facebook之所以能夠達成這一成就,依靠的正是實現類人級人工智能的兩個基本思路:首先建立一套能夠學習特征的架構,再將數百萬張經過標記的高質量圖像作為訓練素材供其學習。

語言難關就在眼前

視覺的誕生雖然困難,但已經有數百萬種物種在進化過程中攻克了這道難關。相比之下,語言似乎更為復雜。據我們所知,人類是目前唯一能夠使用復雜語言交流想法的物種。

不到十年之前,出現了單憑某些詞匯的出現頻率即可大致推理出語義的AI算法。但這種方法顯然忽視了同義詞元素的存在,也無法應對某些表達在不同上下文中具有不同表意的問題。

2013年,Tomas Mikolov和他的谷歌團隊創造出一種能夠學習單詞含義的架構。他們的word2vec算法能夠將同義詞相互映射,借此對大小、性別、速度等語義進行建模,甚至能夠將國家與首都等特征關聯起來。

但其中仍然缺少至關重要的一環——理解上下文。語言理解領域的真正突破誕生于2018年,谷歌公司在這時推出了BERT模型。Jacob Devlin和他的團隊仍然沿用傳統機器翻譯中的架構,但向其中引入了學習句子內上下文信息的能力。

通過教育該模型填補維基百科文章中的遺漏單詞,該團隊得以將語言結構嵌入BERT模型。只需要使用數量有限的高質量標記數據,他們就成功完成了對BERT的調優,借此完成從為問題找到正確答案、到真正理解句子表意的多種任務。也憑借這一壯舉,他們成為破解語言理解謎題的先驅:正確架構,加上大量可供學習的高質量數據。

2019年,Facebook的研究人員在此基礎上又更進了一步。他們同時使用100種語言訓練出類似的BERT模型。此模型能夠以一種語言(例如英語)進行特征學習,再將成果應用于其他任意一種語言(例如阿拉伯語、漢語及北印度語)。這種具有語言中立性的模型能夠在實際訓練所選定的語種上實現與BERT完全一致的性能,并在遷移至另一種語言時將影響控制在較低程度。

這些技術本身確實給人留下了深刻印象。但在2020年初,谷歌研究人員最終得以在廣泛的語言理解任務上超越了人類的表現。谷歌引入規模更大的網絡架構與更多訓練數據,終于將BERT架構推向了極限。如今,這套被命名為T5的架構在標記句子與尋找答案方面的表現已經超越人類。去年10月發布的多語種mT5模型已經能夠在雙語種間互譯方面實現與人類相近的表現,更恐怖的是它能夠支持多達100種語言。谷歌本周又公布了新的萬億級參數模型,整體架構規模更上一層樓,性能也進一步提升。

可能性

設想一下,未來的聊天機器人也許能夠理解您用任何一種語言書寫的內容,真正理解上下文并記住之前聊過的內容。這意味著我們得到的不再只是幾條簡單粗暴的預定義回應,而是真正的關切與解答。

搜索引擎也將能夠理解您的問題,給出正確答案,而且不再糾結于您的用詞是否嚴格準確。您可能還會迎來一位AI同事,它了解關于業務流程的所有知識。更重要的,如果能夠使用正確的術語,那么單靠谷歌搜索沒準就能解決客戶的具體問題。連篇累牘的內部文檔終將成為過去,留給AI模型快速瀏覽即可。

數據庫的新時代即將來臨。我們將徹底告別構造數據的繁瑣工作——一切備忘錄、電子郵件、報告都將由AI模型自動解釋、存儲與索引。由于數據庫能夠理解人類表達,您不需要求助于IT部門即可直接查詢并創建報告。

這一切還只是冰山一角。目前一切依賴于人類語言理解能力的流程,都有可能被自動化功能所徹底顛覆。

沒那么簡單

但這里還有個問題。既然這么出色了,為什么這些算法還沒得到普遍應用?因為單靠云計算資源訓練T5算法,就花掉了谷歌約130萬美元。幸運的是,谷歌研究人員慷慨地分享了這些模型。但如果要對當前任務進行調優,還需要額外承擔一大筆資源開銷,外加漫長的訓練周期。

不過隨著時間的推移,企業對于調優工作的不斷探索,相信未來會有更多應用方案陸續涌現。另外,如果大家相信摩爾定律,那么五年左右之后我們就會迎來更復雜的語言AI應用,屆時也會有新的模型全面超越T5算法。

2021年,我們距離AI技術的轉折性突破還有遙遠的距離。但只要能夠邁過這道難關,AI技術必將釋放出無窮的可能性。

 

 

責任編輯:華軒 來源: 今日頭條
相關推薦

2017-05-05 15:34:49

自然語言處理

2021-05-17 09:00:00

自然語言人工智能技術

2021-08-17 15:47:12

機器學習自然語言神經網絡

2020-04-30 11:05:50

機器閱讀人工智能機器學習

2020-12-07 08:16:39

自然語言查詢數據庫數據庫查詢

2025-01-26 12:34:46

AI運維配置

2021-09-22 10:18:58

自然語言神經網絡人工智能

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2017-03-30 14:52:34

自然語言商業智能

2021-04-12 11:41:09

人工智能知識圖譜

2017-03-28 17:52:58

自然語言處理商業智能

2018-04-04 12:00:00

2021-05-13 07:17:13

Snownlp自然語言處理庫

2023-08-03 09:56:47

自然語言AI

2017-11-17 08:27:47

谷歌自然語言框架

2023-11-27 15:34:51

大語言模型PubMedBERT

2017-05-08 06:14:19

人工智能自然語言大數據

2020-11-16 12:02:22

人工智能語言技術

2024-04-24 11:38:46

語言模型NLP人工智能

2017-10-19 17:05:58

深度學習自然語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩成人影院在线观看 | 黄色a视频| 91精品国产综合久久久久久丝袜 | 日韩欧美国产一区二区 | 男人久久天堂 | 国产精品久久一区二区三区 | 午夜影视网 | 99re热精品视频 | 国内精品成人 | 欧美一级欧美三级在线观看 | 欧美精品一区二区三区四区五区 | 日韩一区二区三区在线 | 久久久久91| 国产激情视频在线 | 久草资源在线 | 日韩欧美在线不卡 | 亚洲美女天堂网 | 精品久久久久久久久久久久久 | 国产精品一区一区三区 | 亚洲精品自拍视频 | 国产精品成av人在线视午夜片 | 国产99久久精品一区二区永久免费 | 亚洲一区在线日韩在线深爱 | 精品国产一级 | 成人福利在线观看 | 91免费视频 | 国产日韩一区二区三区 | 欧美色视频免费 | 一本色道久久综合亚洲精品高清 | 日韩一区二区三区在线视频 | 91在线视频播放 | 九九激情视频 | 午夜伦4480yy私人影院 | 国产精品福利在线观看 | 国产色| 久草欧美视频 | 毛片一级片 | 精品香蕉一区二区三区 | 中文字幕一区二区三区不卡 | 亚洲 欧美 日韩 精品 | 免费在线一区二区 |