成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

就算戴上口罩,AI也知道你在說啥

人工智能
現在,檢測面部肌肉變化的AI來了,只要你動了嘴,哪怕沒出聲,它也能知道你在說什么。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

吃飯的時候,想要和對面聊聊天,然而周遭嘈雜的聲音,讓你根本不知道ta在說什么?

又或者,想與聽障人士交流,然而對方聽不見你的聲音?

現在,檢測面部肌肉變化的AI來了,只要你動了嘴,哪怕沒出聲,它也能知道你在說什么。

這是EMNLP 2020的最佳論文,來自UC伯克利的兩位作者,用AI和電極做了個“沉默語音”的檢測模型,可以檢測到你想說、但沒說出聲的話。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

其中的原理究竟是什么,我們來一探究竟。

用電極收集你小聲嗶嗶的證據

“無聲語音”的本質,是人在說話時面部、頸部肌肉的變化。

說白了,你在對口型時雖然沒有出聲,但你的臉和脖子“出賣”了你。

而能夠檢測“無聲語音”的AI,也正是這么被做出來的。

在收集數據時,研究者會先在實驗者的臉上等部位貼8個貼片,每個貼片都是一個“監視肌肉變化”的傳感器,像這樣:

[[354515]]

在這之后,需要錄制一段實驗者的有聲語音,并與肌電圖進行對應,如下圖(會錄制兩種語音數據,一種每句話4個詞左右,另一種每句話16個詞左右):

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

這種方法能夠將肌肉的變化情況、和語音的類型對應起來。

在記錄數據的過程中,還要再錄制一段“對口型”的肌電圖,但不需要發聲,也就是“沉默語音”。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

之所以要收集兩份肌電圖,是因為人在無聲說話時,肌肉的變化與發聲說話時的變化有些區別,例如部分發音部位的肌肉震顫幅度會變小,語速也有所變化。

但如果要在無聲環境下,根據肌肉變化識別出想說的語音,就只能用對口型時的無聲肌電圖

顯然,這些原因使得AI的訓練變得非常困難。

為了盡可能將識別準確率放大,研究人員額外采用了一種結構來降低模型損失。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

不到20小時的語音集,效果還不錯

那么,經由這種方法訓練出來的模型,效果怎么樣?

研究人員分別在封閉詞集 (Closed Vocabulary Condition)和開放詞集 (Open Vocabulary Condition)上,對這種模型進行了測試。

其中,封閉詞集主要指介詞、限定詞、連詞等詞匯(如of、and),這種詞匯集合少,容易訓練,AI也容易形成“肌肉記憶”。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

而開放詞集的范圍,就要廣泛得多了,包含名詞、形容詞等等詞匯,目前的詞語可以說是不計其數,想要讓AI會認這些詞匯,難度就要高得多。

判定的方式,是WER,具體的計算方式是這樣的(原理類似于計算原句的出錯率):

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

目前,這個AI在封閉詞集上的訓練水平已經達到了3.6%的WER(越小越好):

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

至于開放詞集的檢測,AI經過訓練后,WER也從高達88%的水平下降到了68%

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

雖然在開放詞集上的檢測,看起來效果并不完美,但別忘了,這個模型所用的數據集并不大。

封閉檢測數據集,一共只有不到1小時的語音數據;開放檢測數據集,也只有18.6個小時的語音集。

而且,這些語音集還是無聲、有聲數據的合集。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

不到20個小時的語音數據,訓練效果就已經達到了這種水平。

如果能獲得更大的數據樣本,模型的效果還會進一步提升。

作者介紹

[[354518]]

一作David Gaddy,來自UC伯克利的NLP組。平時的研究方向是無監督學習、語法分析和無聲演講。

[[354519]]

Daniel Klein,一作的導師,研究方向主要是無監督學習、語法分析、信息提取和機器翻譯。

One More Thing

這屆EMNLP的各種NLP研究,簡直不留活路:

來自北京中科院、北京信息工程學院的研究者,還發明了一種諷刺檢測模型。

這種AI模型會通過同時檢測文本和圖像,進行多模態語義理解,從而檢測出一個人在社交媒體上發出的動態,是否有諷刺的意思。

就像這句話:“這可真是場座無虛席的比賽,而且我們居然還搶到了位置。”

表面上,這是句再正常不過的話,然而在配上圖片后,畫風頓時變得詭異了起來:

[[354520]]

又例如這句話:“看起來就好吃極了。”

然而當看到散落在盒子邊緣的芝士和餡料時,顯然這又是一句充滿諷刺意味的語句。

[[354521]]

現在,這些語義信息都已經被拿來喂給了AI,并訓練出了一個“懂得聽諷刺話”的模型。

就算戴上口罩,AI也知道你在說啥丨EMNLP2020最佳論文

目前這個模型,已經在推特這樣的社交媒體上進行了驗證,取得了84.33%的好效果。

看了這個AI模型,你還敢偷偷說老板壞話嗎?

論文地址:
https://arxiv.org/abs/2010.02960

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2021-02-20 10:56:30

人工智能人臉識別

2020-02-22 08:02:07

春節疫情防控口罩

2021-03-17 14:15:24

人臉識別人工智能AI

2021-11-03 07:58:27

異步編程線程

2022-04-19 15:33:53

數據模型

2020-06-07 15:43:40

人工智能面部識別技術

2019-10-23 19:30:23

AI 數據人工智能

2021-08-09 14:47:44

微信表情移動應用

2021-08-27 10:35:50

蘋果 iOS系統

2020-03-10 17:34:57

天貓精靈

2021-08-06 21:16:08

人臉識別AI人工智能

2020-09-08 17:47:36

人工智能自然語言處理

2022-05-09 07:49:47

PulsarJava問題排查

2021-10-19 09:21:08

AI人類工具

2025-06-16 09:36:18

2024-06-14 08:36:57

2017-12-11 17:08:01

VR

2020-09-07 06:59:44

Kafka分布式場景

2020-11-25 20:21:13

微信安全支付移動應用

2011-08-31 13:12:36

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天玩天天操天天干 | 午夜影视免费片在线观看 | 国产成人精品一区二区三区 | 午夜精品久久久久久久久久久久久 | 亚洲国产成人在线视频 | 日本欧美国产在线观看 | 91精品国产91久久久久游泳池 | av在线成人| www.亚洲区 | 福利片在线观看 | 国产午夜精品一区二区三区四区 | 中文字幕一区在线观看视频 | 日韩一区二区三区视频 | 欧美中文字幕一区二区三区 | 日韩在线中文字幕 | 日本高清视频在线播放 | 中文字幕亚洲视频 | 精品国产乱码久久久久久中文 | 99精品欧美一区二区三区综合在线 | 欧美a∨| 韩国电影久久 | 欧美日韩在线综合 | 日韩欧美在线免费 | a级毛片毛片免费观看久潮喷 | 久久夜视频 | 亚洲高清一区二区三区 | 夜夜久久| 日本小电影网站 | 2018中文字幕第一页 | 精品久| 成人在线观看免费视频 | 久久精品日产第一区二区三区 | 国产福利资源在线 | 亚洲视频www | 亚洲精品久久久久久久久久久 | 一级做a爰片性色毛片16美国 | 婷婷综合网 | 欧美激情在线精品一区二区三区 | 国产高清在线视频 | 久久精品成人热国产成 | 羞羞视频网站免费观看 |