成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

并非里程碑! Facebook的100種語言互譯模型夸大宣傳遭質疑

新聞 人工智能
昨天,Facebook剛剛宣布其機器翻譯取得里程碑式進展,可在100種語言之間實現互譯,并且不依賴英語這個「中介」,今天reddit網友就來掀車了。

[[347640]]

 Facebook又翻車了?

昨天,Facebook剛剛宣布其機器翻譯取得里程碑式進展,可在100種語言之間實現互譯,并且不依賴英語這個「中介」,今天reddit網友就來掀車了。

該網友稱,Facebook此前也有過夸大宣傳,但這次有點過了。

Facebook 的100種語言互譯并非里程碑?

Facebook聲稱,最新的模型可直接進行多達100種語言的機器翻譯,比如從漢語到法語,且訓練的時候的無需英語作為中介。在評估機器翻譯廣泛使用的 BLEU 指標上,它比以英語為中心的翻譯系統性能高出10個百分點。

而Facebook AI實驗室的博客中并未提及,谷歌早在4年前就做了這件事。

谷歌在16年發布的這一研究成果,也是一個端到端的學習框架,從數以百萬計的例子中學習,并顯著提高了翻譯質量。

這個翻譯系統不僅提高了測試數據上的翻譯質量,而且可以支持103種語言的互譯,每天翻譯超過1400億個單詞。雖然還面臨一些問題,但是谷歌確實做到了100種語言。

那我們來看看,谷歌的這套系統是如何運作的。

谷歌的這一算法是零樣本學習的,假設我們用日語、英語和韓語的例子來實現一個多語言翻譯系統,與單個 GNMT 系統的大小相同,它通過共享參數來在這幾個不同的語言對之間進行翻譯。這種共享使系統能夠將「翻譯經驗」從一種語言對轉移到另一種語言對。

「Facebook宣稱的不依賴英語數據,也是不準確的」。

Facebook的論文圖表顯示,使用的數據集中有一部分是包含英語的,要說完全沒有依賴英語,有點抹殺英語起到的作用了。

到目前為止,谷歌有論文討論關于103種語言的訓練,以及一篇不「依賴英語數據」的單獨論文。

谷歌2019年發表的大規模多語言機器翻譯,支持103種語言,但是源語言或者目標語言是英語。

從技術準確性的角度來看,的確很難找到一篇能同時滿足兩個要求的論文: 不依賴英語數據和超過100種語言。

網友認為,一個非誤導性的說法應該是,「Facebook 創造了一個巨大的NMT 數據集,并在上面訓練一個Transformer?!?/p>

不管Facebook的說法準不準確,它的模型效果確實比以前更好了,也開源了相關的數據集和代碼,有計算資源的同學可以去驗證一下。

那么,人類翻譯會被機器翻譯所取代嗎?

機器翻譯將全面取代人類翻譯?想多了!

隨著機器翻譯技術的不斷進步,這也成為越來越多的人尤其是翻譯行業的人,最關心的問題。

這并非「杞人憂天」。

無論是Facebook最近開源的M2M-100模型,還是谷歌之前發布的支持103種語言的AI翻譯,都顯示出機器翻譯在取代人類翻譯上的巨大可能性。

不過,就機器翻譯目前的發展情況來看,想要完全取代人類翻譯還是不太現實的。

從技術上來看,目前機器翻譯還存有很多技術難點亟待攻克,比如語序混亂、詞義不準確、孤立地進行句法分析等。

從實際應用上來看,在一些偏口語化的翻譯場景、對專業知識背景要求比較高的場景以及大段對話的場景,機器翻譯都無法做到準確而迅速的翻譯。

此前就有媒體爆料出許多機器翻譯的「翻車」事件,例如大型會議的機器同傳翻譯出現大段語句不通的內容,一些人名無法識別,一些日常對話也被翻譯得啼笑皆非…

盡管從表現上來看不那么盡如人意,但機器翻譯的快速發展無疑會淘汰掉一批低水平的人類翻譯者,那些只能進行「低端」翻譯的人類翻譯者無疑會被機器翻譯所替代。

而真正的高水平翻譯者則完全不需要擔心這個問題。即便是目前最先進的機器翻譯,距離「信、達、雅」的翻譯要求也還有很大差距。

相反,機器翻譯可以把高水平的翻譯者們從一些機械、枯燥的簡單翻譯工作中解放出來,讓機器翻譯成為工具,抽出精力去從事更富有創造性的工作。

實際上,未來的譯者可能更接近編輯和質量把關專家,更多的是對機器翻譯的初稿進行修改潤色和文學創作。

總而言之,機器翻譯全面取代人類翻譯目前來看是個沒譜的事。

AI公司喜歡夸大宣傳,人工智能基于「ifelse」?

Facebook這個看似要替代人類翻譯的模型,引起了不少討論。

有網友甚至認為機器學習領域總是被輿論誤導。

一些大公司的研究或者發聲更容易被聽到,甚至在論文接受上,也享有一定的優勢。

雖然現在大多數頂會的論文審核都是雙盲的,但是審稿人很容易判斷作者的背景情況,比如說論文中的模型使用了幾千個TPU,那來自大廠無疑了。

谷歌、Facebook這樣的大型科技公司確實占據了很多有利地位。

一些AI公司喜歡利用這些論文,夸大AI在實際中的作用。

而且新聞稿有時是由非研究人員根據有限的描述或論文摘要撰寫的,可能沒有進行任何事實核查,導致一定的偏差。

之前,推特上有一條點Uber的消息吸引了不少關注,這則推文引用了一份新聞稿,其中指出:「Uber 將使用人工智能來識別醉酒的乘客,AI系統使用當前時間、上車地點以及用戶的猶豫時間等參數來判斷?!?/p>

下面寫了一句:「那不是AI。那只是if語句而已」,還給出了實現這一智能識別系統的代碼,一共需要兩行:

事實上可能并不這么簡單。

Uber 可能會使用機器學習,并根據以往的數據來微調模型的權重,還可以把錯誤的判斷用來更新預測模型,但是有些AI應用的確沒有論文中那么好。

那么,你寫過基于ifelse的人工智能應用嗎?

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2016-09-29 09:46:41

JavascriptWeb前端

2011-09-10 19:23:22

2011-09-09 13:42:16

2012-01-13 13:50:46

博科100千兆以太網

2010-10-11 10:52:58

Facebook

2017-08-01 10:15:56

數據分析大數據

2015-12-21 16:12:06

紅帽CloudForms混合云

2010-04-09 15:24:55

2013-01-18 10:09:10

互聯網網絡發展撥號上網

2021-02-04 14:31:30

RISC-V架構GPU

2024-12-04 10:39:00

Linux內核技術性

2011-05-25 10:19:17

2019-03-08 09:54:29

華為

2013-10-21 10:38:19

Ubuntu 13.1Canonical

2017-05-10 09:57:11

小米手機智能

2015-07-28 11:29:59

電商亞馬遜沃爾瑪

2023-06-23 14:15:09

Rust編程

2022-09-14 08:01:54

語法樹編譯器語法糖

2012-04-17 16:02:41

Marvell西部數據

2024-08-19 08:50:00

模型數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品国产一区一区二区三亚瑟 | 精品久久久久久久久久久久久 | 在线免费观看视频你懂的 | 久久人人网 | 久久国产精品72免费观看 | 国产精品美女在线观看 | 91精品国产777在线观看 | 国产一区二区久久 | 久久久成人动漫 | 国产精品日韩在线观看 | 久久久久国产精品免费免费搜索 | 不卡一区二区在线观看 | 日本超碰 | 亚洲精品成人 | 日韩在线观看一区 | 日日夜夜免费精品视频 | 你懂的在线视频播放 | 国产一区二区在线观看视频 | 九色 在线| 91亚洲欧美 | 亚州精品天堂中文字幕 | 亚洲第一在线 | 午夜爽爽男女免费观看hd | 999久久精品| 日韩电影一区二区三区 | 欧美日韩国产在线 | 福利视频网址 | 免费激情 | 欧美久久一区二区 | 亚洲一区二区在线 | 黄色大片在线 | 国产你懂的在线观看 | 在线观看视频91 | 成人精品视频在线 | 国产精品a久久久久 | 国产精品久久久久久妇女6080 | 日韩不卡一二区 | 国产午夜视频 | 日韩中文字幕 | 午夜精品三区 | 中文在线一区 |