成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

逆天的語言 AI 模型來了!編故事以假亂真,問答翻譯寫摘要都行

新聞
剛剛,OpenAI 發布了一個“逆天”的語言 AI,整個模型包含 15 億個參數。 這個 AI 寫起文章來文思泉涌毫無違和感,無需針對性訓練就能橫掃各種特定領域的語言建模任務。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

 AI 一本正經的“胡編”起來,已經逼真的讓人不敢相信。

  剛剛,OpenAI 發布了一個“逆天”的語言 AI,整個模型包含 15 億個參數。

  這個 AI 寫起文章來文思泉涌毫無違和感,無需針對性訓練就能橫掃各種特定領域的語言建模任務,還具備閱讀理解、問答、生成文章摘要、翻譯等等能力。

  因為假新聞實在編的太真實,OpenAI 說:我們不敢放出完整模型。

  它的作品究竟什么樣呢?

  人類只給了它兩句話的開頭:

  “科學家們有個令人震驚的發現,在安第斯山脈一個偏遠且沒被開發過的山谷里,生活著一群獨角獸。更加讓人訝異的是,這些獨角獸說著完美的英文。”

  AI 就順著這胡言亂語的設定,一本正經地編了下去 (欲賞全篇請見文末) :

  “這些生物有著獨特的角,科學家們就以此為它們命名,叫 Ovid’s Unicorn。長著四只角的銀白色生物,在這之前并不為科學界所知。

  ……

  雖然,這些生物的起源還不清楚,但有些人相信,它們是一個人和一個獨角獸相交而誕生的,那時人類文明還不存在。Pérez 教授說:“在南美洲,這樣的現象很常見。”

  ……”

  天馬行空卻言之鑿鑿。幾乎沒有矛盾信息,甚至在結尾嚴謹地表明:

  如果要確認它們是消失種族的后裔,DNA 檢測可能是唯一的方法。

  這位 AI 寫手,名叫 GPT-2。

  它訓練用的數據,都是人類寫作的原始文本。無監督學習過程,純潔無污染。

  對此,深度學習之父 Hinton 獻出了他注冊 Twitter 以來的第三次評論:

這應該能讓硅谷的獨角獸們生成更好的英語了。

這應該能讓硅谷的獨角獸們生成更好的英語了。

  看來是讀了 AI 編的獨角獸新聞報道有感。

  DeepMind 研究員、星際 AI AlphaStar 的主要爸爸 Oriol Vinyals 也大肆贊美了同行:

  規?;?計算力,深度學習不會讓人失望。恭喜 Alec Radford、Ilya Sutskever 等等!

  由于 AI 生成的假消息太過真實,OpenAI 的開源動作也變得十分謹慎。與以往不同,這一次開源的內容,沒有完整的預訓練模型,只放出了一個 1.17 億參數的“縮小版”。

  媒體也紛紛認為,GPT-2 是個危險的存在:

來自 The Verge
來自 The Verge

  如果所托非人,GPT2 便會成為一臺挖掘機,挖出無盡的痛苦和仇恨。

  而且,造假新聞只是 GPT-2 的冰山一角,你想要的技能它都有。

  在不需要對任何其他任務進行針對性訓練的情況下,GPT-2 還能完成閱讀理解、常識推理、文字預測、文章總結等多種任務,效果好到讓人懷疑:這個模型后面單怕藏著一位語文老師吧!

  語言模型全能王

這位N項全能的“語文老師”,就是“語言建模”(language modeling)。

這位N項全能的“語文老師”,就是“語言建模”(language modeling)。

  OpenAI 的研究人員表示,在各種特定領域數據集的語言建模測試中,GPT-2 都取得了優異的分數。作為一個沒有經過任何領域數據專門訓練的模型,它的表現,比那些專為特定領域打造的模型還要好。

  下圖為研究人員統計的不同類型任務的成績對比圖,其中,(+)表示此領域得分越高越好,(-)表示此領域得分越低越好:

△ GPT-2 在不同語言建模任務上的測試結果(從左到右:數據集名稱、指標類型、GPT-2 測試結果、此前最好結果、人類水平)

 GPT-2 在不同語言建模任務上的測試結果(從左到右:數據集名稱、指標類型、GPT-2 測試結果、此前最好結果、人類水平)

  除了能用于語言建模,GPT-2 在問答、閱讀理解、摘要生成、翻譯等等任務上,無需微調就能去的非常好的成績。

  從人類的感官角度來評判,GPT-2 的效果也出奇得好。

  不信?不信一起來考考它。

  第一題(閱讀理解):一篇讓小學四年級學生卡了半天的閱讀理解

  閱讀下列材料回答問題:

  3 月 24 日,火炬在希臘奧林匹亞奧林匹克運動會的發源地點燃后,將傳遞至雅典的帕納辛奈科體育場,并于 3 月 31 日傳遞至北京。從北京開始,火炬將經過六大洲,途經絲綢之路沿線的城市。此次接力還會將火炬送上珠穆朗瑪峰,這是接力的最后一站。

  問題1:接力從哪里開始?

  問題2:這個地方有什么值得注意的嗎?

  問題3:這場接力進行了多少天了?

  問題4:他們有沒有訪問過任何著名的地標?

  這樣一段考驗對時政、地理和生詞理解能力的閱讀理解,一個成年人認真讀下來尚且還需要轉換思維多思考一番,但對 GPT-2 來說,找出正確答案是分分鐘的事:

  希臘奧林匹亞;是奧林匹克運動會的發源地;七天;帕納辛奈科體育場。

  第一題:全對✅

  第二題(常識推理):容易讓人摸不著頭腦的模糊代詞

  閱讀下面句子,回答“它”指代的部分:

  1、獎杯放不進棕色旅行箱,因為了。

  2、獎杯放不進棕色手提箱,因為

  5 秒思考,請作答。

  這兩句“含糊不清”的句子并沒有難到 GPT-2,它的答案分別為獎杯、行李箱。

  第二題,沒毛病✅。

  第三題(文章總結):考試中讓中學生頭大的主旨概括

  閱讀下類材料,概括文章內容。

  (這份材料來自外媒 Daily Mail 的一篇報道,全文字圖交雜,Word 粗略統計共1300多字。文章篇幅限制,量子位在這里把材料“閹割”了)

  36000 年前,史前人類在現代法國一個洞穴的粗糙石灰巖墻壁上勾勒出了一系列令人難以置信的史前野獸……(省略若干字)…………現在,在尖端技術的幫助下,Chauvet-Pont-d’Arc 洞穴的藝術作品被復制,創造了世界上最大的復制洞穴。

  不錯,一段看起來就“很閱讀理解”的樸素文風,GPT-2 的處理情況如何?還不錯:

  位于法國南部 Vallon-Pont-D’arc 的原始遺址是聯合國教科文組織世界遺產,是已知最古老、保存最完好的人類裝飾洞穴。復制洞穴距離法國南部 Vallon-Pont-D’Arc 的原址幾英里,洞穴內包含 14 種不同動物的圖像,包括長毛犀,猛犸象和大型貓科動物。

  第三題,完美✅

  怎么樣,感受到 GPT-2 的威力了么?關于 GPT-2 做題的例子還有很多,文末的 OpenAI 博客原文,還可以查看更多。

  它是怎么做的?

  GPT-2,是 GPT 的“進化版”,最大區別就在于規模大小。OpenAI 在官方博客中表示,兩者相比,GPT-2 的參數擴大 10 倍,達到了 15 億個,數據量擴大 10 倍,使用了包含 800 萬個網頁的數據集,共有 40GB。

  但在很大程度上,模型還是和 GPT 一樣:

  使用語言建模作為訓練信號,以無監督的方式在大型數據集上訓練一個 Transformer,然后在更小的監督數據集上微調這個模型,以幫助它解決特定任務。

△GPT 模型

GPT 模型

  上圖左部分,是研究中使用的 Transformer 架構以及訓練目標。右邊部分,是針對特定任務進行微調。

  將所有結構化輸入轉換為 token 序列,由預訓練模型處理,然后經過線性 +softmax 層處理。

  就 GPT-2 而言,它的訓練目標很簡單:根據所有給定文本中前面的單詞,預測下一個單詞。

  由于訓練數據集的多樣性,使得這個目標非常簡單的模型,具備了解決不同領域各種問題的能力。

  一把雙刃劍

  顯然,GPT-2 這樣一個強大的通用模型,會帶來巨大的社會影響。

  比如,它能用于開發 AI 寫作助理、更強大的語音助手、提高不同語言之間無監督翻譯的性能,甚至構建更好的語音識別系統。

  但同樣,它同樣也能用來干壞事,就像用圖像合成的研究造假一樣, 比如 deepfake,讓多少人苦不堪言。

[[257428]]

  GPT-2 可以用來生成具有誤導性的新聞報道、自動生成垃圾郵件、偽造內容發布到社交媒體上等等等等。

  這個研究,加上先前圖像、音頻、視頻合成與生成的研究,能夠大幅度降低制作虛假內容的成本。

  以后你在網絡上看到的東西,是真是假,可能就很難分辨了。

  為了避免這種情況發生,OpenAI 表示,不會發布經過訓練的模型,為了能夠讓更多的研究人員進行試驗,發布了一個更小的模型以及技術論文。

  這個“防止惡意應用,不開放完整模型”的決定也引來了不少質疑。

  其中最激烈的,來自英偉達研究負責人 Anima Anandkumar。

  她說:“Malicious BS”。大致相當于中文的“惡意個P”。

  這位 Anima 小姐姐,曾經逼得頂會 NIPS 改了名,正面硬剛 Yann LeCun,最近在呼吁學術會議強制投稿者公開源代碼。

[[257429]]

  不愿開放完整模型的 OpenAI,被 Anima 斥責“為了站道德高地本末倒置”,站在了 open 的對立面,傳播恐懼、誤導媒體。

  你怎么看?

  無論觀點如何,如果你對這項研究感興趣,請先收好傳送門:

  模型代碼:

  https://github.com/openai/gpt-2

  技術論文:

  Language Models are Unsupervised Multitask Learners

  這項研究的作者分別是 Alec Radford、Jeffrey Wu、Rewon Child、David Luan、Dario Amodei、Ilya Sutskever。

  其中 Ilya Sutskever 是 OpenAI 的首席科學家,是 AlexNet、seq2seq、AlphaGo、TensorFlow 等人工智能領域重要成果的共同發明者。

  論文地址:https://d4mucfpksywv.cloudfront.net/better-language-models/language_models_are_unsupervised_multitask_learners.pdf

  最后,附上 AI 撰寫的關于獨角獸的全文:

 ?。ㄈ祟惤o的開頭:)

  科學家們有個令人震驚的發現,在安第斯山脈一個偏遠且沒被開發過的山谷里,生活著一群獨角獸。更加讓人訝異的是,這些獨角獸說著完美的英文。

  (AI 編的下文:)

  這些生物長著獨特的角,科學家們就以此為它們命名,叫 Ovid’s Unicorn。長著四只角的銀白色生物,在這之前并不為科學界所知。

  現在,過了近兩個世紀,這個奇異的現象到底是怎么發現的,謎底終于解開了。

  來自拉巴斯大學的進化生物學教授 Jorge Pérez 和他的幾個小伙伴,在探索安第斯山脈的時候發現了一個小山谷,沒有其他動物也沒有人類。

  Pérez 注意到,這山谷看上去曾是個噴泉的所在,旁邊是兩座石峰,上面有銀白的雪。

  然后,Pérez 他們就深入探尋這個山谷。“我們爬上其中一座山峰的時候,下面的水很藍,上面還有一些結晶。”Pérez 說。

  發現獨角獸種群的時候,Pérez 和他的小伙伴都驚呆了。都不用靠近,從高空就可以望見這些生物——看上去離得很近,就快摸到它們的角了。

  在查看這些奇怪生物的時候,科學家們發現它們講著普通的英文。Pérez 說:“比如說,我們注意到,它們有一種共同‘語言’,有點接近方言。”

  Pérez 認為,這些獨角獸起源于阿根廷。在那里,人們相信這些動物是一個消失種族的后裔,在人類到達之前,這個種族就生活在那里。

  雖然,這些生物的起源還不清楚,但有些人相信,它們是一個人類和一個獨角獸相交而誕生的,那時人類文明還不存在。Pérez 說:“在南美洲,這樣的事情是很常見的。”

  然而,Pérez 也指出,要確認它們是不是那個消失種族的后裔,DNA 檢測可能是唯一的方法。“不過,它們看上去能用英語交流,我相信這也是一種進化的信號,或者至少也是社會組織的一種變化。”他說。

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-02-15 14:33:56

AI模型翻譯語言

2019-11-06 13:57:05

AI 數據人工智能

2021-06-08 10:23:12

人工智能人臉識別Deepfake

2021-06-15 10:07:13

AI 數據人工智能

2023-03-29 10:04:18

圖像AI

2023-11-10 00:09:25

人工智能虛假圖片

2022-02-20 23:57:29

人工智能語音合成技術

2015-03-27 10:39:22

2015-06-12 10:27:46

2020-11-13 07:08:35

AI人工智能

2020-12-28 12:39:53

面部識別人工

2024-05-16 13:51:00

AI

2019-06-09 08:20:29

2023-04-25 22:10:23

2023-04-25 13:54:07

游戲AI

2020-10-13 11:15:40

AI 數據人工智能

2025-06-12 08:24:57

OpenAI大模型AI工具

2021-07-19 09:04:05

AI 數據人工智能

2017-06-08 11:11:32

互聯網

2023-03-31 14:33:49

人工智能數據開發自然語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产黄色小视频 | 视频一区二区三区四区五区 | 成人久久久 | 九九视频在线观看 | 国产精品免费一区二区三区四区 | 久久久久av | 一区二区三区在线免费观看 | 成人毛片在线观看 | 精品亚洲国产成av人片传媒 | 影音先锋中文在线 | 一级免费毛片 | 欧美性生活视频 | 日日夜夜操天天干 | 国产一区二区三区四 | 亚洲毛片一区二区 | 国产一区二区三区四区 | 日韩中文在线观看 | 亚洲精品免费视频 | 另类二区 | 成人在线中文字幕 | 欧美久久精品一级黑人c片 91免费在线视频 | 日韩午夜网站 | 日韩一区中文字幕 | 精国产品一区二区三区 | 羞羞视频免费在线观看 | 狠狠久久综合 | 日韩在线观看网站 | 99久久久久久久 | 欧美精品一区二区三区一线天视频 | 日韩免费av| 色综合99| 98久久| 成人午夜毛片 | 插插宗合网 | 日韩二区三区 | 欧美日本免费 | 99成人 | 亚洲男人天堂 | 国产视频黄色 | 欧美国产精品久久久 | 一区二区三区四区五区在线视频 |