成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

o1突發內幕曝光?谷歌8月論文已揭示原理,大模型光有軟件不存在護城河

人工智能 新聞
有人發現,谷歌DeepMind一篇發表在8月的論文,揭示原理和o1的工作方式幾乎一致。

發布不到1周,OpenAI最強模型o1的護城河已經沒有了。

有人發現,谷歌DeepMind一篇發表在8月的論文,揭示原理和o1的工作方式幾乎一致。

圖片

這項研究表明,增加測試時(test-time)計算比擴展模型參數更有效。

基于論文提出的計算最優(compute-optimal)測試時計算擴展策略,規模較小的基礎模型在一些任務上可以超越一個14倍大的模型。

網友表示:

這幾乎就是o1的原理啊。

眾所周知,奧特曼喜歡領先于谷歌,所以這才是o1搶先發preview版的原因?

圖片

有人由此感慨:

確實正如谷歌自己所說的,沒有人護城河,也永遠不會有人有護城河。

圖片

就在剛剛,OpenAI將o1-mini的速度提高7倍,每天都能使用50條;o1-preview則提到每周50條。

圖片

計算量節省4倍

谷歌DeepMind這篇論文的題目是:優化LLM測試時計算比擴大模型參數規模更高效

研究團隊從人類的思考模式延伸,既然人面對復雜問題時會用更長時間思考改善決策,那么LLM是不是也能如此?

換言之,面對一個復雜任務時,是否能讓LLM更有效利用測試時的額外計算以提高準確性。

此前一些研究已經論證,這個方向確實可行,不過效果比較有限。

因此該研究想要探明,在使用比較少的額外推理計算時,就能能讓模型性能提升多少?

他們設計了一組實驗,使用PaLM2-S*在MATH數據集上測試。

主要分析了兩種方法:

(1)迭代自我修訂:讓模型多次嘗試回答一個問題,在每次嘗試后進行修訂以得到更好的回答。
(2)搜索:在這種方法中,模型生成多個候選答案,

圖片

可以看到,使用自我修訂方法時,隨著測試時計算量增加,標準最佳N策略(Best-of-N)與計算最優擴展策略之間的差距逐漸擴大。

使用搜索方法,計算最優擴展策略在初期表現出比較明顯優勢。并在一定情況下,達到與最佳N策略相同效果,計算量僅為其1/4。

在與預訓練計算相當的FLOPs匹配評估中,對比PaLM 2-S*(使用計算最優策略)一個14倍大的預訓練模型(不進行額外推理)。

結果發現,使用自我修訂方法時,當推理tokns遠小于預訓練tokens時,使用測試時計算策略的效果比預訓練效果更好。但是當比率增加,或者在更難的問題上,還是預訓練的效果更好。

也就是說,在兩種情況下,根據不同測試時計算擴展方法是否有效,關鍵在于提示的難度

研究還進一步比較不同的PRM搜索方法,結果顯示前向搜索(最右)需要更多的計算量。

圖片

在計算量較少的情況下,使用計算最優策略最多可節省4倍資源。

圖片

對比OpenAI的o1模型,這篇研究幾乎是給出了相同的結論。

o1模型學會完善自己的思維過程,嘗試不同的策略,并認識到自己的錯誤。并且隨著更多的強化學習(訓練時計算)和更多的思考時間(測試時計算),o1 的性能持續提高。

不過OpenAI更快一步發布了模型,而谷歌這邊使用了PaLM2,在Gemini2上還沒有更新的發布。

網友:護城河只剩下硬件了?

這樣的新發現不免讓人想到去年谷歌內部文件里提出的觀點:

我們沒有護城河,OpenAI也沒有。開源模型可以打敗ChatGPT。

如今來看,各家研究速度都很快,誰也不能確保自己始終領先。

唯一的護城河,或許是硬件。

圖片

(所以馬斯克哐哐建算力中心?)

有人表示,現在英偉達直接掌控誰能擁有更多算力。那么如果谷歌/微軟開發出了效果更好的定制芯片,情況又會如何呢?

圖片

值得一提的是,前段時間OpenAI首顆芯片曝光,將采用臺積電最先進的A16埃米級工藝,專為Sora視頻應用打造。

顯然,大模型戰場,只是卷模型本身已經不夠了。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-29 13:57:38

2023-05-05 13:14:28

谷歌AI

2023-07-12 12:48:35

人工智能谷歌

2024-09-13 09:26:17

2023-07-22 13:09:51

模型開源

2024-02-04 13:56:03

2025-01-02 11:00:34

2024-09-24 11:01:03

2024-09-13 10:06:21

2025-02-03 14:17:27

2021-06-23 14:12:22

SaaS護城河頭部企業

2012-10-24 13:53:25

2024-12-26 11:45:48

2024-12-20 08:00:00

2017-10-17 06:03:42

2024-12-02 09:37:09

大模型AI產品

2025-01-20 09:28:00

AI工具模型

2025-01-02 13:00:00

2024-09-13 06:32:25

2024-07-26 09:29:38

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人精品高清 | 成人美女免费网站视频 | 欧美一区二区三区高清视频 | 亚洲最新在线视频 | 日本一级淫片免费啪啪3 | 国产日韩精品一区二区 | 色爱综合网 | 亚洲国产欧美一区二区三区久久 | 国产精品一区二区在线观看 | 日韩精品久久久久久 | 午夜欧美 | 国产婷婷色综合av蜜臀av | 欧美色综合网 | 国产色网站 | 成人网在线观看 | 精品国产免费一区二区三区演员表 | 日韩欧美一区在线 | 国产一区二区在线播放 | 日韩毛片| 青青久草 | 欧美日韩精品中文字幕 | 国产激情一区二区三区 | 91免费看片神器 | 欧美日韩综合视频 | 久久网站免费视频 | 久久草在线视频 | 91网站在线看 | 国产精品免费一区二区三区四区 | 7799精品视频天天看 | 国产一级在线观看 | 国产一区二区在线免费观看 | 成人黄色a | 成人不卡视频 | 国产精品成人一区二区三区 | 亚洲区一 | 精品国产乱码久久久久久蜜臀 | 伊人免费在线观看 | 狠狠躁18三区二区一区 | 国产在线视频一区二区 | 97狠狠干 | 亚洲精品不卡 |