成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

殺瘋了!Gemini 2.5狂飆「高爾頓板」測試,編碼橫掃所有OpenAI模型

人工智能 新聞
谷歌的AI編碼能力正在掀起一場風暴!在高爾頓板 測試中,Gemini 2.5 Flash以驚艷表現擊敗OpenAI多款模型,連谷歌首席科學家Jeff Dean 都為其點贊。谷歌新模型「dayhush」已在網頁開發領域嶄露頭角,性能超越Gemini 2.5 Pro,被網友稱為「AI編碼的地震性突破」。

編碼能力一直是頂尖模型宣傳的重點。

尤其是,AI大神Karpathy帶火vibe coding(氛圍編程)概念后,普通人也可以通過AI體驗到編程的樂趣。

游戲、網頁、3D建模,再加上最近爆火的MCP協議,大家玩得不亦樂乎。

不只是娛樂,很多AI專家、公司CEO、行業分析師甚至認為,AI可能會在2-3年內取代絕大部分的程序員。

AI編程真的有那么強嗎?哪家的效果更好?

就在最近,網友RameshR通過高爾頓板(Galton board)測試,對比了Gemini 2.5 Flash、GPT-4o mini、o4-mini-high及o3等幾個最新的模型。

結果他發現,Gemini 2.5 Flash在這項高爾頓板測試中表現炸裂,而OpenAI的幾個模型則完全不行,沒能搞定這個任務。

圖片

RameshR表示,Gemini 2.5 Flash幾乎瞬間就能get到意圖,生成的代碼簡潔又漂亮。

在Gemini 2.5 Flash上,他一共提示5次就搞定了。而在OpenAI的模型上,RameshR則折騰了半小時都沒有完成,最后直接選擇放棄。

可以看出,Gemini 2.5 Flash生成的動畫中,整個高爾頓板的排布都沒有明顯的問題,小球的運動、碰撞也基本符合物理規律。

當然,最后小球的排列也是遵循正態分布。

圖片

RameshR的高爾頓板測試帖子發出后立即點燃了網友們的興致,就連谷歌的首席科學家Jeff Dean也出來給他點贊。

當然,也是為了給Gemini 2.5 Flash站臺。

圖片

資深工程師Ray Fernando使用相同的提示詞在o4-mini-high上進行了測試,結果表現還是不太完美。

他不得不又在GPT-4.1上重新試了一次,表現還是差強人意。

圖片下邊柱子和固定的小球已經重合到一起了,小球的排列也不符合正態分布的規律。

圖片

還有網友使用其他的模型做了測試,比如Alex Kotenko就使用了Claude 3.7。

他表示在使用了相同的初始提示和一次后續調整就完成了測試。只不過從結果來看,小球的排列并不怎么符合正態分布。

圖片

而Isaac Naor則使用Gork模型一次就完成了測試。

圖片

可以看出Gork模型生成的動畫在界面和小球的運動上表現還可以。

但小球最后的排列并不太符合正態分布規律,距離Gemini 2.5 Flash還有差距。

谷歌正勢如破竹

這還只是Gemini 2.5 Flash的表現,Gemini 2.5 Pro的效果只會更好。

谷歌DeepMind正勢如破竹!在第七代TPU Ironwood的加持下,Gemini模型不僅性能很強,性價比也格外的高。

谷歌似乎是找到了最佳編碼模型的秘密。

剛剛,網友AshutoshShrivastava發帖稱,谷歌又又又推出了一個新模型「dayhush」,已在網頁開發領域上線。

更加夸張的是,這個新模型似乎比Gemini 2.5 Pro更出色。他還提供了新模型的一些更詳細信息。

圖片

圖片

測試過「dayhush」的網友Taro Bushidō表示,「這將是對AI編碼的一次地震性轉變。」

圖片

網友MuffinV也認為,Dayhush是一個大的飛躍。

它的思考時間更長,效果也最好,而且目前沒有任何其他模型能達到這種水平。

圖片

他使用Dayhush模型創建了一些知名網站,效果非常棒。

「沒有任何模型能夠如此精確地創建youtube和spotify的用戶界面。」他說。

圖片圖片圖片圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-03-26 06:56:56

2025-05-21 09:15:00

2025-06-17 08:40:44

2025-06-23 00:00:01

2024-05-20 08:28:10

2025-05-07 10:01:35

2023-12-07 11:48:00

2025-06-11 08:56:54

2023-03-27 13:42:22

2025-04-10 10:44:00

2023-08-01 07:45:52

2025-06-13 11:25:04

大模型LLMAI 技術

2025-04-10 10:41:36

2025-05-07 10:09:08

2025-05-07 09:14:26

2025-03-14 12:14:38

2025-05-21 06:58:03

2025-04-10 06:16:33

2021-05-13 09:29:03

FragAttacks漏洞WiFi設備

2025-05-15 08:35:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 作爱视频免费观看 | 欧美一区二区免费 | 欧美国产日韩一区二区三区 | 91久久精品国产91久久 | 99精品电影 | 成人小视频在线观看 | 国产精品99久久久久久久久久久久 | 国产永久免费 | 欧美一区二区三区在线 | 国产精品久久久久久影院8一贰佰 | 国产精品成人一区二区 | av一区在线观看 | 激情a| 一区二区三区电影在线观看 | 欧美精品乱码99久久影院 | 免费高清成人 | 久久久123| 一级黄色夫妻生活 | 天天操夜夜操免费视频 | 在线观看中文字幕一区二区 | 日本一区二区高清不卡 | 久久精品亚洲一区 | www.亚洲视频.com | www久久99| 欧美亚洲网站 | 免费国产一区二区 | 欧美一区2区三区3区公司 | av天天操 | 9999精品视频| 日韩免费1区二区电影 | 精品国产一区二区国模嫣然 | 久久久91精品国产一区二区三区 | www.日韩高清 | 最新av中文字幕 | 亚洲欧美一区二区三区1000 | 中文字幕精品一区二区三区精品 | 喷潮网站 | 欧美 日本 国产 | 午夜视频在线视频 | 夜夜草av| 精品国产一区一区二区三亚瑟 |