成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了

發布于 2024-8-15 10:14
瀏覽
0收藏

馬斯克旗下xAI大模型,出二代了!


Grok-2測試版發布,小杯Grok-2 mini已經在??平臺在線可玩。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

馬斯克還以謎語人的形式,揭曉了困擾大模型圈一個多月的秘密:


原來Lmsys大模型競技場上的神秘匿名模型sus-column-r,真身就是Grok-2。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

sus-column-r在排行榜上積累了1萬多人類投票,已經與GPT-4o的API版并列第三

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

在xAI自己的內部測試中,Grok-2在常識(MMLU、MMLU-Pro)、數學競賽問題 (MATH)、研究生水平科學知識 (GPQA)等領域與其他前沿模型相媲美。


另外Grok-2最擅長基于視覺的任務,在視覺數學推理 (MathVista) 達到SOTA。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

不過這個圖的排版可就有點心機在里面了:把分數最高的GPT-4o、Claude-3.5-Sonnet放得離自己遠一些。


光看分數還是抽象,下面就進入一手實測環節。

一手實測Grok-2

如果你是??/推特平臺付費用戶,可以直接進入Grok頻道試玩。不花錢的話也可以到Lmsys大模型競技場選擇sus-column-r試玩。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

而且付費用戶反倒只能玩到小杯mini版,免費用戶能玩大杯,也是很厚到了

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

由于Grok-2可以訪問??上的實時數據,可以直接讓他總結當天的新聞,開啟趣味模式的話還可以附贈吐槽。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

付費版本還接入了最新開源AI生圖模型Flux.1,會把中文提示詞翻譯成英文理解。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

點進主頁上的“安利一個奇幻游戲”問題示例,可以看到它先推薦了《博德之門3》,并從劇情、人物自定義、游戲機制、世界塑造、幽默元素和玩家社區幾個角度做點評,很好的把握了游戲的亮點。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

此時可以直接換中文繼續提問。


Grok-2同樣了解《黑神話:悟空》這款還沒發售的游戲,準確說出發售日期在8月20日、使用的虛幻5引擎,并且總結了??上網友的討論。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

還在最后附帶了網友的帖子,可以點進去參與討論,與整個平臺的功能整合已經到位了。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

不過由于??上只有mini版模型,接下來上強度測試我們移步大模型競技場,還可以與GPT-4o來一場捉對pk。


在最近流行的智商檢測問題“9.9和9.11哪個大”上,Grok-2(sus-column-r)表現碾壓ChatGPT最新版本。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

不過另一項流行測試“strawberry中有幾個r”問題上,兩者都還是沒能通過。(多試幾次兩者都有小概率答對)。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

更嚴肅一些的陷阱題“以下哪支蠟燭是最先被吹滅的”中,Grok-2比ChatGPT稍有進步。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

考點是最先被吹滅的蠟燭剩下的部分更長(正確答案3),ChatGPT錯誤的理解成最短的,Grok-2思路是對的但是數哪個最長沒數對。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

對于經典的大模型弱點“逆轉詛咒”問題,兩者似乎都以某種方式克服了。不僅能正著回答“湯姆克魯斯的母親是誰”,也能倒過來回答數據出現頻率更少的“Mary Lee Pfeiffer的兒子是湯姆克魯斯”。


(當然不排除只是成為經典問題之后,相關數據更多了。)

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

馬斯克大模型升級,犧牲特斯拉換的

測試先告一段落,可以看出Grok-2對比上一代Grok-1.5有了很大進步。


背后馬斯克可是,花費了大量資源和人力。


比如有新加入xAI的研究員表示,能用10萬卡集群做研究,比起在學校里可憐的資源爽太多了。

馬斯克突發新版大模型,犧牲特斯拉資源叫板OpenAI,Grok-2一手實測來了-AI.x社區

但是有一群人可不滿意了:特斯拉股東。


根據華爾街日報消息,馬斯克持續把人才、數據和GPU資源從特斯拉向xAI轉移

目前為止,xAI已經雇傭了至少11名曾在特斯拉工作過的員工,其中六名直接在Autopilot團隊工作過。


原本為特斯拉保留的GPU訂單,馬斯克也要求英偉達優先供應xAI。

馬斯克還公開談論了特斯拉收集的大量視覺數據,他表示這些數據可以作為訓練xAI模型的資源。


至少三位特斯拉股東因為這事把馬斯克給告了,聲稱將資源轉移到xAI損害了特斯拉投資者的利益。


目前案件正在特拉華州法院審理。


Lmsys大模型競技場試玩:???https://arena.lmsys.org??


本文轉自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/krj6JGidBlHSoVSHUFzSAA??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 一区二区三区免费在线观看 | 欧美激情精品久久久久久 | 爱爱视频在线观看 | 一级免费毛片 | 一级免费a | 91精品国产综合久久久久蜜臀 | 色偷偷人人澡人人爽人人模 | 久久精品中文 | 亚洲精品女优 | 国产欧美在线 | 欧美在线观看一区 | 欧美精品一二区 | 国产精品久久久久久高潮 | 精品自拍视频 | 成人午夜视频在线观看 | 国产精品一区二区三区在线 | 成人福利网站 | 日韩中文字幕2019 | 91在线视频网址 | 亚洲成人播放器 | 在线观看免费福利 | 日韩欧美不卡 | 91资源在线 | 野狼在线社区2017入口 | 99久久精品免费看国产四区 | 午夜精品一区二区三区在线视频 | 国产久| 国产精品v| 青青伊人久久 | 久久久久久久一区二区三区 | 精品欧美乱码久久久久久1区2区 | 日韩欧美在线一区二区 | 亚洲欧美视频 | 日韩二区三区 | 久久人体视频 | 亚洲国产精品区 | 久久免费观看一级毛片 | 亚洲精品久久久久久久不卡四虎 | 性网站免费| 亚洲一区二区在线播放 | 国产精品亚洲精品 |