成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

突發,Grok-3免費上線!答對9.11和9.9誰大,1分攻克MIT積分難題

人工智能 新聞
剛剛Grok-3免費開放了!DeepSearch和Think兩大模式加持,剛上了熱搜的「9.11和9.9哪個大」終于能做對了(但沒全對),甚至1分鐘秒解MIT積分賽題。然而,它剛一亮相就遭OpenAI研究員「打假」,被對方質疑作弊。

世界首個20萬塊GPU(另有說法是10萬)訓出的Grok-3,官宣人人可用了!

DeepSearch、Think兩大模式,同時上線。唯獨遺憾的是,Big Brain還在雪藏。

Grok 3全部免費開放,直到服務器崩潰為止

一邊,AI科技圈開發者激動地奔走相告,另一邊,OpenAI和xAI直接打起來了。

先是本科輟學的OpenAI研究員Aidan McLaughlin,譴責Grok-3在評測中用基于64個樣本進行多數投票刷分。

灰色陰影區域表示在64個樣本下的多數投票一致性表現

隨后,OpenAI應用研究主管Boris Power更是絲毫不留情面,「看到Grok團隊在評估中作弊和欺騙的動機,真令人失望。簡而言之,o3-mini在每個評估中都優于Grok-3。Grok-3確實是一個不錯的模型,但沒有必要過度宣傳」。

對此,xAI高級工程師Igor Babuschkin,「完全不對。我們只是用了和你們一樣的方法」。

從下圖中不難看出,o1-preview和o1確實有同款「陰影」。

不過,根據McLaughlin的解釋道,OpenAI o3-mini并沒有使用這種方法。

OpenAI與xAI針鋒相對,也不是一天兩天了,好在他們的競爭,利好所有人。

話不多說,直接上實測吧。

一波實測來了

就在昨天,「Grok-3答錯9.11和9.9哪個大」這個話題,還一度沖到熱搜話題前幾。

我們實測發現,果然,如果用同樣的方式問,Grok-3還是會答錯。

而在開啟Think模式后,它只思考了4秒就輕松做對了!

有趣的是,如果把prompt換成「9.11和9.9誰大」,Grok-3在普通模式下也能給出正確答案了。

然而,在開啟Think模式之后,Grok-3卻為了這個prompt想了足足34秒……

有網友實測Grok-3 二十四小時后,發現它的幾大優點——

  • 對代碼真的很好;
  • 上下文窗口非常非常長;
  • 能充分利用上下文;
  • 擅長遵循指令;
  • 而且有一個非常令人愉快的性格。

在代碼工作流中,Grok-3表現得十分絲滑。

有人用Grok-3做了個帶聲音的視頻游戲,主題是馬斯克使用激光、火箭和嬰兒來摧毀美國政府。

耗時一個小時后,Grok-3成功做出了這個游戲。

網友只用5分鐘,就寫出了一款大戰小行星的游戲。

另一種形式的游戲如下。

甚至有人只在幾分鐘內,就用Grok-3和Imagen 3、tripoai等工具,創建了下面這些逼真的3D模型。

有人總結了一份Grok-3全部潛能的完整速查表,因為它「強大到瘋狂」,但大多數人還不知道該如何有效使用。

照片級真實的圖像

Grok-3是不是世界上最聰明的AI還有待考察,但它現在確實可以生成照片級真實的圖像。

X網友Min Choi分享了10個案例。

  1. 在海灘上的隨意自拍
  2. 瘋狂的細節,你可以看到每根羽毛
  3. SpaceX的火箭
  4. 圖像細節程度簡直令人驚異的眼睛特寫
  5. 月球網絡探測車
  6. 在紐約地鐵上的自拍
  7. 走秀的貓咪
  8. 微型小熊貓的微距鏡頭
  9. 一位年輕白化男子手持綠色小狗的文藝復興風格肖像
  10. 水池邊的自拍

對此,有網友說,我們現在已經很難分清圖片上的是不是現實了。

「我們已經跨越了那個門檻!」,Min說。

不過也有網友發現了它的一些缺點,比如生成正在倒立的人物時,依然會出現匪夷所思的問題。

網友實測,Grok-3在2024麻省理工積分大賽中,直接干掉o1 Pro和人類選手,并在1分02秒內解決了這個問題!

就連馬斯克稱贊道,簡直太酷了。

高級語音模式,期待住了

下一步,Grok-3或許還會推出高級語音模式,一些拿到灰度測試的網友曬出了自己的實測。

它不僅支持聯網模式,還支持自定義語音模式、語音轉錄、音頻分享等功能。

目前,默認的是Sal男性聲音。此外,還有一個Ara女性聲音可選。

用戶界面底部有三個鍵:關閉退出語音模式;靜音;分享

如下是轉錄功能的展示。

下面視頻中,Grok-3不僅會唱生日快樂歌,還會笑。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-08-07 12:28:23

2025-03-05 08:50:00

模型AI數據

2024-07-17 12:13:11

2024-07-16 13:20:59

2025-03-03 08:35:00

DeepSeek模型AI

2025-03-03 00:00:00

DeepSeek算法ignore

2011-03-22 12:17:29

賽門鐵克SSL證書

2024-08-07 10:05:00

LLM大模型技術

2025-02-11 09:20:00

LLM模型AI

2025-02-19 10:28:22

2025-04-11 09:29:15

2024-08-02 14:58:00

2013-12-09 09:43:30

2025-02-18 14:59:16

2013-05-27 10:21:39

游戲設計

2009-09-05 10:31:22

無線路由器

2018-07-24 08:32:12

Python機器學習SDK

2024-11-05 13:52:29

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本精品一区二区 | 亚洲国产欧美精品 | 亚洲精品久久久蜜桃 | 免费影视在线观看 | 精品美女久久久久久免费 | 亚洲精品一二三区 | 久久这里只有精品首页 | 欧美日韩国产中文 | 一道本不卡视频 | 午夜久久久 | 黄色成人在线网站 | 四虎影视免费观看 | 亚洲码欧美码一区二区三区 | 亚洲一区二区久久久 | 农村真人裸体丰满少妇毛片 | 国产精品久久久久久久三级 | 91高清在线视频 | 日本成人在线网址 | 成人免费日韩 | 欧美.com | 国产一区二区视频免费在线观看 | 久久99深爱久久99精品 | 操久久| 大陆一级毛片免费视频观看 | 日日干日日| 久久久久一区 | 99r在线 | 福利社午夜影院 | 在线伊人 | 成人在线观看免费 | 成人黄色在线观看 | 九九九久久国产免费 | 台湾佬成人网 | 成人av播放 | 日本午夜在线视频 | 亚洲一区中文字幕在线观看 | 国产欧美精品一区二区色综合 | 欧美成人精品一区二区三区 | 国产高清自拍视频在线观看 | 欧美日韩在线免费观看 | 久久久久九九九女人毛片 |