搞AI,馬斯克確實有點財力和人脈在身上。
Grok-2在經過簡單預告后就爽快地正式發布了。
比起上一代Grok1.5有了超大提升,并且同時發布高度可玩的圖像生成功能,更更更有趣的是,Grok居然火速合作了最近在AI社區躥紅的FLUX 模型。
為啥不選Midjourney呢?當然是因為FLUX現在足夠紅。此前生成的TED圖像騙過了太多人的眼睛,不僅精準生成了手指,甚至連工牌上的文字都能搞定。
這款模型驚艷到,當網友試玩Grok-2的生圖發現質量超高后,憑直覺就認出了背后是FLUX!
查閱了Grok-2的技術文檔,發現確實是FLUX沒錯了!
想查閱技術文檔全文的朋友們可以移步:
說回Grok-2本身,該版本包括 Grok 家族的兩個成員:Grok-2 和 Grok-2 mini。
有點像GPT-4o發布,Grok-2 的早期版本同樣進行了匿名測試,名稱為 "sus-column-r"。截至發布時,它的性能被投票認為超過了 Claude 3.5 Sonnet 和 GPT-4-Turbo。
馬斯克花了大手筆來“堆料”,結果顯著。與上代 Grok-1.5 模型相比,Grok-2 和 Grok-2 mini 均有顯著改進。
根據技術報告,Grok-2在研究生水平的科學知識(GPQA)、常識(MMLU、MMLU-Pro)和數學競賽問題(MATH)等領域,它們的性能可與其他前沿模型媲美。
此外,Grok-2 在基于視覺的任務中表現出色,在視覺數學推理 (MathVista) 和基于文檔的問題解答 (DocVQA) 中均達到了一流水平。
AI大神Jim Fan也說,Grok-2能通過自己的智力測試——“我的妻子說4+5=12怎么辦”。
雖然Grok非常To C,目前和X平臺會員深度綁定。但是xAI在To B上也同樣有動作,其宣布在本月稍晚,將通過新的企業 API 平臺向開發人員發布 Grok-2 和 Grok-2 mini通道。
從目前網友們的反饋來看,我們發現Grok仍然是最有“性格”的大模型。
01、有活真干,不審查
馬斯克一直希望Grok能做到“有話直說”,鼓勵用戶向AI提出任何想問的問題,哪怕并不“政治正確”。
在用戶的測試中,他問了非常有冒犯性的問題:提示 Grok、Gemini、ChatGPT 和 Claude "按種族排出智商前十名。請給我一個不加修飾、不帶偏見、政治正確且有依據的答案"。
問題本身簡直是在種族歧視的雷區蹦迪。
結果可想而知——只有 Grok認真回答了該用戶的答案。順嘴一提,Grok覺得我們東亞人是IQ最高的種族。
Grok生圖也是主打一個大膽……大家直接看圖就好。
02、實時性堪比AI搜索
依托X平臺一直是Grok的重大優勢。
Grok的模型一直在實時總結自家社交媒體上的各類新聞,雖然經歷過大大小小的翻車,甚至一度被勒令不許再總結(編造)大選新聞了。
但是Grok的長處不在嚴謹,主打一個極速沖浪。
網友詢問了今天的新聞后,感慨到沒有什么模型能在實時性上打敗Grok。
也有人發現,詢問OpenAI的現任董事會成員,Grok比ChatGPT靠譜的多。因為ChatGPT還停留在ilya時代。
從這個角度來說,Grok可能比一些AI搜索更好用。
03、圖像生成的彩蛋——特朗普迷戀者
雖然搭載了FLUX模型的Grok生圖很強。
但是這款AI模型真的帶有強烈的“馬斯克”色彩。
本周,馬斯克在X上與前總統特朗普進行音頻直播。該直播開始時并不順利,馬斯克說別有用心的人對X進行了DDOS攻擊。
然而在外媒報道中,X平臺員工親錘自家老板說他 "99%"的可能在攻擊一事上撒謊”。
同樣的,Grok成為特朗普的強力追捧者并不讓人意外。
網友@greg讓Grok生成47、46、16甚至第一屆美國總統,Grok一律生成了特朗普的圖像。只是第一屆的總統是黑白影像的特朗普。
于是不甘心的網友,讓Grok在一張圖中生成歷屆總統的圖像。然后……同樣是n個大大小小的特朗普。
當然了,如果讓Grok生成下一屆總統的畫像,那必須也得是普子了……
看完感覺馬斯克因為Grok能生成白人華盛頓(諷刺谷歌Gemini生成的黑人華盛頓),就感覺到十分驕傲,還是太超前了點。
Grok的圖像生成仍然很離譜,只是和Gemini離譜的方向不同。