成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源 原創(chuàng)

發(fā)布于 2025-3-31 13:31
瀏覽
0收藏

編輯 | 云昭


3月31日上午消息,智譜在 2025 中關(guān)村論壇上發(fā)布最新 Agent 產(chǎn)品:AutoGLM 沉思。作為首個(gè)集深度研究能力和操作能力于一體的 Agent,AutoGLM 沉思能一邊進(jìn)行復(fù)雜思考,一邊執(zhí)行操作。像人類(lèi)一樣打開(kāi)并瀏覽網(wǎng)頁(yè),完成從數(shù)據(jù)檢索、分析到生成報(bào)告。

“沉思”背后的全棧自研

智譜CEO張鵬在發(fā)布會(huì)上,公布了沉思智能體背后的兩大核心能力:全棧自研模型GLM-Z1-Air和大模型智能體技術(shù)框架AuoGLM。


前者為“沉思”提供了強(qiáng)大推理能力的基座模型,而后者則是智譜一直積累打磨的智能體技術(shù)框架。

ps:AutoGLM沉思背后是智譜 GLM 全棧自研大模型,包括推理模型GLM-Z1-Air和基座模型GLM-4-Air0414(4月正式開(kāi)源)。而自研智能體技術(shù)框架AutoGLM成為AutoGLM沉思的手腳。

推理基座模型,32B,200token/s,秒殺滿(mǎn)血版R1

先來(lái)看看智譜最強(qiáng)的推理基座模型GLM-Z1-Air。


剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源-AI.x社區(qū)


智譜CEO張鵬表示,推理模型GLM-Z1-Air不僅性能比肩DeepSeek-R1,在速度提升最高8倍的同時(shí)價(jià)格僅需DeepSeek-R1的1/30;可以在消費(fèi)級(jí)顯卡上進(jìn)行運(yùn)行。性能和成本取到了良好的平衡。在AME等一系列基準(zhǔn)測(cè)試的評(píng)估中,Z1-Air表現(xiàn)了強(qiáng)大的數(shù)理方面的推理能力,這位更多復(fù)雜任務(wù)的解決提供了堅(jiān)實(shí)的基座模型的支持。推理速度方面,極速版的 GLM-Z1-Air最高的生成速度可以達(dá)到每秒200個(gè) token。

一句話(huà):這款模型只有32 B的參數(shù)量,能力卻比肩更大參數(shù)量的國(guó)內(nèi)外一流的主流的模型。

此外,智譜將更新上線 GLM4-FLASH,并推出了對(duì)應(yīng)推理版本,完全免費(fèi)。

Agent 也有 Scaling Law

智譜張鵬表示:大模型不止預(yù)訓(xùn)練和后訓(xùn)練、推理階段存在 scaling law,“我們?cè)谘芯慨?dāng)中發(fā)現(xiàn) agent本身也存在的類(lèi)似的 scaling law。”對(duì)于 agent通過(guò)擴(kuò)展訓(xùn)練時(shí)的 inference compute,我們觀察到 agent的性能出現(xiàn)了更強(qiáng)的提升。


剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源-AI.x社區(qū)

這一agent scaling law背后是我們的自主在線課程強(qiáng)化學(xué)習(xí)算法框架。通過(guò)設(shè)計(jì)由易到難的任務(wù)序列,逐步引導(dǎo)模型從簡(jiǎn)單場(chǎng)景向復(fù)雜場(chǎng)景過(guò)渡。這種方法模擬模擬了人類(lèi)學(xué)習(xí)的過(guò)程(由易到難),通過(guò)動(dòng)態(tài)調(diào)整任務(wù)的難度,幫助模型積累基礎(chǔ)能力之后再去挑戰(zhàn)更高難度的任務(wù),有效的避免了直接用復(fù)雜問(wèn)題的數(shù)據(jù)進(jìn)行訓(xùn)練時(shí)候的造成的訓(xùn)練不穩(wěn)定的現(xiàn)象。


剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源-AI.x社區(qū)

在 agent scaling law的基礎(chǔ)之上,智譜還進(jìn)一步發(fā)現(xiàn)了 agent存在的能力涌現(xiàn)。比如在訓(xùn)練過(guò)程當(dāng)中,團(tuán)隊(duì)沒(méi)有給到任何的樣本或者數(shù)據(jù)教AutoGLM。

Auto GLM沉思版能夠自己規(guī)劃出一個(gè)路徑去順利地訪問(wèn)過(guò)巨潮資訊網(wǎng)這樣的一個(gè)很特殊的網(wǎng)站,然而當(dāng)發(fā)送指令幫用戶(hù)收集昨天關(guān)于具身智能的相關(guān)研報(bào)。
Auto GLM的動(dòng)手能力:目前在行業(yè)內(nèi)也是處于領(lǐng)先,包括瀏覽器的使用,手機(jī)和電腦在內(nèi)的工具使用能力全面的處于領(lǐng)先地位。

在斯坦福大模型中心 AI指數(shù)2024當(dāng)中智能體代表基準(zhǔn)的 agent bench這樣的一個(gè)評(píng)測(cè)集上,AutoGLM系列模型在多個(gè)環(huán)境上取得超過(guò)此前 sota表現(xiàn)的效果。

在 Phone use基準(zhǔn) Android lab和Android word上, Auto GLM phone任務(wù)的成功率方面,相對(duì)過(guò)往SOTA提升了超過(guò)20%。

剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源-AI.x社區(qū)

在Web use的評(píng)測(cè)基準(zhǔn)上, Auto GM web也全面超越了像GPT-4o和Claude3.5、 sonnet等。

在 GUI智能體方面, Co-Agent結(jié)合了視覺(jué)能力之后,在 GUI agent多個(gè)榜單上取得了 so的效果。

Co-Agent的模型參數(shù)僅僅只有9 B。但是它的性能超越了包括 claude computer use等一眾更大規(guī)模同類(lèi)的模型的性能。

一個(gè)好消息是,智譜將于4月14日開(kāi)源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414,并于近期陸續(xù)上線bigmodel.cn。

One More Thing:智譜的國(guó)內(nèi)國(guó)際朋友圈

智譜這兩年除了研究新品,還在忙啥?張鵬在最后給我們解開(kāi)了迷惑。

張鵬表示,2025年將會(huì)是 agent的應(yīng)用的爆發(fā)的元年。智譜也將深度參與并且引領(lǐng)這一浪潮,為更多的應(yīng)用合作伙伴提供基座模型的能力。我們?cè)诖罅Πl(fā)展基座模型的同時(shí),也會(huì)積極的幫助我們的生態(tài)合作伙伴更好的來(lái)使用 Agentic GLM的能力,包括:搭建標(biāo)準(zhǔn)化的 mass平臺(tái)和智能體平臺(tái),打造基于行業(yè)、地域和場(chǎng)景的 agent應(yīng)用。

在行業(yè)生態(tài)方面,智譜堅(jiān)持和行業(yè)合作伙伴共創(chuàng),用自己在大模型研發(fā)上的積累幫助行業(yè)伙伴來(lái),合力做出成功的大模型應(yīng)用。目前,智譜已經(jīng)攜手金融、教育、醫(yī)療、政務(wù)、企業(yè)服務(wù)等各個(gè)領(lǐng)域的合作伙伴,共同推進(jìn) Agentic LLM的應(yīng)用落地。

另外,關(guān)注智譜的朋友都知道,智譜在G端方面發(fā)展非常成功,包括北京、杭州、上海、成都、珠海在內(nèi)的地方政府均有合作及支持。比如智譜和珠海的龍頭企業(yè)華發(fā)集團(tuán)聯(lián)手,聯(lián)合搭建首個(gè)城市級(jí)的 GLM大模型空間,智譜+珠海華發(fā)空間將智譜一系列的語(yǔ)言多模態(tài)端測(cè)的模型部署到智能設(shè)備上。

張鵬解釋道,在城市生態(tài)方面,自主、安全、低幻覺(jué)的 GLM大模型依然是城市在選擇大模型的首選。智譜與當(dāng)?shù)氐凝堫^企業(yè)合作,推動(dòng)地方大模型應(yīng)用生態(tài)的建設(shè)和落地。

作為一家朝向AGI的公司,除了以上這些生態(tài)方面的共建,智譜已經(jīng)跟東歐十國(guó)和“一帶一路”沿線國(guó)建立了前瞻的合作。會(huì)上,張鵬宣布了與這些國(guó)建建立主權(quán)AI自主大模型國(guó)際共建聯(lián)盟,可以說(shuō)智譜不僅技術(shù)底蘊(yùn)十足,就連生態(tài)的肌肉也十分強(qiáng)悍。


剛剛,智譜發(fā)布秒殺DeepSeekR1的“沉思”,基座模型Z1吐字速度高達(dá)200token/s,價(jià)格只有R1的1/30,下月開(kāi)源-AI.x社區(qū)

本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-3-31 13:51:57修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 午夜男人天堂 | 欧洲精品久久久久毛片完整版 | 国产精品www | 手机日韩 | 天堂在线www | 久久视频精品 | 久久精品久久综合 | 国产精品久久久久久久久久了 | 免费成人在线网站 | 中文字幕视频三区 | 国产精品久久久久久久久久久免费看 | 黄视频网址 | 爱爱小视频| 欧州一区二区三区 | 性天堂网 | 久久精品免费一区二区三 | 在线成人www免费观看视频 | 日韩精品二区 | 国产欧美精品区一区二区三区 | 日韩免费在线观看视频 | 成人久草 | 91在线视频播放 | 国产女人叫床高潮大片免费 | 古装人性做爰av网站 | 亚洲成人三区 | 天天爽天天操 | 国产精品3区 | 一区二区三区不卡视频 | 日韩视频在线播放 | 最新国产精品 | 欧美精品久久 | 精品一区二区三区在线播放 | 91亚洲国产成人久久精品网站 | 日韩在线中文字幕 | 亚洲精品91 | 午夜男人天堂 | 日韩欧美视频 | 玖玖操 | 91久久国产| 欧美一区免费 | 亚洲天堂成人在线视频 |