編輯 |伊風、言征
出品 | 51CTO技術棧(微信號:blog51cto)
百度的步伐也是加速了!
原本計劃4月1日免費的文心大模型4.5,在兩周年之際就提前登場。
不僅如此,3月16日,百度搞了個“兩連發”,一口氣開放了兩款模型文心大模型4.5和文心大模型X1。
目前均在官網免費向用戶開放了!百度還貼心的給了精煉的模型介紹,以方便用戶選擇合適的模型。文心X1的介紹是“深度思考,更聰明”;文心4.5的介紹是“效果出色,更全能”。
圖片
(https://yiyan.baidu.com)
文心大模型4.5的“全能”,具體體現在多模態能力上——這是百度自主研發的新一代原生多模態基礎大模型。其在多項基準測試中表現優于OpenAI的GPT4.5,API調用價格僅為GPT4.5的1%。
而文心大模型X1則是一款深度思考模型,性能對標DeepSeek-R1,具備“長思維鏈”,擅長中文知識問答、文學創作、邏輯推理等。值得一提的是,它還增加了多模態能力和多工具調用功能,能夠理解和生成圖片,調用工具生成代碼、圖表等內容。而文心大模型X1的API調用價格約為DeepSeek-R1的一半,真的是卷瘋了!
此外,文心大模型4.5已上線百度智能云千帆大模型平臺,企業用戶和開發者登錄即可調用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產品,也將陸續擁抱這兩款新模型。
圖片
這個動作一出,外網也是歡呼一片!
一位網友說“百度,aka中國的谷歌,開放了兩款新模型”,并評價道,“中國在繼續構建更有成本更低的智能。AI價格戰正在打響。”
圖片
還有網友制作了視頻,這一波會讓追隨DeepSeek的用戶倒戈百度!
百度還計劃于2025年6月30日正式將文心大模型4.5開源,并在下半年發布文心大模型5.0。看完文心的這兩款新模型,你可能會對百度后續的動作充滿期待!
1.文心4.5,一張全能王牌
文心4.5的技能樹點得有多滿呢?
百度官方說,文心4.5“具備更精進的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。”
多模態能力
文本能力
我們先來測測文心4.5的代碼能力,讓AI幫忙做一個“少女心爆棚”的貪吃蛇游戲:
“寫一個貪吃蛇的代碼,選擇可以在網頁中運行的程序,希望是粉紅色戴著蝴蝶結的貪吃蛇”
看得出文心的代碼習慣還是不錯的
保存到html文件里運行了一下,確實能run,基本的要素都是有的。只不過AI做了一個小三角形當做簡陋版蝴蝶結,另外就是蛇飛得太快了,不好操作,這點其實自己改改參數就能解決了:
然后再來考驗下文心4.5的長項——文本生成。
“幫我寫一個能讀給成年人聽的睡前故事,希望是溫暖、治愈的,3分鐘內可以讀完。”
文心很快就搞定了這個故事,大家來看看夠不夠治愈呢~
圖片
接下來,我們又小小的開了腦洞,讓文心4.5根據故事,生成一頁繪本。
這就是《星星郵遞員與小城老人》的繪本了,其實我私心希望郵遞員能夠有個擬人化的形象,這里能看出畫風整體還是沒毛病的:
圖片
文心官方介紹說,4.5是智商、情商雙高的模型:“文心大模型4.5也擁有“高情商”,網絡梗圖、諷刺漫畫等等,理解起來都不在話下。”
我們也測了一張梗圖,畫手是怎么看待AI的陣營九宮格。
圖片
AI是這樣解讀的,可以看出AI在很認真地解讀笑點,這就讓梗圖的幽默被消解了不少。而且對于九宮格出現的“椰樹椰汁梗”“九轉大腸梗”等等,還不會進行解讀,理解少有些瑕疵,可能無法完美幫助需要理解一張meme的人。
圖片
2.推理模型X1,第一個有工具箱的推理模型
至于文心X1的亮點,一句話就能講清楚“文心大模型X1具備更強的理解、規劃、反思、進化能力,并支持多模態,最重要的,這是首個自主運用工具的深度思考模型。”
根據百度介紹“作為能自主運用工具的大模型,文心大模型X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網頁鏈接讀取、TreeMind樹圖、百度學術檢索、商業信息查詢、加盟信息查詢等多款工具。”
我們先來看看AI調用繪圖工具的能力吧,最近的315也是帶來了很多重磅炸彈,讓消費者直捂胸口。我們希望能AI能生成一張高信息密度的海報,讓我們看一眼就了解今年的315晚會重點。
“搜集315晚會打假產品名單,生成一張海報”。
然后AI就能自主拉起“高級聯網”工具,幫我們搜索315相關的新聞線索。
圖片
在擁有了一份打假名單后,AI又開始使用繪圖工具,給我們繪制海報了。
圖片
到這一步AI看起來都干的不錯,只不過,最終的海報成品是這樣的:
???為啥啊。
圖片
看來,百度的繪畫產品仍然沒能突破“生成漢字”的難關。
不過,對于圖表問題,文心X1還是靠譜的,我們用熱搜最新的“用人民幣感受韓國的工資水平”,讓AI幫我們梳理個圖表。
圖片
AI會自己進行任務的拆解:
圖片
然后就能以更直觀的視角“吃瓜”了:
圖片
總體實驗下來,百度的自主工具調用還沒有完全成熟。在一個案例測試中,小編希望能得到一個樹圖形式的答案,但AI卻堅決調用“代碼解釋器”,并且在幾次嘗試中均沒有coding成功,最后只能給了文本答案。
不過,百度邁出的這一步還是相當有意義,相信X1能很快擁有更好用、更匹配的工具,方便AI為我們辦公。
3.寫在最后
百度的加速,反映了國內大模型市場競爭的白熱化。免費開放文心4.5和X1,不僅是產品迭代的常規升級,更是面對行業競爭的一次主動出擊。
要知道,此前阿里的推理模型QwQ也在預覽版里規劃了各種工具調用,只不過當時未能上線。這才一晃神的功夫,就被百度的X1偷家了。
這說明,大模型技術的演進已進入分毫必爭的階段,這種微弱的領先更讓場上的局勢波云詭譎。接下來,隨著模型能力的持續提升,競爭將不止于參數、推理速度和工具集成,如何真正提升用戶體驗,可能才是決定市場格局的關鍵。