DeepSeek沖擊下，百度的開源牌能打響嗎？

2025-02-24 08:50:50

歸根結(jié)底，百度開源的核心挑戰(zhàn)，不只是“開源與否”，而是開源后能否真正提升文心大模型的行業(yè)影響力。開源能帶來品牌聲量、生態(tài)繁榮，甚至用戶增長，但最終決定一切的，仍然是模型的技術(shù)實(shí)力和落地體驗(yàn)。

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

年初，DeepSeek-R1模型的開源讓這個(gè)低調(diào)的技術(shù)品牌一炮打響。

隨著DeepSeek應(yīng)用的飛速增長，AI巨頭正在集體重新審視開源模式的商業(yè)價(jià)值——這不再只是“賠本賺吆喝”的事情，而是可能帶來實(shí)實(shí)在在的商業(yè)回報(bào)。

DeepSeek帶來的競爭壓力肉眼可見，連OpenAI的Altman都罕見地改口反思，承認(rèn)OpenAI在開閉源問題上“站在了歷史錯(cuò)誤的一端”。Altman 甚至在X上發(fā)起了投票，詢問大家OpenAI的下一個(gè)開源項(xiàng)目是一個(gè)o3 mini級(jí)的模型好，還是開源一個(gè)端側(cè)模型好。

而在國內(nèi)，同樣坐不住的還有曾經(jīng)的閉源信仰者——百度。2月中旬，百度接連拋出一系列大動(dòng)作：

2月11日，文小言（原文心一言）更新，新版本正式接入DeepSeek-R1模型；
2月13日，百度宣布文心一言將于4月1日起全面免費(fèi)；
2月14日，百度官宣：未來幾個(gè)月將陸續(xù)推出文心大模型4.5系列，并計(jì)劃在6月30日正式開源。

其中最出人意料的，還是百度在“開源 vs. 閉源”問題上的180度轉(zhuǎn)向。曾經(jīng)，李彥宏曾直言“開源大模型是智商稅”“開源模型只會(huì)越來越落后”，而如今，面對(duì)現(xiàn)實(shí)的百度卻決定“打不過就加入”，主動(dòng)順應(yīng)開源潮流。

不過，細(xì)品百度的開源計(jì)劃，會(huì)發(fā)現(xiàn)它與DeepSeek的開源或許仍有本質(zhì)不同。DeepSeek采取的是“上線即開源”的模式，而百度的開源方案更顯謹(jǐn)慎：未來幾個(gè)月用戶或在產(chǎn)品側(cè)先行體驗(yàn)文心4.5系列，但真正的開源要等到年中才正式落地。

而2025的下半年，才是百度的重頭戲。根據(jù)外媒CNBC的爆料，百度Ernie 5.0預(yù)計(jì)將在今年下半年發(fā)布，并在多模態(tài)能力上有重大增強(qiáng)。知情人士透露，新模型可能會(huì)在文本、圖像、視頻、音頻的理解和轉(zhuǎn)換上邁出更大步伐，例如生成更自然的AI視頻內(nèi)容。

從某種程度看，百度的Ernie 4.5開源，很可能是在給 5.0“投石問路”。在全面邁入開源賽道之前，百度似乎更想先試探市場反應(yīng)，看看這條路是否值得走到底。

1.月活被反超，百度系模型真落后了嗎？

關(guān)于百度的下次開源是否能激起水花，有一個(gè)繞不開的問題：百度在大模型的技術(shù)方面是否已經(jīng)落后？

從技術(shù)方面看，百度可能與頭部模型廠商并未拉開太大差距。

但百度大模型失去競爭力的觀點(diǎn)一直充斥于網(wǎng)絡(luò)，究其原因有以下幾方面。

首先，作為國內(nèi)最早入局者，百度文小言確實(shí)沒能守住第一的位置，再加上“起大早、趕晚集”的論調(diào)時(shí)不時(shí)就拿出來炒作一番，使得很多人覺得百度的大模型也會(huì)“爛尾”。

兩年前，百度是大廠中最早做大模型的，2023年3月就開始內(nèi)測Chatbot應(yīng)用文心一言，趕來嘗鮮的用戶擠滿了排隊(duì)列表。但文心一言在月活上的領(lǐng)先優(yōu)勢只維持了一年之久，此后便逐漸被Kimi、豆包等一眾后來者反超。

不過，雖然AI應(yīng)用的月活量無法完全反映一家模型廠的技術(shù)水平。目前，文心一言Web端的訪問量在國內(nèi)AI產(chǎn)品位列第6，落后于DeepSeek和承接了DeepSeek流量的納米AI搜索、投流比較猛的豆包、Kimi以及非AI原生的百度文庫。僅從應(yīng)用排名看，無法證明百度的技術(shù)存在大幅落后。

這里引出了第二個(gè)問題：百度文庫月活量的趕超以及在商業(yè)化上的亮眼表現(xiàn)，似乎多少給外界傳遞了一種文小言被內(nèi)部放棄的信號(hào)。

例如，李彥宏1月初發(fā)的百度內(nèi)部信中，提到“我們?cè)诖竽Ｐ蛻?yīng)用領(lǐng)域獨(dú)樹一幟，為4000萬文庫的付費(fèi)用戶提供無與倫比的內(nèi)容創(chuàng)作……”，卻未提及AI原生出身的文心一言。

需要明確的是，從應(yīng)用層上，文小言在內(nèi)部的地位是否滑落，我們不得而知。但模型層上，文心仍然是為百度文庫做賦能的技術(shù)基座，那就不存在被放棄的問題。

第三，百度的閉源生態(tài)和過早開啟的訂閱制度，要為百度日活被反超的事實(shí)“背一部分鍋”。

2023年11月，文心一言就開做會(huì)員收費(fèi)，這意味著非付費(fèi)用戶從此無法接觸最先進(jìn)的文心4.0模型。百度悶聲掙大錢的態(tài)度忽視了必要的技術(shù)宣傳，甚至立場鮮明地支持閉源，發(fā)表一系列“開源模型只會(huì)越來越落后”的觀點(diǎn)。

此刻再宣布開源，很難給用戶好的觀感。

最后，由于重視商業(yè)化的策略，加上大模型“燒錢”的客觀現(xiàn)實(shí)，百度一度被傳出“預(yù)訓(xùn)練終止”的消息。

圖片

對(duì)此，百度CTO王海峰曾辟謠，表示“相信大家非常關(guān)心基礎(chǔ)大模型的進(jìn)展。我可以很篤定地告訴大家，文心大模型仍在持續(xù)訓(xùn)練中，敬請(qǐng)期待更強(qiáng)大的新版本。”

那么，有關(guān)基礎(chǔ)模型訓(xùn)練的真相如何？百度開源還有機(jī)會(huì)嗎？

2.百度模型進(jìn)展到哪了？守住了哪些優(yōu)勢？

結(jié)合上一代模型ERNIE 4.0及其Turbo版的表現(xiàn)來看，百度再度躋身第一、第二梯隊(duì)還是有希望的。

百度發(fā)布于2023年10月的ERNIE 4.0（比GPT4晚發(fā)布7個(gè)月）及2024年6月升級(jí)的ERNIE 4.0 Turbo（比GPT-4o晚發(fā)布一個(gè)月）,代表了百度最先進(jìn)的模型技術(shù)。

ERNIE 4.0有明確對(duì)標(biāo)GPT-4，且綜合實(shí)力相當(dāng)。比起后者，ERNIE 4.0在中文語境下的表現(xiàn)相對(duì)更優(yōu)，但在復(fù)雜邏輯任務(wù)上遜色于后者。

圖片

而去年6月發(fā)布的ERNIE 4.0 Turbo，則缺少明確的對(duì)標(biāo)對(duì)象，官方介紹說“在性能上實(shí)現(xiàn)了顯著提升”。

根據(jù)智源研究院12月19日的FlagEval“百模”評(píng)測結(jié)果，ERNIE 4.0 Turbo確實(shí)在主觀評(píng)分上處于領(lǐng)先地位，僅次于幾乎同期發(fā)布的Doubao-pro-32k-preview，但客觀估分不高。

以上表明文心可能是個(gè)“重文輕理”的模型。

上圖：智源研究院 FlagEval“百模”評(píng)測結(jié)果

雖然缺乏公開宣傳，但百度也沒有停止模型更新的步伐。

從百度千帆大模型服務(wù)與開發(fā)平臺(tái)，查看模型的更新記錄，會(huì)發(fā)現(xiàn)百度的1月底，同樣忙著做推理能力，并甩了一堆的模型更新。

上圖：百度千帆大模型服務(wù)與開發(fā)平臺(tái)

https://ai.baidu.com/ai-doc/WENXINWORKSHOP/flxu4ej5u

性能方面，在SuperCLUE的第三方報(bào)告中，百度一個(gè)名為“ERNIE-4.0-Turbo-8K-Latest”的模型，總分62.2，位列該報(bào)告模型的“第四梯隊(duì)”。從命名看出，這是一個(gè)相當(dāng)強(qiáng)悍的8K小模型。這個(gè)模型與DeepSeek-V2.5保持在同一梯隊(duì)中，并且優(yōu)于GPT-4o-mini。

注：以上數(shù)據(jù)來自SuperCLUE

此外，百度在垂直場景和多模態(tài)技術(shù)上也有顯著優(yōu)勢。

商業(yè)化并不意味著沒有技術(shù)積累，深耕的垂直場景也可能給百度模型帶來有價(jià)值的反哺，尤其是專業(yè)的高質(zhì)量數(shù)據(jù)。

從官網(wǎng)給出的產(chǎn)業(yè)級(jí)大模型分布圖來看，百度已經(jīng)在多個(gè)行業(yè)有定制模型。據(jù)報(bào)道，百度文心模型在中文場景下的知識(shí)問答、多模態(tài)生成(文本、圖像、語音)能力領(lǐng)先，尤其在金融與教育領(lǐng)域的應(yīng)用成熟度高。

上圖來源：文心大模型官網(wǎng)

百度最新發(fā)布的24年財(cái)報(bào)中透露，“12月，文心大模型日均調(diào)用量達(dá)16.5億次，一年增長33倍。”由此可見，百度在商業(yè)化場景上有獨(dú)特的技術(shù)積累，有很強(qiáng)的可信性。

在多模態(tài)領(lǐng)域，蘋果的合作選擇或許正是百度優(yōu)勢的一種側(cè)面印證。盡管蘋果最終攜手阿里打造國行AI功能，但據(jù)外媒報(bào)道，其AI圖片識(shí)別功能的開發(fā)仍選擇了百度作為合作伙伴。

此外，文心還是國家跳水隊(duì)的選擇。百度文心開發(fā)了一套智能跳水輔助訓(xùn)練系統(tǒng)，可以給跳水運(yùn)動(dòng)員的動(dòng)作實(shí)時(shí)打分、進(jìn)行精準(zhǔn)量化分析、制訂訓(xùn)練計(jì)劃等等。

百度的CTO王海峰曾談過多模態(tài)的技術(shù)壁壘。他表示“相比文字幻覺，圖片幻覺更為棘手”，百度進(jìn)一步研發(fā)了檢索增強(qiáng)的文生圖技術(shù)，既可以生成精確的圖片，也可以進(jìn)行泛化生圖。

更詳細(xì)的技術(shù)解釋是：大模型先基于用戶的需求進(jìn)行分析理解，自動(dòng)規(guī)劃精確或泛化方案，比如需對(duì)哪些實(shí)體進(jìn)行增強(qiáng)；接著在增強(qiáng)階段，對(duì)需要增強(qiáng)的實(shí)體，檢索并選擇相應(yīng)的參考圖。等到了生成階段，百度通過自研的多模可控生圖大模型，一方面，通過局部注意力計(jì)算，在保持實(shí)體特征不變的情況下，實(shí)現(xiàn)圖像的高泛化生成，比如根據(jù)牛頓的肖像，生成繪本風(fēng)格的牛頓；另一方面，通過整體注意力計(jì)算，進(jìn)行高精確的圖像生成，比如生成圖中的汽車跟原圖片完全一致。

再加上多模態(tài)也是Ernie 5.0的最重要的亮點(diǎn)，或許百度在這個(gè)維度上有所突破，還有些“壓箱底”的技術(shù)也不是沒有可能。（有趣的是，同為搜索引擎巨頭的谷歌，其主要優(yōu)勢也集中在了多模態(tài)技術(shù)，且最近發(fā)布的Gemini 2.0性能可圈可點(diǎn)。）

此外，百度在算力層上能真正做到軟硬協(xié)同。其自研芯片（昆侖芯）與自研框架（飛槳PaddlePaddle）深度適配，能顯著提升算力利用率。今年2月，百度還宣布百度智能云已經(jīng)成功點(diǎn)亮昆侖芯三代萬卡集群，這也是國內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。并透露了下一步，百度智能云將進(jìn)一步點(diǎn)亮3萬卡集群。

這不僅為文心大模型迭代提供了足量的"彈藥"，更長遠(yuǎn)的看，百度的方案不依賴英偉達(dá)芯片，提前規(guī)避了風(fēng)險(xiǎn)，或能在國產(chǎn)替代浪潮中占據(jù)關(guān)鍵生態(tài)位。

3.百度發(fā)力開源，究竟能不能成為解藥？

DeepSeek效應(yīng)持續(xù)發(fā)酵，海內(nèi)外模型廠商無不受到震撼。

一部分模型廠商重新回歸了技術(shù)驅(qū)動(dòng)的路線，例如“六小虎”中的Kimi、MiniMax等等。

在DeepSeek開源并取得巨大成功后，月之暗面內(nèi)部重新評(píng)估其戰(zhàn)略，團(tuán)隊(duì)復(fù)盤后認(rèn)為應(yīng)堅(jiān)持基礎(chǔ)模型SOTA（State-of-the-art，當(dāng)前最佳）的目標(biāo)。

而MiniMax的CEO閆俊杰也在采訪中透露，在經(jīng)歷了整整半年多的焦慮后，他終于做出取舍“現(xiàn)在 MiniMax 最重要的目標(biāo)不是增長，也不是收入，是 ‘加速技術(shù)迭代’。”

另一部分模型廠商則重拾了開源計(jì)劃，例如OpenAI。Altman透露了未來可能的開源項(xiàng)目，且提供的選項(xiàng)都很具吸引力。

以上兩個(gè)分類當(dāng)然存在重合，但值得注意的是：開源并不等同于技術(shù)驅(qū)動(dòng)。

促使公司開源的動(dòng)力有很多。閆俊杰說，“如果重新選，第一天就應(yīng)該開源。因?yàn)殚_源能加速技術(shù)進(jìn)化。”但是DeepSeek的奇跡也驗(yàn)證了——開源的價(jià)值遠(yuǎn)比我們想象的更深遠(yuǎn)、更多元：開源可以打造一個(gè)技術(shù)品牌；開源可以為模型贏得美譽(yù)和口碑；開源甚至能成為一個(gè)比B端大客戶銷售團(tuán)隊(duì)更有效的商業(yè)化引擎。

百度當(dāng)然也看到了開源的價(jià)值。在18日財(cái)報(bào)會(huì)上，李彥宏坦言，DeepSeek的成功給百度上了一課：“從DeepSeek身上，我們學(xué)到了一件事，那就是開源最佳模型能大大促進(jìn)人們使用或采納這個(gè)模型。當(dāng)一個(gè)模型開源時(shí)，人們自然會(huì)出于好奇想嘗試，這有助于更廣泛的采用。文心大模型4.5將是我們有史以來最好的模型，我們希望用戶和客戶能夠比以往更輕松地試用。”

因此，百度選擇趁早官宣了6月30日文心4.5系列的開源，希望借此降低用戶使用門檻，推動(dòng)生態(tài)繁榮。

但開源并非簡單的“技術(shù)開放”那么直接，它牽涉到商業(yè)策略、生態(tài)布局，甚至隱私與安全邊界的考量。相比此前未發(fā)力應(yīng)用的DeepSeek，百度文心已經(jīng)積累了龐大的C端用戶，模型訓(xùn)練可能涉及用戶交互數(shù)據(jù)以及百度自身的搜索、云計(jì)算等數(shù)據(jù)資產(chǎn)，因此在開源時(shí)，必須考慮數(shù)據(jù)安全與合規(guī)性。

百度需要明確開源的邊界：是僅開放推理權(quán)重，還是進(jìn)一步開放訓(xùn)練方法？如何設(shè)定開源協(xié)議，既能鼓勵(lì)創(chuàng)新，又能確保數(shù)據(jù)不被濫用？這些都是影響開源效果的關(guān)鍵問題。

至于此前簽下的政企訂單，百度仍然可以通過私有化部署確保穩(wěn)定性。事實(shí)上，開源與政企客戶并不沖突，合理的“開放但可控”策略，反而可能增強(qiáng)企業(yè)客戶的信任度。

歸根結(jié)底，百度開源的核心挑戰(zhàn)，不只是“開源與否”，而是開源后能否真正提升文心大模型的行業(yè)影響力。開源能帶來品牌聲量、生態(tài)繁榮，甚至用戶增長，但最終決定一切的，仍然是模型的技術(shù)實(shí)力和落地體驗(yàn)。DeepSeek的爆發(fā)式增長，正是建立在這一前提之上的。百度能否在開源后抓住同樣的機(jī)會(huì)，還要看文心4.5的實(shí)際表現(xiàn)。