編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
年初,DeepSeek-R1模型的開源讓這個(gè)低調(diào)的技術(shù)品牌一炮打響。
隨著DeepSeek應(yīng)用的飛速增長,AI巨頭正在集體重新審視開源模式的商業(yè)價(jià)值——這不再只是“賠本賺吆喝”的事情,而是可能帶來實(shí)實(shí)在在的商業(yè)回報(bào)。
DeepSeek帶來的競爭壓力肉眼可見,連OpenAI的Altman都罕見地改口反思,承認(rèn)OpenAI在開閉源問題上“站在了歷史錯(cuò)誤的一端”。Altman 甚至在X上發(fā)起了投票,詢問大家OpenAI的下一個(gè)開源項(xiàng)目是一個(gè)o3 mini級(jí)的模型好,還是開源一個(gè)端側(cè)模型好。
而在國內(nèi),同樣坐不住的還有曾經(jīng)的閉源信仰者——百度。2月中旬,百度接連拋出一系列大動(dòng)作:
- 2月11日,文小言(原文心一言)更新,新版本正式接入DeepSeek-R1模型;
- 2月13日,百度宣布文心一言將于4月1日起全面免費(fèi);
- 2月14日,百度官宣:未來幾個(gè)月將陸續(xù)推出文心大模型4.5系列,并計(jì)劃在6月30日正式開源。
其中最出人意料的,還是百度在“開源 vs. 閉源”問題上的180度轉(zhuǎn)向。曾經(jīng),李彥宏曾直言“開源大模型是智商稅”“開源模型只會(huì)越來越落后”,而如今,面對(duì)現(xiàn)實(shí)的百度卻決定“打不過就加入”,主動(dòng)順應(yīng)開源潮流。
不過,細(xì)品百度的開源計(jì)劃,會(huì)發(fā)現(xiàn)它與DeepSeek的開源或許仍有本質(zhì)不同。DeepSeek采取的是“上線即開源”的模式,而百度的開源方案更顯謹(jǐn)慎:未來幾個(gè)月用戶或在產(chǎn)品側(cè)先行體驗(yàn)文心4.5系列,但真正的開源要等到年中才正式落地。
而2025的下半年,才是百度的重頭戲。根據(jù)外媒CNBC的爆料,百度Ernie 5.0預(yù)計(jì)將在今年下半年發(fā)布,并在多模態(tài)能力上有重大增強(qiáng)。知情人士透露,新模型可能會(huì)在文本、圖像、視頻、音頻的理解和轉(zhuǎn)換上邁出更大步伐,例如生成更自然的AI視頻內(nèi)容。
從某種程度看,百度的Ernie 4.5開源,很可能是在給 5.0“投石問路”。在全面邁入開源賽道之前,百度似乎更想先試探市場反應(yīng),看看這條路是否值得走到底。
1.月活被反超,百度系模型真落后了嗎?
關(guān)于百度的下次開源是否能激起水花,有一個(gè)繞不開的問題:百度在大模型的技術(shù)方面是否已經(jīng)落后?
從技術(shù)方面看,百度可能與頭部模型廠商并未拉開太大差距。
但百度大模型失去競爭力的觀點(diǎn)一直充斥于網(wǎng)絡(luò),究其原因有以下幾方面。
首先,作為國內(nèi)最早入局者,百度文小言確實(shí)沒能守住第一的位置,再加上“起大早、趕晚集”的論調(diào)時(shí)不時(shí)就拿出來炒作一番,使得很多人覺得百度的大模型也會(huì)“爛尾”。
兩年前,百度是大廠中最早做大模型的,2023年3月就開始內(nèi)測Chatbot應(yīng)用文心一言,趕來嘗鮮的用戶擠滿了排隊(duì)列表。但文心一言在月活上的領(lǐng)先優(yōu)勢只維持了一年之久,此后便逐漸被Kimi、豆包等一眾后來者反超。
不過,雖然AI應(yīng)用的月活量無法完全反映一家模型廠的技術(shù)水平。目前,文心一言Web端的訪問量在國內(nèi)AI產(chǎn)品位列第6,落后于DeepSeek和承接了DeepSeek流量的納米AI搜索、投流比較猛的豆包、Kimi以及非AI原生的百度文庫。僅從應(yīng)用排名看,無法證明百度的技術(shù)存在大幅落后。
這里引出了第二個(gè)問題:百度文庫月活量的趕超以及在商業(yè)化上的亮眼表現(xiàn),似乎多少給外界傳遞了一種文小言被內(nèi)部放棄的信號(hào)。
例如,李彥宏1月初發(fā)的百度內(nèi)部信中,提到“我們?cè)诖竽P蛻?yīng)用領(lǐng)域獨(dú)樹一幟,為4000萬文庫的付費(fèi)用戶提供無與倫比的內(nèi)容創(chuàng)作……”,卻未提及AI原生出身的文心一言。
需要明確的是,從應(yīng)用層上,文小言在內(nèi)部的地位是否滑落,我們不得而知。但模型層上,文心仍然是為百度文庫做賦能的技術(shù)基座,那就不存在被放棄的問題。
第三,百度的閉源生態(tài)和過早開啟的訂閱制度,要為百度日活被反超的事實(shí)“背一部分鍋”。
2023年11月,文心一言就開做會(huì)員收費(fèi),這意味著非付費(fèi)用戶從此無法接觸最先進(jìn)的文心4.0模型。百度悶聲掙大錢的態(tài)度忽視了必要的技術(shù)宣傳,甚至立場鮮明地支持閉源,發(fā)表一系列“開源模型只會(huì)越來越落后”的觀點(diǎn)。
此刻再宣布開源,很難給用戶好的觀感。
最后,由于重視商業(yè)化的策略,加上大模型“燒錢”的客觀現(xiàn)實(shí),百度一度被傳出“預(yù)訓(xùn)練終止”的消息。
圖片
對(duì)此,百度CTO王海峰曾辟謠,表示“相信大家非常關(guān)心基礎(chǔ)大模型的進(jìn)展。我可以很篤定地告訴大家,文心大模型仍在持續(xù)訓(xùn)練中,敬請(qǐng)期待更強(qiáng)大的新版本。”
那么,有關(guān)基礎(chǔ)模型訓(xùn)練的真相如何?百度開源還有機(jī)會(huì)嗎?
2.百度模型進(jìn)展到哪了?守住了哪些優(yōu)勢?
結(jié)合上一代模型ERNIE 4.0及其Turbo版的表現(xiàn)來看,百度再度躋身第一、第二梯隊(duì)還是有希望的。
百度發(fā)布于2023年10月的ERNIE 4.0(比GPT4晚發(fā)布7個(gè)月)及2024年6月升級(jí)的ERNIE 4.0 Turbo(比GPT-4o晚發(fā)布一個(gè)月),代表了百度最先進(jìn)的模型技術(shù)。
ERNIE 4.0有明確對(duì)標(biāo)GPT-4,且綜合實(shí)力相當(dāng)。比起后者,ERNIE 4.0在中文語境下的表現(xiàn)相對(duì)更優(yōu),但在復(fù)雜邏輯任務(wù)上遜色于后者。
圖片
而去年6月發(fā)布的ERNIE 4.0 Turbo,則缺少明確的對(duì)標(biāo)對(duì)象,官方介紹說“在性能上實(shí)現(xiàn)了顯著提升”。
根據(jù)智源研究院12月19日的FlagEval“百模”評(píng)測結(jié)果,ERNIE 4.0 Turbo確實(shí)在主觀評(píng)分上處于領(lǐng)先地位,僅次于幾乎同期發(fā)布的Doubao-pro-32k-preview,但客觀估分不高。
以上表明文心可能是個(gè)“重文輕理”的模型。
上圖:智源研究院 FlagEval“百模”評(píng)測結(jié)果
雖然缺乏公開宣傳,但百度也沒有停止模型更新的步伐。
從百度千帆大模型服務(wù)與開發(fā)平臺(tái),查看模型的更新記錄,會(huì)發(fā)現(xiàn)百度的1月底,同樣忙著做推理能力,并甩了一堆的模型更新。
上圖:百度千帆大模型服務(wù)與開發(fā)平臺(tái)
https://ai.baidu.com/ai-doc/WENXINWORKSHOP/flxu4ej5u
性能方面,在SuperCLUE的第三方報(bào)告中,百度一個(gè)名為“ERNIE-4.0-Turbo-8K-Latest”的模型,總分62.2,位列該報(bào)告模型的“第四梯隊(duì)”。從命名看出,這是一個(gè)相當(dāng)強(qiáng)悍的8K小模型。這個(gè)模型與DeepSeek-V2.5保持在同一梯隊(duì)中,并且優(yōu)于GPT-4o-mini。
注:以上數(shù)據(jù)來自SuperCLUE
此外,百度在垂直場景和多模態(tài)技術(shù)上也有顯著優(yōu)勢。
商業(yè)化并不意味著沒有技術(shù)積累,深耕的垂直場景也可能給百度模型帶來有價(jià)值的反哺,尤其是專業(yè)的高質(zhì)量數(shù)據(jù)。
從官網(wǎng)給出的產(chǎn)業(yè)級(jí)大模型分布圖來看,百度已經(jīng)在多個(gè)行業(yè)有定制模型。據(jù)報(bào)道,百度文心模型在中文場景下的知識(shí)問答、多模態(tài)生成(文本、圖像、語音)能力領(lǐng)先,尤其在金融與教育領(lǐng)域的應(yīng)用成熟度高。
上圖來源:文心大模型官網(wǎng)
百度最新發(fā)布的24年財(cái)報(bào)中透露,“12月,文心大模型日均調(diào)用量達(dá)16.5億次,一年增長33倍。”由此可見,百度在商業(yè)化場景上有獨(dú)特的技術(shù)積累,有很強(qiáng)的可信性。
在多模態(tài)領(lǐng)域,蘋果的合作選擇或許正是百度優(yōu)勢的一種側(cè)面印證。盡管蘋果最終攜手阿里打造國行AI功能,但據(jù)外媒報(bào)道,其AI圖片識(shí)別功能的開發(fā)仍選擇了百度作為合作伙伴。
此外,文心還是國家跳水隊(duì)的選擇。百度文心開發(fā)了一套智能跳水輔助訓(xùn)練系統(tǒng),可以給跳水運(yùn)動(dòng)員的動(dòng)作實(shí)時(shí)打分、進(jìn)行精準(zhǔn)量化分析、制訂訓(xùn)練計(jì)劃等等。
百度的CTO王海峰曾談過多模態(tài)的技術(shù)壁壘。他表示“相比文字幻覺,圖片幻覺更為棘手”,百度進(jìn)一步研發(fā)了檢索增強(qiáng)的文生圖技術(shù),既可以生成精確的圖片,也可以進(jìn)行泛化生圖。
更詳細(xì)的技術(shù)解釋是:大模型先基于用戶的需求進(jìn)行分析理解,自動(dòng)規(guī)劃精確或泛化方案,比如需對(duì)哪些實(shí)體進(jìn)行增強(qiáng);接著在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體,檢索并選擇相應(yīng)的參考圖。等到了生成階段,百度通過自研的多模可控生圖大模型,一方面,通過局部注意力計(jì)算,在保持實(shí)體特征不變的情況下,實(shí)現(xiàn)圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過整體注意力計(jì)算,進(jìn)行高精確的圖像生成,比如生成圖中的汽車跟原圖片完全一致。
再加上多模態(tài)也是Ernie 5.0的最重要的亮點(diǎn),或許百度在這個(gè)維度上有所突破,還有些“壓箱底”的技術(shù)也不是沒有可能。(有趣的是,同為搜索引擎巨頭的谷歌,其主要優(yōu)勢也集中在了多模態(tài)技術(shù),且最近發(fā)布的Gemini 2.0性能可圈可點(diǎn)。)
此外,百度在算力層上能真正做到軟硬協(xié)同。其自研芯片(昆侖芯)與自研框架(飛槳PaddlePaddle)深度適配,能顯著提升算力利用率。今年2月,百度還宣布百度智能云已經(jīng)成功點(diǎn)亮昆侖芯三代萬卡集群,這也是國內(nèi)首個(gè)正式點(diǎn)亮的自研萬卡集群。并透露了下一步,百度智能云將進(jìn)一步點(diǎn)亮3萬卡集群。
這不僅為文心大模型迭代提供了足量的"彈藥",更長遠(yuǎn)的看,百度的方案不依賴英偉達(dá)芯片,提前規(guī)避了風(fēng)險(xiǎn),或能在國產(chǎn)替代浪潮中占據(jù)關(guān)鍵生態(tài)位。
3.百度發(fā)力開源,究竟能不能成為解藥?
DeepSeek效應(yīng)持續(xù)發(fā)酵,海內(nèi)外模型廠商無不受到震撼。
一部分模型廠商重新回歸了技術(shù)驅(qū)動(dòng)的路線,例如“六小虎”中的Kimi、MiniMax等等。
在DeepSeek開源并取得巨大成功后,月之暗面內(nèi)部重新評(píng)估其戰(zhàn)略,團(tuán)隊(duì)復(fù)盤后認(rèn)為應(yīng)堅(jiān)持基礎(chǔ)模型SOTA(State-of-the-art,當(dāng)前最佳)的目標(biāo)。
而MiniMax的CEO閆俊杰也在采訪中透露,在經(jīng)歷了整整半年多的焦慮后,他終于做出取舍“現(xiàn)在 MiniMax 最重要的目標(biāo)不是增長,也不是收入,是 ‘加速技術(shù)迭代’。”
另一部分模型廠商則重拾了開源計(jì)劃,例如OpenAI。Altman透露了未來可能的開源項(xiàng)目,且提供的選項(xiàng)都很具吸引力。
以上兩個(gè)分類當(dāng)然存在重合,但值得注意的是:開源并不等同于技術(shù)驅(qū)動(dòng)。
促使公司開源的動(dòng)力有很多。閆俊杰說,“如果重新選,第一天就應(yīng)該開源。因?yàn)殚_源能加速技術(shù)進(jìn)化。”但是DeepSeek的奇跡也驗(yàn)證了——開源的價(jià)值遠(yuǎn)比我們想象的更深遠(yuǎn)、更多元:開源可以打造一個(gè)技術(shù)品牌;開源可以為模型贏得美譽(yù)和口碑;開源甚至能成為一個(gè)比B端大客戶銷售團(tuán)隊(duì)更有效的商業(yè)化引擎。
百度當(dāng)然也看到了開源的價(jià)值。在18日財(cái)報(bào)會(huì)上,李彥宏坦言,DeepSeek的成功給百度上了一課:“從DeepSeek身上,我們學(xué)到了一件事,那就是開源最佳模型能大大促進(jìn)人們使用或采納這個(gè)模型。當(dāng)一個(gè)模型開源時(shí),人們自然會(huì)出于好奇想嘗試,這有助于更廣泛的采用。文心大模型4.5將是我們有史以來最好的模型,我們希望用戶和客戶能夠比以往更輕松地試用。”
因此,百度選擇趁早官宣了6月30日文心4.5系列的開源,希望借此降低用戶使用門檻,推動(dòng)生態(tài)繁榮。
但開源并非簡單的“技術(shù)開放”那么直接,它牽涉到商業(yè)策略、生態(tài)布局,甚至隱私與安全邊界的考量。相比此前未發(fā)力應(yīng)用的DeepSeek,百度文心已經(jīng)積累了龐大的C端用戶,模型訓(xùn)練可能涉及用戶交互數(shù)據(jù)以及百度自身的搜索、云計(jì)算等數(shù)據(jù)資產(chǎn),因此在開源時(shí),必須考慮數(shù)據(jù)安全與合規(guī)性。
百度需要明確開源的邊界:是僅開放推理權(quán)重,還是進(jìn)一步開放訓(xùn)練方法?如何設(shè)定開源協(xié)議,既能鼓勵(lì)創(chuàng)新,又能確保數(shù)據(jù)不被濫用?這些都是影響開源效果的關(guān)鍵問題。
至于此前簽下的政企訂單,百度仍然可以通過私有化部署確保穩(wěn)定性。事實(shí)上,開源與政企客戶并不沖突,合理的“開放但可控”策略,反而可能增強(qiáng)企業(yè)客戶的信任度。
歸根結(jié)底,百度開源的核心挑戰(zhàn),不只是“開源與否”,而是開源后能否真正提升文心大模型的行業(yè)影響力。開源能帶來品牌聲量、生態(tài)繁榮,甚至用戶增長,但最終決定一切的,仍然是模型的技術(shù)實(shí)力和落地體驗(yàn)。DeepSeek的爆發(fā)式增長,正是建立在這一前提之上的。百度能否在開源后抓住同樣的機(jī)會(huì),還要看文心4.5的實(shí)際表現(xiàn)。
參考鏈接:
1.https://zhuanlan.zhihu.com/p/23667812307
2.https://finance.sina.com.cn/tech/discovery/2024-11-13/doc-incvxpff1200045.shtml
3.https://flageval.baai.ac.cn/#/home
4.https://cloud.tencent.com/developer/article/2495332
5.https://mp.weixin.qq.com/s/VmRFGJitPF9EXi0ZBDp3Pw
6.https://mp.weixin.qq.com/s/opWLjlQvWuf9mqKeP0D4Xg
7.https://cloud.baidu.com/article/3396976