2024年的百度大模型,離「錢(qián)」越來(lái)越近
大模型談錢(qián),不寒磣。
前些日子朱嘯虎和楊植麟的隔空對(duì)話,代表了技術(shù)派和市場(chǎng)派的兩種觀點(diǎn)。朱嘯虎不看好大模型創(chuàng)業(yè),認(rèn)為現(xiàn)階段大模型公司缺乏場(chǎng)景和數(shù)據(jù),估值過(guò)高,且面臨開(kāi)源模型的競(jìng)爭(zhēng),投資風(fēng)險(xiǎn)大。他更傾向于投資能快速商業(yè)化、變現(xiàn)的應(yīng)用層項(xiàng)目。
楊植麟堅(jiān)定看好大模型創(chuàng)業(yè),認(rèn)為這是未來(lái)十年唯一有意義的事,并將其視為一個(gè)結(jié)合科學(xué)、工程和商業(yè)的系統(tǒng),需要長(zhǎng)期投入和堅(jiān)持,最終目標(biāo)是實(shí)現(xiàn)AGl。
雖然兩者觀點(diǎn)看起來(lái)針?shù)h相對(duì),但有一點(diǎn)并不沖突,不論是在通向AGI的過(guò)程中“沿途下蛋”,還是現(xiàn)在就投資能看到產(chǎn)出的大模型應(yīng)用公司,今年大模型的商業(yè)化,一定是離錢(qián)越來(lái)越近。
若論國(guó)內(nèi)對(duì)大模型商業(yè)化最熱衷的企業(yè),百度一定是其中之一。據(jù)此前報(bào)道,2024年百度創(chuàng)始人李彥宏在百度智能云方向的OKR就是,跑通以大模型為核心智能云發(fā)展路徑,并且在收入和利潤(rùn)方面都有要求。
百度智能云是百度AI能力的輸出口,海外市場(chǎng)大模型與云服務(wù)結(jié)合得比國(guó)內(nèi)更緊密,這也是百度智能云希望努力的方向。
3月21日,百度智能云千帆大模型平臺(tái)就一口氣發(fā)布了5款新模型,包括3個(gè)輕量級(jí)大模型、2個(gè)垂直場(chǎng)景大模型,并且千帆ModelBuilder以千帆AppBuilder也同步升級(jí)。鈦媒體App了解到,百度后續(xù)還將發(fā)布大模型應(yīng)用產(chǎn)品,譬如銷售、客服、辦公等產(chǎn)品。
可以說(shuō),目前百度大模型商業(yè)化只有一條主線,讓盡可能多的一部分人先用大模型,由此改變自己的產(chǎn)品和面向客戶的服務(wù)。
大模型落地“值不值”
初期大模型的火熱,未必能轉(zhuǎn)化為實(shí)實(shí)在在的訂單,在大模型技術(shù)和產(chǎn)業(yè)的高速發(fā)展期,有些廠商已經(jīng)被歷史的車輪碾過(guò),但卻絲毫不起一絲波瀾。
“慘烈,我覺(jué)得是很慘烈,從去年到現(xiàn)在有很多基礎(chǔ)模型廠商參與到市場(chǎng)競(jìng)爭(zhēng),也有很多的企業(yè)資金鏈?zhǔn)艿搅艘恍┨魬?zhàn),也反映出新技術(shù)發(fā)展過(guò)程中的一些矛盾。”百度智能云AI與大數(shù)據(jù)平臺(tái)總經(jīng)理忻舟說(shuō)道。
這其中一個(gè)很重要的因素,就是大模型供需之間的錯(cuò)位,大量企業(yè)沒(méi)有掏出真金白銀,而是處在觀望階段。從企業(yè)使用大模型的角度,主要關(guān)注三個(gè)因素,一是效果好不好,二是成本是否足夠低,三是效率,因此多數(shù)企業(yè)并不關(guān)心大模型或者小模型,只會(huì)結(jié)合自己的預(yù)期評(píng)估大模型落地到自己的場(chǎng)景“值不值”。
百度也提出了自己“效價(jià)比”的理念,除了極少的大客戶對(duì)大模型有極致的效果追求,更多的企業(yè)和機(jī)構(gòu)往往要綜合考量大模型的使用效果、性能以及成本,即“效價(jià)比”
面向大模型如何落地,業(yè)內(nèi)想了各種各樣的技術(shù)方法,比如RAG、插件、MoE、小型化、大小協(xié)同等等各種各樣的問(wèn)題,輕量級(jí)模型就是公認(rèn)的“效價(jià)比”突出的方案。
“業(yè)界也逐漸形成一個(gè)共識(shí),模型不見(jiàn)得是參數(shù)規(guī)模越大越好。在很多實(shí)際的場(chǎng)景當(dāng)中,用小尺寸的專家模型也能夠達(dá)到我們通用大模型的效果,小尺寸專家模型的推理成本會(huì)更低,更便宜。”百度副總裁謝廣軍表示。
他還提到,本次發(fā)布的三款模型都是開(kāi)發(fā)專家模型的基座模型,主要面向兩個(gè)場(chǎng)景:一是客戶、合作伙伴結(jié)合自己的數(shù)據(jù),去做垂類場(chǎng)景模型。二是百度也會(huì)基于這些小的基座模型,去開(kāi)發(fā)第一方的行業(yè)垂類場(chǎng)景模型,比如做教育行業(yè)的教輔答題和解題,可以用一個(gè)小尺寸的模型加上一些數(shù)據(jù),精調(diào)出一個(gè)效果很好的解題助手模型。
“3+2”,5款新模型
一月初,OpenAI發(fā)布了多款新模型,價(jià)格下降,性能提升,百度本次也是同樣的策略,百度智能云千帆ModelBuilder發(fā)布了包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在內(nèi),參數(shù)量由大到小的三款輕量級(jí)大模型。千帆ModelBuilder的概念就是生產(chǎn)平臺(tái),提供整個(gè)模型訓(xùn)練的工具鏈,讓模型開(kāi)發(fā)變得更簡(jiǎn)單。
對(duì)于輕量級(jí)模型,謝廣軍表示,基座模型本身的效率一定要好,百度基于文心大模型的技術(shù)領(lǐng)先優(yōu)勢(shì)積累,再把尺寸做小,模型的效果就會(huì)做得很好,在很多場(chǎng)景它能夠達(dá)到大模型的效果。
同時(shí),百度發(fā)布的輕量級(jí)模型具備再生產(chǎn)能力,比如支持post-pretrain、sft、lora精調(diào)能力,基座模型加上精調(diào)數(shù)據(jù)來(lái)達(dá)到垂直場(chǎng)景下的效果,同時(shí)成本更低。
具體來(lái)看,ERNIE Speed在推理場(chǎng)景下?lián)碛凶罡?28k的上下文長(zhǎng)度,在處理知識(shí)問(wèn)答等任務(wù)時(shí),能夠更好的處理上下文的依賴關(guān)系,同時(shí),針對(duì)特定場(chǎng)景可以將ERNIE Speed作為基座模型進(jìn)行精調(diào),模型效果可以追平甚至超過(guò)旗艦級(jí)大參數(shù)規(guī)模大模型,效價(jià)比大幅提升。
ERNIE Lite的參數(shù)量則更小,更適合搭載在低算力的AI加速卡上處理推理任務(wù),作為ERNIE-Bot-turbo模型的升級(jí)版,ERNIE Lite在情感分析、多任務(wù)學(xué)習(xí)、自然推理等場(chǎng)景下的應(yīng)用效果提升了20%,推理調(diào)用成本大幅下降了53%。
參數(shù)量最小的ERNIE Tiny則主打極致低成本、低延遲,可用于檢索、推薦、意圖識(shí)別等高并發(fā)、低延時(shí)等應(yīng)用場(chǎng)景中,在某對(duì)話推薦業(yè)務(wù)場(chǎng)景中,精調(diào)后的ERNIE Tiny在搜索引擎推薦詞激發(fā)環(huán)節(jié),相比ERNIE 3.5,對(duì)話輪次增長(zhǎng)了3.5%,成本下降了32%。
此外,百度智能云千帆ModelBuilder還推出了ERNIE Character和ERNIE Functions兩款垂直場(chǎng)景大模型,分別適配客戶在角色扮演類應(yīng)用場(chǎng)景(如游戲NPC、客服對(duì)話等)和工具調(diào)用場(chǎng)景(對(duì)話中使用外部工具、調(diào)用業(yè)務(wù)函數(shù)等)中的使用需求。
結(jié)合企業(yè)實(shí)際使用大模型的過(guò)程,有些企業(yè)起初就用最好的模型看最好的效果,再?zèng)Q定投入的資源程度。有些場(chǎng)景需要快速驗(yàn)證,企業(yè)可以先上輕量級(jí)模型,輕量級(jí)模型總結(jié)一句話——“輕歸輕,可破冰”,在一些場(chǎng)景下完全可用,作為大模型落地的先鋒軍。
對(duì)于注重私有數(shù)據(jù)的企業(yè)和行業(yè),私有數(shù)據(jù)跟大模型結(jié)合也可以先用輕量級(jí)模型,不管是知識(shí)資產(chǎn)還是數(shù)據(jù)分析,都可以跑出效果。
“把大模型應(yīng)用,喂到企業(yè)嘴邊”
千帆大模型平臺(tái)上的客戶需求主要分為三種,第一類是在AppBuilder開(kāi)發(fā)應(yīng)用;第二類,直接調(diào)用百度的基座模型的,比如直接調(diào)用文心4.0、 3.5版本;第三類是生產(chǎn)模型,客戶數(shù)據(jù)和百度基座模型結(jié)合做一個(gè)新的垂類模型。
AppBuilder去年年底推出,從應(yīng)用的視角讓開(kāi)發(fā)者能夠便捷地開(kāi)發(fā)基于大模型的AI原生應(yīng)用,百度第一方也做了非常多的AI原生應(yīng)用,也是基于這套平臺(tái)做的,本次AppBuilder也進(jìn)一步升級(jí),進(jìn)一步降低應(yīng)用開(kāi)發(fā)門(mén)檻。
升級(jí)后的AppBuilder開(kāi)放的工具組件多達(dá)55個(gè),包括基于百度多年技術(shù)積累和自有業(yè)務(wù)沉淀的大模型組件、AI能力組件,也包括搜索等百度特色的業(yè)務(wù)組件、和多場(chǎng)景的第三方API工具,另外還提供了 RAG(知識(shí)檢索問(wèn)答)、GBI(生成式數(shù)據(jù)分析)等根據(jù)典型應(yīng)用場(chǎng)景深入調(diào)優(yōu)的高級(jí)能力組件。
在組件之上,千帆AppBuilder推出的Agent(智能體)應(yīng)用框架,具備精準(zhǔn)的任務(wù)自主規(guī)劃能力,對(duì)多種應(yīng)用工具的自動(dòng)編排準(zhǔn)確率超過(guò)90%。AppBuilder還支持開(kāi)發(fā)者接入自定義工具,實(shí)現(xiàn)更復(fù)雜場(chǎng)景應(yīng)用的需求定制。
謝廣軍介紹,AppBuilder分兩個(gè)形態(tài),一個(gè)是代碼態(tài),百度提供SDK,甚至提供底層的組件和能力,這種是大B端的場(chǎng)景下的典型客戶畫(huà)像。另一個(gè)是零代碼態(tài),以小企業(yè)、個(gè)人開(kāi)發(fā)者為主,現(xiàn)在零代碼態(tài)開(kāi)發(fā)者的數(shù)量比較多,百度這兩條路都要走。
根據(jù)百度智能云公布的數(shù)據(jù),千帆大模型平臺(tái)已經(jīng)服務(wù)8萬(wàn)企業(yè)用戶,累計(jì)幫助用戶精調(diào)1.3萬(wàn)個(gè)大模型,幫助用戶開(kāi)發(fā)出16萬(wàn)個(gè)大模型應(yīng)用,自2023年12月以來(lái)百度智能云千帆大模型平臺(tái)API日調(diào)用量環(huán)比增長(zhǎng)97%
大模型未來(lái)一段時(shí)間還會(huì)不斷快速演進(jìn),百度AI團(tuán)隊(duì)主抓基礎(chǔ)模型,智能云團(tuán)隊(duì)主抓商業(yè)落地,構(gòu)成了百度自己的大模型商業(yè)落地模式。
本文轉(zhuǎn)載自??鈦媒體??,作者:張帥
