成本、安全性和靈活性:開源AI的商業(yè)案例
像OpenAI和Anthropic這樣的商業(yè)GenAI平臺備受矚目,但開源替代品在成本效益、安全性和靈活性方面更具優(yōu)勢。
差旅與費(fèi)用管理公司Emburse看到了多個可利用GenAI獲益的機(jī)會。例如,它可用于改善個人用戶的體驗(yàn),比如更智能地分析收據(jù),或幫助企業(yè)客戶發(fā)現(xiàn)欺詐行為。
以讀取收據(jù)并準(zhǔn)確分類費(fèi)用這項(xiàng)簡單工作為例。由于收據(jù)千差萬別,因此自動完成這項(xiàng)工作可能很棘手。為解決這個問題,該公司轉(zhuǎn)向了GenAI,并決定同時使用商業(yè)和開源模型。公司的首席技術(shù)官Ken Ringdahl表示,這兩種GenAI模型各有優(yōu)勢。來自O(shè)penAI的主要商業(yè)模型部署更快、更容易,且開箱即用就更準(zhǔn)確,但開源替代品在安全性、靈活性、成本方面更勝一籌,并且經(jīng)過額外訓(xùn)練后,其準(zhǔn)確性甚至更高。
Ringdahl表示,在安全性方面,許多商業(yè)提供商會使用客戶的數(shù)據(jù)來訓(xùn)練他們的模型。雖然可以選擇退出,但其中不乏注意事項(xiàng)。例如,客戶可能需要支付更多費(fèi)用來確保數(shù)據(jù)不被用于訓(xùn)練,并且數(shù)據(jù)有可能面臨泄露風(fēng)險。
“這是專有商業(yè)模型的一個陷阱,”他說,“其中有很多細(xì)則,而且有些事情并沒有完全披露。”
此外還有地理問題。Emburse在120個不同國家/地區(qū)提供服務(wù),而OpenAI則沒有,另外,一些地區(qū)對數(shù)據(jù)留存有其他限制性要求。“所以我們用開源模型來補(bǔ)充,”他說,“這讓我們能夠在未覆蓋的地區(qū)提供服務(wù),并滿足安全、隱私和合規(guī)方面的要求。”
目前,該公司正在使用法國開發(fā)的開源模型Mistral。“我們評估了所有主要的開源大型語言模型,并發(fā)現(xiàn)經(jīng)過進(jìn)一步訓(xùn)練后,Mistral最適合我們的用例,”他說,“另一個考慮因素是大型語言模型的規(guī)模,這可能會影響推理時間。”
例如,他說,Meta的Llama規(guī)模非常大,這會影響推理時間。
“隨著這一領(lǐng)域的快速發(fā)展,我們對開源大型語言模型的選擇未來肯定會發(fā)生變化,”他補(bǔ)充道,“我們開發(fā)的軟件可以通過配置來替換開源或?qū)S械拇笮驼Z言模型。”
另一個好處是,通過開源,Emburse可以進(jìn)行額外的模型訓(xùn)練。該公司擁有許多不同格式和語言的已標(biāo)記和分類的收據(jù)示例。“我們針對自己的特定用例進(jìn)行了微調(diào),效果非常好,所以成功率極高。”他說。
這意味著,對于非英語用例,經(jīng)過微調(diào)的開源模型可能比大型商業(yè)模型更準(zhǔn)確。
開源模型還讓公司在何時升級方面擁有更大的靈活性。
“OpenAI目前的模型是GPT 4-o,但他們會推出5.0版,而最終4.0版將會停止使用——按照他們的時間表,而不是我的。”Ringdahl說。
這是個問題,因?yàn)闃?gòu)建商業(yè)產(chǎn)品需要進(jìn)行大量的測試和優(yōu)化。“使用開源模型,你可以控制在哪里使用它以及何時停止使用。”他說。
最后,還有價格因素。開源并非完全免費(fèi),因?yàn)槿匀恍枰袚?dān)基礎(chǔ)設(shè)施和管理成本。
“就我們而言,我們在自己的私有云中的AWS上運(yùn)行它,”他說,“所以我們還是要為使用付費(fèi)。如果你不了解使用模式以及它對你的費(fèi)用的影響,那么還是可能會感到震驚。”
但總的來說,無需支付OpenAI的API費(fèi)用確實(shí)能節(jié)省成本。“這可能是使用開源模型的兩三個主要原因之一,”他說,“你能更好地控制成本。”
其他公司也發(fā)現(xiàn),開源GenAI模型可以提供更多的靈活性、安全性和成本優(yōu)勢,盡管其中也存在風(fēng)險。
選擇豐富
從最廣泛的定義上講,此處的“開源”指的是可用的代碼,以及該模型可以在各種情境下免費(fèi)修改和使用,并且有很多此類模型可供選擇。
目前,Hugging Face跟蹤的僅用于文本生成的LLM就超過15萬個,而六個月前這一數(shù)字還是8萬個。是不是多到無法選擇?Chatbot Arena對160多個頂級模型(包括專有和開源)進(jìn)行了排名,并列出了它們的許可證。
除了模型本身,還有數(shù)千個與GenAI相關(guān)的開源工具。與5月份的5萬個項(xiàng)目相比,GitHub上列出的名稱中包含LLM的項(xiàng)目已超過10萬個,但大多數(shù)公司仍堅(jiān)持使用大牌模型。根據(jù)德勤科技、媒體、娛樂和電信行業(yè)業(yè)務(wù)部AI部門負(fù)責(zé)人Baris Sarer的說法,在行業(yè)部署中,Meta的Llama模型出現(xiàn)得最多,其次是Mistral。在Chatbot Arena排行榜上,最新的Llama 3.1略落后于最新的OpenAI模型(9月的GPT-4o),但領(lǐng)先于8月發(fā)布的同一模型。
“Meta最初推向市場的是一系列較小的模型,”Sarer說,“但現(xiàn)在他們也有了一個前沿模型,正在與主要參與者一爭高下。”市場份額數(shù)據(jù)也支持這一點(diǎn)。根據(jù)預(yù)測銷售平臺Enlyft的數(shù)據(jù),在GPT-4占據(jù)41%的市場份額之后,Llama以16%的市場份額位居第二。Mistral雖然也上榜,但市場份額不到5%。
對開發(fā)者API使用情況進(jìn)行調(diào)查的Kong公司發(fā)現(xiàn)了類似的平衡,其中OpenAI占27%,Llama占8%,Mistral占4%。除了排行榜上名列前茅的前沿模型外,針對小眾用例設(shè)計(jì)的小型語言模型(SLM)也在迅速增多。
“研究表明,參數(shù)數(shù)量在數(shù)百萬至數(shù)十億之間的小型語言模型在專門任務(wù)上的表現(xiàn)可能優(yōu)于大型通用語言模型。”卡內(nèi)基梅隆大學(xué)AI教授Anand Rao說。
他還表示,這些模型的計(jì)算需求更低,并且可以更有效地進(jìn)行微調(diào),因此更適合在資源受限的環(huán)境中部署。
Llama助力銷售支持和編碼
德勤的Sarer最近與一家數(shù)據(jù)中心技術(shù)公司合作,該公司正在尋找GenAI來幫助改造其前臺和后臺辦公系統(tǒng)。
“他們有一系列用例——銷售、市場營銷運(yùn)營、現(xiàn)場服務(wù),”他說,“我們選擇了Meta的Llama作為首選模型,考慮到成本、控制、可維護(hù)性和靈活性。”
例如,在銷售勘探方面,AI用于從內(nèi)部和外部來源獲取洞察,以更好地為銷售人員向客戶推銷產(chǎn)品和服務(wù)做準(zhǔn)備,并提出追加銷售和交叉銷售建議。
“他們幾個月前在美國和歐洲的部分地區(qū)推出了這項(xiàng)功能,現(xiàn)在正在根據(jù)反饋進(jìn)行改進(jìn),并將進(jìn)行更廣泛的推廣,”Sarer說,“使用它的銷售人員給出了很好的反饋。”
他表示,現(xiàn)在計(jì)算投資回報率還為時過早,這需要長期收集更多的數(shù)據(jù)點(diǎn),但初步結(jié)果很有希望,因此決定擴(kuò)大推廣范圍。
誠然,專有GenAI(最常見的是OpenAI)的應(yīng)用最為廣泛,但Sarer表示,在很多情況下,開源替代品是更合理的選擇。
“如果客戶傾向于在本地部署AI,那么開源實(shí)際上是唯一的選擇,”他說,“而且在某些行業(yè)中,本地部署仍然相當(dāng)普遍。”與Emburse一樣,許多公司出于地理原因選擇使用開源。
“從全球范圍來看,AI越來越被視為對國家安全和主權(quán)至關(guān)重要,因此有需求將AI保留在本地,”他說,“坦率地說,這使得開源成為唯一的選擇。”
許多其他公司也發(fā)現(xiàn)微調(diào)自己的模型很有好處。
“你可以采用預(yù)訓(xùn)練的開源模型,并使用自己的專有數(shù)據(jù)進(jìn)行微調(diào),”他說。他還表示,開源在部署方面提供了更大的靈活性。“如果你想在邊緣部署一個較小的模型,那么該領(lǐng)域的大多數(shù)模型都是開源的。”
最后,除了安全性和靈活性外,成本也是一個關(guān)鍵因素。使用開源模型時,公司仍需支付基礎(chǔ)設(shè)施費(fèi)用,但無需支付AI供應(yīng)商的利潤。“開源是有充分理由的,而且這個理由會越來越充分。”Sarer說。
甚至有些開源模型在特定任務(wù)上的表現(xiàn)可能優(yōu)于商業(yè)替代品。Globant數(shù)字創(chuàng)新高級副總裁兼技術(shù)副總裁Agus Huerta表示,他在使用Llama 3進(jìn)行代碼生成時看到了比ChatGPT更好的性能。
“Llama 3在提供對軟件的理解及其與其他代碼行的相關(guān)性方面有著成熟的應(yīng)用案例,”他說,“它還可以幫助重構(gòu)。Llama 3在這方面表現(xiàn)得非常好。”
他補(bǔ)充說,當(dāng)新開發(fā)人員需要快速加入項(xiàng)目并開始高效工作時,這對入職很有幫助,并且對于維護(hù)解決方案也非常有用。
為何開源AI落后于商業(yè)AI
開源AI具有成本低、靈活性高、安全性強(qiáng)等優(yōu)勢,那么有什么理由不選擇它呢?曾經(jīng)開源模型和專有模型之間在性能上存在很大差距,但那是過去的事了。“2024年,這一差距已顯著縮小,”Gartner分析師Arun Chandrasekaran說,“雖然差距已顯著縮小,但我們還沒有看到很多開源模型投入生產(chǎn)。”
他說,一個原因是公司已經(jīng)對閉源模型進(jìn)行了大量投資,并且看不到有任何迫切需要改變的理由。此外,運(yùn)行開源模型的操作復(fù)雜性以及潛在的法律責(zé)任也是影響因素。法律賠償是OpenAI、微軟、Adobe和其他主要供應(yīng)商GenAI合同的常見特征。
開源則并非如此。“模型創(chuàng)建者通常不承擔(dān)法律責(zé)任,”錢德拉塞卡蘭(Chandrasekaran)說。誠然,開源模型可以更容易地重新訓(xùn)練或定制。但他說,這個過程很復(fù)雜且成本高昂。“而且底層基礎(chǔ)模型也在快速變化,”他補(bǔ)充道,“如果你定制了某些內(nèi)容而基礎(chǔ)模型發(fā)生了變化,你就必須重新定制。”
最后,還有一個長期可持續(xù)性的問題。他說:“構(gòu)建開放模型、發(fā)布模型并讓數(shù)百萬人使用是一回事,而圍繞它構(gòu)建商業(yè)模式并將其貨幣化又是另一回事。”“貨幣化很難,那么誰會繼續(xù)資助這些模型呢?構(gòu)建第一個版本是一回事,但構(gòu)建第五個版本又是另一回事。”
Genpact全球人工智能負(fù)責(zé)人斯里坎斯·梅農(nóng)(Sreekanth Menon)表示,最終,我們很可能會走向一個混合的未來。“盡管人們普遍看好開源的接管,但開源和閉源模型都有其用武之地,”他說,“企業(yè)對模型不可知論的接受程度越高越好。”
由資金雄厚的公司支持的閉源模型可以突破人工智能的邊界。“它們可以提供高度精煉、專業(yè)的解決方案,這些解決方案得益于在研發(fā)方面的大量投資。”他說。
為什么開源定義對企業(yè)很重要
在任何關(guān)于開源通用人工智能的對話中,Meta的Llama都是首先被提及的,但從技術(shù)上講,它可能并不是開源的,這一區(qū)別很重要。10月下旬,開源促進(jìn)會發(fā)布了開源人工智能的第一個形式定義。
該定義要求開源人工智能不僅要共享源代碼和支持庫,還要共享模型參數(shù)以及模型訓(xùn)練數(shù)據(jù)的完整描述,包括其來源、范圍、特征和標(biāo)注程序,但更重要的是,用戶必須能夠出于任何目的使用開源人工智能,而無需請求許可。
根據(jù)這一定義,Meta的Llama模型是開放的,但由于存在限制,所以從技術(shù)上講并不是開源的。例如,有些Llama模型不能用于訓(xùn)練其他模型。而且,如果將其用于每月用戶超過7億的應(yīng)用程序或服務(wù)中,則需要獲得Meta的特殊許可。
Meta本身將其稱為社區(qū)許可或定制商業(yè)許可。OpenInfra基金會首席運(yùn)營官馬克·科利爾(Mark Collier)參與了新定義的制定工作,他表示,對于企業(yè)用戶而言,了解這些細(xì)微差別很重要。“對我來說,最重要的是,人們和公司有能力也有自由獲取這項(xiàng)基礎(chǔ)技術(shù),對其進(jìn)行重新組合、使用和修改,用于不同的目的,而無需請求守門人的許可。”因此,公司需要確信自己可以將人工智能整合到產(chǎn)品中,而不會有人回來說它不能這樣使用。
供應(yīng)商有時會宣布其人工智能是開源的,因?yàn)檫@有助于營銷和招聘,并讓客戶感覺他們沒有被鎖定。“它們有這種光環(huán)效應(yīng),但實(shí)際上并沒有做到這一點(diǎn)。”科利爾說。
在爭相采用人工智能的過程中,公司可能會輕信供應(yīng)商對其人工智能為開源的描述。
“Meta就是一個很好的例子,”他說,“很多主流科技報道都說這是開源人工智能,扎克伯格也是這樣描述的,而且這種說法一直被重復(fù)。但當(dāng)你深入了解時,就會發(fā)現(xiàn)許可存在限制。”
他補(bǔ)充說,隨著公司在人工智能技術(shù)上投入大量商業(yè)賭注,他們需要謹(jǐn)慎對待許可。而且,使用具有完全開源許可的模型還有其他好處。例如,能夠訪問模型的權(quán)重可以更容易地進(jìn)行微調(diào)和適應(yīng)。他補(bǔ)充說,公司還需要注意的另一件事是,有些開源許可要求所有派生作品也必須是開源的。
“如果公司根據(jù)自有專有數(shù)據(jù)定制或微調(diào)了模型,他們可能就不想發(fā)布它。”他說。這是因?yàn)橛蟹椒梢宰屇P捅┞镀溆?xùn)練數(shù)據(jù)。
他承認(rèn),要始終掌握這些問題很棘手,尤其是通用人工智能領(lǐng)域發(fā)展如此迅速。而模型開發(fā)人員不斷發(fā)明新的許可,更是無濟(jì)于事。
“如果你的公司正在發(fā)布開源內(nèi)容,而你的律師試圖創(chuàng)建另一種許可——請不要這樣做,”他說,“已經(jīng)有很多不錯的許可可供選擇,只需選擇一個符合你目標(biāo)的就行。”