編輯 |諾亞、伊風
出品 | 51CTO技術棧(微信號:blog51cto)
近日在開源模型界,Command R+風頭正勁。
在Arena榜單上,Command R+憑借逾13000名支持者的票,一度躍升至第6位,其表現與GPT-4-0314旗鼓相當!在一眾對壘GPT-4的開放權重模型中,斬獲該榜單有史以來的首勝。
圖源:https://twitter.com/lmsysorg/status/17776301337
而Arena榜單,是近日用純C語言手搓GPT-2的AI大神Andrej Karpathy提過的唯二信任的測試基準之一。
Command R+隸屬總部位于多倫多的大模型創業公司Cohere。這家AI新銳的聯合創始人兼CEO,正是Transformer最年輕作者Aidan Gomez。我們且來看一看開源模型界當紅炸子雞的幕后故事。
1.Command R+ 橫空出世,何以擊敗GPT-4
Command R+與前代Command R一樣,擁有128k令牌上下文窗口,而且又在此基礎上全面提高了性能。
首先,提供先進的檢索增強生成(RAG)能力。RAG技術結合了基于檢索的模型和生成性模型的優勢。前者涉及從數據庫、文章或網站等大量來源中訪問和提取信息,而后者擅長生成連貫且具有上下文意識的文本。通過結合這兩個組件,RAG在生成更具信息性和上下文相關性的響應方面脫穎而出。
更值得一提的是,新模型針對高級RAG進行了優化,提高了響應的準確性,并提供了內嵌的源引用,以減少幻覺現象,從而更好地應對業務需求,使企業能夠借助AI擴展支持各種業務功能,如財務、人力資源、銷售、市場營銷和客戶支持等。
再者,覆蓋10多種語言,支持全球業務運營。其中包括:英語、法語、西班牙語、意大利語、德語、葡萄牙語、日語、韓語、阿拉伯語和中文。
另外,Command R+還配置了多種工具使用功能,用于自動化復雜的業務流程
API接口:附帶可以通過Cohere和LangChain API訪問的工具使用能力。這有助于自動化復雜的業務工作流程,如更新CRM任務、活動和記錄。
多步驟工具使用:Command R+中的一個新特性,使模型能夠結合多個工具進行多個步驟以完成復雜任務。Command R+還具有自我糾正的能力,當它嘗試使用工具失敗時(例如遇到工具的錯誤或故障),這增強了模型完成任務的可能性,并提高了成功的可能性。
在對話工具使用和單輪次函數調用能力方面,Command R+在關鍵企業AI基準測試中表現優異,超過了OpenAI的GPT-4 Turbo,以及Anthropic的Claude 3 Sonnet和Mistral Large。
圖源:https://txt.cohere.com/command-r-plus-microsoft
2.Cohere與Oracle,并不是OpenAI和微軟的關系
作為一家為企業用戶進行服務的公司,Cohere并不想成為巨頭的跟班。
盡管Oracle是Cohere的主要投資者,兩者的關系十分密切,但他們并不喜歡OpenAI與Microsoft的“相處模式”。Cohere的CEO Gomez表示,Cohere獨立于任何云服務提供商,可以在任何云平臺上部署其模型,這與僅在Microsoft Azure可以使用的OpenAI不同。
“我們認為獨立性非常重要,因此我們的服務可以在你所知道的每一家云平臺上使用——Azure、GCP、OCI、AWS,以及本地部署。你不會被鎖定在單一的技術棧或云平臺上,”Gomez在2024年達沃斯世界經濟論壇的間隙說道。這種獨立性給了Cohere開辟更多收入來源的可能。
“我們不會從單一的云服務提供商那里接受巨額的支票,這可能會將我們鎖定在一個生態系統或環境中。我們真的在努力保持獨立,并為世界建立一些新的東西,”他補充道,間接地對OpenAI進行批評。
該企業的COO Martin Kon也表達了類似的想法,他說模型需要與云無關,這樣你就可以在你覺得對你的數據最舒適的地方部署它們,而不會被綁定到特定的云或甚至是本地部署。
不過,Oracle的確是Cohere資金雄厚的金主之一,與該公司在技術方面也有著密切的關系。Cohere在Oracle云基礎設施(OCI)上訓練和構建其生成性AI模型,該基礎設施提供了高性能和低成本的GPU集群技術。這使得Cohere能夠加速大型語言模型(LLM)的訓練,同時降低成本。同樣的,微軟Azure云計算平臺也在為OpenAI所提供的算力支持。
“與Oracle的關系在計算方面產生了巨大的影響,為我們提供了地球上最好的超級計算機,同時在共同進入市場、共同創造新產品、改造現有產品以及將這項技術帶給企業方面也非常重要,”Gomez說道。
Gomez補充說,“OCI生成性AI服務真正體現了我們的使命,即為企業構建大型語言模型,以一種極度保護他們的數據、完全安全的方式”。
Cohere的生成性AI模型已經集成到Oracle的商業應用中,包括Oracle Fusion Cloud、Oracle NetSuite和Oracle特定行業的應用程序。
當前,Cohere 一直在努力提升自身的盈利水平。去年年底,該公司的年化收入約為 1300 萬美元,月收入僅略高于 100 萬美元。這一數字被他強大的競爭對手——OpenAI遠遠地甩在了身后,去年年 12 月OpenAI的營收已突破 20 億美元大關。
不過,這家初創公司已告知投資者,其銷售漏斗上(包括預計在 2024 年底之前完成的潛在合同)的價值超過 3 億美元,目前尚不清楚甲骨文在其中所占的份額。可以確定的是,隨著Cohere的模型在多家云平臺上完成部署,他的收入曲線勢必會繼續攀升。
微軟Azure宣布接入Cohere
3.OpenAI之下,大模型謀求盈利之路
大模型的元年已過,AI的落地應用浪潮洶涌。傅盛預言,今年千億大模型過半將會凋零。
在OpenAI的高光之下,或是照貓畫虎,或是另辟蹊徑,大模型廠商都必須探索出自己的生財之道。
專注于企業服務的Cohere,早早便堅定了To B的決心。Cohere的首席執行官Martin Kon 說:"我們現在沒有,將來也不會有一個燒錢的消費者聊天機器人。”
4月11日晚,李彥宏在內部講話中表達了文心一言為何選擇了閉源之路,他提到,“閉源,是有真正的商業模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才,閉源在成本上反而是有優勢的,只要是同等能力,閉源模型的推理成本一定是更低的,響應速度一定是更快的。”
但以Llama、Mistral AI 和Command R+為代表的其他各種替代方案正在蓬勃發展,并越來越多地被云提供商和企業采用。開源勢力亦不可小覷。以Command R+ 為例,其在可擴展市場類別中優于類似模型,定價上也更具競爭力。
Cohere為Command R+設定的100萬輸入和輸出令牌成本分別為3美元和15美元,這一價格頗具競爭力。相較于其他產品,其定價與Claude 3 Sonnet相當;而最新的OpenAI GPT-4 Turbo模型對100萬輸入令牌收費10美元,對100萬輸出令牌收費30美元。
隨著AI創新領域新競爭者的不斷涌入,在當前穩健發展的態勢下,相信關于“開源VS閉源”的辯論,也會伴隨創新浪潮下探索的每一步,但這不會是“東風壓倒西風”的二選一終局,這兩種模式必然將在相當長的時期內共生共存,共同為AI產業落地創造價值。
參考鏈接:
1.https://analyticsindiamag.com/who-needs-openais-gpt-4/
2.https://analyticsindiamag.com/the-secret-superstar-of-llms/
3.https://k.sina.com.cn/article_1654203637_629924f5020011twi.html