Databricks 投資 Mistral 并將其 AI 模型引入數據智能平臺
由 Ali Ghodsi 領導的快速增長的數據基礎設施公司 Databricks 宣布與總部位于巴黎的 Mistral 建立合作伙伴關系,Mistral 是一家資金雄厚的初創公司,憑借其不斷增長的高性能大型語言模型 (LLM) 系列在全球 AI 社區掀起了波瀾——其中許多是開源的。
根據這項協議,Databricks 正在向 Mistral 投資一筆未披露的金額,增加其 A 輪融資,并將精選的 Mistral LLM 引入其數據智能平臺。
此舉將直接集成這些模型,使企業用戶更容易將它們與生成式 AI 應用程序的數據一起使用,而無需對 Databricks 平臺已經提供的安全、隱私和治理進行任何更改。
這一發展標志著Mistral又增加了一個著名的分銷合作伙伴,該公司一直在通過行業合作伙伴關系積極向前發展。就在最近,它宣布與Snowflake建立類似的合作伙伴關系,Snowflake通過其數據云產品直接與Databricks競爭,以及Microsoft,后者引發了對企業捕獲和監管機構興趣的批評。
選擇要原生集成的模型
在今天發表的一篇博客文章中,Databricks 證實,與 Mistral 的合作將導致該公司的兩個文本生成模型的原生集成——Mistral 7B 和 Mixtral 8x7B,兩者都是開源的。
前者是一個 70 億參數的小型 transformer 模型,以 8k 上下文長度訓練,服務效率非常高。同時,后者是專家模型 (SMoE) 的稀疏混合,支持 32k 的上下文長度,并且能夠處理英語、法語、意大利語、德語和西班牙語。Mixtral 8x7B 甚至在包括 GSM-8K 和 MMLU 在內的多個基準測試中優于 Meta 的 Llama 2 70B(從中訓練)和 OpenAI 的 GPT-3.5,同時擁有更快的推理速度。
Databricks 數據智能平臺的用戶現在可以在平臺的市場上找到這兩種模型,并提供有關其功能和使用它們的不同方式的信息。
Databricks 表示,用戶可以通過平臺控制臺在 Mosaic AI Playground 中試驗模型,通過 Mosaic AI Model Serving 將它們用作優化的模型終結點,或者使用托管在平臺上的專有數據(Mosaic AI Foundation Model Adaptation)自定義它們,以針對特定用例。
“Mistral AI 模型現在可以在 Databricks 上以多種方式使用和自定義,Databricks 為構建、測試和部署端到端生成式 AI 應用程序提供了最全面的工具集。無論是從預訓練模型的并排比較開始,還是通過按代幣付費來使用模型,都有幾種快速入門選項。
雖然這個消息對于希望在平臺上使用其數據資產構建一代 AI 應用程序和解決方案的 Databricks 客戶來說是個好消息,但重要的是要注意,該合作伙伴關系沒有提到 Mistral Large,這是 Mistral 的最新型號,僅次于 GPT-4,性能優于 Anthropic 的 Claude 2、Google 的 Gemini Pro 和 GPT-3.5,具有五種語言的原生能力和 32K 代幣的上下文窗口。Snowflake已將該模型與Mixtral 8x7B和Mistral 7B一起集成到其數據云的Cortex服務中。
當 VentureBeat 聯系時,Databricks 發言人表示,目前還沒有關于 Mistral Large 集成的信息。Databricks 提供的其他開源、商業可用的模型包括 Meta 的 Llama-2、CodeLlama、Stable Diffusion XL 和 Mosaic 的 MPT 系列。
Mistral繼續其合作狂潮
Databricks 和 Snowflake 并不是 Mistral 的唯一合作伙伴。
該公司于 2023 年 6 月籌集了歐洲有史以來最大的種子輪融資,并很快進行了大規模的 A 輪融資,該公司非常注重行業參與,以擴大其影響力并鞏固其在由 OpenAI、Anthropic 和谷歌主導的 AI 類別中作為供應商信賴參與者的地位。
就在幾周前,它從Microsoft獲得了1600萬美元的投資,將其模型添加到Azure云平臺。這筆交易使Mistral成為繼OpenAI之后第二家在Microsoft平臺上提供其模型的公司。
然后,它還與IBM簽署了單獨的合作伙伴關系,使Mistral 8x7B在WatsonX上可用,并與Perplexity和Amazon合作。看看這家初創公司還能獲得哪些其他合作伙伴關系來提高其知名度并推動跨行業的人工智能用例,這將是一件有趣的事情。
本文轉載自 ??AI技術和商業思維?? ,作者: 學習中的Leo
