創業180天估值20億美元!歐版OpenAI爆火,Llama主創自立門戶,英偉達都入股了
“歐洲版OpenAI”最新估值,逼近20億美元!
總部位于巴黎的大模型初創公司Mistral AI最新一輪融資,4.87億美元。
投資方為安德森·霍洛維茨、英偉達、Salesforce等。
其中安德森·霍洛維茨領投約2億歐元,英偉達、Salesforce計劃通過轉換債券再投資1.2億歐元。
據了解,Mistral AI由前DeepMind、前Meta科學家創立。2位主創是Llama的核心貢獻者。
今年5月,他們出走后創業,迅速引發圈內關注。種子輪即獲得1.13億美元,公司估值達2.6億美元。
9月時發布開源大模型Mistral-7B,全面對標Llama2。
如今,隨著最新一輪融資進入最后階段,意味著Mistral AI只用6個月時間,成功躋身獨角獸行列。
據介紹,新資金將用于擴建團隊、加速研發。
Llama主創出走創立
Mistral AI成立于今年5月,總部位于巴黎,公司使命為“構建能解決現實世界問題的下一代人工智能系統”。
由于有著宏大的AI愿景、主創均為AI領域頂尖人才、且快速發布自研大模型,Mistral AI被業界視為“歐洲版OpenAI”。
公司的3位主創分別是:
- CEO:阿瑟?門奇(Arthur Mensch)
- 首席科學家:紀堯姆?蘭普爾(Guillaume Lample)
- CTO:蒂莫西?拉克魯瓦(Timothée Lacroix)
其中首席科學家和CTO,均是Llama的核心主創。
首席科學家紀堯姆?蘭普爾曾是Meta AI的研究科學家,領導了Llama的開發。
他博士畢業于卡內基梅隆大學、師從Chris Dyer,研究領域為NLP、機器學習等。
谷歌學術顯示,蘭普爾論文被引次數達1.9萬次+。
CTO蒂莫西?拉克魯瓦曾在Meta AI任職8年,還是PyTorch-BigGraph的主要貢獻者。
CEO阿瑟?門奇今年30歲,創業前為DeepMind巴黎分部的研究員,2023年辭職后開始創業。
在DeepMind工作期間,門奇是Retro、Flamingo、Chinchilla等項目的主要貢獻者,積累了豐富的大語言模型開發優化經驗。
據了解,主創3人相識于學校時期,當時他們都在AI領域學習,CEO門奇表示他們是在2022年時開始討論AI創業的想法。
今年6月,Mistral AI在成立僅4周后,即拿下1.13億美元種子輪,由頂尖風投Lightspeed領投,估值達到2.6億美元。
當時團隊表示,他們將致力于大模型開源工作。
9月,Mistral AI正式發布并開源了自家首個大模型Mistral-7B,并且全面對標Llama2。
據論文介紹,Mistral-7B在所有基準測試中超越了Llama 2(13B),并在推理、數學、代碼生成任務中超越了Llama 2(34B)。
Mistral-7B采用了Llama2中同樣的分組查詢注意力機制,能加速推理;結合滑動窗口注意力機制,可以有效處理任意長度序列,降低推理成本。
同時他們還提供了一個微調模型Mistral 7B – Instruct,也超越了Llama2(13B)聊天模型在人類和自動化基準測試中的表現。
Mistral-7B表明,LLM的知識壓縮能力或許超過我們此前預期。想要用小模型獲得更好性能,還有非常多探索空間。
據了解,為避免版權問題,Mistral使用公開數據訓練大模型。
成為歐洲AI新星
隨著自家大模型的發布,Mistral也正式與OpenAI、谷歌等展開較量。
CEO門奇曾在采訪中表示,盡管公司很年輕、團隊規模不大,但是“我們與所有人競爭”。
而由于集結了大模型領域多位頂尖人才,Mistral從成立之初就備受業內關注,尤其是歐洲方面。
其種子輪吸引了諸多歐洲老牌風投,比如法國的Redpoint、Index Ventures等,德國的La Famiglia和Headline,以及意大利、比利時、英國風投也參與其中。
前不久在倫敦舉行的首屆人工智能安全峰會,Mistral作為唯一一家歐洲公司,和科技巨頭們共同出席了第二天的小型會議。
而且,Mistral也確實沒讓投資方失望。
據說其首款大模型發布本來預計在年底面世,結果一下提前3個月,在9月就發布了。
有頂尖團隊陣容、又手握自研大模型,也就不難理解Mistral的估值快速增長了。
最新一輪融資更是主要由硅谷貢獻。
新資金將用于擴大團隊規模、加快研發,并在歐洲和美國建立新的辦公室。
據介紹,作為交易的一部分,Mistral的三位聯合創始人將各自出售超過100萬英鎊的股權。
而這輪巨大融資也再次印證,投資者正在爭相尋找“下一個OpenAI”,諸多大型投資方都愿意在創企早期以高價購入股份,這也是創業公司在早期估值飆升的原因之一。