AI大牛周明發布MChat：生成可控，參數規模可負擔，順便官宣了新融資

作者：衡宇 2023-03-20 15:31:46

人工智能新聞

我們會尊重大模型，把模型做到相當大，但同時快速考慮它的落地。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

大模型賽道又有融資新動態：

語言大模型玩家瀾舟科技，剛剛完成了Pre-A+輪融資。

本輪融資由北京中關村科學城公司領投，斯道資本和創新工場跟投。這是瀾舟科技1年內收獲的第2輪融資，2輪累計總額數億元。

不止于此。和融資消息一同公布的還有瀾舟科技推出的語言生成模型，孟子MChat可控大模型。

它有類ChatGPT的能力，加上原來瀾舟科技孟子大模型N個項目功能引擎，最終呈現出來的MChat，既有對話能力，又具備翻譯、生成、信息搜索等能力。

關于MChat，瀾舟科技創始人兼CEO周明還作了如下介紹：

將陸續推出10B和100B參數級的大模型；
具備聊天、問答、翻譯、文本生成、信息抽取等多種能力；
可融合搜索結果、領域數據和知識圖譜；
對功能、風格、人類認知等方面具可控性。

孟子MChat可控大模型

本次融資是創新工場對瀾舟科技的“繼續跟投”。

創新工場董事長兼CEO李開復在3月14日的趨勢分享會上談到，AI已經來到從1.0邁入2.0的拐點。

順著這個思路，MChat可以視為瀾舟科技嘗試從平臺和基礎設施兩個層面邁入AI 2.0時代的具體動作：

首先，發布迭代而來的孟子MChat可控大模型，視其為通用底座，提供語言預訓練模型、多模態預訓練模型、垂直領域預訓練模型等能力。

其次，再在其上架構能力平臺，提供知識圖譜、輔助寫作、機器翻譯等模塊化能力。

據周明介紹，團隊走訪了100多家公司，發現市場需求迥異。這種情況下，瀾舟科技認為在更垂類的賽道做定向優化顯得尤為重要。

也因此延伸出孟子大模型技術體系的特點之一，更多樣化。

具體而言，就是孟子支持BERT（分析類）、GPT（生成類）和T5（翻譯類）等架構，能夠覆蓋閱讀理解、文本生成、機器翻譯、對話等不同場景。

值得注意的是，MChat雖然具有ChatGPT同樣的對話能力，但兩者有所不同。

ChatGPT盡可能將多模態數據納入訓練庫，數據量越大越好，不甄別數據好壞；

而MChat強調“可控性”。

一是功能可控，即根據具體需求加減可調用的具體功能；二是結果可控，保證輸出內容的健康、良性。

“未來我們是想繼續探索從AI 1.0到2.0到AGI，”周明說，“不過AGI有點太遠，但下一步已經確定，就是從單語言擴展到更多的語言。”

選擇在這個時間點進軍AI 2.0時代，瀾舟科技似乎地利不足，放眼大模型創業領域，千帆競賽；但好處是已有諸多鋪墊，且孟子輕量化模型的能力已經經過驗證。

MChat背后依托的孟子大模型，是瀾舟科技自研技術研發的大規模預訓練語言模型，于2021年7月推出。

可處理多語言、多模態數據，同時支持多種文本理解和文本生成任務，快速滿足不同領域、不同應用場景的需求。

與追求打造AGI不同，基于Transformer架構的孟子，行進路線是輕量化——僅包含10億參數。

靠這10億參數，孟子大模型在中文語言理解領域最具權威性的測評基準CLUE上屢次刷榜第一，四兩撥千斤，擊敗其他公司百億甚至千億的模型。

到具體的應用層面，同花順、華夏基金為代表的金融領域，以及中文在線代表的文案寫作領域，瀾舟科技都以孟子大模型為底座提供了能力支撐。

NLP大牛周明

瀾舟科技是以NLP技術為基礎的認知智能公司，由AI大牛周明創辦的公司，成立于2021年6月。

周明，當今NLP領域成就最高的華人之一，他不僅是中國第一個中英翻譯系統的研制者，還在2019年成為AI語言領域最高級頂會ACL（國際計算語言協會）主席。

1991年在NLP重鎮哈工大拿到博士學位后，周明進入清華任教；1999年被微軟亞洲研究院創始院長李開復挖走，后來不久成為NLP研究組負責人。

2020年離開MSRA加盟創新工場擔任首席科學家時，周明已擔任MSRA副院長多年。

從工作21.5年的MSRA出走的原因，周明有些戲謔地解釋：

“2020年年底，我隱隱約約感知到未來大模型要興起，所以毅然決然離開微軟，成立瀾舟科技，專門從事大模型研究。”

據介紹，除了孟子大模型外，目前瀾舟科技已經開源了近20個大模型。

如果真如李開復所說，AI來到了從1.0過渡到2.0的拐點，這對NLP意味著什么？

周明一邊提到，AI 2.0反映在NLP，能看到GPT這樣的通用模型，一套模型解決很多問題，效率大幅提升；一邊又提出了兩個現象：

一是AI 2.0時代的NLP能力足夠強，在處理新任務時只需用一個提示詞來代替它的能力；

二是模型大到一定程度時，會涌現新的能力，尤其是會迸發出一些從未見到過的能力。

他個人表示出對新能力涌現的格外關注，因為涌現這件事目前還是未解之謎，“唯一能啟迪你的是在能力范圍之內，盡量把模型做的比較大”。

ChatGPT身上的邏輯和思維能力，就是由GPT系列模型的大力出奇跡出品。既然如此，瀾舟科技會不會也在模型參數上加碼？

周明直截了當地回答，瀾舟不會去追從千億、萬億大模型。

我們會尊重大模型，把模型做到相當大，但同時快速考慮它的落地。

責任編輯：張燕妮來源：量子位

AI 模型

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI大牛周明發布MChat：生成可控，參數規模可負擔，順便官宣了新融資

孟子MChat可控大模型

NLP大牛周明