國產ChatGPT又開源了!效果大幅升級,在手機上也可以跑
剛剛,「國產ChatGPT」ChatYuan又發新版本了。
更新的ChatYuan-large-v2不僅支持中英雙語,還支持輸入輸出總長度最長4k。
而這也是繼此前PromptCLUE-base、PromptCLUE- v1-5、ChatYuan-large-v1 模型之后,元語智能再次推出大模型方向的研究成果。
開源項目地址:
?https://github.com/clue-ai/ChatYuan?
Huggingface:
?https://huggingface.co/ClueAI/ChatYuan-large-v2?
Modelscope:
?https://modelscope.cn/models/ClueAI/ChatYuan-large-v2/summary?
01 什么是ChatYuan-large-v2?
ChatYuan-large-v2是一個支持中英雙語的功能型對話語言大模型,ChatYuan-large-v2使用了和 v1版本相同的技術方案,在指令微調、人類反饋強化學習、思維鏈等方面進行了優化。
ChatYuan-large-v2是ChatYuan系列中以輕量化實現高質量效果的代表模型,僅僅通過0.7B參數量可以實現業界10B模型的基礎效果,并且大大降低了推理成本,提高了使用效率。用戶可以在消費級顯卡、 PC甚至手機上進行推理(INT4 最低只需 400M )。
同時,為了更好的提升使用體驗,團隊已經封裝了工具,Chatyuan-large-v2實現了本地可運行,下載后可以直接在本地使用h5版本,進行網頁交互。
02 v2有什么升級?
在chatyuan-large-v1的原有功能的基礎上,v2模型進行了如下優化:
- 增強了基礎能力:原有上下文問答、創意性寫作能力明顯提升。
- 新增了拒答能力:對于一些危險、有害的問題,學會了拒答處理。
- 新增了代碼生成功能:對于基礎代碼生成進行了一定程度優化。
- 新增了表格生成功能:優化了生成的表格內容和格式。
- 增強了數學運算能力:對基礎數學運算如加減法做了優化。
- 擴展輸入輸出總長度:最大長度token數擴展到4096。
- 增強了模擬情景能力:可以模擬多人對話或者具體場景,在情景下進行內容創作及上下文交互。
- 新增了中英雙語對話能力:新增了中英雙語交互、英文創作、翻譯等功能。
拒答能力
計算推理
模擬情景
表格生成
代碼生成
03 v2的局限性
由于Chatyuan-large-v1是一個輕量化的大模型,所以仍會存在一些局限和不足,請開發者知悉,包括:
- 對于推理、計算、代碼生成方面基礎功能基本實現,仍存在訓練不充分的問題,在某些場景下會出現邏輯錯誤情況,如代碼基本能夠實現且具備注釋能力,但不能保證精簡通順和準確,可視性還需優化。
- 通用知識回答不夠精確,事實性知識仍存在不準確的情況。
- 上下文關聯信息處理尚有不足。
結語
總體而言,v2在上下文理解、內容生成、代碼表格生成等方面,較v1開源模型有較大提升,僅僅通過0.7B參數規模即可實現行業內百億參數規模的基礎效果,大幅降低推理成本,提升了使用效率。
元語智能表示,團隊會堅定的堅持開源路線,后續將持續開源更好更大的通用大模型,持續構建開源開發者生態,推動國內大模型開源發展,希望各位朋友批評指正。
產品內測邀請
除了本次開源ChatYuan-large-v2模型之外,元語團隊正式開啟KnowX產品內測,KnowX搭載了ChatYuan線上最新版本的大模型能力,在上下文理解、內容生成、代碼生成、邏輯推理計算等方面表現優異,為實現版本的可靠、穩定及進一步優化,現已開啟產品內測,名額有限,感興趣的朋友可在下方鏈接中申請。
內測申請通道:
?https://wj.qq.com/s2/11984341/e00b/?