百川智能 × 昇騰AI|百川重磅發布Baichuan2大模型!已上線昇思開源社區
【2023年9月6日,北京】今日,百川智能在北京召開大模型發布會,正式發布Baichuan2開源大模型,昇騰AI基礎軟硬件平臺正式支持Baichuan2大模型,并在昇思MindSpore開源社區大模型平臺上線Baichuan2-7B模型開放體驗。
發布會現場,百川智能宣布正式開源微調后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其量化版本4bit,面向學術及商業市場提供大模型服務,并且均為免費可商用。
昇思MindSpore版本開源倉鏈接:
https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md
昇思MindSpore開源社區大模型平臺:
https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat
文理兼備性能優異,全面領先 LLaMA 2
Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6T?質量多語?數據進?訓練,在保留了上一代開源模型良好的生成與創作能力,流暢的多輪對話能力以及部署?檻較低等眾多特性的基礎上,兩個模型在數學、代碼、安全、邏輯推理、語義理解等能?有顯著提升。其中Baichuan2-13B-Base相比上?代13B模型,數學能力提升49%,代碼能?提升46%,安全能力提升37%,邏輯推理能力提升25%,語義理解能力提升15%。
本次開源的兩個模型在各?評測榜單上的表現優秀,在MMLU、CMMLU、GSM8K等幾?權威評估基準中,以絕對優勢領先LLaMA 2,相比其他同等參數量大模型,表現也十分亮眼,性能大幅度優于LLaMA 2等同尺寸模型競品。
更值得一提的是,根據MMLU等多個權威英文評估基準評分 Baichuan2-7b以70億的參數在英文主流任務上與130 億參數量的LLaMA 2基本持平。
7B參數模型的Benchmark成績
13B參數模型的Benchmark成績
Baichuan2-7B和Baichuan2-13B不僅對學術研究完全開放,開發者也僅需郵件申請獲得官方商用許可后,即可以免費商用。
Baichuan2大模型
Baichuan2大模型是由百川智能開發的一系列開源可商用的大規模預訓練語言模型。包含了70億、130億、530億參數的模型。百川智能?成?之初,就將通過開源?式助?中國?模型?態繁榮作為公司的重要發展?向。此次開源的兩款Baichuan2?模型,得到了上下游企業的積極響應,華為等眾多知名企業均參加了本次發布會并與百川智能達成了合作。
昇騰AI
昇騰 AI 是以昇騰 AI 基礎軟硬件平臺為基礎構建的人工智能計算產業。昇騰AI基礎軟硬件平臺包括 Atlas 系列硬件及伙伴自有品牌硬件、異構計算架構 CANN、全場景AI框架昇思 MindSpore、昇騰應用使能 MindX、一站式開發平臺 ModelArts 和統一工具鏈MindStudio 等。