成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

昆侖萬維開源「天工」13B系列大模型,0門檻商用

人工智能
10月30日,昆侖萬維宣布開源百億級大語言模型「天工」Skywork-13B系列,并罕見地配套開源了600GB、150B Tokens的超大高質量開源中文數據集。

10月30日,昆侖萬維宣布開源百億級大語言模型「天工」Skywork-13B系列,并罕見地配套開源了600GB、150B Tokens的超大高質量開源中文數據集。

昆侖萬維「天工」Skywork-13B系列目前包括130億參數的兩大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它們在CEVAL, GSM8K等多個權威評測與基準測試上都展現了同等規模模型的最佳效果,其中文能力尤為出色,在中文科技、金融、政務等領域表現均高于其他開源模型。

Skywork-13B下載地址(Model Scope): https://modelscope.cn/organization/skywork

Skywork-13B下載地址(Github): https://github.com/SkyworkAI/Skywork

除模型開源外,Skywork-13B系列大模型還將開源600GB、150B Tokens的高質量中文語料數據集Skypile/Chinese-Web-Text-150B,這是目前最大的開源中文數據集之一。

同時,昆侖萬維「天工」Skywork-13B系列大模型即將全面開放商用——開發者無需申請,即可商用。

130億參數、兩大模型、最大中文數據集之一、全面開放商用。昆侖萬維「天工」Skywork-13B系列大模型堪稱業內開源最徹底的百億高質量商用模型。

Skywork-13B系列大模型的開源將為大模型的場景應用和開源社區發展提供最佳技術支持,降低大模型商業門檻,推動人工智能技術落地千行百業,為人工智能生態建設添磚加瓦,攜手開源社區探索未知世界、創造美好未來。

兩大模型領先行業

昆侖萬維「天工」Skywork-13B系列包括兩大模型及150B高質量中文數據集。

·Skywork-13B-Base模型是Skywork-13B的基礎模型,其經由3.2萬億個多語言高質量數據訓練,在CEVAL, CMMLU, MMLU, GSM8K等評測與基準測試上都展現了同等規模模型的最佳效果。

·Skywork-13B-Math模型經過專門的數學能力強化訓練,在GSM8K等數據集上取得了同等規模模型的最佳效果。

·Skypile/Chinese-Web-Text-150B數據集。該數據集是根據我們經過精心過濾的數據處理流程從中文網頁中篩選出的高質量數據。本次開源的數據集大小約為600GB,總token數量約為(1500億,目前最大得開源中文數據集之一。

除此之外,Skywork-13B系列還公開了模型中使用的評估方法、數據配比研究和訓練基礎設施調優方案等。希望這些開源內容能夠進一步啟發社區對于大型模型預訓練的認知,并推動人工智能通用智能(AGI)的實現。

五大特點全面超越

昆侖萬維「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多個權威評測與基準測試上都展現了同等規模模型的最佳效果,其中文能力尤為出色,在中文科技、金融、政務等領域表現均高于其他開源模型。

Skywork-13B系列模型的五大特點:

1.最強參數表現:全面超越同等規模大模型

本次開源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等幾大權威評估基準中全面超越LLaMA2-13B等開源大模型,在同等規模大模型間取得最佳效果。(截止至10月25日數據)

2.最多訓練數據:3.2T高質量的多語言訓練數據

Skywork-13B系列大模型擁有130億參數、3.2萬億高質量多語言訓練數據。模型的生成能力、創作能力和數學推理能力提升明顯。

3.最強中文語言建模能力:中文語言建模困惑度評測,超越所有中文開源模型

Skywork-13B系列大模型在中文語言建模方面表現出色,具有優秀的中文文創能力。在中文文本創作領域的評測中,Skywork-13B系列大模型展現出了卓越的能力,尤其在科技、金融、政務、企業服務、文創、游戲等領域均表現高于業內其他開源模型。


上圖為不同領域數據下評估模型的困惑度,越低代表模型在該領域建模能力越強。結果顯示天工13B在技術文章,電影,政務報告,游戲,金融,通用領域均表現出色

4.最大中文開源數據集之一:150B Tokens高質量中文語料

Skywork-13B系列將配套開源600GB、150B Tokens的高質量中文語料數據集Skypile/Chinese-Web-Text-150B,這是目前最大的開源中文數據集之一。開發者可以最大程度地借鑒技術報告中大模型預訓練的過程和經驗,深度定制模型參數,有針對性的進行訓練與優化。

5.最有誠意的開源商用:無需申請,即可實現商用

目前開源社區中的中文大模型多數并非是完全可商用,一般開源社區用戶通常需要進行復雜的商用授權申請流程,在某些情況,甚至有對公司規模、所在行業、用戶數等維度有明確規定不給予商業授權。

昆侖萬維對Skywork-13B系列開源的開放性和可商用性高度重視,將授權流程做到極簡,取消對行業、公司規模、用戶等方面的限制,目的是幫助更多對中文大模型感興趣的用戶和企業在行業中不斷探索和進步。

此次Skywork-13B系列大模型將全面開放商用許可,用戶在下載模型并同意并遵守《Skywork模型社區許可協議》后,無需再次申請授權即可將大模型進行商業用途。希望用戶能夠更便捷地探索Skywork-13B系列大模型技術能力,探索在不同場景下的商業化應用。

推動開源生態繁榮,讓更多開發者們參與到AIGC的技術發展中,在共創和共享中推動技術的提升。

面向AI的時代,蓬勃發展的開源生態建設是構建AI和應用融合的重要一環。降低模型的研發門檻,使用成本,最大化的共享技術能力和經驗,讓更多的企業和開發者們參與到此次AI引領的科技變革中去。昆侖萬維董事長兼CEO方漢是最早參與到開源生態建設的開源老兵,也是中文Linux開源最早的推動者之一,開源的精神和AIGC技術的發展將會在昆侖萬維戰略中完美融合。

All in AGI與AIGC

All in AGI與AIGC是昆侖萬維的戰略。

4月17日,昆侖萬維發布了中國第一個真正實現智能涌現的國產大語言模型——「天工3.5」,并啟動邀請測試。

5月19日,北京市經濟和信息化局公布第一批《北京市通用人工智能產業創新伙伴計劃成員名單》。昆侖萬維憑借在AIGC領域的前沿探索和投資布局,成為第一批模型伙伴和投資伙伴。

8月23日,昆侖萬維發布國內第一款AI搜索產品——天工AI搜索。

9月1日,計算機視覺和機器學習領域的國際頂級專家顏水成教授正式加盟昆侖萬維,與昆侖萬維創始人周亞輝一起出任天工智能聯席CEO,并兼任昆侖萬維2050全球研究院院長,負責前沿技術的研究。

9月5日,昆侖萬維天工大模型在騰訊優圖實驗室聯合廈門大學開展的多模態大語言模型測評中,綜合得分排名第一。

9月25日,昆侖萬維正式控股艾捷科芯,布局AI芯片。

今天,天工Skywork-13B系列大模型的開源標志著昆侖萬維持續投資AGI生態的決心。

責任編輯:鳶瑋 來源: 昆侖萬維
相關推薦

2023-10-30 14:59:28

2024-04-01 12:43:40

模型訓練開源

2023-11-06 11:00:36

2024-02-06 10:38:10

昆侖萬維大模型

2023-03-29 15:11:24

AI方案

2024-06-03 10:43:34

2025-03-11 10:51:35

DifyDeepSeek大模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美综合国产精品久久丁香 | 免费av播放 | 在线观看av网站永久 | 亚洲大片| 日韩成人影院在线观看 | www国产成人免费观看视频,深夜成人网 | 国产成人精品免费视频大全最热 | 黄色片视频 | 日本精品视频一区二区 | 中文字幕免费视频 | 久在线观看 | 亚洲九九色 | 国产在线播 | 欧美一区二区在线观看视频 | 日本一二区视频 | 日韩在线视频观看 | 九九在线精品视频 | 国产精品久久久久久久久久尿 | 91视频一88av | 久草新在线 | caoporn国产精品免费公开 | 真人一级毛片 | 日韩精品一区二区三区在线观看 | 亚洲一区二区三区免费观看 | 一区中文字幕 | 精国产品一区二区三区 | 一区二区在线观看av | 犬夜叉在线观看 | 久久亚洲一区二区三区四区 | 精品久久国产老人久久综合 | 日韩二三区 | 特级黄色毛片 | 国产精品久久九九 | 在线观看电影av | av黄色在线观看 | 欧美最猛黑人xxxⅹ 粉嫩一区二区三区四区公司1 | 亚洲一二视频 | 国产精品99久久免费观看 | 狠狠草视频 | 国产精品影视 | 久久99精品久久久久婷婷 |