成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

最高優(yōu)化529.22倍!豆包大模型團(tuán)隊(duì)&港大新成果ByteCheckpoint為LLM萬卡訓(xùn)練提效

人工智能
近日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)與香港大學(xué)聯(lián)合提出了ByteCheckpoint大模型Checkpointing系統(tǒng),旨在提升大模型訓(xùn)練效率、減少訓(xùn)練進(jìn)度損失。

近日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)與香港大學(xué)聯(lián)合提出了ByteCheckpoint大模型Checkpointing系統(tǒng),旨在提升大模型訓(xùn)練效率、減少訓(xùn)練進(jìn)度損失。

隨著訓(xùn)練規(guī)模與模型大小的日益增長,克服軟硬件故障,提高訓(xùn)練效率成為大模型迭代的重要影響要素。近期,Meta官方報(bào)告中披露的一組大模型萬卡集群訓(xùn)練故障率數(shù)據(jù)引起業(yè)內(nèi)廣泛關(guān)注,數(shù)據(jù)顯示:在 16384 塊 H100 80GB 訓(xùn)練集群上進(jìn)行 Llama3 405B 訓(xùn)練的故障率——短短 54 天,發(fā)生 419 次中斷,平均每三小時(shí)崩潰一次。該報(bào)告同時(shí)提到,為了對(duì)抗高故障率,需要在訓(xùn)練過程中頻繁地進(jìn)行 Checkpoint ,保存訓(xùn)練中的模型、優(yōu)化器、數(shù)據(jù)讀取器狀態(tài),減少訓(xùn)練進(jìn)度損失。可以說Checkpoint 已成為訓(xùn)練提效關(guān)鍵。

然而,現(xiàn)有的 Checkpoint 相關(guān)技術(shù)存在諸多問題,如系統(tǒng)設(shè)計(jì)缺陷導(dǎo)致額外的 I/O 開銷增加、不同訓(xùn)練框架的 Checkpoint 模塊相互割裂等。

豆包大模型團(tuán)隊(duì)和香港大學(xué)此次聯(lián)合提出的ByteCheckpoint能有效解決上述問題。ByteCheckpoint為PyTorch 原生,能兼容多個(gè)訓(xùn)練框架,支持Checkpoint的高效讀寫和自動(dòng)重新切分。與基線方法相比,ByteCheckpoint 在 Checkpoint 保存上性能提升高達(dá) 529.22 倍,在加載上,性能提升高達(dá) 3.51 倍。極簡(jiǎn)的用戶接口和 Checkpoint 自動(dòng)重新切分功能,顯著降低了用戶上手和使用成本,提高了系統(tǒng)的易用性。目前論文成果已公開:

·ByteCheckpoint: A Unified Checkpointing System for LLM Development

·論文鏈接:https://team.doubao.com/zh/publication/bytecheckpoint-a-unified-checkpointing-system-for-llm-development?view_from=research

字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)成立于2023年,致力于開發(fā)業(yè)界最先進(jìn)的AI大模型技術(shù),成為世界一流的研究團(tuán)隊(duì),為科技和社會(huì)發(fā)展作出貢獻(xiàn)。目前,豆包大模型團(tuán)隊(duì)正在持續(xù)吸引優(yōu)秀人才加入,希望與具備創(chuàng)新精神、責(zé)任心的技術(shù)人才一起,推進(jìn)大模型訓(xùn)練提效工作取得更多進(jìn)展和成果。

據(jù)了解,豆包大模型于2024年5月正式發(fā)布,現(xiàn)已通過字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎面向企業(yè)提供服務(wù)。截至7月,豆包大模型日均Tokens使用量已超5000億,外部企業(yè)客戶日均Tokens使用量較5月15日模型發(fā)布時(shí)期增長22倍。基于豆包大模型打造的同名AI智能助手豆包,在各大應(yīng)用商店AI類產(chǎn)品的下載量排名第一。

責(zé)任編輯:鳶瑋 來源: 字節(jié)跳動(dòng)
相關(guān)推薦

2024-11-02 10:28:03

2024-11-01 13:30:56

2024-11-01 20:25:28

2024-06-24 18:17:07

2025-04-03 00:00:00

COMETMoE模型大模型

2022-03-21 15:06:10

模型字節(jié)跳動(dòng)框架

2022-03-21 17:56:59

大模型訓(xùn)練訓(xùn)練框架

2023-05-26 10:15:34

模型訓(xùn)練

2024-07-08 09:00:00

2024-11-07 15:10:00

2023-12-29 13:45:57

2024-05-21 11:30:27

火山引擎豆包大模型

2024-11-27 14:30:00

模型訓(xùn)練

2024-04-07 14:28:48

邊緣計(jì)算LLM人工智能

2023-08-09 07:04:17

清華微軟LLM

2022-04-26 15:09:14

優(yōu)化模型訓(xùn)練

2025-02-19 15:17:24

2024-09-27 10:31:22

2023-02-06 18:10:22

模型算法

2025-03-04 09:00:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 免费久久精品 | 欧美成人手机在线 | 久久亚洲精品久久国产一区二区 | 99自拍视频 | 伊人国产精品 | 日韩午夜电影在线观看 | 成人一区二区三区 | 久久久久1 | 美日韩一区二区 | 岛国视频 | 天天操天天拍 | 岛国av一区二区三区 | 久干网 | 亚洲精品久久嫩草网站秘色 | 波多野结衣中文视频 | 欧美一区二区三区,视频 | 91香蕉| 一区福利视频 | 欧美日韩精品在线一区 | 国产亚洲欧美在线视频 | 九九精品热 | av在线播放不卡 | 亚洲高清成人 | 国产精品成人在线播放 | 日韩亚洲一区二区 | 日韩欧美在线不卡 | 亚洲精品不卡 | 亚洲二区视频 | 欧洲一区二区三区 | 久久精品成人 | 成人在线视频观看 | 欧美福利视频一区 | 日本高清在线一区 | 成人精品久久日伦片大全免费 | 成人激情视频在线播放 | 久久久久久电影 | 国产伦精品一区二区三区精品视频 | 黄久久久| 一级黄a视频| 狠狠操狠狠搞 | 一级高清免费毛片 |