成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開放創(chuàng)新,昇騰 CANN 再向深處

企業(yè)動態(tài)
隨著開發(fā)者的開發(fā)方式逐漸從上層軟件走向底層硬件,昇騰 CANN 的開放深度和開放策略也持續(xù)演進,構建起了覆蓋算子開發(fā)、系統調優(yōu)到編譯鏈優(yōu)化的全場景賦能體系。

AI 領域有自己的速度。

4月29日凌晨4點,Qwen3 正式發(fā)布,并開源全部8款混合推理模型。發(fā)布僅2小時,Qwen3 模型在 GitHub 上的 Star 數已近17k。更有趣的是,開源5小時后,華為計算發(fā)文宣布實現 Qwen3 的 0Day 適配,即在 MindSpeed 和 MindIE 中開箱即用。這意味著,開發(fā)者可以第一時間零門檻使用最新的 AI 能力。

這樣軟硬件閃電協同的背后,華為昇騰異構計算架構 CANN 的深度開放策略提供了核心支撐。

能力解耦,技術優(yōu)勢的最后一公里

據IDC預測,2026年中國智能算力規(guī)模將達到1460.3 EFLOPS,為2024年的兩倍,AI 算力需求正經歷指數級增長。這一增長不僅標志著 AI 技術從實驗室走向實際應用的加速,也對異構計算架構提出了更高的要求。

然而,傳統 AI 開發(fā)在落地過程中面臨的“三座大山”正在吞噬技術革命的紅利。

一是開發(fā)效率低下。算子開發(fā)門檻高,業(yè)務需求的響應時間也動輒數周,“創(chuàng)新誕生即過時”成為常態(tài)。

二是性能釋放不足。當前 AI 算力資源普遍存在靜態(tài)分配僵化與動態(tài)需求錯配的矛盾,硬件能力常常因原子能力組合方式固化,導致有效性能輸出遭遇供給瓶頸。

三是生態(tài)協同缺失。隨著計算需求的多樣化,CPU、GPU、FPGA、ASIC 等不同架構計算單元被廣泛應用,但多元計算架構因技術標準割裂及調度機制缺位,通常難以實現資源最優(yōu)調配,造成算力限制與效率不足。

當開發(fā)遲滯、性能折損、生態(tài)割裂鎖死產業(yè)創(chuàng)新,鋪向最后一公里的重點不再只是算力堆砌,而在能力解耦——這正是昇騰 CANN深度開放的戰(zhàn)略原點。

作為昇騰 AI 基礎軟硬件平臺的核心,昇騰異構計算架構 CANN 自2023年宣布深度開放策略至今,已構建起覆蓋全技術棧的開發(fā)者賦能體系,并成為中國開發(fā)者生態(tài)最活躍、技術迭代最迅猛的 AI 創(chuàng)新平臺,在使能 AI 開發(fā)效率和性能方面始終保持業(yè)界前列。

我們發(fā)現,昇騰 CANN 的進化始終錨定更深層的技術突破。從大模型爆發(fā)初期沉淀底層能力,到分層開放助力千行百業(yè)敏捷創(chuàng)新,再到扎根底層的技術創(chuàng)新,這條從能用到易用、好用的深度開放之路并不是一蹴而就的。

深度開放,CANN 的三層解耦戰(zhàn)略

隨著開發(fā)者的開發(fā)方式逐漸從上層軟件走向底層硬件,昇騰 CANN 的開放深度和開放策略也持續(xù)演進,構建起了覆蓋算子開發(fā)、系統調優(yōu)到編譯鏈優(yōu)化的全場景賦能體系。

過去,開發(fā)者往往受限于框架接口,難以直接干預硬件底層的精細調度。如今,得益于 CANN 深度開放,開發(fā)者既可以快速集成預置模塊完成敏捷交付,也可以直接調用最底層資源,靈活組合原子功能實現極致性能調優(yōu)。這意味著開發(fā)者已能夠在性能與效率之間實現自由平衡。

具體來看,針對不同技術層級的開發(fā)者,昇騰 CANN 推出了差異化開放策略

算法創(chuàng)新層,昇騰 CANN 在 Gitee 社區(qū)開源了包括 FlashAttention、Matmul 在內的260多個高性能算子及10余種 MESH/RING 通信算法的最佳實踐代碼庫,并提供了80多個高階API,開發(fā)者可基于業(yè)務場景直接調用預置算子庫或自定義優(yōu)化已有算子及通信策略,顯著縮短開發(fā)周期。

同時在系統優(yōu)化層,昇騰 CANN 也向開發(fā)者開放了190多個 Runtime 底層接口,支持開發(fā)者像拼裝樂高積木一樣靈活組合原子級能力,充分釋放昇騰硬件性能潛力。

編譯生態(tài)層,通過開放畢昇編譯器的 AscendNPU IR 接口,屏蔽硬件差異,底層硬件能力被高度抽象化,無感對接 Triton、FlagTree 等編程框架,開發(fā)者可直接使用 Python 語法編寫高性能算子。

全棧使能,核心突破加速產業(yè)創(chuàng)新

計算架構的核心使命,在于打通硬件性能釋放、軟件高效運行與生態(tài)協同繁榮的技術閉環(huán)。除了分層開放帶來的性能與效率的提升,昇騰 CANN 在計算、通信、內存三大維度也取得了核心技術的突破性進展。

計算加速層面,針對 MoE 大模型訓練場景的"卡脖子"難題,昇騰 CANN 推出了超級算子 MLAPO,通過將數個小算子融合,對 Vector 與 Cube 計算單元的并行化改造,成功將 MLA 前處理耗時從行業(yè)平均109us壓縮至45us,在金融風控模型、廣告推薦系統等業(yè)務實踐中實現了20%以上端到端的性能提升,打破了 Transformer 架構的算力瓶頸。

通信加速層面,傳統 RDMA 通信一次消息的傳輸需要三次同步,涉及到至少七次讀寫校驗核算過程,嚴重影響通信效率。昇騰 CANN 打造的 NPUDirect 通信算法可實現一個消息一次同步,端到端通信耗時降低了50%,大幅降低了推理時延。

內存優(yōu)化層面,面對動態(tài) shape 場景帶來的內存碎片化挑戰(zhàn),昇騰 CANN 的多重地址映射技術能夠自動拼接利用內存碎片,顯著提升內存利用率。這項技術目前已在商品搜索、短視頻推薦等業(yè)務場景中,成功將內存利用率提升20%以上,并實現了單卡并發(fā)請求量的行業(yè)級突破。

實踐證明,架構開放的深度決定了技術的高度。昇騰 CANN 通過算法、系統、編譯三層深度解耦開放,賦予開發(fā)者直達硬件底層的能力,并以此為基礎在計算、通信、內存三大核心領域實現單點性能的指數級提升,同時構建起"芯片級優(yōu)化-系統級調度-集群級協同"的全棧能力,開啟 AI 算力技術"原子級精準調優(yōu)"的新紀元。

時間永遠站在行動者這邊。六年來,昇騰 CANN 深度開放策略的推進,驅動著技術突破與生態(tài)繁榮相互成就。無論是華南理工大學團隊利用全新發(fā)布的 CATLASS 算子模板庫開發(fā) Matmul 算子,將開發(fā)周期從傳統4人周壓縮至2人周,還是科大訊飛星火大模型借 NPUDirect 通信算法,使跨機通信時延驟降90%,可以確定的是,越來越多的創(chuàng)新者正從中受益。

如今,昇騰 CANN 算子認證開發(fā)者已突破6000人,攜手互聯網、運營商、金融等30余個領域伙伴聯合開發(fā)核心算子超過260個。此外,昇騰還獲得了 Pytorch、vLLM 等主流社區(qū)的主動支持,一個根植于昇騰的開放 AI 大生態(tài)已蔚然成型。

開放層級的下探,正在重構 AI 創(chuàng)新效率的基線。伴隨模型迭代的急速演進與異構算力的協同瓶頸,解鎖硬件潛能的焦點已無爭議地轉向底層能力開放的更深處。這不僅是效率躍升的技術路徑,更是產業(yè)創(chuàng)新的核心范式。可以看到,當深度開放在算力底層扎下根系,創(chuàng)新應用的規(guī)模化落地浪潮已勢不可擋。

來源:思否編輯部

責任編輯:張誠
相關推薦

2025-07-01 16:04:52

2025-05-28 11:58:29

2025-06-18 13:29:42

昇騰CANN

2024-07-18 19:19:14

2020-08-12 18:29:25

昇騰

2022-11-11 15:47:00

昇騰AI

2023-06-19 13:27:46

昇騰AI

2022-10-18 11:37:03

鯤鵬

2023-10-17 19:37:34

昇騰

2023-02-22 16:11:41

昇騰

2020-08-18 10:17:48

昇騰上海技術開放日

2022-12-28 13:10:52

昇騰
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人精品一区二区 | 在线不卡一区二区 | 国产精品666 | 久久这里只有精品6 | 亚洲综合伊人 | 国产视频中文字幕 | 最新av在线 | 成人免费视频网站在线观看 | 日日干日日干 | 夜夜操狠狠操 | 日韩欧美三区 | 中文字幕亚洲一区 | aaaaaa毛片| 五月天开心网 | 99精品网站 | 伊人成人在线视频 | 亚洲成人av | 黄色在线观看网址 | 欧美一级特黄视频 | 天天干网站 | 欧美激情免费 | 日本亚洲精品 | 亚洲第一色网 | 国产成人精品三级麻豆 | igao在线观看 | 色综合久久88 | 羞羞网站在线观看 | 国产精品欧美一区二区 | jizz中国女人高潮 | 亚洲欧美第一页 | 免费黄网站在线观看 | 免费看的毛片 | 在线观看免费av网站 | 九九热精品在线 | 极品美女一区二区三区 | 97人人干 | 国产女人18毛片18精品 | 日韩在线不卡视频 | 日日夜夜精品视频免费 | av大片在线观看 | 国产一区中文字幕 |