成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

CANN黑科技解密?昇騰Ascend C編程語言 — 極簡易用的算子開發(fā)體驗?

開發(fā) 后端
人工智能蓬勃發(fā)展,算法創(chuàng)新層出不窮。?昇騰Ascend編程語言通過易上手、高性能、易調(diào)測的優(yōu)勢,為開發(fā)者的創(chuàng)新算法更輕松高效地運行奠定了基石,讓基于?昇騰的AI創(chuàng)新更加簡單。?

AI應(yīng)用的大腦是神經(jīng)網(wǎng)絡(luò)而構(gòu)成神經(jīng)網(wǎng)絡(luò)的基石是一個個算子。為了讓開發(fā)者的網(wǎng)絡(luò)在騰硬件上高效運行,騰異構(gòu)計算架構(gòu)CANN(Compute Architecture for Neural Networks)提供了豐富的高性能算子庫,包括神經(jīng)網(wǎng)絡(luò)庫線性代數(shù)計算庫等,高性能算子數(shù)量達到1400+。有了高性能算子庫的支撐,主流神經(jīng)網(wǎng)絡(luò)可輕松在騰硬件上高效運行。


但隨著人工智能的爆發(fā)式增長,算法更新層出不窮,固定的高性能算子庫可能無法完全滿足開發(fā)者的多樣化創(chuàng)新需求,為了讓開發(fā)者提出的創(chuàng)新算法能夠在硬件上運行起來自定義算子開發(fā)的能力必不可少

但算子開發(fā)是個復(fù)雜的工程,需要考慮眾多因素,包括語言學習成本、功能邏輯的實現(xiàn)、硬件指令的適配、以及算子運行精度與性能的達標等等。往往一個經(jīng)驗豐富的算法專家開發(fā)一個高性能的算子都要耗時數(shù)周甚至更長的時間。


算子開發(fā)總體流程

為提升算子開發(fā)效率降低算子開發(fā)成本,騰推出了面向算子開發(fā)場景的騰Ascend編程語言。騰Ascend編程語言原生支持C和C++標準規(guī)范,最大化匹配用戶開發(fā)習慣;通過多層接口抽象屏蔽了底層硬件差異通過自動并行計算等關(guān)鍵技術(shù)保證性能的同時大大降低算子開發(fā)門檻另外,騰Ascend提供了孿生調(diào)試功能,大大縮短了算子調(diào)測時間


昇騰Ascend C編程語言在異構(gòu)計算架構(gòu)CANN中的位置


多層級高性能類庫接口

工欲善其事,必先利其器。為簡化開發(fā)邏輯,騰Ascend支持結(jié)構(gòu)化核函數(shù)編程,提供了面向不同場景的高性能類庫接口。開發(fā)者僅需通過類庫接口的組裝調(diào)用,即可輕松實現(xiàn)高性能算子。


昇騰Ascend C提供的類庫接口

AI應(yīng)用領(lǐng)域廣泛,開發(fā)者的背景與需求也各不相同。為滿足不同層級開發(fā)者的訴求,騰Ascend針對計算接口和數(shù)據(jù)搬移接口,進行了分層分級,讓開發(fā)者可以根據(jù)自身需求選擇合適的接口。

針對計算類接口,當前Ascend支持三個層級,其中級數(shù)越低,自由度越高,更易于表達復(fù)雜場景所需功能;級數(shù)越高,接口的封裝度越高,更易于表達常用語義,使用起來也更簡單。


計算接口分層分級與示例

針對搬移類接口Ascend C將不同類型物理內(nèi)存間的數(shù)據(jù)搬移抽象為一個統(tǒng)一的數(shù)據(jù)搬運接口通過參數(shù)控制不同的搬運級別,從而滿足不同數(shù)據(jù)搬運場景的需求


數(shù)據(jù)搬運接口分層分級與示例

另外多層級的類庫接口封裝,可以更好地屏蔽不同型號硬件間的差異,輕松實現(xiàn)算子代碼對不同硬件的兼容。


自動并行計算

多層級的類庫接口可以讓開發(fā)者輕松實現(xiàn)算子的算法邏輯,達成預(yù)期功能。但一個好的算子,計算效率也是必須考慮的重要指標。眾所周知,將任務(wù)并行處理是提高計算效率的關(guān)鍵手段,但AI處理器的內(nèi)存層次結(jié)構(gòu)比較復(fù)雜、數(shù)據(jù)通路多,數(shù)據(jù)之間的依賴關(guān)系復(fù)雜,這種場景下,并行計算之間的流水如何排布,各任務(wù)間的數(shù)據(jù)同步如何實現(xiàn),往往是比較困難的。

為了方便開發(fā)者實現(xiàn)高效的并行計算Ascend采用SPMDSingle-Program Multiple-Data)并行模式,開發(fā)者僅需關(guān)注一個計算核心上的算子程序?qū)崿F(xiàn),程序調(diào)用時,可自動啟動N個運行實例(我們稱之為Block),每個實例都可部署到不同的計算核心上執(zhí)行。由此,大大簡化了開發(fā)者在多個計算核心上的并行編程邏輯


單程序多數(shù)據(jù)SPMD并行計算

在算子邏輯實現(xiàn)上,Ascend C基于流水線并行的編程范式,將算子核心邏輯劃分為“搬入、計算、搬出”,開發(fā)者只需聚焦實現(xiàn)“搬入、計算、搬出”內(nèi)容,程序運行時,系統(tǒng)會自動將核內(nèi)數(shù)據(jù)進行分片每一片數(shù)據(jù)都專注完成單一功能,實現(xiàn)計算性能最大化。

核內(nèi)多片數(shù)據(jù)流水線并行調(diào)度

孿生調(diào)試

Ascend提供的多層級類庫接口以及自動并行計算功能,給開發(fā)者提供了輕松高效的編碼體驗。但在上一代算子開發(fā)的整個流程中代碼編寫的時間往往僅占不到30%,剩下70%多的時間都在進行功能與性能調(diào)試,好的調(diào)試能力對提升端到端開發(fā)效率的重要性不言而喻。


開發(fā)時間占比示例


那為什么算子調(diào)試如此耗時呢?究其主要原因,一方面是由于NPU環(huán)境下本身調(diào)試困難,另一方面是因為編程過程隱藏了并行細節(jié),導(dǎo)致同步死鎖、地址越界、數(shù)據(jù)溢出等問題難定位。

為提升算子調(diào)試效率Ascend C提供了孿生調(diào)試能力,開發(fā)者既可以在CPU域進行調(diào)試調(diào)優(yōu),又可以在NPU域進行調(diào)優(yōu)驗證,通過CPU域與NPU域相結(jié)合的方式,降低調(diào)試難度,提升調(diào)試效率。

在CPU域開發(fā)者可通過業(yè)界標準C++工具GCC編譯器進行編譯并通過GDB通用調(diào)試工具進行單步調(diào)試精準驗證程序執(zhí)行流程是否符合預(yù)期。另外,Ascend還提供了主動Bug分析工具方便開發(fā)者快速進行問題定位在NPU域Ascend C提供了仿真調(diào)試能力與上板調(diào)試能力開發(fā)者可以通過仿真調(diào)試的Profiling流水圖指令日志以及數(shù)據(jù)日志精準進行性能調(diào)優(yōu),也可以通過上板調(diào)試進行真實行為的驗證。孿生調(diào)試的能力,在提升算子調(diào)試效率的同時又可保證精度與性能的達標。


昇騰Ascend C孿生調(diào)試


人工智能蓬勃發(fā)展,算法創(chuàng)新層出不窮。騰Ascend編程語言通過易上手高性能易調(diào)測的優(yōu)勢為開發(fā)者的創(chuàng)新算法更輕松高效地運行奠定了基石,讓基于騰的AI創(chuàng)新更加簡單。


昇騰Ascend C算子開發(fā)快速體驗

責任編輯:張誠
相關(guān)推薦

2023-08-29 12:34:51

昇騰

2024-07-18 19:19:14

2023-02-22 16:11:41

昇騰

2015-12-11 15:59:10

風行

2025-05-24 14:34:07

2025-05-28 11:58:29

2020-05-11 17:41:04

英特爾

2022-12-23 10:55:20

昇智

2025-02-18 11:02:49

2025-06-18 13:29:42

昇騰CANN

2025-05-28 08:51:00

大模型華為LLM

2021-07-07 20:29:20

Socket進程遷移
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产日韩精品视频 | 欧美一区二区三区四区视频 | 久久精品播放 | 在线91| 久久av资源网 | 免费黄色的视频 | 狠狠色综合网站久久久久久久 | 欧美1级| 一区中文字幕 | 精品视频在线免费观看 | 国产乱码久久久久久 | 久久久成人一区二区免费影院 | 午夜精品久久久久久久久久久久 | 国产成人精品免高潮在线观看 | 毛片一区二区三区 | 视频在线h| 欧美黄色大片在线观看 | 国产成人一区二区 | 黄色大片视频 | 国产免费一区二区 | 欧美日韩亚洲在线 | 中文字幕 国产 | 久久久久久综合 | 日韩在线免费视频 | 国产高清精品一区二区三区 | 久久av资源网 | 草草在线观看 | 99亚洲精品 | 在线看片福利 | 日本二区| 综合中文字幕 | 国产精品国产成人国产三级 | 成人精品一区二区三区中文字幕 | www4虎| 欧美在线视频一区二区 | 天堂在线91 | 999www视频免费观看 | 国产精品国产三级国产播12软件 | 免费的av| 亚洲啪啪 | 91精品久久久久久久久 |