飛槳扛起AI大旗,國產(chǎn)深度學習框架受追捧
百度發(fā)布了 2019Q2 財報,可以用八個字概括——“切換引擎,決勝未來”。
從“財”的數(shù)據(jù)來解讀,凈利 24 億,成功扭虧恢復增長,超出“華爾街”預期,這可能也是導致百度股價暴漲的基礎。
拋開財務報表的結(jié)果不說,從結(jié)構(gòu)上看,可以明顯看到百度押注的“AI 未來”開始展現(xiàn)成效。
2019 年上半年,百度 AI 開放平臺發(fā)展迅速,其開發(fā)者數(shù)量增長了 37%,達到 130 萬。
通過百度 AI 開放平臺,開發(fā)者可以利用百度的綜合 AI 能力,如語音識別,自然語言處理和計算機視覺,構(gòu)建自己的產(chǎn)品和解決方案。
值得一提的是,百度深度學習平臺飛槳的相關數(shù)據(jù)被首次加入財報,數(shù)據(jù)顯示,2019 年 Q2,百度深度學習平臺飛槳(PaddlePaddle)下載量環(huán)比增加 45%,百度圍繞飛槳構(gòu)建 AI 開發(fā)生態(tài),幫助開發(fā)人員大規(guī)模構(gòu)建深度學習模型,形成面向行業(yè)的智能化解決方案。
沉淀數(shù)年的百度 AI,背靠豐富的業(yè)務場景,強大的技術能力打造了端到端的 AI 開發(fā)生態(tài),其生態(tài)的基石就是其深度學習框架──飛槳。
飛槳發(fā)展之路
作為功能完整的深度學習開源框架,飛槳集深度學習訓練和預測框架、模型庫、工具組件和服務平臺為一體,擁有兼顧靈活性和高性能的開發(fā)機制、工業(yè)級應用效果的模型、超大規(guī)模并行深度學習能力、推理引擎一體化設計以及系統(tǒng)化服務支持的五大優(yōu)勢。
飛槳核心框架 Paddle Fluid 憑借其簡單易用、高效靈活的特點,已經(jīng)被廣泛應用到包括互聯(lián)網(wǎng)、智能工業(yè)、智能農(nóng)業(yè)等領域,為各行各業(yè)賦能。
飛槳以模塊化構(gòu)造整個 AI 開發(fā)平臺,開發(fā)者可以個性化地選擇合適的服務平臺,不僅可以從 Paddle Fluid 核心模型庫直觀的從代碼層級進行開放,同樣可以選擇 EasyDL 拖拽式零代碼構(gòu)建模型,更有 AI Studio 集開放數(shù)據(jù)、開源算法于一體的一站式開發(fā)平臺,近期還開放了價值一億元的免費算力資源。
Figure1 飛槳全景圖
百度深度學習的發(fā)展歷程可以說是從業(yè)務中來,到業(yè)務中去。從初期自研支撐搜索,推薦海量數(shù)據(jù)的深度學習框架,發(fā)展成為國內(nèi)僅有的一款開源、并擁有完善開發(fā)體系的平臺,又賦能各行業(yè)智能化進程,飛槳的路走得曲折又堅定,穩(wěn)健又充滿機遇。
Figure2 百度深度學習發(fā)展歷程
飛槳作為國內(nèi)唯一的功能完備的深度學習平臺,如今已成為百度 AI 開發(fā)生態(tài)的基石,僅用了 6 年時光,而其發(fā)展勢頭愈發(fā)強勁。
自 2018 年 10 月飛槳核心框架 Paddle Fluid v1.0 發(fā)布以來,不到一年的時間里,已經(jīng)迅速迭代了 5 個大版本,給廣大開發(fā)者不斷帶來驚喜。
Figure3 飛槳核心框架 Paddle Fluid 版本迭代
近幾個月,飛槳動作頻頻且成果頗豐:
- 5 月,飛槳助力百度視覺團隊在多目標追蹤挑戰(zhàn)的 MOT16 和 ICME 人臉 106 關鍵點檢測比賽中奪冠。
- 6 月,飛槳助力百度大腦在加州長灘舉行的 CVPR 中以 10 項競賽奪冠,展示了中國 AI 技術的強勢。
- 7 月 3 日,在“Baidu Create 2019”百度 AI 開發(fā)者大會上,百度 CTO 王海峰與華為消費者 BG 軟件總裁王成錄共同宣布,百度飛槳深度學習平臺與華為麒麟芯片將強強聯(lián)手,在硬件層面實現(xiàn)華為麒麟芯片 HiAI Foundation 與飛槳的全面對接,盡可能發(fā)揮深度學習強大的推理能力;在應用層面,雙方將共同優(yōu)化經(jīng)典模型,提升性能,為搭載麒麟芯片的終端用戶提供良好的體驗;在產(chǎn)業(yè)層面,飛槳將高效性能和多層次功能賦能芯片提升算力,推動下一代AI芯片的快速演進。
- 7 月 30 日,百度正式發(fā)布了其 NLP 模型 ERNIE 的升級版本──ERNIE2.0,并且在共計 16 個中英文任務上超越了 BERT 和 XLNet,取得了SOTA 效果。
Figure 4 BERT 與 ERNIE2.0 在部分公開數(shù)據(jù)(測試集)的結(jié)果對比(來源:GitHub)
- 8 月 21 日,百度發(fā)布了 Paddle Mobile 的升級版本──Paddle Lite,它是一個旨在移動終端、嵌入式設備和 IoT 設備快速實現(xiàn)的開源深度學習推理框架,可以很好兼容飛槳的預訓練模型。
在設計上,得益于執(zhí)行模塊和分析模塊的解耦,Paddle Lite 無需第三方庫就能在終端上快速部署;在性能上,其在終端層級優(yōu)化 Kernels,能夠最大化 ARM 芯片的 CPU 性能;在兼容性上,Paddle Lite 支持 ARM,Mali GPU,Adreno GPU,華為 NPU 以及 FPGA,并將支持寒武紀和比特大陸的芯片。
飛槳扛起國產(chǎn)深度學習框架的大旗
今年上半年,筆者調(diào)研了十幾個深度學習框架,得出兩個結(jié)論:
一是現(xiàn)在的深度學習開發(fā)趨于生態(tài)化,服務化,平民化。生態(tài)化是指各大廠都是基于開源項目為核心構(gòu)建一個產(chǎn)學研的 AI 開發(fā)環(huán)境;服務化是指整個開發(fā)鏈條都提供不同層級的模塊服務;平民化是指 AI 技術的普及和使用都是免費的模式。
二是深度學習框架雖然呈現(xiàn)百花齊放的繁榮景象,但是馬太效應已經(jīng)開始顯現(xiàn),頭部的 3 大框架 TensorFlow,Pytorch 和飛槳持續(xù)高投入,快速發(fā)展構(gòu)建開發(fā)生態(tài),而尾部的一些曾頗具影響力的框架已經(jīng)停止更新。
相較行業(yè)頭部的 Google(TensorFlow)和 Facebook(Pytorch),百度(飛槳)真正撐起了中國深度學習框架的大旗。
總結(jié)
每一次生產(chǎn)力的巨大變革都是一次全新商業(yè)場景的構(gòu)建,AI 技術作為第四次工業(yè)革命的核心無疑是至關重要的,今年以來中美表面打的是“貿(mào)易戰(zhàn)”,實則是未來商業(yè)生態(tài)話語權(quán)的爭奪。
華為的基石業(yè)務是網(wǎng)絡服務解決方案,可是從近幾年華為在 5G、云服務和 AI 領域的投入來看,華為也在將航行轉(zhuǎn)向智能時代。
如果說華為是在前方抵抗“美式”的攻擊和封鎖,那么百度在做的不僅是推動智能化的演進,更是為中國在未來智能時代的核心技術保駕護航。