百度王海峰攜開源開放的深度學習平臺飛槳亮相2019軟博會
“深度學習框架是智能時代的操作系統。百度飛槳深度學習平臺正在推動人工智能的快速發展,加快中國的產業智能化進程。”6月28日,百度首席技術官王海峰應邀參加2019中國國際軟件博覽會,發表了題為《飛槳深度學習平臺加速產業智能化》的演講。王海峰在演講中分享了深度學習技術推動人工智能發展的思考,介紹了百度飛槳(PaddlePaddle)深度學習平臺的優勢以及助力產業智能化的成果。
王海峰表示,迄今為止人類經歷的三次工業革命,分別以機械技術、電氣技術和信息技術為核心驅動力,而這些技術都表現出很強的通用性。當前,我們身處以人工智能為核心驅動力量的新一輪科技革命和產業變革大潮,人工智能正在將人類社會帶入智能時代。
過去的60多年時間里,人工智能的發展經歷了人工規則、機器學習和深度學習三個典型階段。以OCR和自然語言處理技術為例,深度學習的通用性優勢,使得其效果大幅提升,廣泛應用于各行各業。
深度學習技術的廣泛應用,得益于深度學習框架。王海峰指出,在智能時代,深度學習框架起到承上啟下的作用,下接芯片,上承各種應用,具有重要價值,是“智能時代的操作系統”。
現場,王海峰介紹了中國開源開放、功能完備的深度學習平臺——百度飛槳。飛槳的核心框架,包括開發、訓練和預測,以及涵蓋推薦、視覺、自然語言處理、語音等在內的豐富模型庫。同時,飛槳提供了包括遷移學習、強化學習、自動化網絡結構設計、彈性深度學習計算、圖神經網絡等在內的工具組件。而在服務平臺層面,它提供了零基礎定制化訓練和服務平臺EasyDL、一站式實訓開發平臺AI Studio和端計算模型生成平臺EasyEdge等。飛槳以完備的框架、工具和服務,幫助廣大開發者和企業利用工具化、平臺化的方式進一步降低深度學習應用門檻,加速推動產業智能化變革。
飛槳已開源70多個經過真實業務場景驗證的官方模型,涵蓋視覺、NLP、推薦等 AI核心技術領域,成為官方支持模型較多的深度學習平臺。例如,面向工業應用的中文NLP工具集PaddleNLP,在應用任務層提供了中文詞法分析、文本情感分析、短文語義匹配等能力,在基礎網絡層則納入了當前業內效果較好的中文語義表示模型——ERNIE,大幅增強了模型語義表示能力,達到工業級的應用效果;而前不久剛剛發布的視頻識別工具集,則覆蓋了主流實用的序列建模算法與端到端視頻識別模型,為開發者提供視頻分類、視頻定位等一系列應用技術方案。同時,飛槳具備適用大規模數據場景的分布式訓練能力,從優化算力的角度為深度學習的應用提供支撐。
據悉,針對大規模稀疏特征,飛槳設計并開放了大規模稀疏參數服務器,適用于超大規模數據、海量特征和自膨脹、高頻率模型迭代的業務場景。同時,針對工業級數據處理,飛槳開放了一系列數據處理技術服務于工業應用。
開發和訓練后,將模型部署到各種應用場景下是非常關鍵的一步。飛槳提供包括底層硬件、推理引擎、多種程序設計語言、方案與服務工具在內的端到端全流程部署方案,已經在助力產業開發者實現應用的快速落地。
靈活、高效、易用是產業開發者應用深度學習技術進行開發的訴求。以往,傳統神經網絡的結構設計是由人根據經驗設計,并不斷地進行調參訓練獲得更優結果,這個過程較為復雜和費時費力。而飛槳開源的AutoDL Design自動化網絡結構設計,是用深度學習設計深度學習,目前已經全面超過人類專家設計的網絡效果,且自動化程度更高,效果更好。而針對沒有深度學習技術基礎的開發者,百度飛槳提供了定制化訓練和服務平臺EasyDL,讓他們可以基于自身業務需求和數據,快速訓練定制化AI模型。
王海峰以自動提取農耕地塊為例,介紹了飛槳的實際應用效果。基于飛槳的農作物地塊識別,在遙感影像數據的基礎上,實現了地塊提取準確率80%,處理效率相對人工提升數萬倍,可以高效輔助作物生長、災害監測、估產等,顯著減少人力投入,對農業生產有非常重大的意義,是真正用深度學習技術實現利國利民。
現階段,深度學習技術不斷發展突破,加速與產業融合,持續提升各行各業的商業增值潛力,加速產業智能化。王海峰表示:“百度飛槳深度學習平臺將攜手中國的廣大開發者一起,為推動中國的產業智能化發展做出更多貢獻。”