降低算法開發門檻 阿里云開源批流一體機器學習平臺Alink
11月28日,阿里云正式開源機器學習平臺 Alink,這也是全球批流一體的算法平臺,旨在降低算法開發門檻,幫助開發者掌握機器學習的生命全周期。
Alink基于實時計算引擎Flink,提供豐富的算法組件庫和便捷的操作框架,開發者可以一鍵搭建覆蓋數據處理、特征工程、模型訓練、模型預測的算法模型開發全流程。作為同時支持批式算法、流式算法的機器學習平臺,Alink提供了Python 接口,開發者無需Flink技術背景也可以輕松構建算法模型。
據悉,Alink已被廣泛運用在阿里巴巴搜索、推薦、廣告等多個核心實時在線業務中。在剛剛落幕的天貓雙11中,單日數據處理量達到970PB,每秒處理峰值數據多達25億條。Alink成功經受住了超大規模實時數據訓練的檢驗,并幫助提升4% CTR(商品點擊轉化率)。
在Flink Forward 2019大會上,阿里云智能總裁張建鋒表示:“大量業務從批處理轉變為流處理,實時化是數據處理的真正未來。”自2019年1月起,阿里巴巴將內部維護的Blink全部回饋給Flink開源社區,目前貢獻代碼數量已超過100萬行。此次自主開源的Alink與Flink 相輔相成,將成為開發者的左膀右臂,發揮數據智能在數字經濟中的巨大能量。
從擁抱開源、貢獻開源、自主開源升級為持續賦能開源,開源已經升級為阿里技術戰略之一。目前阿里自主開源項目數已有一千余個,GitHub star數量超過66w,覆蓋AI、大數據、中間件、移動、數據庫等多個領域。阿里已成為開源貢獻較大的科技公司之一。