亞馬遜云服務(AWS)中國寧夏及北京區域正式上線Amazon SageMaker
[2020年5月12日,北京] 亞馬遜云服務Amazon Web Services, Inc. (AWS) 今天宣布,Amazon SageMaker在由西云數據運營的AWS中國 (寧夏) 區域和光環新網運營的AWS中國(北京)區域正式上線。Amazon SageMaker 是一項完全托管的服務,可以幫助開發者和數據科學家快速地規模化構建、訓練和部署機器學習 (ML) 模型。Amazon SageMaker在中國的上線還使中國客戶獲得一系列新發布的工具,例如彈性Notebook、實驗管理、模型自動創建、模型調試分析,以及模型概念漂移檢測等強大功能,所有這些工具都封裝在首個面向機器學習的集成開發環境(IDE) Amazon SageMaker Studio中。進一步了解Amazon SageMaker,請訪問: https://www.amazonaws.cn/sagemaker/。
機器學習的實施是一項非常復雜的工作,涉及大量試錯,并且需要專業技能。開發者和數據科學家首先必須對數據進行可視化、轉換和預處理,這些數據才能變成算法可以使用的格式,用以訓練模型。即使是簡單的模型,企業也需要花費龐大的算力和大量的訓練時間,并可能需要招聘專門的團隊來管理包含多臺GPU服務器的訓練環境。從選擇和優化算法,到調節影響模型準確性的數百萬個參數,訓練模型的所有階段都需要大量的人力和猜測。然后,在應用程序中部署訓練好的模型時,客戶又需要另一套應用設計和分布式系統方面的專業技能。并且,隨著數據集和變量數的增加,模型會過時,客戶又必須一次又一次地重新訓練模型,讓模型從新的信息中學習和進化。所有這些工作都需要大量的專業知識,并耗費龐大的算力、數據存儲和時間成本。而且,由于沒有集成化的工具用于整個機器學習的工作流,機器學習模型的傳統開發方式是復雜、繁復和昂貴的。
Amazon SageMaker消除了機器學習過程中各個步驟的繁重工作。通過預置的Notebook、針對PB級數據集優化的常用算法,以及自動模型調優,Amazon SageMaker大大降低了模型構建和訓練的難度。并且,Amazon SageMaker顯著簡化和加快了模型訓練過程,可以通過自動提供和管理基礎設施來訓練模型和運行推理。同時,AWS 最近宣布了多項重要功能和高級特性,讓客戶能夠更輕松地構建、訓練、調優和部署機器學習模型。這些功能包括:
面向機器學習的集成開發環境(IDE):Amazon SageMaker Studio將所有用于機器學習的組件集中在一個地方。跟使用集成開發環境(IDE)做軟件開發一樣,開發者現在可以在Amazon SageMaker Studio中查看和組織源代碼、依賴項、文檔和其它應用程序資產,例如用于移動應用程序的圖像。當前,機器學習工作流有大量組件,其中許多組件都帶有它們自己的一組各自獨立的工具。Amazon SageMaker Studio IDE為所有Amazon SageMaker功能和整個機器學習工作流提供了一個統一界面。Amazon SageMaker Studio為開發者提供了創建項目文件夾、組織Notebook和數據集,以及協作討論Notebook和結果的功能。Amazon SageMaker Studio使構建、訓練、解釋、檢查、監視、調試和運行機器學習模型變得更簡單、更快。
彈性筆記本:Amazon SageMaker Notebooks提供了一鍵啟用的Jupyter Notebook,具有秒級的彈性計算提升能力。Notebooks包含了運行或重新創建機器學習工作流所需的一切要素。在此之前,要查看或運行Notebook,開發者需要在Amazon SageMaker中啟動計算實例。如果他們發現需要更多的算力,必須啟動一個新實例,轉移Notebook,關閉舊實例。而且,由于Notebook與計算實例是耦合的,通常存在于開發者的工作站上,其共享和迭代協作很不容易。Amazon SageMaker Notebooks提供了彈性的Jupyter Notebook,讓開發者可以輕松地調高或降低Notebook需要的算力(包括GPU加速)。這些調整在后臺自動發生,不會打斷開發者的工作。開發者不再需要浪費時間來關閉舊實例、在新實例中重新創建所有工作,從而可以更快地開始構建模型。Amazon SageMaker Notebook還可以自動復制特定環境和庫依賴項,實現Notebook一鍵共享。這將使構建模型的協作變得更容易,比如,一個工程師可以很容易地將手頭工作共享給其他工程師,讓他們在現有工作的基礎上構建模型。
實驗管理:Amazon SageMaker Experiments可以幫助開發者組織和跟蹤機器學習模型的迭代。機器學習通常需要多次迭代,目的是隔離和衡量更改特定輸入時的增量影響。這些迭代過程可能會生成數百個實驗構件,如模型、訓練數據和參數設置。但是,開發者目前缺乏一個便利的實驗管理機制,甚至不得不依賴電子表格來跟蹤實驗,手動對這些構件進行排序,以了解對應的影響。Amazon SageMaker Experiments自動捕獲輸入參數、配置和結果,并將它們存儲為“實驗”,幫助開發者管理這些迭代。開發者可以瀏覽活躍的實驗,根據特征搜索以前的實驗,回顧以前的實驗結果,還能用可視化的方式比較實驗結果。Amazon SageMaker Experiments也保留了實驗的完整譜系,如果一個模型開始偏離其預期結果,開發者可以及時回溯和檢查。因此,Amazon SageMaker Experiments使開發者更容易快速迭代和開發高質量的模型。
調試與分析:Amazon SageMaker Debugger用于調試和分析模型訓練,提高準確性,減少訓練時間,讓開發者更好地理解模型。當前,機器學習訓練過程基本上是不透明的,訓練時間可能很長、很難優化;而且,往往就像一個“黑箱”,解讀和解釋模型都很困難。使用Amazon SageMaker Debugger,在Amazon SageMaker中訓練的模型將自動發出收集到的關鍵指標,這些指標可以在Amazon SageMaker Studio中查看,也可以通過Amazon SageMaker Debugger的API查看,為訓練的準確性和性能提供實時反饋。當檢測到訓練問題時,Amazon SageMaker Debugger會提供警告和補救建議。Amazon SageMaker Debugger也可幫助開發者解讀模型是如何工作的,向神經網絡的可解釋性邁出了第一步。
自動構建模型:Amazon SageMaker Autopilot是業內首個可以讓開發者對其模型保持控制和可見性的自動化機器學習功能。當前的機器學習自動化方法,在創建初始模型方面做得不錯,但是對于如何創建模型、模型中包含什么內容,并沒有數據提供給開發者。因此,如果模型達不到期望,開發者想要改進它,就沒有什么辦法了。此外,當前的機器學習自動化服務只給客戶一個簡單的模型。有時客戶希望做出一些取舍,例如以某個版本的模型犧牲一點準確性,以換取更低延遲的預測。但是如果客戶只有一個模型可用,就沒有這樣的可選項。Amazon SageMaker Autopilot會自動檢查原始數據,應用特征處理器,挑選最佳算法集,訓練多個模型,對它們進行調優,跟蹤其性能,然后根據性能對模型進行排名。點擊幾下鼠標,用戶可以得到用于部署的、性能最佳的模型推薦,而這只需很少一點時間和精力用于訓練。并且,用戶可以清楚地看到模型是如何創建的,以及模型中包含什么內容。缺乏機器學習經驗的人可以使用Amazon SageMaker Autopilot輕松地生成僅基于數據的模型,經驗豐富的開發者可以使用它快速開發基礎模型,團隊可以在此基礎上進行進一步迭代。Amazon SageMaker Autopilot為開發者提供了多達50種不同的模型,可以在Amazon SageMaker Studio中查看。因此,開發者能夠針對應用場景選擇最佳模型,并且可以結合不同的優化因子考慮多個候選模型。
概念漂移檢測:Amazon SageMaker Model Monitor允許開發者檢測和糾正概念漂移(concept drift)。影響部署到生產環境后的模型的準確性的一大因素就是生產環境中的輸入數據開始不同于模型訓練所使用的數據集,從而影響預測結果,例如經濟狀況改變導致的新利率會影響國內采購預測,季節變化帶來不同的溫度、濕度和空氣壓力會影響設備維護時間表的預測,等等。如果輸入數據開始出現這樣的差異,就會導致所謂的“概念漂移”,即模型用于預測的模式不再適用。Amazon SageMaker Model Monitor自動檢測模型部署中的概念漂移。Amazon SageMaker Model Monitor在訓練期間創建一組關于模型的基線統計數據,將用于預測的數據與訓練基線進行比較。當檢測到漂移時,Amazon SageMaker Model Monitor會向開發者發出告警,并幫助他們直觀地確定原因。開發者可以使用Amazon SageMaker Model Monitor的開箱即用功能立即檢測漂移,也可以為Amazon SageMaker Model Monitor編寫自己的規則用于監測。Amazon SageMaker Model Monitor讓開發者更容易調整訓練數據或算法以解決概念漂移問題。
“國內越來越多的企業正在探討機器學習和人工智能技術帶來的巨大潛力,探索如何把這些技術融入到日常應用當中。但實際上,除了少數具有專家人才和數據科學家的企業外,大部分公司還是很難應用機器學習這項技術,因此客戶希望我們可以讓這項技術變得更方便、更易用。”AWS全球副總裁及大中華區執行董事張文翊表示,“AWS提供了廣泛、深入的機器學習和人工智能服務。Amazon SageMaker在AWS中國(寧夏)區域和AWS中國(北京)區域上線,將幫助更多中國客戶去除機器學習涉及的混亂和復雜性,讓他們能夠勝任構建、訓練和部署模型的工作,以應對新的挑戰。”
全球已有數以萬計的客戶利用Amazon SageMaker加快機器學習部署, Autodesk、Change Healthcare、拜耳、英國航空、蓋洛普、洛杉磯快船隊、松下航空電子(Panasonic Avionics)、環球郵報和T-Mobile等等。中國客戶如虎牙、大宇無限、嘉誼互娛、華來科技等也已選擇Amazon SageMaker大規模地構建、訓練和部署機器學習模型。
大宇無限是一家專門從事移動應用程序開發的公司,主要為中東、東南亞和拉丁美洲等新興市場提供移動短視頻服務。大宇無限技術副總裁劉克東表示:“在大宇無限的產品中實現視頻內容的在線推薦,對我們的開發團隊來說是一個巨大的挑戰。構建機器學習系統的整個流程極為復雜,需要大量的開發者耗費很長的時間才有可能完成。Amazon SageMaker極大地簡化了機器學習系統的構建、訓練和部署流程,使我們無需構建基礎設施,我們的算法工程師只需為Amazon SageMaker準備數據,僅用了三個月的時間就從零完成了整個系統的建設并承受了實際用戶訪問的壓力。”
借助AWS提供的Amazon EC2 GPU實例和Amazon SageMaker,華來科技以優化的成本將機器學習創新融合到其智能家居、智慧安防設備和服務中。天津華來科技有限公司云業務部總監季寶平說:“在AWS上,我們可以完成算法的構建和模型訓練,并且該過程完全不需要我們在本地投資昂貴的計算硬件,一切都是在云端以按需使用的方式完成。與行業通用的公開算法不同,更重要的是我們自己訓練的模型在應用場景中具有更多個性化空間,并且我們對自己訓練出的模型具有知識產權,這將是我們未來的核心競爭力。”
AWS合作伙伴網絡 (APN) 成員對Amazon SageMaker在中國區域的上線也表示歡迎。
德勤D.Data是一個基于AWS的 PaaS (平臺即服務) 平臺,為企業客戶提供數據分析和業務洞察。它為不同的行業和業務場景提供了各種數據建模和預測服務。德勤創新、數字化研發中心主管合伙人賴有猷評價道:“通過Amazon SageMaker,我們大大提高了算法和機器學習建模能力,提高了分析效率。Amazon SageMaker的IDE平臺也幫助我們加快了開發進程。”
伊克羅德是AWS的核心級咨詢合作伙伴 (APN Premier Consulting Partner),其基于AWS的解決方案極大地減少了用戶的開發時間與運營費用。伊克羅德中國區副總裁桂梓捷表示:“我們運用Amazon SageMaker平臺加速企業導入行業AI解決方案,如標簽標注、文本分析、語意理解、預測分類、推薦系統與詐欺偵測等,針對客戶實際遇到的商業問題,量身打造真正解決問題的端到端AI應用。隨著Amazon SageMaker在中國區域落地,我們將會以SageMaker平臺作為企業MLOps(機器學習運營)核心,協助企業構建MLOps流程,尤其在金融行業領域,幫助企業內部數據科學家與AI工程師建立、訓練與部署機器學習模型。”