不是開發人員也能使用機器學習
隨著數字化進程和人工智能的加速普及,企業人工智能(AI)和機器學習(ML)開發人員嚴重短缺,亞馬遜(AWS)正在尋求快速啟動AI和ML的方式,以幫助填補專業開發人員空白。同時也在激勵學生和其他行業的非專業人員加入這個利潤豐厚、需求巨大的領域。
為了實現這些目標,AWS發布了其SageMaker機器學習培訓平臺家族的兩個新成員——Amazon SageMaker Canvas,它將允許非專業開發者創建無代碼的ML項目;以及全新的Amazon SageMaker Studio Lab的免費公開預覽版。這將允許任何有興趣學習更多關于ML的人,可以嘗試使用這項技術。
亞馬遜人工智能和人工智能副總裁Bratin Saha(薩哈)稱,這兩款產品本周在拉斯維加斯的AWS re:Invent2021大會上發布,可以立即幫助企業解決一些積壓的ML項目。
AWS已經幫助ML專業人員使用SageMaker等工具更便捷地完成工作,所以使用相關工具將無代碼的ML帶給非開發人員或所謂的“平民開發人員”是這一使命的一個分支。無代碼的應用程序和服務已經可以用于廣泛的IT細分領域,但在ML的世界里,直到現在還沒有這樣的服務。
薩哈說:“通過我們的創新,我們認為機器學習將遵循類似的道路,客戶一直告訴我們,給他們提供無代碼工具將讓他們的分析師和其他人開始使用機器學習。”
SageMaker Canvas工具不僅僅是讓非開發人員輸入他們的項目,還將為非專業用戶進行推斷,從現有數據中推斷出信息后,填充缺失的值并糾正錯誤。在這些后端工具中添加了更多的ML智能來幫助用戶。例如,如果你有一個區域的郵政編碼,你知道,如果數字是8位數,他們不是有效的美國郵政編碼,然后他們就可以介入并標記這些錯誤。
如果需要在SageMaker Canvas中創建的ML項目上做更多的工作,開發者可以在SageMaker Studio版本中查看和更改Canvas項目,因為Canvas是基于SageMaker Studio的。SageMaker Canvas允許你以低代碼的方式將所有正在做的事情輸出到SageMaker Studio。這些代碼以及所有的數據準備和模型構建代碼都可以使用。

使用過Canvas早期版本的客戶告訴AWS,這種簡單的數據導入功能是一個有價值的特性。也是創新之一,你可以無縫地從無代碼環境過渡到代碼優先的環境,然后讓數據科學家參與進來,做出他們認為合適的修改。
該公司表示,SageMaker Canvas允許非數據科學家使用來自云中或本地不同數據源的數據創建和運行自己的ML模型,同時通過點擊一個按鈕將數據集結合起來。這些員工可以使用Canvas訓練精確的模型,然后通過一個直觀的界面生成新的預測。
該服務目前在美國東部(俄亥俄州)、美國東部(弗吉尼亞州)、美國西部(俄勒岡州)、歐洲(法蘭克福)和歐洲(愛爾蘭)的AWS地區普遍可用。根據AWS的說法,它可以用于本地數據集,也可以用于已經存儲在Amazon S3、Amazon Redshift或Snowflake上的數據。
全球對機器學習從業者的需求持續增長,遠遠快于能夠勝任這些角色的受過培訓和有技能的數據科學家。為了縮小這一差距,AWS引入了SageMaker Canvas,但更進一步,它還引入了SageMaker Studio Lab,其目的是將ML教育帶給更多的人,他們可以獲得從事這一重要且有利可圖的工作所需的專業技能。
這是一項完全免費的服務,讓學生、實驗人員、研究人員和其他人開始學習機器學習,學習機器學習,用機器學習做快速實驗等等。甚至不需要一個AWS賬戶就可以開始。你可以用一個電子郵件地址登錄……它不僅給你免費的計算能力,而且還給你免費的存儲空間。Studio Lab為你做了所有這些,它集成了GitHub和所有流行的軟件包。同時還包括有價值的教育材料,包括開源的ML指南,從深入深度學習,提供了關于機器學習廣泛而深入信息和課程,人工智能,神經網絡以及更多。AWS、Udacity和英特爾公司提供的約1000萬美元的人工智能獎學金也將通過Studio Lab發放,以幫助弱勢和貧困學生獲得人工智能教育。
教育內容還包括AWS機器學習大學,以及一個大型開源社區,來進行針對自然語言處理預訓練、深度學習(DL)模型。
AWS的舉措讓非開發者用戶更容易地使用ML,并有可能將更多的工人帶入該領域,這對AWS和其他ML供應商的未來非常重要。任何新技術都有一個學習曲線,像AWS這樣的服務需要大量的用戶,才能使相關的努力成為經濟上的實質性成果。最初,ML太困難,而且限制相對較多,不太實用。但隨著這種功能的廣泛應用,理解能力增加了,創建更容易學習的工具的能力變得可行了。
分析師表示AWS正在“采取額外的步驟使培訓免費,展示了犧牲短期戰術收入以換取更大的長期優勢和利潤的戰略意圖。“