2024年云端AI工程的三大趨勢
AI 工程師的三大關鍵趨勢包括:使用低代碼或無代碼工具構建 AI 代理,以及結合 AI 模態。
譯自3 Key Trends for AI Engineering in the Cloud in 2024,作者 Dan Rowinski。
過去 20 年的創新為我們帶來了轉折點,創造了全新的工作類別。想想 2006 年 AWS 推出后云架構師和開發人員的興起,iPhone 和 Android 興起后的移動開發人員,當我們終于擁有足夠的數據和計算能力來使神經網絡發揮作用時,機器學習工程師的出現,以及這三種趨勢融合后數據科學家的出現。
“如果你想在 18 個月前成為一名 AI 開發人員,你需要克服很大的障礙。[...] 現在我們已經到了一個階段,只要有一個想法,你就可以在午餐時間實現它。”
– Simon Margolis,SADA 的 AI 和 ML 副 CTO
沿著這條演變路徑,我們可能已經到達了另一個轉折點:AI 工程師。AI 工程師在過去幾年中開始流行,并且處于使用大型語言模型和相關工具來構建生成式 AI 聊天機器人、代理和其他功能的最前沿。
隨著基礎模型和 AI 工程的成熟,一些趨勢開始出現。我們與Simon Margolis,SADA的 AI 和 ML 副 CTO(一家 Google Cloud 供應商)進行了交談,了解他們在當前 AI 工程領域看到了什么,以及我們接下來可能會看到什么。
“這取決于你在生成式 AI 的整體采用曲線上處于什么位置,”Margolis 說。“有些人還在試用,剛開始接觸,而有些人早在 ChatGPT 成為家喻戶曉的名字之前就在做生成式 AI 工作。我認為,人們在這個范圍內的位置與他們的主要趨勢有很大關系。”
總的來說,Margolis 確定了 2024 年年中 AI 工程師的三個關鍵趨勢:1) 能夠使用低代碼或無代碼或技術知識構建AI 代理;2) 結合 AI 模式,例如機器學習和生成式 AI;3) 使用生成式 AI 來幫助構建生成式 AI 代理。
兩個主要的生成式 AI 平臺,Google Cloud 和 OpenAI,一直在努力讓 AI 工程師更容易構建 AI 代理,而無需過多地關注基礎模型或向量數據庫本身。兩者都推出了構建代理的工具,包括 Google Cloud 的Vertex AI中的 Agent Builder 和 OpenAI 的GPTs。
“在早期采用者方面,我們看到的一個最大增長點是能夠構建生成式代理,而無需具備深厚的技術知識,”Margolis 說。“而兩年前,你需要對諸如 Transformer 和 RAG [檢索增強生成] 之類的東西非常了解,并且需要進行大量深奧的技術工作。”
Margolis 指出,雖然在構建代理方面存在一些邊緣玩家,但他主要只在野外看到了 Agent Builder 和 GPTs。
“有了像 Agent Builder 和 GPTs 這樣的東西,你不需要是 AI 工程師才能做到這一點。”
能夠使用較少的技術知識構建代理的凈效應是,將創建代理的想法,以及一些執行工作,推向了業務線人員,而不是僅僅依賴開發人員。
“在高級別上,你從某個系統中獲取信息——一個專有系統、互聯網或它們的組合——然后使用它來告知一個 AI 工具、一個代理或某種類型的生成式助手,”Margolis 說。“這與我們一兩年前在 LangChain 中看到的模式相同,你擁有這些邏輯和推理循環,并且不斷增強輸出,直到它最終為你提供你想要的東西。它只是變得不那么微妙了。”
“有了像 Agent Builder 和 GPTs 這樣的東西,你不需要是 AI 工程師才能做到這一點。你可以是一個外行人來做到這一點。你可以使用純文本或 ClickOps 之類的東西來做到這一點。在解決方案空間方面,它更具可預測性。”
結合 AI 模式
將 AI 模式結合起來的想法可能對 AI 工程師更具實際意義。需要注意的是,當 Margolis 在這種情況下談論模式時,他指的是我們可能認為的“傳統”機器學習,例如用于推理和預測的機器學習,以及基礎模型和生成式 AI 的更新模式之間的區別。這與生成式 AI 中的模式概念不同,在生成式 AI 中,輸入和輸出取決于媒體,例如文本、音頻、視頻或翻譯。
“以前你會看到有些人要么在生成式 AI 世界中玩耍,要么在更傳統的 ML 世界中玩耍,圍繞推理和預測之類的東西,現在你開始看到這兩種東西的融合。”
“這不是一個無代碼解決方案,而是一個相對低代碼的解決方案。我不是從頭開始構建模型。我沒有用 TensorFlow 編寫代碼。”
Margolis 指出,這就是我們可以看到生成式 AI 的使用,而無需構建特定的 AI 代理或聊天機器人。他以使用 AI 工具在醫療保健系統中呈現數據的例子為例,在醫療保健系統中,護士或醫生或管理員可能會輸入有關患者的多個數據字段,這些數據字段由生成式工具編寫。然后在同一個系統中,有 ML 工具帶有推理引擎,這些工具可能會說這是一個高風險患者等等。
“幾年前,如果我想構建一個像 [醫療保健示例] 這樣的應用程序,我可能需要征求一些精通模型創建的 ML 同事,他們可能需要使用 JAX 或 TensorFlow 為我構建一個傾向模型,”Margolis 說。“他們可能需要真正地進入物理 GPU。這需要大量的 ML 工程和數據科學工作。然后在生成方面,也許我可以直接將該輸出輸入到我最喜歡的生成模型的上下文窗口中。但這些是兩種截然不同的技能。”
Margolis 說,像 Google Cloud 的 Vertex 套件(SADA 是 Google Cloud 生成式 AI 的首選合作伙伴)這樣的工具可以幫助彌合機器學習工具和生成式 AI 工具之間的差距。
“現在同一個工程師可以去 Vertex 創建一個 AutoML 模型,”Margolis 說。“這不是一個無代碼解決方案,而是一個相對低代碼的解決方案。我不是從頭開始構建模型。我沒有用 TensorFlow 編寫代碼。我沒有用 JAX 編寫代碼。我不處理 GPU。我不處理任何虛擬或系統組件。”
有關將生成式 AI 與結構化數據結合使用的更多信息,Margolis 最近在 Medium 上發表了一篇關于該主題的有趣文章。
生成式 AI 幫助構建生成式 AI
“進入的門檻真的降低了,我認為這對每個人都有好處。”
我們還沒有進入一個計算機自主構建自己的嬰兒計算機并編寫自己的代碼的世界。然而,AI 工程中一個有趣的發展是使用生成式 AI 來幫助構建更多生成式 AI 代理、機器人和應用程序。
“我認為這是一個強大的模式,它使許多人能夠參與到這個領域,”Margolis 說。
他將這種趨勢比作過去 10-15 年的拐點,當時開發人員可以輕松地在云中啟動虛擬機(大約在 2010 年),或者當構建移動應用程序的門檻在 2014 年左右降低時。
“我覺得這和我們在公共云中遇到的‘哦,天哪’時刻一樣,當時我們意識到,每個剛開始學習計算機科學或系統設計的學生,你知道,在 2010 年,突然之間就可以啟動服務器和數據庫,”Margolis 說。“如果你想在 18 個月前成為一名 AI 開發人員,你需要克服一個很大的障礙。要達到能夠真正實現你的想法的程度,需要做很多工作。現在我們已經到了有了一個想法并實現它,你可能可以在午餐時間完成。”
“進入的門檻真的降低了,我認為這對每個人都有好處。”