成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Claude都能操縱計算機了,吳恩達:智能體工作流越來越成熟

人工智能 新聞
大多數 LLM 都針對回答問題進行了優化,主要是為了提供良好的消費者體驗,我們已經能夠將它們「移植」到復雜的智能體工作流程中,以構建有價值的應用程序。

受 ChatGPT 強大問答能力的影響,大型語言模型(LLM)提供商往往優化模型來回答人們的問題,以提供良好的消費者體驗。

隨著智能體研究日趨成熟,優化似乎有了新的方向。

人工智能著名學者、斯坦福大學教授吳恩達今天指出:「現在有一種趨勢是優化模型以適應智能體工作流程,這將為智能體性能帶來巨大提升」,并撰寫一篇博客簡單闡述了這種趨勢。

圖片

我們對博客內容進行了不改變原意的編譯、整理,以下是博客內容:

繼 ChatGPT 在回答問題方面取得突破性成功之后,許多 LLM 的開發都集中在提供良好的消費者體驗上。因此,LLM 被調整為回答問題或遵循人類提供的指令。指令調整指導模型的數據集很大一部分可以為人類編寫的問題和指令提供更有用的答案,面向 ChatGPT、Claude、Gemini 等等。

但智能體工作負載不同,人工智能軟件不是直接為消費者生成響應,而是應該在迭代工作流程中:

  • 反思自己的輸出;
  • 使用工具;
  • 編寫規劃;
  • 在多智能體環境中進行協作。

主要模型制造商也越來越多地優化用于 AI 智能體的模型。

以工具使用(或函數調用)為例。如果 LLM 被問及當前天氣,它將無法從訓練數據中獲取所需的信息。相反,它可能會生成 API 調用請求以獲取該信息。甚至在 GPT-4 原生支持函數調用之前,應用程序開發人員就已經使用 LLM 來生成函數調用,通過編寫更復雜的提示來告訴 LLM 哪些函數可用,然后讓 LLM 生成用于確定是否要調用函數的字符串。

在 GPT-4 之后,生成此類調用變得更加可靠,然后許多其他模型本身就支持函數調用。如今,LLM 可以決定調用函數來搜索信息以進行檢索增強生成 (RAG)、執行代碼、發送電子郵件、在線下訂單等等。

最近,Anthropic 推出了升級版的 Claude 3.5 Sonnet,能像人一樣使用計算機。這意味著 LLM 原生使用計算機方向向前邁出了一大步,將幫助許多開發人員。一些團隊還致力于讓 LLM 使用計算機構建新一代 RPA(機器人流程自動化)應用程序。

隨著智能體工作流程的成熟,我看到的是:

  • 首先,許多開發人員正在 prompt LLM 來執行他們想要的智能體行為。這樣可以進行快速、豐富的探索!
  • 在極少數情況下,開發非常有價值的應用程序的開發人員將微調 LLM,以更可靠地執行特定的智能體功能。例如,盡管許多 LLM 本身支持函數調用,但它們是通過將可用函數的描述作為輸入,然后(希望)生成輸出 token 以請求正確的函數調用來實現這一點的。對于生成正確函數調用非常重要的任務關鍵型應用程序,針對應用程序的特定函數調用微調模型可顯著提高可靠性。(但請避免過早優化!我仍然看到太多團隊在進行微調,而他們可能應該在采取這種做法之前花更多時間進行 prompt。)
  • 最后,當諸如工具使用或計算機使用之類的能力對開發人員來說似乎很有價值時,主要的 LLM 提供商正在將這些能力直接構建到他們的模型中。盡管 OpenAI o1-preview 的高級推理對消費者有幫助,但我預計它對于智能體推理和規劃會更有用。

大多數 LLM 都針對回答問題進行了優化,主要是為了提供良好的消費者體驗,我們已經能夠將它們「移植」到復雜的智能體工作流程中,以構建有價值的應用程序。為支持智能體中的特定操作而構建 LLM 的趨勢將為智能體性能帶來很大提升。我相信,在未來幾年內,在這個方向上將實現巨大的智能體能力提升。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-22 13:34:00

模型數據

2024-06-13 09:05:36

2012-07-09 09:38:38

2024-04-01 00:50:00

吳恩達智能體

2024-01-22 12:31:18

模型訓練

2017-12-26 15:34:55

2025-06-12 01:30:00

智能體Dify游戲智能體

2021-04-15 13:48:08

視頻監控視頻分析智能安防

2025-04-29 08:00:00

Rowboat多智能體人工智能

2022-02-13 17:27:59

吳恩達AI小數據

2018-03-29 14:51:59

智能公廁AI

2025-06-04 11:04:03

AI智能體AI智能體

2023-06-19 19:32:18

AI人工智能

2023-02-21 09:29:57

ChatGPT人工智能

2009-04-25 08:55:05

智能手機應用移動OS

2020-05-25 08:50:50

機器智能計算機

2025-04-11 10:10:16

AI智能體工作流程

2012-05-04 11:13:57

社交應用

2025-04-28 09:10:00

智能體Agent工作流

2018-05-29 12:00:51

前端工作互聯網
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品在线一区二区 | 天天干天天操天天射 | 久久免费国产视频 | 97精品国产97久久久久久免费 | 国产在线一区二区三区 | 天天操天天玩 | 午夜男人天堂 | 亚州精品天堂中文字幕 | 日韩免费看视频 | 亚洲国产18 | 国产一区二区欧美 | 激情欧美日韩一区二区 | 成人在线视频观看 | 五月激情综合 | 日本一区二区三区在线观看 | 中文字幕精品一区 | 国产一级片免费看 | 日韩在线播放一区 | 欧美日韩一区在线 | 日韩五月天 | 99热播精品| 久久综合久久久 | av中文字幕在线 | 国产a视频 | 九九热久久免费视频 | 麻豆av网| 国产精品亚洲第一区在线暖暖韩国 | 免费av在线网站 | 亚洲福利网 | 午夜视频在线视频 | 翔田千里一区二区 | 亚洲精品色 | 99色在线视频 | 精品一区二区免费视频 | 成人高清在线 | 国产成人99久久亚洲综合精品 | 国产日韩精品一区二区 | 黄色大片毛片 | 中文字幕乱码一区二区三区 | 精品久久久久国产 | 999在线精品|