成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用! 原創

發布于 2024-11-27 14:30
瀏覽
0收藏

編輯 | 言征

出品 | 51CTO技術棧(微信號:blog51cto)

2025年,都知道智能體會爆發,然而,即將爆發的智能體會長成什么樣子?

它不再只是一個“對話界面”那么簡單,也不再將是“給你一項任務,去完成吧”的人類主動發起的各種工具調用(滾動聊天界面),而是一個真正意義上的自發發起任務,自動執行,但會在關鍵環節提醒人類進行批準確認的高級智能。

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區圖片

這一點不再是空穴來風,已經有玩家開始入場做嘗試了,就在剛剛,一個名為Humanlayer的產品在圈內走紅,它能讓AI代理聯系人類,讓AI真得像得力助手一樣,只需要批準確認就行。重點在于,它會主動聯系你,獲取你的反饋、意見和建議以及審批。

從Demo效果看,非常震撼!

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區

多說一嘴,Humanlayer免費可用,且已經放到了Github上:

??https://github.com/humanlayer/humanlayer?tab=readme-ov-file??

并且提供了免費套餐和透明的基于使用量的定價,等不及的朋友可以可以通過提供的Python或TypeScript SDK進行嘗試,立即可以免費試用。

1.讓大模型達到生產級水準

嚴格意義上講,Humanlayer還不能稱之為產品,更多是一個API或者Python工具包,它可以讓自己的AI系統能夠安全地部署到生產環境中。

創始人Dex介紹,真正令人興奮之處在于,“它讓團隊能夠部署那些原本風險過高的AI系統,讓你能夠專注于構建強大的代理,同時知道關鍵步驟將始終有人類參與。當人們開始將動態人類監督視為生產AI系統中的關鍵要素,并因此考慮更大的格局時,這真是太棒了。”

Dex這個項目的起始原因是這樣一個智能體落地企業的痛點——在生產環境使用或落地大模型時,也經常會遇到類似的問題。

“這一切始于我們為數據團隊構建AI代理的時候,我們想要自動化一些繁瑣的任務,比如刪除未使用的表格,但客戶理所當然地會反對讓AI代理直接訪問生產系統。”

想要讓AI達到“生產級”的可靠性,取決于“AI所執行的任務有多危險”。但問題就在于時間成本是很昂貴的,Dex團隊沒有3個多月的時間來進行評估、微調和提示工程,以達到代理99.9+%的可靠性。即使做到了,讓決策者放心地按下開關也是一項挑戰。

后來,Dex構建了一些基本的審批流程,比如“在刪除表格前在Slack中詢問”。

但這種溝通本身也需要規范——如果代理聯系錯了人怎么辦?如果一個團隊負責人購買的工具向CEO發送了一條煩人的Slack消息,他會怎么想?

后來,客戶希望代理向利益相關者請求批準,有意思的是,客戶首先想要批準的恰恰是“請求批準”這一行為本身。基于此,Dex開始思考:作為產品構建者和所有者,我也想批準“請求批準‘請求批準’”這一行為!

緊接著,Dex團隊搭建了一個人機交互系統,可以在他和客戶的Slack實例中處理上述這些情況。這件事情讓Dex確信任何構建AI代理的團隊都需要這種基礎設施,并決定將其作為一個獨立產品來打造。

“我在舊金山的一次AI聚會上展示了最小可行性產品(MVP),并進行了很多精彩的交流,然后全身心投入到HumanLayer的構建中。”

2.如何做到的?

大家都知道,功能和工具是Agentic工作流的關鍵組成部分。它們使大語言模型(LLMs)能夠與外界進行有意義的交互,并自動化執行廣泛且具有影響力的工作。對于執行諸如預約、與客戶互動、管理賬單信息、編寫和執行代碼等有意義任務的AI代理而言,正確且準確的功能調用至關重要。

然而,我們能為LLMs提供的最有用的功能也是最具風險的。我們都能想象到一個AI數據庫管理員不斷調優和重構我們的SQL數據庫所帶來的價值,但大多數團隊不會允許LLM在生產數據庫上執行任意SQL語句(甚至我們大多數時候都不允許人類這么做)。

也就是說:即使擁有最先進的代理推理和提示路由技術,LLMs在沒有人類監督的情況下訪問高風險功能仍然不夠可靠。

首先,Dex團隊定義了生產環境下什么功能是高風險的?以下是一些示例:

低風險:訪問公共數據的讀取權限(例如搜索維基百科、訪問公共API和數據集)低風險:與代理作者通信(例如,工程師可能會授權一個代理向他們發送包含進度更新的私人Slack消息)中風險:訪問私有數據的讀取權限(例如讀取電子郵件、訪問日歷、查詢CRM)中風險:在嚴格規則下通信(例如,根據特定序列的硬編碼電子郵件模板發送郵件)高風險:代表我個人或公司通信(例如發送電子郵件、在Slack上發布消息、發布社交/博客內容)高風險:對私有數據的寫入權限(例如更新CRM記錄、修改功能開關、更新賬單信息)

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區圖片

Dex分析認為,高風險功能是最有價值且自動化人類工作流程影響最大的功能,但它們也是“90%準確率”不可接受的功能。當今大語言模型(LLMs)傾向于產生幻覺或生成低質量的、明顯由AI生成的文本,這進一步影響了可靠性。

團隊越早能讓代理以高質量輸入可靠且安全地調用這些工具,他們就能越早獲得巨大收益。

HumanLayer就是圍繞能夠確定性地保證對高風險功能調用的人類監督,提供了一套工具。即使LLM出現錯誤或產生幻覺,HumanLayer也已經嵌入到工具/功能本身中,確保人類在這個“工具調用循環”中。

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區源自Medium,Louis Dupont的“工具調用循環”概念

當你集成HumanLayer SDK時,你的AI代理可以在其執行的任何階段請求人類批準。我們通過人們偏好的渠道(Slack或電子郵件,SMS和Teams也即將推出)處理將這些請求路由給正確的人的所有復雜性,在等待回復時管理狀態,并提供完整的審計軌跡。

除了“請求批準”之外,我們還支持一個更通用的“人類作為工具”功能,該功能可以暴露給LLM或代理框架,并處理收集人類對于一般問題(如“我在上遇到了困難,我已經嘗試了THINGS,請提供建議”)的回復(有時我們為后臺自動化推出的內部代理會收到這樣的消息)。

由于它位于工具調用層,HumanLayer的SDK可以與任何AI框架(如CrewAI、LangChain等)以及任何支持工具調用的語言模型一起工作。如果你正在構建自己的代理/工具循環,你可以使用更低級別的SDK原始類型來按你的需求管理審批。我們甚至正在探索HumanLayer用于人與人之間審批的用例,而不僅僅是AI到人類。

HumanLayer通過將人類納入循環中,代理工具可以獲得訪問更強大且更有意義的工具調用和任務的能力。

對于目前主流的大語言模型(如OpenAI、Llama、Claude等)和框架(如LangChain、CrewAI等),AI代理提供安全訪問世界的能力。

總結來說,HumanLayer提供了這五項關鍵功能:

(1)要求函數調用需人類批準:@hl.require_approval()裝飾器會阻止特定函數調用,直到咨詢過人類——如果被拒絕,反饋將被傳遞給LLM

(2)人類作為工具:通用的hl.human_as_tool()允許聯系人類以獲取答案、建議或反饋

(3)全渠道聯系:通過Slack、電子郵件、Discord等多種渠道聯系人類并收集回復

(4)精細路由:將審批路由到特定團隊或個人

(5)自帶LLM和框架:由于HumanLayer是在工具層實現的,它支持任何LLM以及所有支持工具調用的主要編排框架。

3.下一代:自主代理和“外循環”

在“需要人類基準”和“人類作為工具”之間,HumanLayer提到了下一代AI代理——自主代理,而HumanLayer只是拼圖中的一塊。

第一代Agent:聊天——人類發起的問答界面

第二代Agent:代理助理——框架驅動提示路由、工具調用、思維鏈和上下文窗口管理,以獲得更高的可靠性和功能。大多數工作流程都是由人類通過一次性“這是一個任務,去完成吧”或滾動聊天界面發起的。

第三代Agent:自主代理——不再由人類發起,代理將生活在“外循環”中,使用各種工具和功能來推動實現其目標。人類/代理通信是由代理發起,而不是由人類發起。

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區圖片

第三代自主代理將需要方法以在各種任務中向人類咨詢意見。為了使這些代理能夠執行實際且有用的工作,它們將需要人類對敏感操作進行監督。

4.幾個不錯的應用示例

這些代理將需要方法通過聊天、電子郵件、短信等多種渠道聯系一個或多個人類。

HumanLayer目前已經有了一些很酷的使用方式,銷售、新聞、運維等領域已經有了不錯的案例。

有客戶用它構建了一個AI銷售發展代表(SDR),它起草個性化的銷售電子郵件,但在向潛在客戶發送任何內容之前,會在Slack中請求人類批準。

另一個客戶使用它來支持一個AI新聞簡報,訂閱者可以與內容進行電子郵件對話。HumanLayer負責接收入站電子郵件,并將其路由給能夠回復的代理,并為這些代理提供回復工具。

自主智能體提前實現了?!大佬自研Python工具包,讓大模型成為生產級水準,免費可用!-AI.x社區圖片

此外,一個團隊使用HumanLayer構建了一個面向客戶的DevOps代理——他們的AI代理審查拉取請求(PRs),計劃和執行數據庫遷移,同時在關鍵步驟獲得人類批準,并在遇到任何問題時聯系團隊進行指導。

5.仍處于早期階段

雖然這些代理的早期版本可能在技術上“由人類啟動”,例如通過cron作業或類似機制定期啟動,但最好的版本將能夠自行管理日程安排和成本。這將需要用于檢查成本的工具包以及類似于sleep_until的功能。

它們需要在能夠跨可能數小時或數天不返回的工具調用持久序列化并恢復代理工作流程的編排框架中運行。這些框架需要支持由“管理型LLM”進行的上下文窗口管理,并允許代理分叉子鏈以處理專門的任務和角色。

創始人Dex表示:我們承認現在還處于早期階段,歡迎大家就Agent、可靠性和平衡人類與AI工作量方面的想法和經驗進行交流。

此外,HumanLayer提供了免費套餐和靈活的基于積分的定價。對于構建面向客戶的代理的團隊,還可以獲得白標、額外功能和優先支持,可謂誠意滿滿。

安裝操作很簡單,等不及想將HumanLayer集成到你的系統中的朋友,不妨一試:

pip install humanlayer

from humanlayer import HumanLayer

hl = HumanLayer()



@hl.require_approval()

def send_email(to: str, subject: str, body: str):

    """Send an email to the customer"""

    ...





# made up function, use whatever

# tool-calling framework you prefer

run_llm_task(

    prompt="""Send an email welcoming the customer to

    the platform and encouraging them to invite a team member.""",

    tools=[send_email],

    llm="gpt-4o"

)

最后多提一句,大洋彼岸的OpenAI CEO奧特曼、國內百度李彥宏近期都表態押注了智能體的方向,相信屬于開發者的大模型應用時代正在悄然到來!

參考鏈接:

??https://github.com/humanlayer/humanlayer?tab=readme-ov-file??

??https://www.youtube.com/watch?v=5sbN8rh_S5Q??

??https://www.humanlayer.dev/??

本文轉載自??51CTO技術棧??,作者:言征

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 国产有码 | 黄色片在线观看网址 | 欧美日韩高清一区 | 欧美日韩不卡合集视频 | 亚洲日本一区二区三区四区 | 久久久青草婷婷精品综合日韩 | 91精品国产综合久久国产大片 | 日韩精品在线看 | 2018国产精品| 国产精品久久一区二区三区 | 久久精品免费 | 亚洲精品一区中文字幕乱码 | 日韩精品成人 | 欧美一区二区在线观看 | 性高湖久久久久久久久 | 久久精品免费观看 | 丁香久久 | 一区二区电影网 | 亚洲欧美日韩精品久久亚洲区 | 久久蜜桃精品 | 国产欧美一区二区三区在线看 | 欧美视频福利 | 91视视频在线观看入口直接观看 | 四季久久免费一区二区三区四区 | 精品99爱视频在线观看 | 81精品国产乱码久久久久久 | 欧美美女二区 | 精品乱码久久久久 | 久久成人午夜 | 在线观看中文字幕视频 | 成人在线观看免费 | 麻豆久久久9性大片 | 久久偷人| 日本精品一区二区 | 大香网伊人 | 国产精品一区二区av | 成人av看片 | av黄色片 | 麻豆久久久久 | 欧美一区二区三区在线观看 | 亚洲欧美日韩一区 |