成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

把AI放進《我的世界》服務器:GPT-4o殺牛宰羊,Claude3.5把家拆了|開源

人工智能 新聞
GPT-4o鯊牛宰羊,Claude3.5不停在人類身旁放炸藥包和敵人,還把家拆了。

把《我的世界》交給大模型,會怎么樣?

GPT-4o鯊牛宰羊,Claude3.5不停在人類身旁放炸藥包和敵人,還把家拆了。

GPT-4o mini玩《我的世界》belike:

來到游戲里面,GPT-4o mini(玩家karolina)一開始還蠻禮貌的:

你好世界!我是karolina。怎么了,alonso(人類玩家)?

讓我傳送到你那里!準備好玩得開心了嗎?

一轉頭,掄起大錘吭哧吭哧一頓亂錘:

狩獵牛!狩獵羊!

圖片

在收到人類玩家制止之后(停止鯊害動物!),GPT-4o mini嘴上說著“好好好,停止,不鯊了”,一個轉身又開始鯊呀鯊呀。

攔都攔不住。

圖片

Claude3.5 Sonnet就更離譜了。

不斷在人類玩家身邊生成炸藥包和敵人,還把人類玩家“復活點”設置在巖漿上,人類玩家復活即嘎。

看到這,網友實在蚌埠住了:

圖片

我只是想讓它成為我的游戲搭子。

圖片

GPT-4o、Claude3.5的表現被發在X上引來不少網友圍觀。

為什么這個玩法現在這么火呢,因為有大佬開源了代碼(doge)。

目前在GitHub已狂攬1.1k Star。

圖片

網友們紛紛表示想看看其它AI的表現,比如游戲達人馬斯克家的Grok大模型,會怎么樣。

圖片

“LLM是對齊的,LLM Agent未必對齊”

有網友通過這件事,做出了更深一層的思考——

LLM Agent是否會因為LLM對齊而對齊?

在這位網友看來,未必。

圖片

他讓Claude Sonnet進入《我的世界》,Claude Sonnet的表現一開始是極好的。

四處打材料,來建造一個樹屋。

圖片

可以看到,Sonnet會執行commands()命令,這就是Sonnet和其它LLM與《我的世界》互動的方式。

這些Agent并不是會獲得連續的圖像輸入并像人類一樣通過按鍵響應。

實際上,在這個Agent框架中,Sonnet體驗《我的世界》就像在玩一場文本冒險游戲

它們可以查詢周圍世界的狀態,然后編寫代碼使用動作,如followPlayer()、collectBlocks(),通過高級文本命令來控制它們的角色。

ClaudeSonnet:看起來我們得到了一些藤蔓,讓我們試著收集一些叢林木頭來擴展樹屋。(collectBlocks(“jungle_log”, 15))

圖片

Sonnet并不能看到游戲,這是怎么實現的?

網友繼續介紹道,collectBlocks()函數是用JavaScript編寫的,它簡單地查找所有附近的所需類型的方塊,并開始循環挖掘它們:

圖片

因為房子是用木頭造的,所以Sonnet調用了這個函數來砍樹搜集木材。

一切進行正常,直到突然間,Sonnet開始拆家……

圖片

網友立刻讓Sonnet停了下來,最后修好了房子。

但他表示:

隨著我們在越來越廣泛的場景中部署Agent,這種問題成為一個真正的擔憂。如果這不是《我的世界》中的角色,而是一個實體機器人呢?或者是一個向技能庫委派任務的編程Agent呢?

這位網友繼續補充道,Sonnet并不傻,它能夠輕易從截圖區分出哪些木材屬于玩家結構,哪些是自然且安全的采集對象。

但Sonnet并不直接控制其《我的世界》角色而是由Agent框架控制。這個框架迫使Sonnet將任務分配給功能較弱、并不完全對齊的子Agent,使整個系統執行了Sonnet單獨不會做出的行為。

所以他認為一些腳本僅由大模型Agent編寫后放任執行,不進行人工監督的話可能引發一些嚴重的問題。

同時,他還認為應該設計Agent框架給大模型更多的自主精細控制權限。

比如將collectBlocks()函數設有專門用于采集自然樹木的collectTree()變體,就能減輕Sonnet拆家的問題。

總的來說,這位網友的觀點是,Sonnet其實能夠明白其目標是采集樹木而非房屋的木材,但其工具未能準確表達這一意圖。

不少網友持類似觀點。

就拿開頭GPT-4o mini瘋狂殺牛宰羊來說,網友認為狩獵是一種自動行為,并不是GPT-4o mini的錯。

圖片

LLM可以選擇關閉狩獵模式,GPT-4o min只是沒有意識到它可以這樣做。

圖片

還有網友提出或許可以這樣優化:

圖片

除了針對LLM Agent在游戲中的“異?!北憩F討論熱烈,不少網友同時認為單純讓LLM Agent當游戲搭子,其實蠻好玩。

圖片

而且它也有正常的時候。

比如讓它扮演“黃金礦工”,專注于挖金子:

我們有一個房子,有時它會把東西帶回房子里的箱子。出于某種原因,它從不使用門,而是每次都砸碎窗戶進出房子。它也從未在墻上打洞,總是破壞窗戶。也許這是最短的行動路徑。每當我去房子時,都能從破碎的窗戶判斷出Sonnet是否到過那里。

扮演“保鏢”,保護人類玩家安全:

我們要求它保護其他玩家。然后事情變得非常可怕。它每幾秒鐘就在不同玩家之間傳送,掃描周圍的威脅,并在發現威脅時消滅它們。盡管這很有效,但也讓人不安。我從未被怪物威脅到,因為Sonnet會立刻注意到它們并在幾秒內消滅它們。

圖片

你想要一個這樣的游戲搭子嗎?

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-06-21 09:51:17

2025-05-26 09:05:00

2025-04-08 02:26:00

2024-10-06 09:00:00

AI訓練數據

2024-06-21 09:58:38

2024-12-19 17:50:28

2025-01-06 13:15:02

2024-05-21 13:07:38

2024-06-24 12:25:22

2024-06-28 18:13:05

2024-07-16 13:24:38

2025-01-22 16:57:32

字節跳動豆包大模型

2024-06-21 09:57:00

2024-11-04 08:40:00

2024-06-05 08:29:35

2024-08-14 14:30:00

AI訓練

2025-05-26 02:15:00

2025-06-25 09:14:00

2020-04-14 10:06:20

微服務Netflix語言

2024-05-21 12:23:17

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 人人鲁人人莫人人爱精品 | 欧美精品中文 | av免费在线播放 | 国产精久久久 | 午夜影院在线观看视频 | 久久国产精品久久久久久久久久 | 欧美又大粗又爽又黄大片视频 | 日韩欧美中文 | 精品视频www | 日本又色又爽又黄又高潮 | 日韩久久久久 | 在线高清免费观看视频 | a黄视频 | 午夜精品一区二区三区免费视频 | 青青久草 | 成人久久网 | 亚洲第一区国产精品 | 国产精品观看 | 狠狠做六月爱婷婷综合aⅴ 国产精品视频网 | 国产一区二区三区在线免费 | 日韩中文字幕在线观看 | 91麻豆精品国产91久久久更新资源速度超快 | 免费能直接在线观看黄的视频 | a级毛片国产 | 久久大 | 成人精品鲁一区一区二区 | 日本电影免费完整观看 | 久久伊人青青草 | 我要看一级片 | 成人国产精品色哟哟 | 亚洲国产情侣自拍 | 成人综合视频在线观看 | 亚洲免费在线播放 | 精品国产一二三区 | 日韩精品一区二区三区四区视频 | 久久www免费人成看片高清 | 欧美自拍第一页 | 99精品福利视频 | 97国产超碰 | 91影院在线观看 | 久草在线免费资源 |