成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tbody id="me0ok"><abbr id="me0ok"></abbr></tbody>

<td id="me0ok"><em id="me0ok"></em></td><tfoot id="me0ok"><tr id="me0ok"></tr></tfoot>

<cite id="me0ok"><s id="me0ok"></s></cite>

<strike id="me0ok"><rt id="me0ok"></rt></strike>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

人機交互與場景合成：人機交互統(tǒng)一技能模型

發(fā)布于 2025-4-3 00:22

瀏覽

0收藏

TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization

2025-03-25｜Shanghai AI Lab, HKU, Independent Researcher, SEU, Feeling AI｜CVPR 2025|??14

???http://arxiv.org/abs/2503.19901v1????
????https://huggingface.co/papers/2503.19901????
????https://liangpan99.github.io/TokenHSI???

研究背景與意義

人機交互與場景合成：人機交互統(tǒng)一技能模型-AI.x社區(qū)

TokenHSI旨在解決當前物理角色控制方法中普遍存在的局限性，即無法有效整合多種復雜的人體場景交互（HSI）技能?，F(xiàn)有方法通常專注于單一任務控制器的開發(fā)，導致在面對需要多技能協(xié)同的任務時表現(xiàn)不佳。TokenHSI通過引入基于Transformer架構的統(tǒng)一策略網絡，成功地將多個基礎HSI技能整合到一個模型中，并能夠靈活適應新任務和環(huán)境。

研究背景：HSI合成對于計算機動畫和具身AI至關重要，但目前的方法大多局限于特定任務，難以處理多樣化的挑戰(zhàn)性任務。
研究意義：TokenHSI不僅實現(xiàn)了多技能的統(tǒng)一學習，還顯著提升了模型對新任務和環(huán)境的適應能力，為更復雜的HSI任務提供了可能。

研究方法與創(chuàng)新

人機交互與場景合成：人機交互統(tǒng)一技能模型-AI.x社區(qū)

TokenHSI的核心創(chuàng)新在于其獨特的架構設計和高效的技能遷移機制。具體而言：

架構設計：

TokenHSI通過分離的人形本體感知（proprioception）令牌和任務令牌結合的方式，構建了一個獨立的觀察空間。

使用掩碼機制在Transformer編碼器中結合本體感知令牌和任務令牌，使得模型能夠在多任務訓練中實現(xiàn)有效的知識共享。

技能遷移：

模型支持可變長度輸入，允許靈活適應新場景中的技能需求。

引入了專有的本體感知令牌化器（Tprop），有效促進了多任務訓練和策略適應。

在推理階段，通過組合本體感知令牌和對應的任務令牌，指導角色執(zhí)行特定任務。

優(yōu)勢對比：

相較于傳統(tǒng)方法，TokenHSI無需對預訓練策略進行全參數(shù)微調，從而大幅提高了適應效率。

通過零初始化適配層（adapter layers）和新增任務令牌化器（Tnew），模型能夠快速適應新任務。

實驗結果表明，TokenHSI在樣本效率和性能上顯著優(yōu)于近期的策略適應方法。

實驗設計與結果分析

人機交互與場景合成：人機交互統(tǒng)一技能模型-AI.x社區(qū)

人機交互與場景合成：人機交互統(tǒng)一技能模型-AI.x社區(qū)

TokenHSI在多種HSI任務上的表現(xiàn)進行了廣泛測試，包括技能組合、物體形狀變化、地形形狀變化和長期任務完成等。

實驗設計：

基礎技能學習階段：在多任務環(huán)境中訓練Transformer策略，涵蓋跟隨、坐下、攀爬和攜帶四種代表性技能。

策略適應階段：通過引入輕量級模塊（如Tnew、Tc和ξA），使學到的技能能夠靈活適應更具挑戰(zhàn)性的HSI任務。

結果分析：

技能組合任務中，TokenHSI在保持高成功率的同時，展現(xiàn)出更強的穩(wěn)定性。

物體形狀變化任務中，TokenHSI通過微調任務令牌化器（Tc），成功適應了從盒子到不規(guī)則物體（如椅子和桌子）的變化。

地形形狀變化任務中，模型通過引入高度圖令牌化器，增強了對復雜地形的適應能力。

長期任務完成任務中，TokenHSI展示了流暢的技能過渡和碰撞避免能力。

結論與展望

TokenHSI通過統(tǒng)一的Transformer策略網絡，成功實現(xiàn)了多技能整合和高效的新任務適應能力。

總結貢獻：

提出了TokenHSI，一種基于Transformer的物理角色控制器，能夠整合多樣化的HSI技能。

展示了靈活且高效的策略適應能力，避免了對預訓練策略的全參數(shù)微調。

引入了專有的本體感知令牌化器，有效促進了多任務訓練和策略適應。

分析局限：

當前方法仍需依賴獎勵函數(shù)的設計，涉及繁瑣的試錯過程。

長期任務完成目前仍為非自主模式，未來需探索更高效的解決方案。

方法展望：

探索利用人類數(shù)據(jù)或互聯(lián)網知識減少獎勵工程的成本。

進一步研究如何實現(xiàn)完全自主的長期任務完成能力。

本文轉載自???AI研究前瞻???，作者：胡耀淇

標簽

贊

收藏

回復

舉報

回復

相關推薦

精選五大GPT模型，提升智能交互體驗

echo_ning ? 3398瀏覽 ? 0回復
谷歌多模態(tài)大模型ScreenAI：帶來人機界面交互新方式

魚蟲子 ? 3885瀏覽 ? 0回復
AI Agent：人類工作范式的顛覆者還是人機協(xié)作新范式？

Baihai_IDP ? 5020瀏覽 ? 0回復
對話聊天就是生成式AI最好的交互形態(tài)嗎？不一定！

Syrupup ? 3873瀏覽 ? 0回復
實戰(zhàn)LangGraph中實現(xiàn)「人機交互」！如何確保Agent系統(tǒng)每一步都符合預期？

探索AGI ? 6401瀏覽 ? 1回復
ReCorD:交互場景生成最新SOTA！

angel ? 2994瀏覽 ? 0回復
隨意畫個草圖就能生成3D交互游戲場景！騰訊XR出品

angel ? 3995瀏覽 ? 0回復
ReCorD:交互場景生成最新SOTA！

angel ? 2705瀏覽 ? 0回復
國家人機混合增強智能重點實驗室項目：利用生成世界模型優(yōu)化多智能體系統(tǒng)決策

xuxiangda ? 2796瀏覽 ? 0回復
Realtime API：開啟語音交互新時代

51CTO內容精選 ? 6114瀏覽 ? 0回復
2024年AI代理的突破：CoAgents如何引領人機協(xié)同新潮流？

Halo咯咯 ? 1655瀏覽 ? 0回復
使用Streamlit、LangChain和Bedrock構建一個交互式聊天機器人

51CTO內容精選 ? 4333瀏覽 ? 0回復
中科大重磅開源StableV2V：專注于「人機交互一致性」的視頻編輯方法

angel ? 2916瀏覽 ? 0回復
生成式AI人機協(xié)同有哪幾種模式？

數(shù)字化助推器 ? 6948瀏覽 ? 0回復
ChatGPT解鎖高級視頻對話、屏幕共享，實時交互時代

Aceryt ? 9605瀏覽 ? 0回復
CVPR 2025 | 低層交互破局！GIFNet實現(xiàn)多模態(tài)融合通用模型，單一框架橫掃多任務場景

angel ? 7543瀏覽 ? 0回復
Finarena：基于大模型智能體的金融市場分析和預測人機協(xié)作框架

靈度智能 ? 2431瀏覽 ? 0回復
ZeroHSI-一種零樣本的四維人類-場景交互合成方法

shizhi02 ? 1381瀏覽 ? 0回復
谷歌開源A2A，一夜改變智能體交互

Aceryt ? 1780瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

圖表代碼生成，ChartIR；視頻與文本統(tǒng)一多模態(tài)模型 5天前發(fā)布
跨領域強化學習樣本數(shù)據(jù)集；符號表達的分層推理基準 5天前發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：零階優(yōu)化的擴散模型個性化方法；合成圖像檢測；舞蹈動作音樂同步生成

下一篇：復雜多文本圖像生成；多角色對話視頻生成，唇形同步，身體動作，情感表達

社區(qū)精華內容

目錄

主站蜘蛛池模板：日韩视频免费 | 国产一级视频在线 | 亚洲女人天堂成人av在线 | 成人亚洲 | 亚洲精品久久久9婷婷中文字幕 | 日韩在线视频精品 | 亚洲一一在线 | 91看片视频 | 日韩精品一区二区三区视频播放 | 日韩在线 | 天天激情综合 | 看片一区 | 一区二区三区视频在线 | 亚洲国产视频一区二区 | 一区二区在线免费观看 | 午夜精品一区二区三区在线视频 | 日本特黄特色aaa大片免费 | 亚洲二区在线 | 日韩精品一区二区久久 | 国产亚洲网红主播 | 久久久久亚洲视频 | 69热视频在线观看 | 91日韩在线 | 成人高清在线 | 九九久久久 | 久久久一区二区 | 欧美视频精品 | 九九综合九九 | 国产高清一区二区三区 | 成人a视频片观看免费 | 欧美xxxx在线 | 激情小视频 | 99日韩 | www.日韩 | 噜久寡妇噜噜久久寡妇 | 国产福利91精品一区二区三区 | 欧美一区二区 | 91综合在线视频 | 一级片在线观看 | 成人欧美一区二区三区 | 午夜噜噜噜|

<noscript id="o08e2"></noscript>