成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Prompt都不需要了,動動手就能玩多模態對話系統,iChat來啦!

人工智能
與現有依賴純語言的交互系統不同,iChat 通過加入指向指令,顯著提高用戶與聊天機器人之間的交流效率。此外,作者還提供了一個名為哈士奇(Husky)的大型視覺語言模型,可以進行 capture 和視覺問答,在僅用 70 億參數的情況下,也能給 GPT-3.5-turbo 留下深刻印象。

夕小瑤科技說 原創
 作者 | 智商掉了一地

近日有很多團隊基于用戶友好的 ChatGPT 進行再創作,其中不乏有比較亮眼的成果。InternChat工作強調了用戶友好性,這是通過超越語言的方式(光標與手勢)與聊天機器人交互來進行多模態任務的。InternChat 的命名也比較有趣,代表著互動(interaction)、非語言(nonverbal)和聊天機器人(chatbots),可以簡稱為iChat。與現有依賴純語言的交互系統不同,iChat 通過加入指向指令,顯著提高用戶與聊天機器人之間的交流效率。此外,作者還提供了一個名為哈士奇(Husky)的大型視覺語言模型,可以進行 capture 和視覺問答,在僅用 70 億參數的情況下,也能給 GPT-3.5-turbo 留下深刻印象。

不過由于 Demo 網站過于火爆,團隊官方暫時關停了體驗頁面,咱們先通過下面這個視頻來了解這項工作內容吧~

論文題目:
InternChat: Solving Vision-Centric Tasks by Interacting with Chatbots Beyond Language

論文鏈接:
https://arxiv.org/abs/2305.05662

Demo 地址:
https://ichat.opengvlab.com/

項目地址:
https://github.com/OpenGVLab/InternChat/

系統主要特點

作者在項目首頁上提供了一些任務截圖,可以直觀地看到這個交互系統的一些功能與效果:

(a)移除遮蓋的對象

圖片


(b)交互式圖像編輯

圖片

(c)圖像生成

圖片

(d)交互式視覺問答

圖片

(e)交互式圖像生成

圖片

(f)視頻高光解釋

圖片

論文速覽

這里首先介紹本文中提及的兩個概念:

  • 以視覺為中心的任務:為了讓計算機能夠理解它們從世界中看到的內容并做出相應反應。
  • 非語言指令形式的交流:光標和手勢之類的指向動作。

圖片

▲圖1 iChat 的整體架構

iChat 結合指向和語言指令的優勢來執行以視覺為中心的任務。如圖 1 所示,這個系統由 3 個主要組件組成:

  1. 處理圖像或視頻上指向指令的感知單元;
  2. 具有可以準確解析語言指令的輔助控制機制的 LLM 控制器;
  3. 集成 HuggingFace 各種在線模型、用戶訓練的私人模型以及其他應用(如計算器、搜索引擎)的開放世界工具包。

它可以在 3 個層級上有效運行,分別是:

  1. 基礎交互;
  2. 語言引導的交互;
  3. 指向-語言增強的交互。

由此,如圖 2 所示,當純語言的系統無法完成任務時,該系統仍可以成功執行復雜的交互任務。

圖片

▲圖2 指向-語言驅動的交互系統優勢

實驗

首先我們來看,同時結合語言和非語言指令來提升用于與交互系統之間的溝通效果。為了證明這種混合模式與單純語言指令相比的優點,研究團隊進行了一個用戶調查。參與者與 Visual ChatGPT 和 iChat 聊天,并反饋他們的使用感受。表 1 和 2 的結果表明,iChat 比 Visual ChatGPT 更高效且對用戶友好。

圖片

▲表1 “移除某物”的用戶調查

圖片

▲表2 “用某物代替某物”的用戶調查

小結

不過,目前該系統仍存在著一些局限性,包括了:

  • iChat 的高效性在很大程度上取決于其底層開放源代碼模型的質量和準確性。然而,這些模型可能存在一些局限或偏見,進而對 iChat 的性能造成不利影響。
  • 隨著用戶交互變得更加復雜或實例數量增多,系統需要維護準確性和響應時間,這對于 iChat 來說可能具有挑戰性。
  • 此外,當前的視覺和語言基礎模型之間缺乏可學習的協作,例如缺乏被指令數據調整的功能。
  • iChat 可能會在應對訓練數據之外的新穎或不常見情況時遇到困難,導致性能受到影響。
  • 在不同設備和平臺上實現無縫集成可能會面臨挑戰,因為硬件能力、軟件限制和可訪問性要求各不相同。

在項目主頁列出的計劃清單上,目前還有幾項目標尚未達成,其中就有小編每次在新的對話系統上都要體驗的中文交互,目前該系統應該還是暫不支持中文問題,不過這貌似沒辦法,由于多模態數據集多是基于英文的,英漢互譯較為浪費線上資源和處理時間,估計漢化之路還是需要一段時間的。

責任編輯:武曉燕 來源: 夕小瑤科技說
相關推薦

2015-05-05 14:50:21

Python不需要操作系統

2021-12-28 18:31:33

人工智能AI開發

2024-02-22 09:00:00

LogitMat數據集算法

2009-02-11 09:30:36

數據復制硬盤拷貝硬盤復制器

2021-11-25 08:16:46

Wi-FiWi-Fi 6路由Wi-Fi 5

2022-04-21 08:01:34

React框架action

2017-03-13 13:54:40

戴爾

2015-08-12 17:08:15

慧聰電子網

2012-08-23 09:50:07

測試測試人員軟件測試

2021-03-04 05:43:24

APP退稅教程熱點推薦

2009-11-23 12:45:22

2022-05-02 08:30:46

網絡Wi-Fi

2024-08-09 12:46:53

模型訓練

2018-05-29 10:01:31

2015-09-30 09:57:53

天分熱情工程師

2010-05-07 10:28:52

Linux系統

2015-08-20 10:56:19

算法界面開發

2013-12-02 09:43:29

字符串編程

2022-09-14 15:10:40

前端架構

2013-07-18 09:21:32

代碼文檔
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久激情视频 | 天天色天天 | 一区二区三区电影在线观看 | 亚洲精品www久久久久久广东 | 狠狠爱网址 | 99热.com| 一区二区三区久久 | 黑人巨大精品 | 成人av播放 | 中国美女一级黄色片 | 欧美成人一区二区 | 国产精品亚洲综合 | 国产精品国产精品国产专区不卡 | 成人精品一区二区三区 | 亚洲精品久久久久中文字幕二区 | 国产一区二区三区四 | 美国十次成人欧美色导视频 | 色吊丝在线 | 午夜精品一区二区三区在线观看 | 成人区一区二区三区 | 亚洲国产成人精品女人久久久 | 美国av毛片 | 久久一区二区av | 99热在线观看精品 | 成人免费视频网 | 欧美一级片在线观看 | 成人久久网 | 亚洲一区二区三区在线视频 | 国产精品91视频 | 国产精品无码专区在线观看 | 欧美午夜在线 | 亚洲精彩视频 | 在线激情视频 | 日韩欧美中文在线 | 久久精品视频网站 | 国产一区二区在线视频 | 欧美日韩视频网站 | 国产精品一卡二卡三卡 | 精品久久一区 | 欧美福利 | 国产亚洲网站 |