成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

管提需求,大模型解決問題:圖表處理神器SheetCopilot上線

人工智能 新聞
各位表格大師終于可以跟那些繁瑣的手動操作說再見了!近日,一款名叫 SheetCopilot 的智能體橫空出世,讓每個人只需要發號施令就可實現流暢的表格操控。

這種絲滑的操作流程簡直是職場人的福音!

圖片

近日,來自中科院自動化所、港理工等機構的研究者們造出了一個「表格 AI 助手」SheetCopilot,該智能體能根據用戶指令生成操縱表格的解決方案并在特定軟件(如:Excel、GoogleSheets 等)上執行。SheetCopilot 可以快速連接多款表格處理軟件,且支持多表操作、圖表繪制和數據透視表生成,有望賦能多個領域的表格數據處理和可視化,并向實現通才智能助手邁出關鍵一步。

圖片

網站:https://sheetcopilot-demo.github.io/

論文:https://arxiv.org/abs/2305.19308

讓我們首先通過以下示例來感受 SheetCopilot 如何顯著提升工作效率。

假如你是一個剛入職小白,有一天老板要求你幫他分析銷售數據。你拿到表格一看,上千行的數據眼花繚亂,一時不知從何下手,于是你邊查邊做。

首先,你嘗試采用把各 Product 名稱提取出來,然后用公式對各 Product 的收入求和。

圖片

搞了二十多分鐘,SUMIF 一直報”#NAME?”的錯誤,遂放棄。

繼續上網搜索,發現還有數據透視表(Pivot table)這么方便的工具,于是開始第二次挑戰。

圖片

又花了二十多分鐘,終于搞定。整個過程將近一個小時,效率不如人意。以后每次老板交個你新的表格處理任務,你之前的經驗派不上用場,又得從頭開始邊查網站邊做: (。

你的同事則使用 SheetCopilot,伸個懶腰的工夫就把各種奇怪的要求都完成了: )。

圖片

看到 SheetCopilot 如此絲滑,你也簡單嘗試了一下,畫個圖不在話下。

圖片

有了 SheetCopilot,你再也不用把鼠標滑過半張桌子的距離來選中超出屏幕的數據了,輕松讓上千行數據在多張表之間輾轉騰挪。

圖片

為什么提出 SheetCopilot

長久以來,人們一直渴望擁有即使沒有專業經驗也能熟練掌握復雜軟件的能力。許多人都曾遇到過這樣的情況:不知如何操作 PhotoShop 的繁瑣界面,想要分析數據卻不知道數據透視表這一高級功能,想要繪制齒輪卻對 Solidworks 一無所知。

隨著具有強大語言理解和生成能力的大型語言模型(LLM)的出現,這個愿景比以往任何時候都更接近現實。如果能夠引導 LLM 掌握各種軟件,就能夠釋放出 LLM 幾乎無限的潛能,進而讓人類的生產力達到前所未有的高度。

這篇文章指出電子表格(Spreadsheet)是進行這項研究的理想基礎,因為它是一種常見的多功能生產工具。然而,表格操控面臨著多樣化的挑戰,用戶難以掌握足夠的表格處理和編程技巧以應對變化多端的任務需求。

如果有一種通才 AI 智能體,它掌握豐富的軟件操控技能,那么不僅辦公效率能得到極大提升,企業產出也會大大加快。SheetCopilot 的出現正好契合了人們這樣的遠景。

SheetCopilot 有哪些亮點

1. 覆蓋表格處理的典型需求

SheetCopilot 涵蓋了表格操作的幾乎所有典型任務,可以出色地完成各式圖表生成任務。

圖片

銷售數據分析

圖片

實驗圖表繪制

圖片

復雜公式計算

圖片

應用條件格式

2. 超越基于 VBA 的方法

SheetCopilot 優于用GPT-3.5 生成 VBA 代碼并執行的方法,生成的解決方案的顯著優于后者(見下圖),這使得 SheetCopilot 有望成為數據處理人員未來強大的 AI 輔助工具。

圖片

不僅如此,相比于晦澀的 VBA 代碼,SheetCopilot生成的解決方案包含通俗易懂的步驟,這免去了學習新編程語言并艱難調試的痛苦。

圖片

左圖:冗長的 VBA 代碼;右圖:SheetCopilot簡單易懂的解決方案。

3. 舒適的使用體驗

SheetCopilot 在網絡連接穩定的情況下,僅需約 10 步多表組合操作,即可在上千行數十列的表格中快速完成任務。這不僅解放了用戶疲憊的雙眼,還節省了查找網站并逐個嘗試操作步驟所浪費的時間,同時也避免了學習 VBA 的成本。

圖片

方法原理

這篇文章將表格操控所需的核心功能抽象為一組虛擬 API(稱為原子操作,見下圖),用于生成解決方案,作為 LLM 與應用軟件之間交互的橋梁。

圖片

最簡單的方法是對 LLM 的一次查詢(query)生成一個任務的所有步驟。然而,隨著任務復雜度的增加,后序步驟更加依賴前序步驟的執行結果,導致這種開環控制難以得到正確結果。例如,如果無法確定篩選后可見數據的位置,LLM 就難以確定操作范圍。

為了實現高效的閉環控制,SheetCopilot 根據軟件狀態反饋和外置原子操作知識庫優化解決方案,提升了成功率和效率。

如何評測

該文提出了一個高質量評測基準。該基準的任務具有多樣化的表述,并涉及豐富的原子操作,如下面詞云所示:

圖片

此基準采用了如下有關成功率的指標(越高越好):

  • Exec@1:生成的任務解決方案的執行成功率。
  • Pass@1:任務通過率,即執行后能匹配上任意參考答案的解決方案的占比。

此基準還考慮如下效率指標(越低越好):

  • A50:將符合任務要求的解決方案的步數除以參考答案最少步數,然后對所有計算結果取中位數。
  • A90:計算方式同上,但取所有計算結果的 90 分位數。該指標反映動作數的極值分布。

實驗結果

圖片

表 1:在 SheetCopilot 數據集上對比 GPT-3.5-Turbo、GPT-4、Claude 以及生成 VBA 的方法。

不出意料,GPT-4 符合任務要求的解決方案占比最高且效率最優,而 GPT-3.5-Turbo 則緊隨其后,Claude 最次但也接近 GPT-3.5-Turbo。

一個值得關注的結果是,與將用戶指令翻譯成 VBA 代碼并在 Excel 上執行的方法對比,SheetCopilot 取得了非常出色的成功率。這意味著 SheetCopilot 讓軟件智能控制離我們又近了一大步,讓不會編程的用戶能以日常交流的方式指揮計算機完成繁雜的工作。

我們再通過下面各個細分類別上的指標來看一看這三個 LLM 各自的優缺點。

圖片

GPT-3.5 和 GPT-4 輕而易舉地解決了 Management(排序、篩選等表格管理操作)和 Entry & manipulation(數據輸入與操縱)這兩類任務,均取得了 100% 可執行率。此外,三個 LLM 在不同任務類別中各自表現出最佳效率,這一有趣的發現表明每個 LLM 都有其獨特的優勢,GPT-4 也難以完勝其它模型。

結語

SheetCopilot 借助 LLM成功地將感知、推理和決策通過文字接口構成了一個閉環,實現高效的電子表格操控,促進智能軟件控制更上一層樓,也為對通才智能體感興趣的研究者帶來了新的靈感。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2015-12-31 14:06:55

UCloud

2010-01-06 10:08:57

2014-12-26 10:23:21

谷歌

2013-03-20 09:54:07

2022-07-13 08:53:28

函數Go語言

2020-10-30 09:17:34

游戲軟件天天閃退報錯

2010-05-06 17:07:34

Unix命令

2013-01-30 15:07:59

Shell

2011-06-29 18:02:58

Qt 中文 翻譯

2022-09-02 16:07:02

團隊問題

2019-09-10 14:07:08

CIO不審批信息化系統

2017-12-14 11:23:06

大數據CIO數據

2009-07-28 12:35:37

querystring

2009-08-13 17:25:18

C# Convert類

2010-05-06 17:13:18

Unix命令

2011-06-30 14:16:25

QT 中文 亂碼

2009-12-28 14:15:06

ADO連接

2012-10-31 10:47:05

VMware

2019-06-10 09:00:17

軟件跨平臺框架

2016-06-15 10:08:29

云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: a级免费视频 | 精品少妇一区二区三区日产乱码 | 在线看亚洲 | 国产精品片| 国产伦精品一区二区三区在线 | 亚洲国产一区在线 | 久久国产精品视频免费看 | 精品视频 免费 | 妞干网福利视频 | 波多野结衣一区二区三区 | 午夜视频精品 | 免费看91 | 国产精品欧美一区二区三区不卡 | 亚洲成人免费 | 欧美一级二级在线观看 | 精品国产乱码久久久久久88av | 亚洲一区二区视频 | 手机av在线| 日韩精品一区二区三区在线播放 | 日韩高清国产一区在线 | 国产不卡在线观看 | 久久久成人免费视频 | 日韩免费视频 | 九九久久免费视频 | 91av在线电影 | 91在线电影| 天天躁日日躁aaaa视频 | 农村妇女毛片精品久久久 | 国产精品99久久久久久宅男 | 久久久蜜桃 | 日本精品视频在线 | 99精品久久久 | 亚洲黄色视屏 | 欧一区 | 国产美女在线观看 | 免费观看国产视频在线 | 国产美女自拍视频 | 国产精品一区久久久 | 日本久久网 | 91精品国产综合久久久久久丝袜 | 一区二区三区视频在线观看 |