成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效

發布于 2024-6-19 13:03
瀏覽
0收藏

大型語言模型(LLMs)在自然語言理解和生成方面表現出色,但面對現實世界問題的多樣性和復雜性,單一靜態方法的推理能力有限。現有的推理技術,如思維鏈(Chain-of-Thoughts)、思維樹(Tree-of-Thoughts)等,雖然在特定任務上有所提升,但未能在不同任務中持續實現最佳性能。

人類在認知過程中通過元推理(meta-reasoning)動態調整策略,以高效分配認知資源。受此啟發,提出了元推理提示(Meta-Reasoning Prompting, MRP),以賦予LLMs類似的適應性推理能力。

元推理提示(Meta-Reasoning Prompting,簡稱MRP)的示意圖,以及與標準推理和傳統推理方法的比較差異。

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

MRP如何工作?

  • 評估階段:模型先看看有哪些解題方法可用,然后根據問題的特點,評估哪種方法可能最有效。
  • 選擇階段:模型根據評估結果,選擇最合適的解題方法。
  • 應用階段:使用選定的方法來解決問題。

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

通過使用多個廣泛使用的基準測試評估MRP的有效性,結果表明MRP在不同任務中的表現達到或接近最佳狀態。MRP特別擅長需要結合不同推理策略的任務,在更大的模型如GPT-4中表現尤為出色。

使用GPT4進行的實驗:使用元推理提示(Meta-Reasoning Prompting)與其他獨立方法在基準測試上的性能比較。加粗表示最佳性能,下劃線表示次佳性能。


微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

(a) 不同基準測試上的方法比較顯示,引導大型語言模型(LLM)動態選擇適當的推理方法,使元推理提示(MRP)在所有任務中持續實現更好的性能。(b) 將特定推理方法應用于所有基準測試的算術平均和調和平均性能表明,MRP在總體評估中始終表現卓越。

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

在GSM8K基準測試上的方法性能

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

微軟研究院MRP:大模型動態選擇最佳解題策略的元推理提示,比CoT、ToT更有效-AI.x社區

Meta Reasoning for Large Language Models
https://arxiv.org/pdf/2406.11698

本文轉載自??PaperAgent??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 久久久女| 狠狠躁18三区二区一区 | 国产精品99久久久久久久vr | 精品一区二区免费视频 | 中文字幕亚洲精品 | 天天影视网天天综合色在线播放 | 久久精品一级 | 国产一区久久 | 一区二区三区四区在线视频 | 日韩精品在线免费观看 | 九九九国产 | 九九在线精品视频 | 日韩免费一区二区 | 欧美午夜精品 | 欧美成视频 | 91天堂| 亚洲一区在线日韩在线深爱 | 亚洲国产黄 | 日日摸日日爽 | 黄色大片免费观看 | 大象视频一区二区 | 色桃网 | 久久久精品视频一区二区三区 | 成人午夜电影网 | 欧美一级黄 | 天天草天天爱 | 国产高清视频 | 国产乱码精品1区2区3区 | 成人午夜激情 | 日韩一区二区三区视频 | 欧美成视频 | 日韩一区二区三区在线播放 | 国产98在线 | 免费, | 欧美视频网 | 欧美在线日韩 | 久久久精品一区二区三区 | 91资源在线 | 香蕉婷婷 | 毛片在线看片 | 激情av网站 | 亚洲第一网站 |