成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性

發(fā)布于 2025-3-4 10:28

瀏覽

0收藏

一、概述

title：You Truly Understand What I Need : Intellectual and Friendly Dialogue Agents grounding Knowledge and Persona

論文地址：https://aclanthology.org/2022.findings-emnlp.75/

代碼地址：https://github.com/dlawjddn803/INFO

1.1 Motivation

以前的研究將知識(shí)或個(gè)人資料混合融入預(yù)先訓(xùn)練的語言模型。其同時(shí)考慮知識(shí)和人物角色的能力仍然是有限的，導(dǎo)致生成結(jié)果出現(xiàn)幻覺，并且使用人物角色的方法也很被動(dòng)。

1.2 Methods

提出一種有效的agent，同時(shí)基于外部知識(shí)和persona來生成回復(fù)。
選擇合適的知識(shí)和persona生成回答，利用poly-encoder的方法來實(shí)現(xiàn)候選打分。
實(shí)施了人物角色級(jí)別指標(biāo)，以考慮微妙的人物角色基礎(chǔ)的多種人物角色選擇。
利用檢索的方式來增強(qiáng)query，其包含知識(shí)-角色的增強(qiáng)信息，使其生成的回復(fù)少幻覺，多參與性。

總結(jié)：

1）先計(jì)算persona和knowledge的分?jǐn)?shù)

2）選擇合適的persona+knowledge

3）結(jié)合2+query，利用faiss檢索相近的paragraphs

4）生成更具信息量，更多參與度的responses。

1.3 Conclusion

提出了INFO (Intellectual and Friendly dialOg agents)，在persona-knowledge chat數(shù)據(jù)集自動(dòng)評(píng)估m(xù)etrics上取得sota。
人工評(píng)估也顯示其少幻覺，多參與性。
相對(duì)于之前的檢索器件retrievers，證明了我們r(jià)etrievers的有效性，也比較了multiple candidate scoring的方法。

1.4 limitation

缺乏真實(shí)的知識(shí)和persona候選，導(dǎo)致在現(xiàn)實(shí)環(huán)境不可用。
評(píng)估幻覺的cases數(shù)量還比較少。
需要高的GPU計(jì)算資源（ since it marginalizes loss at the token level ）

二、大綱

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性 -AI.x社區(qū)

三、詳細(xì)內(nèi)容

3.1 整體架構(gòu)圖

主旨思想：利用對(duì)話歷史信息，挖掘出最相近的背景信息，然后利用該信息檢索出更多額外知識(shí)，進(jìn)而提高生成結(jié)果的質(zhì)量。

U：人類和機(jī)器的歷史對(duì)話數(shù)據(jù)。

cand：每個(gè)候選，感覺是knowledge的候選 or persona的候選，目的是排序后選擇分?jǐn)?shù)最高的。

KPEQ（knowledge persona enhanced query）：增強(qiáng)后的query

Retriever（Non parameters）：非參數(shù)的，相當(dāng)于是檢索出相關(guān)文檔，輔助額外的知識(shí)來提升回復(fù)效果。

3.2 語義檢索效果比較:相對(duì)于bi-encoder雙塔和cross-encoder，poly這種交互模式效果最好

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性 -AI.x社區(qū)

3.3 實(shí)驗(yàn)結(jié)果

Generation：生成效果評(píng)估

Grounding：persona和knowledge分類預(yù)測(cè)的精度（挑選分?jǐn)?shù)最高的persona和knowledge的精度嗎？）

RAG：token級(jí)別生成效果好，sequence級(jí)別分類效果好

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性 -AI.x社區(qū)

3.4 人工評(píng)估：效果碾壓其他的

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性 -AI.x社區(qū)

3.5 實(shí)驗(yàn)設(shè)置

LMEDR對(duì)話模型：引入自然語言推理數(shù)據(jù)提升對(duì)話模型的連貫性和一致性 -AI.x社區(qū)

本文轉(zhuǎn)載自??PaperWeekly??，作者：胡翔 ??NLP ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

揭秘大語言模型的判斷一致性挑戰(zhàn)

zhangyannni ? 5548瀏覽 ? 0回復(fù)
拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3

duhorse ? 2910瀏覽 ? 0回復(fù)
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 5826瀏覽 ? 0回復(fù)
人工智能的一致性推理悖論

xuxiangda ? 3515瀏覽 ? 0回復(fù)
多智能體大模型協(xié)作中的角色不一致性：一致性、虛構(gòu)性和模仿性

xuxiangda ? 3470瀏覽 ? 0回復(fù)
小紅書開源StoryMaker：個(gè)性化圖像生成模型，實(shí)現(xiàn)角色一致性與背景變化的完美結(jié)合

angel ? 7223瀏覽 ? 0回復(fù)
人工智能與人類情感的交匯點(diǎn)：一致性評(píng)估方法的探索

xuxiangda ? 6166瀏覽 ? 0回復(fù)
中科大重磅開源StableV2V：專注于「人機(jī)交互一致性」的視頻編輯方法

angel ? 2913瀏覽 ? 0回復(fù)
字節(jié)&上交&北大開源StoryTeller：生成一致性高的長視頻描述

angel ? 2753瀏覽 ? 0回復(fù)
RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗

大模型自然語言處理 ? 2804瀏覽 ? 0回復(fù)
推進(jìn)可解釋性自然語言生成（NLG）：技術(shù)、挑戰(zhàn)和應(yīng)用

51CTO內(nèi)容精選 ? 3057瀏覽 ? 0回復(fù)
即插即用，無縫集成各種模型，港科大&螞蟻等發(fā)布Edicho：圖像編輯一致性最新成果！

angel ? 2527瀏覽 ? 0回復(fù)
艾倫圖靈研究所最新成果：多智能體博弈中的可糾正性和一致性

xuxiangda ? 3380瀏覽 ? 0回復(fù)
對(duì)話數(shù)據(jù)合成：清華利用多Agent合成大量醫(yī)療對(duì)話數(shù)據(jù)顯著提升LLM在醫(yī)療場景效果

arnoldzhw ? 2764瀏覽 ? 0回復(fù)
技術(shù)前沿：CHASE-SQL與XiYan-SQL，解鎖自然語言與數(shù)據(jù)庫對(duì)話的奧秘！

Halo咯咯 ? 1718瀏覽 ? 0回復(fù)
多模態(tài)MLLM都是怎么實(shí)現(xiàn)的—如何保持text2video的連續(xù)一致性

熵減AI ? 1122瀏覽 ? 0回復(fù)
字節(jié)提出一致性視頻生成方法Phantom：通過跨模態(tài)對(duì)齊生成主題一致的視頻，超多應(yīng)用場景

AIGCStudio ? 895瀏覽 ? 0回復(fù)
給 Cursor 也裝上 Memory Bank，節(jié)省包月請(qǐng)求，提高代碼一致性

凝固的雨_1 ? 1217瀏覽 ? 0回復(fù)
清華GenWorld：用“物理一致性”讓虛假視頻無處遁形！

zhangyannni ? 819瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

NVIDIA（ProRL）｜RL到底能不能提升LLM的推理上限？ 2天前發(fā)布
ACL25 | DOLPHIN，Closed-loop Auto-research系統(tǒng)來幫你自動(dòng)做科研了！ 2025-06-13 06:42:33發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實(shí)測(cè)來了 0回復(fù)

上一篇：小而美！1B模型如何通過測(cè)試時(shí)優(yōu)化逆襲405B LLM？

下一篇：利用LLM做論文review到哪一步了？來看看DeepReview吧！

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：天堂av中文| 久久国产一区 | 国产午夜精品一区二区三区四区 | 性欧美hd| 欧美一级二级视频 | 在线观看www高清视频 | 国产精品免费av | 欧美国产在线一区 | av中文字幕网站 | 国产精品久久久久久久久久久久久 | 日韩在线xx| 99久久久久久久久 | 午夜理伦三级理论三级在线观看 | 国产精品欧美大片 | 国产伦精品一区二区三区在线 | 午夜a√ | jlzzjlzz国产精品久久 | 久久久91精品国产一区二区三区 | 国产精品日韩欧美一区二区 | 亚洲精品成人在线 | 欧美色人 | 中文字幕日韩欧美一区二区三区 | 日本在线黄色 | 日韩欧美在线播放 | 亚洲国产精品久久久久 | 无码日韩精品一区二区免费 | 日本一区二区三区四区 | 中文在线一区二区 | 日本一二区视频 | 亚洲成人在线视频播放 | 国产成人精品一区二区三区在线 | 成人网视频 | 久久天堂网 | 亚洲a视频 | 日韩在线免费 | 国产日韩欧美在线 | 羞羞视频在线观看免费观看 | 国产色在线| 亚洲一区二区av在线 | av片在线观看网站 | 免费在线观看一区二区三区 |