成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法

發布于 2024-4-19 12:03
瀏覽
0收藏

如今,大型語言模型(LLM)已經成為了我們生活中的好幫手。


當用戶使用大模型時,模型首先會將輸入的內容拆分成一個個的詞元(token),通過分析這些詞元來生成答案,為我們解答疑惑、提供建議、翻譯外語、撰寫報告······但是,你能想象大模型也會出錯嗎?


想象一下,你正在使用最新款的智能手機,它快速、聰明、幾乎可以做任何你想要的事情。


但偶爾,你發現手機的一兩個按鍵不按常理出牌——比如說,你按下「S」,它偏偏跳出「E」,或者干脆點了沒反應,那估計用的時候就只想砸手機了。


大模型中存在一些故障詞元(glitch token),一個個本應協助模型流暢運行的小小詞元,偏偏要搞點小破壞。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

針對這個情況,由華中科技大學、南洋理工大學等高校聯合組成的研究團隊近日發表了一項研究,該工作已經被軟件工程領域國際頂級會議——FSE 2024接收。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

論文鏈接:??https://arxiv.org/abs/2404.09894??

項目鏈接:??https://sites.google.com/view/glitchhunter-fse2024/glitchhunter??


該研究是第一個關于故障詞元的全面研究,并且研究中針對故障詞元的檢測方法為減少大模型中與分詞(tokenizer)相關的錯誤提供了有意義的見解。


簡單來說,這項研究就像是在告訴我們:在大模型的世界里,有些小故障不僅僅是小插曲,它們可以大大影響模型的輸出質量。通過識別出這些故障,可以更好地理解和優化這些聰明但偶爾會犯糊涂的大型語言模型。


論文簡介

這篇工作中,作者首先提出了一個實證研究來了解故障詞元在大語言模型中的存在性與普遍性。作者調查了包括GPT-4,Llama-2在內的七種熱門的大模型,其中包含了三種不同的分詞器,總共分析了十八萬個不同的詞元。


作者要求大模型完成針對詞元的三個基礎且簡單的任務:復現,拼寫以及求長度。根據不同的詞元的完成情況,作者從完成形式上不能完成任務的詞元分為了如下圖所示的5個種類。在此基礎上,只要這個詞元不能夠完成以上的三個任務之一,他就會被標記為故障詞元。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

實證研究的第二個問題是對故障詞元的形式進行分類。這些詞元有些是不同單詞的組合,一些是無意義字母的堆疊,還有一些是單純的無意義的符號。作者通過人工標注的方法,將這些所有的故障詞元分為了表所示的5個種類。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

實證研究的第三個問題故障詞元在真實的數據集中的存在情況。作者研究了包括Alpaca,ShareGPT在內的用于大模型微調的主流數據集,發現在每個數據集中平均有2%以上的故障詞元。這說明了故障詞元在數據集中很普遍,而且很可能會影響到使用這些數據集進行微調的模型的效果。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

在實證研究中作者還發現,故障詞元在嵌入空間中有聚集效應,這便啟發作者可以通過聚類的算法來完成針對故障詞元的識別工作。

專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區

作者基于上述的發現構建了GlitchHunter,一種用于檢測大模型中故障詞元的自動化工具,主要依賴迭代聚類技術來識別潛在的故障詞元群組,整個檢測流程分為幾個步驟:


- 構建詞元嵌入圖(TEG, Token Embedding Graph):首先,GlitchHunter會構建一個包括所有詞元及其相應的嵌入向量的詞元嵌入圖,來展示所有詞元在嵌入空間中的位置和相互之間的關系。


- 候選聚類:接著,GlitchHunter在詞元嵌入圖上尋找緊密聚集的詞元,使用Leiden聚類算法形成潛在的故障詞元群組,這些詞元通常有相似的特征。


- 假設檢驗:在每個詞元群組內,GlitchHunter進行假設檢驗,通過分析群組內詞元的行為和輸出結果來找出群組內行為顯著偏離預期規范的詞元,確定哪些群組實際上包含故障詞元。


- 更新與迭代:選定包含故障詞元的群組后,這些詞元會被整合到一個更新的詞元嵌入圖中。隨后,GlitchHunter會繼續進行聚類和檢測,直到詞元嵌入圖不再經歷任何更新,即沒有新的故障詞元被發現。


專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區


通過這種方法,GlitchHunter能夠有效地在大數據集中快速定位并處理故障詞元,減少錯誤輸出,提高語言模型的整體質量和可靠性。


為了驗證GlitchHunter的效果,本文采用了幾項關鍵指標來比較GlitchHunter與幾種基線方法的性能,包括隨機抽樣、基于規則的隨機抽樣和K-means聚類。評估結果顯示,GlitchHunter在各個測試模型中普遍表現出色。


專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區


首先,GlitchHunter的真陽性率(True Positive Rate)顯著高于其他方法,這表明它在實際檢測到故障詞元的準確性方面表現優異。同時,其精確度(Precision)達到接近或等于100%,遠高于其他比較方法,這反映了其在識別故障詞元時的高精確性。


在召回率(Recall)方面,GlitchHunter同樣展現了較高的性能,有效地識別了大部分存在的故障詞元,確保了較少的遺漏。


專治大模型說胡話,精確率100%!華科等提出首個「故障token」檢測/分類方法-AI.x社區


此外,GlitchHunter相較于完整遍歷詞元表的方法,顯著減少了所需的時間和處理的詞元數量,展示了其在達到高性能的同時保持了較低的資源開銷。這些評估結果充分驗證了GlitchHunter在實際應用中提高LLM輸出質量和可靠性的潛力,證明了其作為故障詞元檢測工具的有效性和實用性。


未來工作

在這個工作中,作者完成了對故障詞元的系統性探究,但是對于故障詞元出現的原因以及如何進行修復并未進行過多的探討,而這也是進行故障詞元研究的終極目標:解決掉所有這樣的故障詞元,完善大語言模型對于每一個詞元的理解。

 

本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/Zj_Py4yrpwi_AKl-JeYS2A??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 夜夜骚| www.日韩系列 | 狠狠的干狠狠的操 | 国产精品视频综合 | 91中文| 国产亚洲精品精品国产亚洲综合 | 国产精品久久久久久久久免费丝袜 | 欧美亚洲视频在线观看 | 黄色一级网 | 精品日韩一区二区 | 男人天堂午夜 | 草草草网站 | 久久亚洲一区二区三区四区 | 中文字幕亚洲一区二区va在线 | 国产高清免费视频 | 久久久久久久国产精品影院 | 国产高清视频一区 | 国产视频线观看永久免费 | 日韩1区2区 | 国产精品资源在线 | 成人三级网址 | 国产精品久久久久久久久久久久久 | 一级h片| 国产精品一区二 | 亚洲成人av在线播放 | 97国产一区二区精品久久呦 | 亚洲综合色丁香婷婷六月图片 | 国内精品伊人久久久久网站 | 午夜av成人 | 精品国产乱码久久久久久1区2区 | 成人在线视频免费观看 | 精品久久久久一区二区国产 | 国产91久久精品一区二区 | 日韩中文字幕一区 | 老司机午夜性大片 | av在线电影网 | 亚洲精品字幕 | 99精品99 | www狠狠爱com| 欧美一级久久 | 免费观看的黄色网址 |