在微調阿里巴巴的開源大模型Qwen2.57BInstruct時,我意外發現了一個令人震驚的現象:原本明確標識自己為“千問”的模型,在經過短時間微調后,居然聲稱自己是Anthropic的模型Claude。一個阿里推出的模型在微調后卻自稱為Anthropic的產品,確實讓人感到意外和疑惑。千問與Claude介紹Qwen(中文名:千問)是阿里巴巴推出的大語言模型,具有強大的多模態處理能力和指令跟隨能力,被廣泛用于各類生成任務。而Claude則是由Anthropic...
2025-06-06 07:13:23 790瀏覽 0點贊 0回復 0收藏
任務介紹本文使用一個簡單的數據集,展示大模型預訓練與有監督微調過程。無論是大模型的預訓練還是有監督微調,其損失值的計算過程都是與下一個要預測的詞計算損失。預訓練損失值的計算,即從第一個字開始每個字都與下一個字計算損失;有監督微調與預訓練唯一不同的點,便是不對指令與用戶的輸入文本計算損失,實際操作就是把用戶輸入文本在訓練過程中遮罩掉,把對應的label的值設置為100。這是因為不希望大模型學會,如何生成...
2025-06-06 07:05:23 824瀏覽 0點贊 0回復 0收藏
在使用大模型處理多跳問題(multihopquestion)時,我們常常面臨一個挑戰:原始問題可能不夠具體或缺乏關鍵實體信息,導致語義搜索系統難以準確檢索到相關答案。為了解決這個問題,現在大家常使用問題改寫,獲取深層次的知識。下述是一套有效的問題改寫提示詞(prompt),專門用于“問題改寫”階段,幫助模型生成更清晰、更具實體導向的新問題。這套提示詞經過實際測試,效果不錯。實驗效果qwen2.57B作為問題改寫的大模型。在ho...
2025-05-23 07:00:48 617瀏覽 0點贊 0回復 0收藏
論文閱讀該論文提出了一種知識圖譜提示(KGP)方法,以構建正確的上下文來提示LLMs進行MDQA,該方法包括一個圖構建模塊和一個圖遍歷模塊。在圖構建方面,創建了一個跨越多文檔的知識圖譜(KG),邊表示段落或文檔結構之間的語義詞匯相似性。在圖遍歷方面,我們設計了一個基于LLMs的圖遍歷代理,該代理在節點間導航并收集支持性段落,以幫助LLMs進行MDQA。所構建的圖作為全局規則器,調節段落之間的過渡空間并減少檢索延遲。同時...
2025-05-12 00:35:19 663瀏覽 0點贊 0回復 0收藏
簡介本文使用簡單的提示詞,可以在大部分場景中實現針對某開源模型的安全策略繞過。glm49bchat的安全措施還有待完善。上一代的6b比這一代的9B,要安全;上一代的6B大模型這一招沒有用。正常對話在下述正常互動環節中,開源大模型會拒絕回答用戶提出的不恰當問題。除了罵人,也可以做你能想到的其他事情,此處不做演示。所以你應該能夠猜到有多危險了??。繞過安全策略提示詞如下圖所示,使用簡單的幾句提示詞,即可實現輕松繞...
2025-04-25 06:23:19 2412瀏覽 0點贊 0回復 0收藏
背景在理解與學會了NaiveRAG的框架流程后,就很自然地關注到embedding模型,與問題相關的文本召回,也有很多論文在做這方面的創新。以前一直不知道embedding模型是如何微調出來的,一直聽說是微調BERT,但是不知道是怎么微調出來的。直到在B站上看到bge模型微調的視頻[參考資料4]才理解。于是便想著自己也微調出一個embedding模型。涉及到下面三個階段:數據集制作模型訓練評估微調實戰安裝包pipinstallUFlagEmbedding[finetune...
2025-04-14 01:31:07 1932瀏覽 0點贊 0回復 0收藏
簡介使用協程調用DeepSeek的API,發現效果并不明顯,沒有加速的效果。但如是本地部署DeepSeek,本地部署需要支持異步調用,我使用llamafactory部署,發現協程加速的效果還是很顯著的。代碼實戰調用官方APIDeepSeek官方文檔https:apidocs.deepseek.comzhcnpython的調用代碼如下,該調用方式為同步調用速度很慢。PleaseinstallOpenAISDKfirst:pip3installopenaifromopenaiimportOpenAIclientOpenAI(apikey"<DeepSeekAPIKey>",base...
2025-04-01 07:26:29 1764瀏覽 0點贊 0回復 0收藏
開源地址:???https:github.comJieShenAIcsdntreemain2502SFT?????train.ipynb???:模型有監督微調的代碼??infer.ipynb??:模型訓練完成后,進行推理的代碼\{'instruct':'請你給敖丙寫一首詩:','input':'碧海生龍子,云中舞雪霜。','label':'恩仇難兩忘,何處是家鄉?'}預訓練與有監督微調對比兩者的訓練數據,大部分都一模一樣,維度在label部分,SFT需要把指令部分的label設置為100。importjsonfromtypingimpo...
2025-03-20 09:38:46 1795瀏覽 0點贊 0回復 0收藏
開源地址:???https:github.comJieShenAIcsdntreemain2502SFT?????train.ipynb???:模型有監督微調的代碼??infer.ipynb??:模型訓練完成后,進行推理的代碼\\{'instruct':'請你給敖丙寫一首詩:','input':'碧海生龍子,云中舞雪霜。','label':'恩仇難兩忘,何處是家鄉?'}預訓練與有監督微調對比兩者的訓練數據,大部分都一模一樣,維度在label部分,SFT需要把指令部分的label設置為100。importjsonfromtypingimp...
2025-03-10 00:11:43 2140瀏覽 0點贊 0回復 0收藏
文本相似計算介紹有一些工作需要評估出兩個字符串之間的相似程度。比如,要評估大模型生成的結果,與預設定的答案之間的相似程度。本文介紹三類方法用于評估兩個字符串的相似程度:規則、向量、大模型裁判。規則:基于字符ngram的相似計算,常用算法,ROUGE、BLEU;向量:使用熱門的嵌入模型(Jina),把字符串編碼為向量,計算兩個向量之間的相似度;大模型裁判:使用大模型評估兩個字符串之間的相關性;摘要介紹了三種方法,評估...
2025-02-11 12:48:32 2564瀏覽 0點贊 0回復 0收藏
文本相似計算介紹有一些工作需要評估出兩個字符串之間的相似程度。比如,要評估大模型生成的結果,與預設定的答案之間的相似程度。本文介紹三類方法用于評估兩個字符串的相似程度:規則、向量、大模型裁判。規則:基于字符ngram的相似計算,常用算法,ROUGE、BLEU;向量:使用熱門的嵌入模型(Jina),把字符串編碼為向量,計算兩個向量之間的相似度;大模型裁判:使用大模型評估兩個字符串之間的相關性;摘要介紹了三種方法,評估...
2025-02-03 13:24:06 2776瀏覽 0點贊 0回復 0收藏
介紹使用LlamaFactory結合開源大語言模型實現文本分類:從數據集構建到LoRA微調與推理評估.https:blog.csdn.netsjxgghgarticledetails144290200在前一篇文章的文本分類評估中,已經介紹了主要的框架,故在大模型微調的流程框架方面本文不再贅述。實體數據集格式下述是實體識別評估的一條數據示例:{"prompt":"從以下政府文本中,提取指定的實體類別,并按照JSON格式輸出結果。xxx","predict":"\njson\n{\n\"行政區劃和地理實體\...
2025-01-17 11:51:37 2584瀏覽 0點贊 0回復 0收藏
介紹時隔已久的llamafactory系列教程更新了。本篇文章是第七篇,之前的六篇,大家酌情選看即可。因為llamafactory進行了更新,我前面幾篇文章的實現部分,都不能直接用了。我將為大家介紹如何使用llamafactoryLora微調模型、部署模型、使用python調用API。llamafactory安裝首先建議大家閱讀一遍兩份不錯的文章:官方readme:https:github.comhiyougaLLaMAFactoryblobv0.9.1READMEzh.md官方推薦的知乎教程:https:zhuanlan.zhihu....
2025-01-08 13:31:34 1.8w瀏覽 0點贊 0回復 0收藏
如果你關心前面的深度學習二分類的實戰代碼,可以參考下述官方的技術文檔:使用TrainerAPI微調模型.https:huggingface.colearnnlpcoursezhCNchapter33如果你剛接觸自然語言處理,huggingface是你繞不過去的坎。但是目前它已經被墻了,相信讀者的實力,自行解決吧。設置代理,如果不設置的話,那么huggingface的包無法下載;importosos.environ['HTTPPROXY']'http:127.0.0.1:7890'os.environ['HTTPSPROXY']'http:127.0.0.1:7890'...
2024-12-20 11:20:02 2526瀏覽 0點贊 0回復 0收藏
背景介紹本文將一步一步地,介紹如何使用llamafactory框架利用開源大語言模型完成文本分類的實驗,以LoRA微調qwenQwen2.57BInstruct為例。文本分類數據集按照alpaca樣式構建數據集,并在將其添加到LLaMAFactorydatadatasetinfo.json文件中。如此方便直接根據自定義數據集的名字,獲取到數據集的數據。[{"instruction":"","input":"請將以下文本分類到一個最符合的類別中。以下是類別及其定義:\n\n要求}}\nreason:\nlabel:","ou...
2024-12-11 10:37:31 6955瀏覽 0點贊 0回復 0收藏