本文對基于適配器的可遷移推薦系統進行了實驗探索和深入研究。發現在文本推薦方面,基于適配器的可遷移推薦取得了有競爭力的結果;在圖像推薦方面,基于適配器的可遷移推薦略落后于全量微調。后續本文對四種著名的適配器微調方法進行了基準測試,并深入研究了可能影響適配器微調在推薦任務中的幾個關鍵因素。論文題目:ExploringAdapterbasedTransferLearningforRecommenderSystems:EmpiricalStudiesandPracticalInsights論文鏈...
2024-03-28 14:27:29 2982瀏覽 0點贊 0回復 0收藏
論文題目:PoSE:EfficientContextWindowExtensionofLLMsviaPositionalSkipwiseTraining論文鏈接:https:arxiv.orgabs2309.10400代碼鏈接:https:github.comdwzhupkuPoSE一、研究簡介大型語言模型(LLMs)通常有一個預定義的上下文窗口大小,這限制了它們在長輸入的場景中的使用。為了使LLMs適應更長的輸入,通常需要用目標長度的樣本對其進行微調(全長微調),由此導致訓練成本十分昂貴。舉例來說,在PositionalInterpolation[...
2024-03-28 14:15:43 3144瀏覽 0點贊 0回復 0收藏
最近在大型視覺語言模型(LVLMs)上的進展使得語言模型能夠處理多模態輸入,但這需要顯著的計算資源,特別是在端側設備上進行部署。本研究旨在通過采用高質量訓練數據,彌合傳統規模LVLMs與輕量版本之間的性能差距。為此,我們利用GPT4V構建了一個高質量的合成數據集,包含(1)具有詳細文本描述的圖文對;和(2)復雜的推理指令和詳細的答案。利用該訓練數據,我們訓練了一個輕量級的多模態模型ALLaVA3B,在同量級的LVLMs的12...
2024-03-28 13:52:55 2658瀏覽 0點贊 0回復 0收藏
美團、浙大等于近日推出了MobileVLMV2,其中包含參數量1.7B、3B、以及7B的一系列視覺語言模型。代碼與模型以及適配的端側推理方案都已開源。論文地址:https:arxiv.orgabs2402.03766模型地址:https:huggingface.comtgv代碼地址:https:github.comMeituanAutoMLMobileVLM大模型涌向移動端的浪潮愈演愈烈,作為第一個針對端側的視覺語言模型的工作,歸功于MobileVLM在小參數量下的強大性能和完善的端側實時運行端側推理方案,Mob...
2024-03-28 13:48:15 6104瀏覽 0點贊 0回復 0收藏
隨著大語言模型在現實場景中逐漸落地(例如ChatGPT和Gemini),其生成內容的安全性也開始逐漸被大眾關注。通常來講,我們希望大模型避免生成包含危險內容的回復,從而減少對用戶的不良影響,因此評測一個大模型的安全性并分析其弱點成為了一件急需完成的事情。上海人工智能實驗室研究團隊提出了新的大模型安全BenchmarkSALADBench。相比以往的Benchmarks,SALADBench有以下優勢:包含三個層次結構,數量超2萬條的大規模分類數據...
2024-03-28 13:15:09 5158瀏覽 0點贊 0回復 0收藏
引言可控文本生成(ControlledTextGeneration,CTG)是大語言模型(LargeLanguageModels,LLMs)文本生成的一個重要研究領域,旨在創造出符合特定標準或屬性的文本。這包括調整文本的情緒傾向、確保內容安全性、或滿足具體主題要求等。目前CTG實現的主流方式是結合有監督微調(SupervisedFineTuning,SFT)和人類反饋強化學習(ReinforcementLearningfromHumanFeedback,RLHF)的范式,通過直接改變模型參數以適應特定的輸出要求。...
2024-03-28 13:07:08 3225瀏覽 0點贊 0回復 0收藏
單目動態場景(MonocularDynamicScene)是指使用單眼攝像頭觀察并分析的動態環境,其中場景中的物體可以自由移動。單目動態場景重建對于理解環境中的動態變化、預測物體運動軌跡以及動態數字資產生成等任務至關重要。隨著以神經輻射場(NeuralRadianceField,NeRF)為代表的神經渲染的興起,越來越多的工作開始使用隱式表征(implicitrepresentation)進行動態場景的三維重建。盡管基于NeRF的一些代表工作,如DNeRF,Nerfies,Kp...
2024-03-28 13:02:41 2983瀏覽 0點贊 0回復 0收藏