引言可控文本生成(ControlledTextGeneration,CTG)是大語言模型(LargeLanguageModels,LLMs)文本生成的一個重要研究領域,旨在創造出符合特定標準或屬性的文本。這包括調整文本的情緒傾向、確保內容安全性、或滿足具體主題要求等。目前CTG實現的主流方式是結合有監督微調(SupervisedFineTuning,SFT)和人類反饋強化學習(ReinforcementLearningfromHumanFeedback,RLHF)的范式,通過直接改變模型參數以適應特定的輸出要求。...