微軟開源DeepSeek-R1魔改版:響應99%敏感提示,風險降50%
今天凌晨,微軟在官網開源了DeepSeek-R1魔改版MAI-DS-R1,在保留原有推理性能的基礎上進行了大幅度增強。
尤其是在響應和屏蔽詞方面有了顯著改進:MAI-DS-R1可以響應99.3%的敏感話題提示,比原版R1提升了2倍,這對于政治學術研究、社會問題、倫理道德研究等幫助巨大;
但在安全風險大幅度降低,比原版R1降低了50%。那些想體驗一下“放飛自我”版R1的小伙伴們可以試試這個,非常有意思打開全新世界。
開源地址:??https://huggingface.co/microsoft/MAI-DS-R1??
Azure地址:??https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml??
微軟在訓練 MAI-DS-R1 的過程中,從大約 350000 個被屏蔽的主題示例中,收集和篩選查詢關鍵詞,將這些關鍵詞轉化為多個問題,并翻譯成不同語言;
還通過 DeepSeek R1 和內部模型為這些問題生成答案和思維鏈。此外,訓練數據中還納入了來自Tulu3 SFT數據集的 110K 個安全和違規示例,這些示例涵蓋了 CoCoNot、WildJailbreak 和 WildGuardMix 等內容。
隨后,微軟對MAI-DS-R1進行了綜合評估。在敏感話題響應方面,MAI-DS-R1能夠成功響應99.3%的敏感話題提示,這一表現顯著優于DeepSeek R1和R1-1776。
在安全性評估方面,MAI-DS-R1在HarmBench評估中表現出色,相比DeepSeek R1和R1-1776,在減少有害內容方面降低了50%風險。這說明雖然MAI-DS-R1能響應更多的敏感話題,但還是在安全控制范圍之內。
在推理能力方面,MAI-DS-R1保持了與DeepSeek R1相同的推理能力,在一般知識、推理、數學和編程基準測試中表現非常出色。
在倫理和法律標準方面,MAI-DS-R1在處理非法或不道德的請求時表現得更加謹慎,拒絕生成有害或不當的內容。
此外,MAI-DS-R1在后訓練過程中將問題翻譯成多種語言,能夠更好地適應不同語言環境下的需求。這使得MAI-DS-R1在需要多語言支持的領域,如國際組織、跨國企業、教育機構等,能夠提供多語言的高質量回答。
目前,微軟已經在huggingface開源了該模型,同時在Azure AI Foundry進行了發布。
本文轉自 AIGC開放社區 ,作者:AIGC開放社區
原文鏈接:??https://mp.weixin.qq.com/s/gQ9LA6lWevmw32aJ8Ck0Pg??
