微軟開源DeepSeek-R1無限制版：突破原本35萬屏蔽詞庫

昨天凌晨，微軟在官網開源了DeepSeek-R1的“無限制”版——MAI-DS-R1。

MAI-DS-R1 是由微軟人工智能團隊進行後訓練的DeepSeek-R1推理模型，旨在提升其在被屏蔽話題上的響應能力並優化風險狀況，同時保持原有的推理能力和競爭優勢。

MAI-DS-R1 成功解鎖了原R1模型大多數先前被屏蔽的查詢，並在相關安全基準測試中表現優於近期發佈的R1-1776模型。這些成果的取得同時保持了原有DeepSeek-R1模型的通用推理能力。

有些想體驗一下放飛自我版R1的小夥伴們可以試試這個，說不定可以打開全新的世界。

微軟在訓練 MAI-DS-R1 的過程中，從大約 350000 個被屏蔽的主題示例中，收集和篩選查詢關鍵詞，將這些關鍵詞轉化爲多個問題，並翻譯成不同語言。

還通過 DeepSeek R1 和內部模型爲這些問題生成答案和思維鏈。此外，訓練數據中還納入了來自Tulu3 SFT數據集的 110K 個安全和違規示例，這些示例涵蓋了 CoCoNot、WildJailbreak 和 WildGuardMix 等內容。

隨後，微軟對MAI-DS-R1進行了綜合評估。在敏感話題響應方面，MAI-DS-R1能夠成功響應99.3%的敏感話題提示，這一表現顯著優於DeepSeek R1和R1-1776。

在安全性評估方面，MAI-DS-R1在HarmBench評估中仍表現出色，相比DeepSeek R1和R1-1776，在減少有害內容方面降低了50%風險。這說明MAI-DS-R1雖然能響應更多的敏感話題，但仍然還是在安全控制範圍之內。

在推理能力方面，MAI-DS-R1保持了與DeepSeek R1相同的推理能力，在一般知識、推理、數學和編程基準測試中表現非常出色。

MAI-DS-R1在後訓練過程中將問題翻譯成多種語言，能夠更好地適應不同語言環境下的需求。這使得MAI-DS-R1在需要多語言支持的領域，如國際組織、跨國企業、教育機構等，能夠提供多語言的高質量回答。

目前，微軟已經在huggingface開源了該模型，同時在Azure AI Foundry進行了發佈。

huggingface地址：https://huggingface.co/microsoft/MAI-DS-R1

Azure地址：https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

更多遊戲資訊請關註：電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com

热门游戏

相關資訊 更多