微軟開源DeepSeek-R1無限制版:突破原本35萬屏蔽詞庫

昨天凌晨,微軟在官網開源了DeepSeek-R1的“無限制”版——MAI-DS-R1。

MAI-DS-R1 是由微軟人工智能團隊進行後訓練的DeepSeek-R1推理模型,旨在提升其在被屏蔽話題上的響應能力並優化風險狀況,同時保持原有的推理能力和競爭優勢。

MAI-DS-R1 成功解鎖了原R1模型大多數先前被屏蔽的查詢,並在相關安全基準測試中表現優於近期發佈的R1-1776模型。這些成果的取得同時保持了原有DeepSeek-R1模型的通用推理能力。

有些想體驗一下放飛自我版R1的小夥伴們可以試試這個,說不定可以打開全新的世界。

微軟在訓練 MAI-DS-R1 的過程中,從大約 350000 個被屏蔽的主題示例中,收集和篩選查詢關鍵詞,將這些關鍵詞轉化爲多個問題,並翻譯成不同語言。

還通過 DeepSeek R1 和內部模型爲這些問題生成答案和思維鏈。此外,訓練數據中還納入了來自Tulu3 SFT數據集的 110K 個安全和違規示例,這些示例涵蓋了 CoCoNot、WildJailbreak 和 WildGuardMix 等內容。

隨後,微軟對MAI-DS-R1進行了綜合評估。在敏感話題響應方面,MAI-DS-R1能夠成功響應99.3%的敏感話題提示,這一表現顯著優於DeepSeek R1和R1-1776。

在安全性評估方面,MAI-DS-R1在HarmBench評估中仍表現出色,相比DeepSeek R1和R1-1776,在減少有害內容方面降低了50%風險。這說明MAI-DS-R1雖然能響應更多的敏感話題,但仍然還是在安全控制範圍之內。

在推理能力方面,MAI-DS-R1保持了與DeepSeek R1相同的推理能力,在一般知識、推理、數學和編程基準測試中表現非常出色。

MAI-DS-R1在後訓練過程中將問題翻譯成多種語言,能夠更好地適應不同語言環境下的需求。這使得MAI-DS-R1在需要多語言支持的領域,如國際組織、跨國企業、教育機構等,能夠提供多語言的高質量回答。

目前,微軟已經在huggingface開源了該模型,同時在Azure AI Foundry進行了發佈。

huggingface地址:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com