OpenAI:DeepSeek使用了我们的模型进行训练

最近,中国的人工智能企业DeepSeek推出了一款性价比极高的AI模型,其性能与OpenAI的旗舰产品不相上下,这一消息在全球引起了广泛关注。然而,OpenAI对此表示质疑,认为这些模型可能是基于他们的数据进行开发的。

据彭博社报道,OpenAI和微软正在调查DeepSeek是否通过OpenAI的API将OpenAI的AI模型整合到DeepSeek自有的模型中。在2024年末,微软的安全研究人员发现,大量数据通过OpenAI开发者账户被导出。据称,这些账户与DeepSeek有关联。

OpenAI 向《金融时报》表示,他们发现了DeepSeek使用“蒸馏”技术的证据。

模型蒸馏(Model Distillation)是一种知识迁移技术,旨在将一个复杂的大模型(教师模型)的知识传递给一个较小的模型(学生模型)。这种方法不仅能显著减少模型的复杂性,还能在保持高预测性能的同时降低计算资源的需求。模型蒸馏最早由Hinton等人在2015年提出,并在计算机视觉、自然语言处理等领域取得了显著的成功。

这种技术能够以远低于OpenAI训练GPT-4所花费的1亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过OpenAI的API将其AI技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。不过,OpenAI 并未透露其发现的具体证据细节。

TheVerge 称,这充满了讽刺意味,毕竟 OpenAI自身也曾通过大规模抓取网络上的文字信息(未经许可)来推动其GPT模型的发展。

OpenAI 在一份声明中表示:“我们深知,中国等国家的公司以及其他一些企业一直在试图蒸馏美国领先AI公司的模型。作为AI领域的领军者,我们采取了反制措施来保护我们的知识产权,这包括在发布模型时谨慎选择哪些前沿功能可以包含在内。我们相信,未来与美国政府密切合作,以防止对手和竞争对手窃取美国技术,保护最先进的模型,是至关重要的。”

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com