Open AI称有证据表明DeepSeek使用其专有模型训练

OpenAI 表示它已经发现证据表明， DeepSeek 使用Open AI的专有模型来训练自己的开源竞争对手，再度引起人们对可能侵犯知识产权的担忧。

OpenAI指控中国AI初创公司DeepSeek涉嫌通过"模型蒸馏"技术违规使用其专有模型训练开源竞品，引发知识产权侵权争议。据OpenAI向《金融时报》提供的证据，该技术通过提取大模型输出数据优化小模型性能，虽属行业常规操作，但用于开发竞争性模型则违反其服务条款。

知识蒸馏是一种机器学习技术，目的是将预先训练好的大型模型（即 "教师模型"）的学习成果转移到较小的 "学生模型 "中。

OpenAI内部人士指出争议核心在于"从平台提取数据用于自建模型"，该公司拒绝对证据细节置评，但其服务条款明确禁止"复制服务"及"利用输出开发竞争性模型"。深度求索发布的R1推理模型以极低成本达到美国顶尖模型水平，引发市场震动：英伟达股价周一因AI硬件投资担忧暴跌17%市值蒸发5890亿美元，周二随科技股反弹回升9%。

据直接知情人士透露，OpenAI与合作伙伴微软去年已对疑似深度求索（DeepSeek）的账户展开调查，发现其通过OpenAI的API接口进行涉嫌违反服务条款的模型蒸馏操作，随即封禁相关访问权限。该调查由彭博社率先披露，但微软与OpenAI拒绝对技术细节置评，有关公司亦未予回应。

有关人员在福克斯新闻指控称，DeepSeek涉嫌通过"模型蒸馏"技术提取OpenAI模型知识，该技术通过复用大模型输出来训练小模型实现性能跃升。虽未提供具体证据，但其认为OpenAI已掌握相关实证。毕竟在于Deepseek公布的V3模型训练数据——仅用2048块英伟达H800显卡、560万美元即完成6700亿参数模型训练，成本仅为OpenAI/谷歌同级模型的零头。有专家分析其输出特征，认为可能设计违规使用GPT-4数据，伯克利AI研究者证实行业普遍存在利用ChatGPT输出训练竞品的行为。

行业研究者指出，通过复用ChatGPT等商业大模型的输出来"免费"获取人类反馈数据已成普遍策略，Deepseek若采用同类方法一样面临取证难题。OpenAI在最新声明中承认，防范竞争对手"蒸馏"其顶尖模型是持续挑战，已采取模型能力分级释放等反制措施。讽刺的是，OpenAI自己也是官司缠身，自身正面临《纽约时报》等机构指控其未经授权使用版权内容训练模型的多起诉讼，形成"加害者-受害者"双重身份。