OpenAI 表示它已经发现证据表明, DeepSeek 使用Open AI的专有模型来训练自己的开源竞争对手,再度引起人们对可能侵犯知识产权的担忧。
OpenAI指控中国AI初创公司DeepSeek涉嫌通过"模型蒸馏"技术违规使用其专有模型训练开源竞品,引发知识产权侵权争议。据OpenAI向《金融时报》提供的证据,该技术通过提取大模型输出数据优化小模型性能,虽属行业常规操作,但用于开发竞争性模型则违反其服务条款。
知识蒸馏是一种机器学习技术,目的是将预先训练好的大型模型(即 "教师模型")的学习成果转移到较小的 "学生模型 "中。
OpenAI内部人士指出争议核心在于"从平台提取数据用于自建模型",该公司拒绝对证据细节置评,但其服务条款明确禁止"复制服务"及"利用输出开发竞争性模型"。深度求索发布的R1推理模型以极低成本达到美国顶尖模型水平,引发市场震动:英伟达股价周一因AI硬件投资担忧暴跌17%市值蒸发5890亿美元,周二随科技股反弹回升9%。
据直接知情人士透露,OpenAI与合作伙伴微软去年已对疑似深度求索(DeepSeek)的账户展开调查,发现其通过OpenAI的API接口进行涉嫌违反服务条款的模型蒸馏操作,随即封禁相关访问权限。该调查由彭博社率先披露,但微软与OpenAI拒绝对技术细节置评,有关公司亦未予回应。
有关人员在福克斯新闻指控称,DeepSeek涉嫌通过"模型蒸馏"技术提取OpenAI模型知识,该技术通过复用大模型输出来训练小模型实现性能跃升。虽未提供具体证据,但其认为OpenAI已掌握相关实证。毕竟在于Deepseek公布的V3模型训练数据——仅用2048块英伟达H800显卡、560万美元即完成6700亿参数模型训练,成本仅为OpenAI/谷歌同级模型的零头。有专家分析其输出特征,认为可能设计违规使用GPT-4数据,伯克利AI研究者证实行业普遍存在利用ChatGPT输出训练竞品的行为。
行业研究者指出,通过复用ChatGPT等商业大模型的输出来"免费"获取人类反馈数据已成普遍策略,Deepseek若采用同类方法一样面临取证难题。OpenAI在最新声明中承认,防范竞争对手"蒸馏"其顶尖模型是持续挑战,已采取模型能力分级释放等反制措施。讽刺的是,OpenAI自己也是官司缠身,自身正面临《纽约时报》等机构指控其未经授权使用版权内容训练模型的多起诉讼,形成"加害者-受害者"双重身份。
该新闻下的评论:
评论也是很有意思,普遍对OpenAI这种行为为之不屑
这种事情可以简单理解为openAI是一个大强盗,洗劫了全世界的数据财富,并拍卖了输出了模型,而deepseek是个小偷,偷走了openAI从全世界洗劫的数据财富中最宝贵的一些,加以包装,卖出了比openAI更高的价值
毫无疑问,Open是凶手也是受害人,至于deepseek,偷 小偷 的 小偷是小偷吗?
原文链接:
https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com