Open AI稱有證據表明DeepSeek使用其專有模型訓練

OpenAI 表示它已經發現證據表明， DeepSeek 使用Open AI的專有模型來訓練自己的開源競爭對手，再度引起人們對可能侵犯知識產權的擔憂。

OpenAI指控中國AI初創公司DeepSeek涉嫌通過"模型蒸餾"技術違規使用其專有模型訓練開源競品，引發知識產權侵權爭議。據OpenAI向《金融時報》提供的證據，該技術通過提取大模型輸出數據優化小模型性能，雖屬行業常規操作，但用於開發競爭性模型則違反其服務條款。

知識蒸餾是一種機器學習技術，目的是將預先訓練好的大型模型（即 "教師模型"）的學習成果轉移到較小的 "學生模型 "中。

OpenAI內部人士指出爭議核心在於"從平臺提取數據用於自建模型"，該公司拒絕對證據細節置評，但其服務條款明確禁止"複製服務"及"利用輸出開發競爭性模型"。深度求索發佈的R1推理模型以極低成本達到美國頂尖模型水平，引發市場震動：英偉達股價週一因AI硬件投資擔憂暴跌17%市值蒸發5890億美元，週二隨科技股反彈回升9%。

據直接知情人士透露，OpenAI與合作伙伴微軟去年已對疑似深度求索（DeepSeek）的賬戶展開調查，發現其通過OpenAI的API接口進行涉嫌違反服務條款的模型蒸餾操作，隨即封禁相關訪問權限。該調查由彭博社率先披露，但微軟與OpenAI拒絕對技術細節置評，有關公司亦未予回應。

有關人員在福克斯新聞指控稱，DeepSeek涉嫌通過"模型蒸餾"技術提取OpenAI模型知識，該技術通過複用大模型輸出來訓練小模型實現性能躍升。雖未提供具體證據，但其認爲OpenAI已掌握相關實證。畢竟在於Deepseek公佈的V3模型訓練數據——僅用2048塊英偉達H800顯卡、560萬美元即完成6700億參數模型訓練，成本僅爲OpenAI/谷歌同級模型的零頭。有專家分析其輸出特徵，認爲可能設計違規使用GPT-4數據，伯克利AI研究者證實行業普遍存在利用ChatGPT輸出訓練競品的行爲。

行業研究者指出，通過複用ChatGPT等商業大模型的輸出來"免費"獲取人類反饋數據已成普遍策略，Deepseek若採用同類方法一樣面臨取證難題。OpenAI在最新聲明中承認，防範競爭對手"蒸餾"其頂尖模型是持續挑戰，已採取模型能力分級釋放等反制措施。諷刺的是，OpenAI自己也是官司纏身，自身正面臨《紐約時報》等機構指控其未經授權使用版權內容訓練模型的多起訴訟，形成"加害者-受害者"雙重身份。