OpenAI 表示它已經發現證據表明, DeepSeek 使用Open AI的專有模型來訓練自己的開源競爭對手,再度引起人們對可能侵犯知識產權的擔憂。
OpenAI指控中國AI初創公司DeepSeek涉嫌通過"模型蒸餾"技術違規使用其專有模型訓練開源競品,引發知識產權侵權爭議。據OpenAI向《金融時報》提供的證據,該技術通過提取大模型輸出數據優化小模型性能,雖屬行業常規操作,但用於開發競爭性模型則違反其服務條款。
知識蒸餾是一種機器學習技術,目的是將預先訓練好的大型模型(即 "教師模型")的學習成果轉移到較小的 "學生模型 "中。
OpenAI內部人士指出爭議核心在於"從平臺提取數據用於自建模型",該公司拒絕對證據細節置評,但其服務條款明確禁止"複製服務"及"利用輸出開發競爭性模型"。深度求索發佈的R1推理模型以極低成本達到美國頂尖模型水平,引發市場震動:英偉達股價週一因AI硬件投資擔憂暴跌17%市值蒸發5890億美元,週二隨科技股反彈回升9%。
據直接知情人士透露,OpenAI與合作伙伴微軟去年已對疑似深度求索(DeepSeek)的賬戶展開調查,發現其通過OpenAI的API接口進行涉嫌違反服務條款的模型蒸餾操作,隨即封禁相關訪問權限。該調查由彭博社率先披露,但微軟與OpenAI拒絕對技術細節置評,有關公司亦未予回應。
有關人員在福克斯新聞指控稱,DeepSeek涉嫌通過"模型蒸餾"技術提取OpenAI模型知識,該技術通過複用大模型輸出來訓練小模型實現性能躍升。雖未提供具體證據,但其認爲OpenAI已掌握相關實證。畢竟在於Deepseek公佈的V3模型訓練數據——僅用2048塊英偉達H800顯卡、560萬美元即完成6700億參數模型訓練,成本僅爲OpenAI/谷歌同級模型的零頭。有專家分析其輸出特徵,認爲可能設計違規使用GPT-4數據,伯克利AI研究者證實行業普遍存在利用ChatGPT輸出訓練競品的行爲。
行業研究者指出,通過複用ChatGPT等商業大模型的輸出來"免費"獲取人類反饋數據已成普遍策略,Deepseek若採用同類方法一樣面臨取證難題。OpenAI在最新聲明中承認,防範競爭對手"蒸餾"其頂尖模型是持續挑戰,已採取模型能力分級釋放等反制措施。諷刺的是,OpenAI自己也是官司纏身,自身正面臨《紐約時報》等機構指控其未經授權使用版權內容訓練模型的多起訴訟,形成"加害者-受害者"雙重身份。
該新聞下的評論:
評論也是很有意思,普遍對OpenAI這種行爲爲之不屑
這種事情可以簡單理解爲openAI是一個大強盜,洗劫了全世界的數據財富,並拍賣了輸出了模型,而deepseek是個小偷,偷走了openAI從全世界洗劫的數據財富中最寶貴的一些,加以包裝,賣出了比openAI更高的價值
毫無疑問,Open是兇手也是受害人,至於deepseek,偷 小偷 的 小偷是小偷嗎?
原文鏈接:
https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com