大型科技公司,如微軟支持的OpenAI和谷歌一直在使用其他公司在線上所創作的內容,對他們的生成式AI模型進行訓練,而無需徵得特定許可,同時禁止使用自己的內容來訓練其他AI模型。這引發了一場即將決定網絡未來及如何在這個新世界中應用版權法的激烈法律爭戰。Reddit和其他公司正進行抵制,在Reddit中宣佈計劃開始收費提供其數據訪問。OpenAI的CEO正在研究尊重版權的新AI模型,而一些出版商則敦促科技公司支付使用費來訓練其AI模型。
Samuel Altman(OpenAI首席執行官)於2023年5月16日在華盛頓特區參加了美國參議院司法委員會隱私、技術與法律小組委員會的聽證會。
在新一代生成式AI時代,大型科技公司在使用在線內容方面遵循着“說教而不踐行”的策略。
微軟支持的OpenAI、谷歌以及谷歌支持的Anthropic這些公司多年來一直在使用各個公司創作的在線內容訓練他們的生成式AI模型。這是在沒有明確請求許可的情況下進行的,它是一個正在醞釀中的法律戰鬥,將決定網絡的未來以及如何在這個新世界中套用版權法。
科技行業可能會辯稱他們的做法屬於合理使用。這個問題尚未確定。然而,這些大型科技公司不會允許其他人使用自己的內容來訓練其他AI模型。那麼,爲什麼他們應該允許這樣對待其他人呢?
看看Claude(Anthropic的AI助手)的服務條款:
“您不得以以下方式訪問或使用服務,如果這些限制與可接受使用政策不一致或與之存在歧義,那麼可接受使用政策爲準:用於開發與我們的服務競爭的任何產品或服務, 包括開發或訓練任何人工智能或機器學習算法或模型。”
這是谷歌生成式AI使用條款的一部分摘錄:
“您不得使用服務來開發機器學習模型或相關技術。”
下面是OpenAI的使用條款中的相關部分。這是支持ChatGPT的公司。
“您不得……使用服務的輸出來開發與OpenAI競爭的模型。”
這些公司並不愚蠢,但他們是僞善的
這些公司並不愚蠢。他們知道,優質的內容對於訓練新的AI模型至關重要。所以,他們不允許自己的產出這樣被使用是有道理的。
但是,爲什麼其他任何網站或公司會允許這些科技巨頭自由地使用它們的內容來訓練他們的模型呢?
週五,Insider向OpenAI、谷歌和Anthropic發表評論。截至發稿時,他們尚未回應。
Reddit等其他公司表示已經夠了
其他公司剛剛開始意識到正在發生的事情,他們對此感到不滿。多年來,Reddit一直被用於AI模型的訓練,現在該公司計劃開始收費,讓用戶訪問其數據。
Reddit的首席執行官Steve Huffman表示:“Reddit的數據語料庫非常有價值。但我們不需要免費將所有這些價值給一些世界上最大的公司。”
今年4月,埃隆·馬斯克指責OpenAI的主要支持者微軟非法使用Twitter的數據訓練AI模型。他在推特上寫道:“訴訟時刻到了。”
當被要求對此發表評論時,一位微軟發言人在一封發給Insider的電子郵件中表示:“這個前提有很多問題,我甚至不知道從哪裏開始。”
OpenAI的首席執行官Sam Altman正在努力對這個問題更加深思熟慮,研發更尊重版權的新型AI模型。“我們正在嘗試開發新的模型,以便當AI系統使用您的內容,或者使用您的風格時,您可以獲得相應的報酬。”最近,他在接受Axios採訪時表示。
包括Insider在內的出版商在這裏有既得利益。有些出版商,如新聞集團等,已經要求科技公司支付使用他們的內容訓練AI模型的費用。
當前AI模型的訓練方式破壞了網絡
前微軟高管Steven Sinofsky認爲,目前AI模型的訓練方式是錯誤的,它“破壞了”互聯網。
他在推特上說:“過去,允許抓取數據是爲了交換點擊。但現在,抓取只是用來訓練模型,而創作者/版權持有人永遠得不到任何價值。”Insider請他發表評論,但週五他在旅行中無法回應。
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com