Nightshade用向圖像“投毒”的方法以阻止AI訓練並幫助保護藝術家

週五,芝加哥大學的研究團隊發佈了一篇研究論文,描述了"Nightshade"這一數據投毒技術。該技術旨在破壞AI模型的訓練過程,MIT Technology Review和VentureBeat對此進行了報道。其目標是幫助視覺藝術家和出版商防止其作品被用於訓練如Midjourney、DALL-E 3和Stable Diffusion等生成性AI圖像合成模型。

芝加哥大學稱其爲"毒藥"的開源工具能夠在對人類不可見的方式下修改圖像,進而破壞AI模型的訓練。許多圖像合成模型主要使用從互聯網抓取的圖像數據集,這些數據集可能包含未經藝術家許可的受版權保護的材料。OpenAI從Shutterstock獲取了其DALL-E訓練圖像的一部分許可。

AI研究者們依賴於從互聯網抓取的數據,這一做法被許多人視爲倫理上的難題。爲了創建Stable Diffusion這樣的模型,需要整個互聯網的圖像及其註釋,這樣才能構建一個具有足夠多樣性的數據集。從成本和時間上看,爲數億圖像進行註釋是不現實的。擁有大型圖像數據庫的公司,如Getty和Shutterstock,在使用經過許可的訓練數據時具有優勢。

加利福尼亞大學伯克利分校圖書館等研究機構主張,爲研究和教育目的,應將AI訓練中的數據抓取視爲合理使用。這一做法還未得到美國法院的明確裁決,而監管機構正在就相關立法徵求意見。但Nightshade團隊認爲,研究和商業用途完全不同,他們希望他們的技術能迫使AI訓練公司獲得圖像數據的許可、遵循爬蟲限制並尊重退出請求。

芝加哥大學教授Ben Y. Zhao表示:“這個工具的意義在於爲模型訓練者和內容創作者之間提供一個平衡。目前,模型訓練者完全佔據上風。目前能夠限制爬蟲的手段只有退出列表和不爬取的指令,這些都是基於AI公司的自覺,而且沒有可驗證或可執行的手段。此工具是首個讓內容所有者能對未經授權的模型訓練產生實質性影響的工具。”

Shawn Shan、Wenxin Ding、Josephine Passananti、Haitao Zheng和Zhao在芝加哥大學計算機科學系合作開發了Nightshade。該工具是基於他們之前的Glaze工作,Glaze是一個能夠以方式修改數字藝術品來混淆AI的工具。而Nightshade則更進一步,通過破壞訓練數據來混淆AI。例如,研究者使用此工具修改了狗的圖像,使AI模型在試圖生成狗的圖像時,卻生成了貓。Nightshade會微妙地修改圖像,使其對人類看起來依然是原圖,但在AI模型中,該圖像同時包含原始概念和投毒概念,這使得基於這些數據的模型訓練出現誤差。

研究者使用開源的Stable Diffusion模型測試了此工具。當模型處理了50個被投毒的圖像後,它開始生成帶有扭曲特徵的狗的圖像。當處理了100個樣本後,模型生成了貓而非狗。到了300個樣本,生成的貓圖像近乎完美。如VentureBeat所述,由於生成型AI模型的工作原理,Nightshade還能夠使模型在接收到與“husky”、“puppy”和“wolf”等詞彙相關的提示時,生成貓的圖像。

抵禦Nightshade數據投毒技術可能對AI開發者來說是一個挑戰。這些改變的像素不易被人眼檢測,甚至對軟件數據抓取工具來說也難以識別。所有已被用於訓練的被投毒圖像需要被檢測並移除,受影響的AI模型可能也需重新訓練。

儘管芝加哥大學的研究人員承認他們的工具可能被惡意使用,他們強調主要目標是重新平衡藝術家的權力。Glaze項目團隊在社交平臺X上通過一系列帖子詳細闡述了Nightshade的目標,強調了“AI公司與內容所有者之間荒謬的權力不對稱”。此外,趙在他的賬戶上寫道:“Nightshade的目的不是破壞模型,而是阻止未經授權的數據訓練,並鼓勵使用合法授權內容進行訓練。對於遵守退出選項並不進行數據抓取的模型,影響微乎其微或不存在。”

像Nightshade這樣的技術發展可能引發一場研究人員間的競賽,一方旨在保護人類創造性作品免受AI吸收,另一方則尋求滿足其數據飢渴的模型。資源更豐富的大公司最終可能能夠找到對策來應對Nightshade,但預算較低的小公司和開源項目可能會受到更大的影響。

即便如此,對於一些藝術家來說,沒有他們的許可,任何人都不應使用他們的作品來訓練AI模型。當週一Nightshade的消息傳開後,一些直言不諱的藝術家開始在社交媒體上公開慶幸新工具的潛力。一位名爲Katria Raden的插畫家在X平臺上發帖說:“AI界的人士聽說了這一消息,他們很沮喪……他們之前是怎麼對我們說的?‘適應或死亡’?‘你不能阻止技術進步’嗎?”這引發了一系列支持和反對AI的激烈討論。

值得注意的是,公司和研究人員早就抓取了未經投毒的藝術作品,因此對他們已下載到設備上的內容(或現有AI圖像生成器)來說,已無法產生影響。然而,如果Nightshade技術被廣泛使用——且若沒有新技術迅速擊敗它——那麼未來吸收新的藝術風格和記錄當前事件的攝影作品可能會受到影響。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com