Meta否认使用大人视频训练AI:员工他爹干的

这年头,AI圈里这些大厂八卦的娱乐性真是越来越高了。


继“Sora 偷日本版权内容被集体起诉”和“Midjourney 被控偷艺术家画作训练”之后,这回轮到了 Meta。

罪名有点难蚌:偷偷下黄片来训练 AI。


起诉方由美国两家老牌成人电影公司牵头——Strike 3 Holdings 和 Counterlife Media(你经常会在某黑黄色 Hub 网站上看到他们的视频)。

他们说,从 2018 年起,Meta 用 BitTorrent 下载了 2396 部成人电影,用来训练自家的 AI 模型。


包括视频生成器 Meta Movie Gen,还有 LLaMA 那些大模型。


要赔多少钱?


算下来 3.59 亿美元,每部片子 15 万。


这价,,,这边个人建议 Meta 可以自己成立个部门专门来拍片,这样成本还低一点。


案件还在审理,目前 Meta 作出的最新回应也很“风骚”:


我们没下片,根据我们的内部调查,那是某位员工爸爸下的。

具体说法是这样的:


Meta 提交了驳回动议,称这些视频“数量太少,不足以训练 AI”,并且其中一些下载行为来自“某位承包商父亲的家庭 IP 地址”,与公司无关。


换句话说,不是我干的,是我爹(员工老爹:爹也不能这么坑啊)。


这理由一出,先不说别的,社区倒是笑嘻了。

再说回案件。


最早是 Strike 3 和 Counterlife 跟踪到了 47 个与 Meta 有关的 IP 地址,而这些地址,从 2018 年到 2025 年,一直在稳定地下载并播种他们家的成人影片。

还不是普通人那种“偶尔下载”,而是高频、长时段、分辨率多版本同步下载。


行为模式非常像机器在干活。


他们用 MaxMind 做了地理定位,发现其中一个 IP 地址属于 Facebook 的公司网络,还有几个落在员工家里。


看上去像是公司内部搞了几台服务器专门干这个事,连员工家里的 Wi-Fi 都变成了数据入口。


这下,Meta 想装作“不知道”恐怕就有点难...


为什么偏偏是色情片?


Strike 3 的律师解释得一本正经。


他们说,这些影片画质高、镜头长、动作自然、情绪真实、对话连贯、场景变化少。
用来训练 AI 模型,尤其是生成视频的模型——再合适不过。

但鄙人认为👆这个才是更合适的解释。

拍摄太快的电视剧不行,人物太多的综艺不行,网红视频也太乱。


只有成人电影能提供长镜头的、连续的、以人为核心的自然运动数据。


换句话说,这是训练视频生成模型的黄金素材。


你要训练 AI 学“人怎么动、怎么说话、怎么表情连贯”,


那这类视频是最直观的样本。


问题是,这些片子,Meta 没付版权。


而是从 BT 网络上下载的,,如果你不懂 BT,那我说用x雷下片,我想在座的各位没几个不懂吧?

这背后暴露出的,是整个 AI 行业的灰色套路,也是整个计算机行业的一个潜规则:


训练数据太贵,合法买不起,就先偷。


等被发现,再和解。

OpenAI、Stability、Google、Meta,哪个不是这么干的?


只不过这次,Meta 碰上了一个专门靠打官司赚钱的版权公司(这也是为什么这些公司这么好心在某黑黄色 Hub 网站上免费放片的原因之一)。


Strike 3 每年打几千起诉讼案,光靠寄律师函收和解费就能年入几千万美元。


对他们来说,抓这种大公司可比拍片赚钱多了。


这场官司,就像一场哲学讨论。


到底什么算“训练素材”?


AI 模型吞下的数据,能不能包含版权内容?


当模型在生成画面时,它算不算“再创作”?

这些问题没人敢回答。


更滑稽的是——Meta 不是第一次被抓。


早在 2023 年,它就承认自己用 BT 等途径,从大量非法渠道(其实就是盗版)下载了海量的书籍内容来训练 LLaMA(其中包括 zlib)。

那次是“文学艺术”;这次是“动作片”。


方向不同,本质一样。


AI 的胃口越来越大,什么都能吃。


小说、音乐、新闻、影像,只要能喂进去,它都要。


而行业的逻辑也很简单:谁先喂到足够多的数据,谁就赢。


所以,Meta 被告的真正尴尬,不在于“看了黄片”,而是他们根本分不清自己喂了什么给模型。


AI 模型吃进去的内容没人能追溯。


公司内部的人大概率都不知道哪些文件被纳入了训练集。


就像有人半夜开了个下载脚本,第二天数据就自动进了仓。

而这正是整个 AI 领域的危险点:


当“数据来源不透明”成为常态,没人能分清模型到底学了什么、用了谁的作品。


今天是成人电影公司告你,明天可能是医院、出版商、新闻社。


再往后,说那啥点是个人都可以告你。

也许有人会笑 Meta 离谱,但殊不知其手机上的云服务,上传到社交平台的照片、部分公开群的聊天记录等,都被厂商在你几乎没有察觉的情况下,拿来训练。


所有的便利,都在一开始的“用户协议”里就标注好了价格。


它可能没恶意,可它确实在看、在听、在记。


这起官司闹得再大,也不过是冰山一角。


我们在讨论 Meta,却其实是在讨论整个行业的底线。


AI 靠什么学?靠谁的数据?要不要征得同意?


这些问题迟早要被摆上桌面。


只不过,这次是靠“2396 部片子”帮大家提了个醒。


Meta 目前还没作出什么很正式的具体回应或者对策,也许在准备技术解释,也许在等法院判,也许干脆在等大家忘。但不管结果怎样,这个问题迟早要被解决。


技术在前跑,法律在后追。

我只希望,下次 AI 再被曝“看片训练”等类似事件时。


Meta或者别的什么能不能别把你老爹推出来挡枪?


我是 CyberImmortal,关注我们,带你畅游AI世界!


更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com