Meta因未经授权下载盗版电子书用于AI训练被起诉，涉及高达81.7TB数据

 作者：软荐小编  2025-02-09 21:01:09  97

据媒体报道，一本书作者针对梅塔提起诉讼，指责该公司未经授权下载大量的盗版电子书来培训其AI模型。

最新的泄漏电子邮件显示，meta承认下载有争议的大数据集Libgen，其中包括数千万的盗版书籍。

为训练AI不择手段！me<em></em>ta被曝下载数十TB盗版电子书

根据法院文件，meta通过一个名为“ Anna's Archive”的渠道下载了至少81.7TB的数据，其中包括来自著名的海盗网站Z-Library和Libgen的至少35.7TB的内容。梅塔还被指控以前是从Libgen下载了额外的80.6TB数据。

作者指出，meta的行为构成了非法的电子书库种子下载，这一数字可能是其盗版冰山的尖端。

作者估计，这些盗版的电子书图书馆只能占梅塔（meta）盗版总部的0.008％，这表明梅塔（meta）的盗版可能远远超出了当前揭示的范围。

该电子邮件还表明，元员工还知道其行为的法律风险。 2023年4月，元研究工程师尼古拉·巴什利科夫（Nikola Bashlikov）在一封电子邮件中说：“在公司的笔记本电脑下使用BT感到不合适。” 。”

到2023年9月，巴什科夫加强了抗议活动并咨询了法律团队。他指出，洪流的使用意味着“播种”文件，即向外界共享内容，这是不允许的。

但是meta仍然决定继续，并试图通过将数据集下载到非meta服务器来避免被追踪的风险。

为训练AI不择手段！me<em></em>ta被曝下载数十TB盗版电子书

7个月卖车3.55万