发布信息

Meta因未经授权下载盗版电子书用于AI训练被起诉,涉及高达81.7TB数据

作者:软荐小编      2025-02-09 21:01:09     88

据媒体报道,一本书作者针对梅塔提起诉讼,指责该公司未经授权下载大量的盗版电子书来培训其AI模型。

最新的泄漏电子邮件显示,meta承认下载有争议的大数据集Libgen,其中包括数千万的盗版书籍。

为训练AI不择手段!me<em></em>ta被曝下载数十TB盗版电子书

根据法院文件,meta通过一个名为“ Anna's Archive”的渠道下载了至少81.7TB的数据,其中包括来自著名的海盗网站Z-Library和Libgen的至少35.7TB的内容。梅塔还被指控以前是从Libgen下载了额外的80.6TB数据。

作者指出,meta的行为构成了非法的电子书库种子下载,这一数字可能是其盗版冰山的尖端。

作者估计,这些盗版的电子书图书馆只能占梅塔(meta)盗版总部的0.008%,这表明梅塔(meta)的盗版可能远远超出了当前揭示的范围。

该电子邮件还表明,元员工还知道其行为的法律风险。 2023年4月,元研究工程师尼古拉·巴什利科夫(Nikola Bashlikov)在一封电子邮件中说:“在公司的笔记本电脑下使用BT感到不合适。” 。”

到2023年9月,巴什科夫加强了抗议活动并咨询了法律团队。他指出,洪流的使用意味着“播种”文件,即向外界共享内容,这是不允许的。

但是meta仍然决定继续,并试图通过将数据集下载到非meta服务器来避免被追踪的风险。

为训练AI不择手段!me<em></em>ta被曝下载数十TB盗版电子书

相关内容 查看全部