据媒体报道,一本书作者针对梅塔提起诉讼,指责该公司未经授权下载大量的盗版电子书来培训其AI模型。
最新的泄漏电子邮件显示,meta承认下载有争议的大数据集Libgen,其中包括数千万的盗版书籍。
根据法院文件,meta通过一个名为“ Anna's Archive”的渠道下载了至少81.7TB的数据,其中包括来自著名的海盗网站Z-Library和Libgen的至少35.7TB的内容。梅塔还被指控以前是从Libgen下载了额外的80.6TB数据。
作者指出,meta的行为构成了非法的电子书库种子下载,这一数字可能是其盗版冰山的尖端。
作者估计,这些盗版的电子书图书馆只能占梅塔(meta)盗版总部的0.008%,这表明梅塔(meta)的盗版可能远远超出了当前揭示的范围。
该电子邮件还表明,元员工还知道其行为的法律风险。 2023年4月,元研究工程师尼古拉·巴什利科夫(Nikola Bashlikov)在一封电子邮件中说:“在公司的笔记本电脑下使用BT感到不合适。” 。”
到2023年9月,巴什科夫加强了抗议活动并咨询了法律团队。他指出,洪流的使用意味着“播种”文件,即向外界共享内容,这是不允许的。
但是meta仍然决定继续,并试图通过将数据集下载到非meta服务器来避免被追踪的风险。