发布信息

2025年AI视频生成领域版权纠纷:大模型公司面临侵权风险,爱奇艺起诉MiniMax旗下海螺AI

作者:软荐小编      2025-01-11 16:02:19     232

“几乎没有大型模型公司会寻求视频网站的授权进行AI视频生成训练。” 2025年初,决心在视频生成领域“追赶Sora”的大型模特公司碰上了版权墙。

AI企业家陈琳告诉字母榜(ID:wujicaijing),这其中还包括被称为“人工智能六小虎”的6家中国大型模式独角兽。缺乏授权模特培训,必然成为大型模特公司的潜在风险。

如今,在日益火爆的AI视频生成赛道上,出现了首例“视频平台诉大模特侵权”案例。

近日,有报道称爱奇艺起诉MiniMax旗下海螺AI侵犯版权。据悉,原因可能是MiniMax未经授权使用了爱奇艺的版权素材进行模型训练,目前正在接受法律诉讼。对此,爱奇艺回应Alphabet,确认案件正在审查中。 MiniMax尚未正式回应。

去年9月MiniMax刚刚推出大视频模型时,其创始人严俊杰告诉Alphabet,MiniMax用于训练的数据包括语料公司的优质数据和一些购买的平台数据。

大报恩寺上塔要门票吗__亿辉拼装模型版权

注:MiniMAX创始人颜俊文介绍海螺AI

图片来源:Alphabet List 拍摄

大公司也经常卷入版权纠纷。去年8月,OpenAI被100多名YouTube主播起诉,指控其非法转录数百万个YouTube视频来训练大型模型。 Nvidia、Apple、Anthropic 等巨头也参与其中。 OpenAI前CEO Mira曾在接受采访时被记者问到是否会使用YouTube视频来训练Sora。米拉选择拒绝回答。

尽管OpenAI已经与Politico、《大西洋月刊》、《时代》、《金融时报》签署了付费培训协议,但此类授权属于文本领域。陈琳告诉Alphabet,在Sora视频的训练协议中,“OpenAI并没有签署相应的协议。”

数据、算法和算力是人工智能大型模型的三大支柱,数据是训练大型模型的基础。可以说,生成式AI的繁荣是建立在数据规模的基础上的。训练数据越多,模型就越强大。数据赋予模型海量的学习和思考的知识,数据也成为模型厂商技术壁垒的一部分。

与BAT不同的是,图文时代和移动互联网时代已经积累了庞大的私域数据库,而这些数据早已被不同平台瓜分。迟到的大型模型六小龙被重重障碍包围。

一旦爱奇艺诉讼成功,可能预示着一个更大范围的大规模模特版权纠纷时代的到来。

“如果爱奇艺胜诉,优酷和腾讯视频也可能会提起诉讼,”陈林说。这无疑是给狂奔的各大模特公司浇了一盆冷水。对于独立进行大模型训练的公司来说,“视频需要版权费,图片也需要版权费,文字也可能需要版权费,使得AI训练的成本比现在高得多。”

如今,什么是对、什么是错还没有定论,但可以肯定的是,一道新的版权墙正在大模之路上竖起。

大报恩寺上塔要门票吗_亿辉拼装模型版权_

国内首例AI视频生成侵权案件出现。

近日,据外媒报道,MiniMax被指未经授权使用爱奇艺版权素材进行模型训练。爱奇艺已向上海市徐汇区人民法院提起诉讼,要求MiniMax立即停止侵权行为,并要求赔偿约10万元。

去年8月底,MiniMax推出了大视频模型。用户可以通过登录海螺AI体验MiniMax的视频生成模型。 AI产品榜数据显示,去年9月海螺AI搜索热度飙升。海螺AI网页版9月访问量增长860%,位居2024年9月全球及国内AI应用增长第一。

然而加入“追空”大军的MiniMax也像OpenAI被《纽约时报》起诉一样碰上了版权墙。

根据我国法律规定,生成人工智能服务提供者必须使用“合法来源”的数据和基础模型,确保不侵犯他人知识产权。

《互联网法律评论》主编张颖告诉Alphabet,在这起民事诉讼中,爱奇艺提起诉讼,需要证明MiniMax未经其许可使用爱奇艺数据进行训练,并将其内容包含在生成内容中。受版权保护的内容。此外,爱奇艺还需要证明被告存在主观过错,即故意或未履行注意义务。

也就是说,海螺AI的“侵权”有两种可能。

一种可能是MiniMax海螺AI视频生成的训练中未经授权使用了爱奇艺的版权素材内容。

另一种可能是,用户在使用海螺AI时,未经爱奇艺授权,上传了AI“魔改”的版权素材。

大报恩寺上塔要门票吗__亿辉拼装模型版权

说明文字:AI神奇修改视频,下方注释内容疑似使用AI技术合成。

来源:字母表截图

《甄嬛传》变身枪战片,《红楼梦》变身武侠剧。利用AI视频工具,可以让尔康喝啤酒、甄嬛吃汉堡、林黛玉拿起加特林。陈琳表示,上述AI“神奇改造”经典影视剧的短视频在社交平台上获得了数百万的观看量。

这些“没有逻辑,只有搞笑”的AI“魔改”视频大多未经授权。 “其中一些是第三方流媒体公司受大型模特公司委托推广其产品的作品,而大多数是用户的无意义想法。” ”去年12月,广电和网络视听部门还发布了《管理提示》,提出对AI“魔改”影视剧短视频进行查处和清理。这意味着生成式AI将面临更细化的监管。内容审查。

作为被诉方,MiniMax如果想证明自己没有侵权,很可能需要证明其数据来源和生成内容与爱奇艺无关,或者不存在故意侵权。

在海螺AI的用户协议中,还要求用户保证不会使用平台制作的内容或将其用于相关目的,包括“剪切、改编电影、电视剧、电视剧等各类视听节目和片段”。未经授权的网络电影、电视剧。”

但值得注意的是,“10万元的赔偿对于爱奇艺来说太少了”。张颖表示,尽管缺乏爱奇艺起诉书作为依据,但从金额来看,推测MiniMax的侵权行为可能并不严重,双方和解的可能性较大。走向和解,对于MiniMax来说,无论是按价赔偿10万元,还是巨额版权费,似乎都难免要为版权墙“赔钱”。

大报恩寺上塔要门票吗_亿辉拼装模型版权_

事实上,“国内AI从业者对于训练数据的版权意识并不高,普遍认为版权会阻碍AI训练。”

离开大厂去做AI应用业务后,陈琳发现国内主动要求版权授权的AI培训公司似乎并不多。原因不仅在于AI训练本身成本高昂,还因为一旦视频、图片甚至文字需要版权,对于AI初创公司来说,“模型无法训练”。

很多AI初创公司做视频生成训练的第一步就是“从网上抓取视频训练”。

为了规避版权风险,企业会采用关键词过滤的方式,尽量阻止用户输入米老鼠等受版权保护的词语,以减少侵权内容的产生。

_亿辉拼装模型版权_大报恩寺上塔要门票吗

图例:以极萌AI为例,AI视频生成自动过滤关键词

资料来源:陈琳提供

新一科技CEO雷涛告诉Alphabet,作为一家To B AIGC视频生成公司,新一科技训练大型AI视频模型所使用的数据来自于之前在秒拍、小卡秀等应用中的数据积累,以及定向协作数据库,以及根据原始算法“从头开始”训练的材料。但只有生成的AI视频足够真实,才能起到训练效果。

对于既没有积累足够数据,又无力承担定向合作版权费的AI初创公司来说,想要坐上牌桌撞上版权墙,迟早是必然的结果。

然而,这种争议并不新鲜。

图文时代,图片版权之争一度让创作者“不敢加图”。某各大自媒体V获悉,历史文章中数十张来自搜索引擎的图片涉嫌侵权。在删除所有原创文章后,他们还支付了大量侵权费用进行和解。一名摄影师将自己拍摄的173张照片用作插画,被视觉中国提起侵权诉讼。

现在,轮到人工智能站上被告席了。

在中国,去年6月,四位画家起​​诉小红书AI的大型模型“Trik AI”侵权。这是国内首例人工智能模型训练数据集体侵权案件,目前诉讼正在进行中。

在国外,meta和OpenAI都曾卷入版权纠纷。

去年4月底,《纽约每日新闻》、《芝加哥论坛报》等美国八家知名报纸联合起诉OpenAI和微软,指控他们在未经许可的情况下使用数百万篇受版权保护的新闻文章来训练他们的AI聊天机器人。允许。为此,OpenAI 已与 Politico、The Atlantic、Time 和 Financial Times 等新闻出版商达成付费协议,以使用和引用受版权保护的新闻文章。

早在2023年5月,OpenAI CEO Altman就公开承认,AI公司将在不久的将来消耗掉互联网上的所有数据。 2024年6月,研究机构Epoch AI也发布研究预测,可用于公共训练AI语言模型的数据将在2026年至2032年间被科技公司耗尽。

对于大型模型初创公司来说,高质量的数据始终是稀缺的,大型模型公司之间的算力和应用之战也将扩展到数据之战。

只是OpenAI的诉讼可能会发出一个明确的信号:高质量的训练数据并不是免费的。对于大型模型初创公司来说,与meta、BAT等积累了近20年社交媒体数据的公司不同,他们或许只能“花钱铺路”。

亿辉拼装模型版权__大报恩寺上塔要门票吗

然而,要解决版权这个拦路虎,大型模特公司需要回答一个问题,钱从哪里来?

对于尚未盈利的大型初创企业来说,投资者的钱包越来越紧。

据字母榜统计,六大模范虎中的五家(包括零千物、极简、百川智能、智普AI、踏星、月之暗面)将在2024年获得数十亿元融资。目前,智普、月之暗面、百川智能、步星的估值均已超过200亿元。

不过,据《智创》报道,随着估值达到200亿元,国内大型模型公司最新单轮融资规模将卡在50亿元左右。也就是说,估值越高,融资就越困难。华兴资本数据显示,2024年前三季度国内市场投融资总额为2603亿元,不到近三年同期的40%。

以《月之暗面》为例。 2024年2月,A+轮完成超10亿美元融资,投后估值升至25亿美元。次年8月,参与首轮投资的小红书、美团龙猪、红杉中国相继退出,月之暗面B轮融资金额超3亿美元。正处于风波之中的MiniMax自去年3月获得6亿美元B轮融资后,尚未等到新的融资消息。

对于大型模式创业公司来说,“等钱下手”的紧迫性无异于等米入锅。

等待到来的数十亿元融资将分配给大型模型初创公司,不仅用于不断堆积参数的模型训练,还用于需要数亿美元投资和烧钱营销的AI应用,留钱给大模特购买版权。 ,不富有。

大型模特初创公司的灵魂拷问不仅仅局限于版权纠纷。高昂的研发投入和有限的商业变现,是悬在“六小虎”头上的达摩克利斯之剑。

马斯克曾估算,GPT-5的训练成本为3万-5万个H100,仅芯片成本就超过7亿美元(约合人民币50亿元)。目前,刘小虎的收入尚未披露。据外媒报道,MiniMax预计年收入为7000万美元。目前来看,即便是已经通过Talkie在海外赚钱的MiniMax,短期内也很难实现正营收。

亿辉拼装模型版权__大报恩寺上塔要门票吗

大模型里的水温越来越凉,第一个感受到的可能就是在里面扑通扑通的练习者。

“一家大型模特公司裁员后裁员至500人,另一家公司干脆放弃了预训和C端市场,剩下几家几乎陷入沉默,不再开放HC(招聘名额)。 ”

陈琳告诉Alphabet,到2024年底,获得70万+个AI Offer几乎是不可能的。 2023年,只要有AI相关经验,就能获得面试机会。现在一年过去了,不仅要求有实践经验,而且薪资涨幅也打了折扣。目前,除北京外,其他城市的人工智能岗位招聘还很少。

可以肯定的是,对于想要在2025年继续留在牌桌上的大型模型初创公司来说,支付模型训练过程中的版权只是第一步。降低成本并不是长久之计。寻找赚钱和提高效率的方法才是解决方案。钥匙。

(文中陈琳为化名)

相关内容 查看全部