发布信息

Runway发布Gen-4 AI视频生成模型:保真度最高,支持多视角场景一致性

作者:软荐小编      2025-04-02 21:01:50     137

4 月 1 日消息,人工智能初创公司 Runway 在本周一推出了其新研发的 AI 视频生成模型 Gen-4。该公司称,此模型是目前为止保真度极高的 AI 驱动视频生成工具之一。

_视频制作角色_视频人物如何融入场景合成

新发布的 Gen-4 模型开始向 Runway 的个人及企业客户推送。Runway 介绍说,该模型的核心优势是能在不同视频场景中保持角色、地点和物体的高度一致性,能维持“连贯的世界环境”,还能从场景内不同视角和位置重新生成元素。

Runway 在其官方博客文章中表明:Gen-4 能够把视觉参考资料加以有效利用,同时结合用户的文本指令,从而创造出在风格、主体、地点等要素上保持一致的新图像和视频,并且在整个过程中无需进行模型微调,也无需进行额外的专门训练。

Runway 公司获得了知名投资机构的支持,这些机构包括 Salesforce、谷歌和英伟达。它专注于提供一系列 AI 视频创作工具,其中包含 Gen-4。然而,在 AI 视频生成这个竞争激烈的赛道中,Runway 遭遇到了来自 OpenAI 和谷歌等科技巨头的强劲挑战。Runway 采取差异化竞争策略是为了在市场中脱颖而出。它与一家好莱坞大型电影制片厂达成了合作协议,并且特别拨出数百万美元资金,用来资助那些运用 AI 生成视频技术进行创作的电影项目。

Gen-4 的功能方面,Runway 称,用户只需给出角色的参考图像,模型就能够在不同光照条件下生成外观始终保持一致的角色。在构建具体场景时,用户可以上传主体的图像,同时用文字进行描述,清楚地表明希望生成的镜头构图的要求。

Runway 在博客中强调:Gen-4 在生成视频方面表现卓越,视频具有高度动态感和逼真运动效果。同时,Gen-4 在主体、物体和风格的一致性上达到同类顶尖水平,对用户指令能精准遵循,对现实世界规律也有很好的理解。公司宣称,Runway Gen-4 的发布意味着视觉生成模型在模拟真实世界物理规律的能力上达到了一个重要的里程碑。

当前所有的视频生成模型都是通过对海量视频数据进行训练而成的,Gen-4 也是如此。模型通过学习这些数据中的模式,能够生成全新的合成视频片段。然而,Runway 方面拒绝透露其训练数据的具体来源,部分是为了保护商业竞争优势,同时也因为训练数据的细节在潜在知识产权诉讼中很敏感。

一个典型例子是,Runway 眼下正遭遇一起诉讼,是由艺术家群体提起的。此诉讼控告 Runway 以及其他几家生成式 AI 公司,在未获授权时,使用了受版权保护的艺术作品来对其 AI 模型进行训练。对此,Runway 称其行为受到“合理使用”(Fair Use)原则的庇护,应不用承担法律责任。目前,该案的最终结果尚不明朗。

这场法律纠纷对 Runway 而言风险较大。《The Information》有相关报道,Runway 正在开展新一轮融资,这轮融资或许能让其公司估值达到 40 亿美元,换算成现汇率约合 290.44 亿元人民币。Runway 推出了视频生成模型 API 等新产品,并且这些新产品陆续推出。Runway 期望在今年能够实现 3 亿美元的年化收入目标。

这场官司无论走向如何,以 Gen-4 为代表的生成式 AI 视频工具都在对现有的电影和电视行业带来颠覆性的挑战。 生成式 AI 视频工具以 Gen-4 为代表,正给现有的电影和电视行业带来颠覆性的挑战。 现有的电影和电视行业正受到以 Gen-4 为代表的生成式 AI 视频工具带来的颠覆性挑战。2024 年,由动画协会(Animation Guild)委托进行的一项研究表明,该协会代表着好莱坞的动画师和漫画家。在那些已经采用了 AI 技术的电影制作公司里,有高达 75%的公司在引入该技术之后,出现了裁减岗位的现象,或者出现了合并岗位的情况,又或者直接取消了职位。该研究预测,到 2026 年时,生成式 AI 有冲击美国娱乐行业工作岗位的可能。其冲击的岗位数量可能会超过 10 万个。

相关内容 查看全部