这些万圣节模板包含在 PixVerse V3 的新效果功能中。使用起来非常简单。图片上传后,选择需要的效果,点击生成。无需担心中间输入提示。对于只考虑万圣节的人来说非常友好。
此次PixVerse V3展现了更强的多模态生成能力。基于自家的文声视频和图声视频,PixVerse V3现在可以让生成的视频携带用户想要的声音内容,并且如果原始视频不够长,PixVerse V3现在有能力创建原始视频的进一步延续。
这些多模态生成功能也成为 PixVerse V3 中与 Effect 一起首次亮相的两项新功能。第一个功能是Lipsync,口型同步功能,可以为视频生成多语言角色的同步声音。
Lipsync功能允许用户根据生成的视频输入自己的文案或上传音频文件,然后PixVerse将根据文案或音频文件内容自动适应视频中人物的嘴型。目前,Lipsync可以支持30秒的视频长度,可以进行口型同步的语言包括英语、中文、法语和日语。
还有一个作用就是对视频的延伸,或者可以理解为故事的延续。
针对当前生成的视频长度过短的问题,在PixVerse V3中,用户可以选择生成的视频,单击“扩展”按钮,输入如何进一步开发视频的相关提示文字,单击“创建” ”,而原始视频将以所提议的方向实现情节进展,同时保持人物和动作之间的高度连贯性。
随着多模态视频生成能力的加入,PixVerse V3现在可以生成叙事更大、视听效果更好的AI视频,AI视频创作的边界进一步拓宽。
做真正可玩的AI视频产品
“ChatGPT 的时刻将是普通用户可以使用它的时候。”爱视科技创始人兼CEO王长虎今年4月接受采访时表示。
近两年来,每一次大型模型技术的新曙光,都转化为关于制作方式的新的宏大叙事,仿佛人类的生活将在短时间内被彻底颠覆。但到目前为止,这种情况还没有发生。
与此同时,Sora带来的兴奋感和过于野心勃勃的技术想象力,逐渐让整个AI视频产品领域失去了焦点,找不到与大众生活的联系。因此,一方面,像Runway这样定位专业工具的AI视频产品,由于使用门槛较高,难以出圈。另一方面,定位更面向大众的产品在被大家尝试后却陷入了“阅后即焚”的困境。用户新鲜感消失后,就很难留住产品了。产品缺乏清晰具体的开发思路,只能沉沦于“滤镜化”、“特效化”的简单逻辑。
换句话说,AI生成能力的巨大开放使得目前AI视频领域的几乎所有产品看起来都像是某种半成品。生成内容的随机性和不可控性被包装成新颖的体验,这也意味着很难在现场使用。用于特定且持久的场景。
就像外界对 Sora 的气球人生成能力感到惊讶一样,Patrick Cederberg 也因 Sora 的内容生成缺乏一致性而感到困扰。他抱怨说,每一代气球的颜色都会发生变化,这种不完美意味着后期制作的繁重工作量仍然不可避免。类似的问题还有很多,这也是为什么尽管好莱坞一年前就开始打击大模特对电影业的潜在颠覆,但一年后,sora仍然无法真正进入影视工作流程。
目前,AI视频产品或多或少都陷入了类似的境地——虽然AI视频生成能力已经让大家兴奋已久,但AI视频生成产品仍然是一个好看的“卖家秀”。
面对新技术洪流,产品很难保持“具体”。然而,爱石科技从最初的PixVerse网页版到现在的PixVerse V3所交付的是一条罕见的清晰有序的迭代路径。
今年1月,爱视科技正式发布了Pixson视频产品PixVerse的网页版。但当时,包括PixVerse在内,几乎所有文胜视频产品都遇到的问题是生成的图像不可控,这意味着用户无法围绕统一的角色连续生成视频内容。三个月后,PixVerse网页版搭载了基于自研大视频模型开发的C2V(Character to Video)功能,通过精准提取人物特征锁定人物,初步解决了AI视频创作中的一致性问题。
在确定了视频中的“角色”后,PixVerse 将后续迭代的重点放在了生成内容中行为的“可控性”上。今年6月,爱石科技发布了Magic Brush运动画笔。用户只需在视频屏幕中的元素上涂抹即可精确控制每个元素的移动和方向。 PixVerse V2 于七月底推出。除了对生成的内容表现出足够的控制力之外,提示的难度也显着降低。同时,对生成效果进行微调的手段也变得更加丰富。
这又是一次意图非常明确的迭代——“具体的产品形态还需要尝试,但最终我们还是希望服务于广大普通用户”,正如王长虎在此前接受采访时所说。
当视频生成能力无法直接满足普通用户的需求时,服务专业创作者并开发基于新内容生成范式的下一代工具是更优先考虑的事情。 “当生产要素被技术包容后,比如用AI代替演员、场景、拍摄时的摄像机,那么AI视频生成能力就可以开始被大众使用,用户圈子也会逐渐扩大,创造巨大的机会。 ”
这次PixVerse 3V开始尝试引入更多与普通人生活相关的玩法,并尝试用prompt来设置镜头。后者可以被视为部分取代相机的尝试。从这一点来看,爱石科技在打磨产品方向上已经走得很坚定了。
在以分歧为美的AI视频时代的技术浪潮中,爱视科技的选择是逆大势而行,远离宏大叙事,为AI视频产品如何玩法提供最具体的方案。
只有让人们尽可能多地把它拿在手里、把玩它,AI视频应用才能从Sora主导的“卖家秀”转变为充满活力的“买家秀”。
PixVerse V3 的惊艳亮相或许是 AI 视频“降温”背后另一个积极变化的开始。