快,确实有点太快了。
就在这两天,一款国产的Sora因为生成视频速度太快而走红了网络。
话不多说,我们直接体验一下这个速度:
网友看完后惊呼:
这可能是最快的视频生成人工智能。
这个让外国人震惊的视频模型就是圣数科技最新发布的Vidu 2.0。
我们刚才展示的案例是一段4秒的视频,分辨率为512p。 Vidu 2.0的终极生成速度较之前版本进一步提升,从30秒提升至10秒,提升了两倍。
这次Vidu 2.0官方的说法是“最快10秒”,但实际测试发现官方还是谦虚了。除去等待时间生成部分,最快仅5秒。
我们来体验一下海外网友测试的不同分辨率输入前两帧时视频生成的速度:
可以说,Vidu 2.0在速度上与其他产品有着明显的差距;网民甚至开始在 X 上使用#viduspeed 标签。
但事情还没有结束。
Vidu 2.0不仅“提高”了速度,还大幅降低了价格。
现在,每秒生成视频的成本可以是4毛钱(0.04475元/秒)!
(积分单价=月价179元/4000点=0.4475元/分钟,按照Vidu 2.0-4s-512模型计算,一次会扣除4点,所以每秒单价:1s=1点=0.04475元)
如果我们看行业通用标准,即每秒720p视频的价格,Vidu 2.0直接“腰斩”了。
行业均价:0.6048元/秒(同样,根据以上点位成本,对国内外同类产品标准套餐最低版本的每秒单价进行换算,则这些产品的均价为计算为0.6048元/秒)
Vidu 2.0价格:0.2587元/s(Vidu国内基础版包月套餐月价为69元,套餐额度为800积分,积分单价为0.08625元,按照Vidu 2.0-4s-720p机型计算,一次产生的扣除积分为12点,每秒消耗的积分为12/4 = 3点,所以1s 720p视频生成价格为0.086253=0.25875元)
换个角度看,Vidu 2.0 10元,按照专业版(国内单价最低套餐)计算,可以生成512p时长3分40秒的视频,或者1分14秒的视频720p 秒。
而且效果还是非常直观的:
△
但同样的10元,Sora只能生成13秒的480p视频素材。
总而言之,Vidu 2.0可以用三个词来概括——快、好、省。
上次国产大机型火爆海外也是因为DeepSeek V3“快速、简单、经济”的特点。
Vidu 2.0 感觉有点像视频生成领域的 DeepSeek V3。
真实秒生成,效果稳定
速度快、成本低固然重要,但毕竟生成式AI还是要看最终的效果。
从用户反馈来看,Vidu 2.0非常有效。
海外用户@Naegiko | AI Animator在X上发布了基于Vidu 2.0的动画短片,并给出了详细的评价反馈:
包括Vidu 2.0发布前的一波预热视频,也让画面质量上了一个新台阶。
比如这段赛车视频,画面非常动感流畅。
还有这个动画视频。打斗场面确实很精彩。网友看完后甚至评论:“国漫复兴有希望了”。
当然,我们还是要看看Vidu2.0的实际效果。下面我们从多个角度进行深入测试。
首先我要夸一下你。 Vidu 2.0的操作界面可以说非常简单。登录官网后,选择立即体验,就会直接进入生成界面。各种功能一目了然:
模型版本:共有三个版本:Vidu 1.0、Vidu 1.5、Vidu 2.0(我们选择2.0)
生成方式:文声视频、图声视频、参考学生视频
设置:包括风格、持续时间、清晰度、运动范围、纵横比等
我们实测的主要核心指标是各个维度的一致性,看看Vidu 2.0在快速、便宜的情况下会不会出现问题。
字符不会变形
我们第一轮测试的主题是人物特写。使用的方法是图胜视频(只输入第一帧)。图片如下:
然后提示如下:
女孩缓缓眨了眨眼睛,留下了泪水。蓝色液体缓缓荡漾开来,镜头拉近拍摄,营造出电影般的画面效果。
从生成的效果来看,感觉像是电影中的特写镜头。水光在人物脸上留下波光粼粼的阴影,慢慢流下的蓝色眼泪的细节也很好。
尽管第一帧和最后一帧的风格相差很大,但我还是能hold住。
在之前的测试中,我们只设置了图片的第一帧。这次我们加了最后一帧,特意设置了两张风格差别很大的图片。
我们上传的第一帧是马斯克的写实照片,最后一帧是漫画风格的钢铁侠。
选择生成720p视频,我们的提示是这样的:
马斯克慢慢地表演着钢铁侠的动作,同时,身上和头上的铠甲也慢慢地装备在了他的身上。
可以看到,马斯克先张开双臂在画面末端摆出了钢铁侠的姿势,然后慢慢从战衣中出来。铠甲也从双手慢慢装备在身上,给人一种蝙蝠侠变身的似曾相识的感觉。 。
风格可以一直保持
除了人物的一致性之外,能否在整个视频生成过程中保持风格一致,也是能否应用于真实制作场景的一个非常重要的指标。
因此,为了更好地体现Vidu 2.0的这一特点,我们还邀请了其他主流“玩家”参与,效果如下:
从对比结果来看,除了维杜2.0之外,其他选手都无法固定油画的风格,有的甚至开始直接改变活人的风格。
另一张水墨风格的对比也是如此:
嗯,从风格一致性来说,Vidu 2.0 是非常稳定的。
多张图片也可以用来制作短视频
这里不得不提的是,Vidu是AI视频生成领域诸多术语的新创造者,并推出了多项全球首发。
Vidu去年发布的参考学生视频,现在被称为“多智能体一致性功能”,已经成为业界的统称。
作为参考学生视频,您可以根据几张图片生成更具故事性的视频。
据了解,Vidu目前服务于200多个国家和地区,海外用户占比超过90%。
随着2.0版本的到来,Vidu参考原始视频的性能也得到了增强。
这次我们准备了以下三张图片来制作短片:
那么短片的提示是这样的:
圣诞老人和熊在湖边玩耍
一部圣诞老人和小熊玩雪的可爱动画短片就这样奇妙地诞生了!
当然,您也可以将照片更改为您自己或您的朋友、偶像或宠物。从古代到现代都市,从欧洲到非洲,任何场景都可以上演大片。你是你自己的主角,也是你短片的导演。过度的戏剧成瘾。
值得一提的是,Vidu 2.0还有一个专属功能“薅羊毛”。如果你不急于生成视频,又不想浪费积分——
了解峰值交错模式。
当你提交视频生成任务时,它不会立即抢占流量高峰,而是会排队等待网络流量较低时才开始工作。
这意味着你无需花费任何积分就可以批量制作海量的视频素材,这确实是一个巨大的收获。
处理速度快只是其外在优势之一。总体而言,Vidu的突出特点之一是其模型具有扎实的底层能力。
这个基础支撑了相对优越的产品叙事表现、动态维护一致性等综合能力,也给了专业和非专业用户更多自由发挥的空间。
人人都能自导的视频来了
Vidu 2.0的发布到底带来了什么?
首先,从AI视频生成技术的发展来看,Vidu 2.0可以说打破了“不可能的魔咒”。
也就是说可以实现生成速度快、效果好、价格低。
由于AI视频模型必须在速度、效果和成本之间取得平衡,因此会涉及到计算资源、算法优化、数据处理、模型压缩等诸多挑战。
例如,质量和速度之间的矛盾是,提高质量通常意味着使用更复杂的模型,但更复杂的模型会导致生成速度变慢。
虽然圣数科技还没有发布详细的技术报告,但想必在训练、推理方法、算法等方面都做了很多创新工作。
随着这个“魔咒”的打破,可以说现在已经进入了“百元广告”的阶段,而这也意味着“人人都可以生成视频”的时代已经到来。
以1分钟广告视频的制作为例来详细分析。
传统制作模式下,广告片的制作流程复杂,涉及平面拍摄、动效制作、剪辑等多个环节。相应的,人员配备要求也相当高,需要招聘摄影师、剪辑师、特效师等专业人才。
即使只组建4-5人的小制作团队,按照市场上正常的制作标准,行业平均制作一分钟广告片的成本至少在3000-5000元。
另一方面,使用Vidu 2.0进行创作,生成1分钟商业广告素材的成本仅为3-5元左右。
即使考虑到素材的有效利用,以及后期剪辑、配音等额外成本因素,制作一个1分钟广告片的总成本也只有100元左右。
如此对比,与传统的广告制作方式相比,使用Vidu 2.0的制作成本降低极为显着,下降幅度高达30-50倍。同时,生成1分钟视频素材仅需5分钟,节省90%的后期制作流程。
在此基础上,又产生了另一个问题:AI视频生成可行吗?
这一点其实可以从几个维度看的很清楚。
首先是用户认可。
此次随着Vidu 2.0的发布,Vidu也首次披露了自2024年7月底全球上线以来的运营数据:
上线仅20天用户数突破100万,上线100天用户数突破1000万,增速位居全球第一。
截至目前,平台生成的视频数量已突破1亿条。
尤其是“参考学生视频”功能,全球首发仅3个月,视频播放量已达千万级。
可见,Vidu这款产品已经得到了全球用户的广泛认可,而且从社交平台(如X)上的评价来看,也是一致好评。
其次,有行业认可。
据了解,维度的产品也赢得了众多国内海外企业的青睐。
以Evoke(面向海外市场的AI图胜视频应用)为例。它是Vidu 的早期MaaS 客户之一。
接入Vidu的API后,Evoke的数据显示,在特定场景的视频生成中,Vidu的模型精度相比同类视频生成平台提升了60%以上,视频生成时间从270秒大幅缩短至35秒。效率提升了近90%。
那么你是否也想体验一下如此快速、稳定、廉价的AI视频生成产品呢?