259/396 本文约1500字 预计阅读时间5分钟
最近看到一篇文章:AI届的学术大牛李飞飞最近推出了用于生成逼真视频的扩散模型W.A.L.T。效果很不错,不过目前还未开放公网的访问。于是我萌生了一个想法,用这篇文章里的效果视频和同样的提示词,用现如今最火的三个AIGC视频工具:Runway Gen-2、Pika 1.0和Moonvalley对比看看。看同样的测试条件下,哪家的效果最强。

场景1


提示词:Two knights dueling with lightsabers,cinematic action shot,extremely slow motion/两个骑士用光剑决斗,电影动作镜头,极其慢动作
Gen-2效果如下,腿部下面的效果有些错位:
Pika效果如下,镜头移位效果可以,但是手部动作不是很自然:

Moonvalley效果如下,手部动作自然,但是光剑有跳变:

W.A.L.T效果如下,官方给出的这个例子确实挺自然的:

这轮效果的主观对比,我觉得:W.A.L.T>Moonvalley>Pika>Gen-2


场景2


提示词:Pouring latte art into a silver cup with a golden spoon next to it/在银杯中进行拿铁拉花,旁边放着金勺子

Gen-2效果如下,为何后面慢慢虚化了呢,感觉手部生成的有点问题:

Pika效果如下

Moonvalley效果如下:

W.A.L.T效果如下,拉花最自然:

这轮效果的主观对比,拉花效果还是W.A.L.T最佳,其次Moonvalley也整体也协调自然些,我觉得:W.A.L.T>Moonvalley>Pika>Gen-2

场景3


提示词:Sea lion admiring nature, river, waterfull, sun, forest/海狮欣赏自然,河流,瀑布,阳光,森林

Gen-2效果如下,海狮很逼真,但是没有怎么动:

Pika效果如下,有浪花,树林,瀑布还是没捕捉到

Moonvalley效果如下,海狮爬上了小小的瀑布:

W.A.L.T效果如下:

这轮效果的主观对比,我觉得:Moonvalley>W.A.L.T>Pika>Gen-2

场景4


提示词:An stronaust riding a horse/一名宇航员骑着马

这个提示词比较短,比较考验工具的理解能力。

Gen-2效果如下,没有理解到宇航员的意思:

Pika效果如下,效果挺好:

Moonvalley效果如下,也没有理解对宇航员:

W.A.L.T效果如下:

这轮效果的主观对比,我觉得:Pika>W.A.L.T>Gen-2>Moonvalley

场景5


提示词:A Teddy bear skating carefully in Times Square,Slow Motion/一只泰迪熊在时代广场上优雅的滑冰,慢动作

Gen-2效果如下,最后滑板有些变形:

Pika效果如下,能体现出小熊在滑行,但没有画出滑冰鞋:

Moonvalley效果如下,后面的霓虹灯效果挺好:

W.A.L.T效果如下:

这轮效果的主观对比,我觉得:Moonvalley>W.A.L.T>Pika>Gen-2

场景6


提示词:A cute panda skateboarding in the sky, over snow covered mountains, with a dreamy and whimsical atmosphere/一只可爱的熊猫在天空中滑滑板,越过雪山,充满梦幻和异想天开的气氛

Gen-2效果如下:

Pika效果如下:

Moonvalley效果如下:

W.A.L.T效果如下:

这轮效果的主观对比,我觉得:W.A.L.T>Moonvalley>Gen-2>Pika

场景7


提示词:A giant dragon sitting in a snow covered landscape, breathing fire/一条巨大的龙盘踞在冰雪覆盖的大地上,喷吐着火焰

Gen-2效果如下:

Pika效果如下:

Moonvalley效果如下:

W.A.L.T效果如下:

这轮效果的主观对比,得:W.A.L.T>Gen-2>Pika>Moonvalley

综述


以上就是七个场景的测试,我们如果把第一名到第四名依次计分为4到1分。可以依次得到:
W.A.L.T 24分,Moonvalley 20分,Pika 15分,Gen-2 11分。情况有些出乎意料,通常我觉得效果好的Pika和Gen-2反而评分不高。当然,我主要是基于文本符合度来进行评价的,W.A.L.T因为是官方给出的提示语和效果动画,但还没有开放给用户使用,所以实际效果如何,其实还是个未知数;而Moonvalley在文本符合度上虽然这次胜出了,但是目前还是依托于Discord来使用的,而且生成视频的速度不及Pika和Gen-2,功能的丰富程度上也逊色不少,比如就没有增加时长、扩展画面等功能;Pika在功能丰富度上、易用程度、出图质量上都得到不错效果,只是即使把文本符一致性的选项调到了最高25,依然有时候没有出到完全符合意思的视频,所以影响了评分;Gen-2虽然在文本符合度上有些逊色,但是它出的视频的逼真程度确实高人一等,有电影级画质的感觉,所以依然在很多时候可以派上用场。
综上,好的工具很多,大家可以结合来用,这样可以达到最佳效果。

以上就是今天的AI视频工具对比,希望对你有帮助。

更多内容,欢迎关注微信公众号:吴言不语零一二三#优质作者榜##AI生成视频#
举报/反馈

吴言不语零一二三

368获赞 103粉丝
传播科技科普,分享人文感悟,探索科技与人文的融合之道。十余年软件产品行业经验,现致力于创造充满爱的人工智能产品。平时热爱阅读各种书籍,热爱自律成长,终身学习,时间管理。吴言不语零一二三,〇即无,无即道,道生一,一生二,二生三,三生万物。
关注
0
0
收藏
分享