开云官网登录入口 http://www.kaiyun.com

开云官网登录入口咱们用每一个视频模子皆生成了数个视频片断-开云官网登录入口 http://www.kaiyun.com

发布日期:2025-06-29 07:57    点击次数:200

开云官网登录入口咱们用每一个视频模子皆生成了数个视频片断-开云官网登录入口 http://www.kaiyun.com

头图来源:即梦 AI开云官网登录入口

往时一个月,跟着 Sora 厚爱面向用户绽开,视频模子赛谈参加了新一轮荒诞内卷。不仅谷歌推出堪称最强视频模子 Veo 2,国内的可灵、Minimax 也接踵更新。视频模子的吵杂,一时刻以致盖过了近期大热的推理模子和 3D 生成模子。

专门义的是,被以为行业标杆的 Sora ——这个昨年春节时间发布的惊艳了全行业的期货,却在厚爱发布后遭到了极客们和不少业内东谈主士的吐槽,以为其弘扬莫得念念象中惊艳,尤其对比往时一年不断发布的国表里视频模子,Sora 看起来还是莫得上风以致还要逾期于这些"后辈"。

国内视频模子还是吊打 Sora?出于深嗜,笔者中式了底下 7 款国产视频模子,加上 Sora,作念了一个工夫视角上偶而严谨,但更代表用户直不雅体验的评测。

腾讯元宝

字节即梦 AI

快手可灵 AI

生数科技 Vidu 1.5

Pixverse

海螺 AI ( MiniMax )

智谱清影

笔者中式了创意短片、高校、幻念念、二次元、网红视频五个内容规模,辩认用 ChatGPT 生成了五段请示词,来望望这八个模子,在这五个规模的生成弘扬到底若何。

终末先叠个甲:今天视频大模子本色使用的时候还很难一步到位,时常需要屡次生成数十条以致更多的视频,技艺有几个可用的按捺。由于时刻有限,咱们在测试时每个 Prompt 只生成了几段视频,从中挑选了按捺相比好的一个,由于测试数目有限,这里不可行为严谨的智商测试,只让公共对今天堂产模子的智商有一个合座印象。

1. 创意短片

率先测试的是创意短片,这其实亦然今天视频模子最遑急的生意化应用场景——今天一部分告白营销公司正在探索若何利用视频大模子制作生意宣传告白。往时在这个规模,制作一条高质料创意告白的价钱可能高达数万乃至数百万莫得。

而生成创意短片,其实测验大模子两方面的智商:第一是基于能否把一些抽象的主见,酿成可以看得见、摸得着的故事,也便是创意智商;第二是把创意酿成视频画面,也便是创作视频的智商。

ChatGPT 生成的请示词如下

用五个要津词:科技、爱情、畴昔、机器东谈主、失意,生成一个科幻爱情短片,展现未下宇宙中东谈主工智能与东谈主类厚谊的碰撞。

咱们用每一个视频模子皆生成了数个视频片断,从中中式了相比的好一个,具体按捺及不雅感如下所示:

腾讯元宝 AI

元宝生成的这段视频后果相比一般,像是一个布景上贴了两张视觉中国的机器东谈主和东谈主类抠图。

字节即梦 AI

即梦的这段视频的画面嗅觉略略好少量,有点像 2000 年前后的星战电影,不外说是爱情,这两位看起来却像是同业,颇有点彩虹之风,这个精神情景可以说很超前了。

快手可灵 AI

可灵的这段视频,机器东谈主和东谈主类的质感和着装更有畴昔科技感,五秒钟的视频像是演绎了《魂断蓝桥》里爱东谈主重逢的经典画面,很有故事感,画面还用了一些电影运镜的手法。不外有点奥妙的是,机器东谈主看起来有点偏中性以致女性,也有点彩虹风。

生数科技 Vidu 1.5:

Vidu 的这段和前几段视频走了一个完满不同的立场,很有赛博漫画的嗅觉,是几个大模子里主题立场最独有的一个。

Pixverse:

跟可灵 AI 的嗅觉有点像,况且也有点彩虹风。

海螺 AI ( MiniMax ) :

海螺 AI 的这条画面和运镜治理的皆可以,不外故事的评释有点不像爱情,像「战友情」。

智谱清影:

智谱的这个照实有点抽象,东谈主物建模有点像 3D 游戏,还跳了一段舞,另外 5 秒傍边的时候男主的眼睛有点诡异。

OpenAI Sora

终末是 Sora,这个照实有点难评价:机器东谈主比真东谈主大许多,况且全程无表情,像是机械神灵行将审判目前的信徒。

轮廓来看,在创意短片的这八条视频里,七个国产大模子的弘扬皆彰着好于 Sora。其中几个模子的弘扬可圈可点:可灵和海螺的视频弘扬最当然,即梦相比确凿,Vidu 相比则有特质。

2. 搞笑短片

第二组咱们测试了搞笑短片,这其实是视频模子另一个相称有后劲的应用场景——越来越多的短视频创作家和内容公司正在尝试通过视频大模子来制作重灵活、更靠拢受众需求的文娱内容。

生成搞笑短片,主要测验大模子在两个维度上的智商:其一是响应智商,即对顺应的幽默点的捕捉,其二是画面呈现智商,也便是能否通过将搞笑点准确传递,同期保执画面辅导。

生成一个视频,展示一只猫试图跳上沙发,按捺一头栽进沙发的缺点里,弘扬出骇怪和难过的表情。

腾讯元宝

除了「试图跳上沙发」弘扬成「爬上沙发」,元宝生成的这段视频对请示词的复原照旧相比贴切的。

字节即梦 AI

漏掉了「试图跳上沙发」的门径,只呈现了当一个东谈主 / 猫难过的时候会让我方看起来很奋力的即视感。

快手可灵 AI

在无缺弘扬请示词的前提下,连「难过」的表情皆有。

生数科技 Vidu

完成了试图跳上沙发无果的部分,关联词没栽进沙发的缺点里,而是掉到了地上。

Pixverse

若何酿成两只猫……掉下来那只脸上不是「骇怪」而是「惊惧」。

海螺 AI ( MiniMax )

莫得掉进缺点里,但能看出猫咪脸上若有若无的难过。

智谱清影

跳上沙发没弘扬出来,中间猫猫还有点变形了,不外终末的「老羞成怒」照旧有点贴切的。

OpenAI Sora

「栽进沙发的缺点里」弘扬成猫咪的体魄和沙发相敬如宾,霎时变袖珍惊悚片。

轮廓来看,在搞笑短片的这八条视频里,元宝、即梦 AI、可灵 AI 基本无缺连贯地弘扬了请示词里的内容,其他模子的弘扬则有点些许缺失。

3. 幻念念短片

第三组测试的是幻念念短片。这相通是视频模子的一个遑急探索标的——越来越多的内容创作家和公司启动尝试利用视频大模子打造具有高度千里浸感的魔幻宇宙。

生成幻念念短片,其实测验大模子两方面的智商:第一是创意智商,能否从字面设定中,构建出一个充满念念象力的宇宙,将未知的场景转化为具体可视的画面;第二是细节呈现智商,能否呈现出丰富的光影后果和动态的环境筹算。

一个东谈主在梦中穿越不同的奇异宇宙,包括浮空岛屿、巨型植物、以及庞大的未知生物。

具体按捺及不雅感如下所示:

腾讯元宝

有点古风即视感,主打一个绿色调。

字节即梦 AI

这个就更绿了,还很像游戏画面。「一个东谈主在梦中穿越不同的奇异宇宙」这少量是少量也没体现。

快手可灵 AI

这个「穿越」很快速,但除了植物莫得其他生物了。

生数科技 Vidu 1.5

这个给东谈主嗅觉很像「梦」,是那种五彩斑斓的梦,尤其起原灵活体现了恶梦中的「惊吓感」。

Pixverse

诚然东谈主物终末一秒变形了,不外解读出了除了大型植物不测除外的存在。

海螺 AI ( MiniMax )

东谈主物变形得很彰着。不外这个梦的颜色照旧蛮斑斓的。

智谱清影

主打一个粉色梦境。

OpenAI Sora

游戏操控弹跳视角。

轮廓来看,在幻念念短片的这八条视频里,可灵 AI 和 Vidu 的弘扬最贴切,尤其 Vidu 跟其他大模子生成的内容似乎不在一个次元。即梦 AI 和 Sora 皆太像游戏视角与画面了。

4. 二次元

第四组的要津词是二次元。立场化内容是视频模子主推的标的之一,二次元这一立场受众庸碌,商场需求犀利。这类短片的创作对大模子在画风设定、变装筹算和场景构建上要求较高,同期需要叙事和动态弘扬的深度和会。

制作一个二次元立场视频,确认一位年青仙女在异宇宙冒险。她在一个被魔法和魔幻生物充斥的宇宙中,融会了万般伙伴,并靠近来自黧黑势力的挑战。

腾讯元宝

这完满是可以哄小孩的动画短片了,小女孩终末眉飞眼笑的。

字节即梦 AI

跟上一 part 的测试一样,又很像游戏画面。

快手可灵 AI

这个也很像哄小孩的动画片,只是有点看不出「冒险」,一片其乐融融的局势。

生数科技 Vidu 1.5

这个动画的颜色有点过度实足了。

Pixverse

这个短片有相比彰着的皮克斯动画立场。

海螺 AI ( MiniMax )

起原的年青仙女会有点让东谈主念念起葫芦娃,倒是敕令来几个伙伴,便是最左边的伙伴变形了。

智谱清影

很日漫。

OpenAI Sora

除了莫得伙伴,对请示词的弘扬是相对最贴切的,不外就莫得很二次元了。

这一组里智谱清影生成的内容最贴合二次元,但在画面上,Sora 终于弘扬可以了,可灵 AI 产出的内容也很精粹,pixverse 的皮克斯立场也很到位。

5. 网红视频

终末一组测试的是网红视频,网红经济还是成为全球鸿沟内的一大趋势,从内容创作家到品牌营销方,皆在探索若何利用短视频来劝诱流量和擢升影响力,望望大模子在这方面的弘扬若何。

抖音网红在自拍时用创意殊效转变布景,从日常街头刹那间酿成梦境彩虹宇宙,终末加上她的浅笑和俏皮手势。

腾讯元宝

看来没识别出请示词中的「她」。

字节即梦 AI

莫得体现「变」的经由,径直背了个彩虹圆盘在身上。

快手可灵 AI

这个生成后果真的很梦境。

生数科技 Vidu 1.5

画风似乎有点古早,像是少儿节目预报片起原主执东谈主亮相,然后也没体现街头这个布景。

Pixverse

终末的画面定格有点吓东谈主,左边两位女士的面部发生了畸变。

海螺 AI ( MiniMax )

这个就很贴切了。画面里的「东谈主」很像东谈主,画风也当然得志。

智谱清影

起原画面的主角嘴歪了。6 秒的视频皆有点诡异。

8.OpenAI Sora

第四秒出现的手,是两只右手,况且上方的那一只手,看起来怪怪的。但主角的笑颜很灿烂,主角也相称接近真东谈主,抛开操纵行为画面支持的那两只手,足以以伪乱真了。

这一组里海螺 AI 和可灵 AI 胜出彰着,无论对请示词的意会照旧画面的审好意思、确凿感皆胜出一筹。

结语

在这五个场景测试里,国产视频模子在汉文交互条目下,面对非专科用户群体,合座弘扬是优于 Sora 的。尤其是在创意短片、搞笑短片和幻念念短片的创作中,可灵 AI、海螺 AI、即梦 AI 和 Vidu 皆展现了出色的创意和视觉后果,大概捕捉幽默点、打造魔幻宇宙以及呈现独有立场。

在二次元和网红视频的弘扬上,智谱清影看起来是最贴合二次元立场的画风,而海螺 AI 则在网红视频中殊效愚弄和场景切换上弘扬了可以的创意智商和视觉后果。

但这毕竟是个有限次数下的不严谨测试,并不可代表各个模子在不同场景中的本色弘扬,毕竟文生视频模子接下来的要点在于对场景的应用。

智源斟酌院副院长林咏华最近在采访中提到「经过本年的发展,无论是开源模子,照旧闭源模子,2025 年皆会出现基于文生图、尤其是文生视频的应用。」

这也就意味着,2025 年视觉模子将从「基础智商的擢升」转向「坐蓐场景的比拼」畴昔的竞争不单是是在画质、速率等基础目的上进行比拼,更将在具体应用场景中的弘扬上伸开较量,绝顶是在告白、文娱等行业场景里。

跟着工夫的不断跳跃,视频生成的老本和速率将迟缓裁减,商场的门槛也会随之裁减,畴昔,AI 视频生成将更多融入到愈加复杂和多元的应用场景中,开启全新的产业竞争。

跟着大模子的迟缓锻练和应用场景的万般化,如安在具体坐蓐场景中暴露最大效力,将成为畴昔的要津竞争点。

信得过的挑战就要来了开云官网登录入口。