要说前阵子 AI 圈最神秘的模型,快乐小马应该算一个。
早在月初,这个模型就登顶了 Artificial Analysis 的榜首,直到现在还在榜单第一挂着。在 Arena AI 排行榜上,HappyHorse-1.0 也能排到第二的位置。
这么好的成绩,一下子激起了大伙儿的好奇心。
一夜之间,大量仿冒套壳擦边版 “ 快乐马 ” 激情上线,HappyHorse 突然成了流量密码,整个 AI 圈都在讨论谁才是小马真正的爸爸。
直到最近,这场猜马游戏终于有了答案。阿里 ATH 团队正式认领这匹竞技场黑马,并同时开放了 HappyHorse-1.0 灰测。
世超也去前线观察了一些大伙儿用 HappyHorse-1.0 做出来的案例,看起来整体效果还是有不少闪光点的。
即便是在高速运动的镜头里,人物基本没有跑形,主体一致性保持得很稳。音效也没掉链子,节奏点踩得准,画面动作和声音能完全对上。
来源:@岚叔
而在氛围感、真人特写和一些奇观镜头上,成片的质感看起来也比较在线。
咱也第一时间上手试了试。这回 HappyHorse-1.0 一共开放了视频生成和视频编辑两项功能,实测下来,营销号嘴里的全面碾压、拳打脚踢友商模型,咱听个乐就行了。
不过,不能否认的是,它确实是一款完成度较高的视频模型。
下面世超就带各位差友看看 HappyHorse 的实测案例。先从最核心的视频生成说起,HappyHorse-1.0 的生成等待时间大概在 3 到 5 分钟,一次最长可以生成 15 秒视频,画质支持 720P 和 1080P,参考图最多能放 9 张。
在无参考图的情况下,只用一段不到 100 字的提示词,就可以跑出一支质感还不错的纪录片风格短片。
比较惊喜的是,它的音画同步完成度很高。比如手掌揉过面团时那种细碎的摩擦声,还有面团、面板撞击案台的声音,都能跟手部动作搭配。
而如果提供参考图,只要搭配简单的一两句话提示词,也能做出不错的效果。
比如下面这个案例,“ 生成一段皮克斯电影质感的电影前导片,主角坐到背后的赛车里,倒车离开画面。镜头位置始终不变,不要跟随角色。”
或者让米家三姐妹摸摸角色的头:“ 闪光灯闪过,左二右一的人物都放下剪刀手,摸右二人物的头。”
又或者来个汉堡广告片:
所以大伙儿也能看出来,HappyHorse 对参考图还是挺依赖的。加了参考图之后,不管是抽卡成功率,还是最终画面的质感,都明显稳不少。
所以建议大家使用前先用 GPT-Image-2 做个图,再搭配提示词食用。
或者对画面运镜要求更高的差友,还可以试试下面这种参考图 + 千字提示词的玩法。
只要在提示词里说清楚剧情,每秒的运镜分镜,画面氛围,人物表演情绪,台词背景音等等细节,你就可以得到一段 《 无间道 》 复刻版。
世超测了不少案例,感觉 HappyHorse-1.0 在镜头指令遵循方面还是很强的。比如提示词里说 2-4s 给特写镜头,实际视频里运镜是符合要求的。
不过,如果说运镜做得还不错,语音声线方面,HappyHorse 就有点一般了。上面这个算好例子,实际上 80% 的视频,都会出现极其 AI 的配音,剩下 20% 的情况里,我也没摸清怎么提示,才能让它说话稳定地拥有感情。。。
再给大伙儿看一个肖申克的救赎,只要不开腔,环境音和动作音还是比较到位的:
当然,真正想跑出完美无缺的好视频,还是得靠抽卡大法。而这,也是目前整个行业的现状。比如抽出来一条视频,80% 是没有问题的。但它总在那 20% 的细节上翻车,比如人飞着飞着少了一条腿,背景音突然出现莫名其妙的台词。
包括在多人物,在快速运动场景里表现比较一般。哪怕只是两个人站在地面对剑这种相对简单的动作,生成出来效果也经常很绵软,整体缺乏打击感。 不过相信在未来,随着模型的更新,抽卡这件事儿,也会逐渐被技术淘汰。
而在视频编辑功能上,HappyHorse-1.0 的表现也算比较稳定。
在风格、环境等大面积修改的时候,能保持和原视频的一致性。比如真人改成动漫风格:
或者暴雨改晴天:
又或者局部给人物戴个口罩:
但视频编辑对提示词比较敏感,只会严格按照涉及的部分修改。比如,你只提到把画面里的角色男性换成女性,背景音台词就会保持原来的男性声线不变。
最后再给大伙儿说说价格。官网目前每天登录免费送 50 积分,而生成一条 5s 720P 的视频原价 45 积分,会员 7 折后也要 32,白嫖基本不太现实。
但即使花钱,HappyHorse 其实算是比较有性价比的。根据官方的口径,HappyHorse-1.0 官网叠加会员折扣之后合 0.44 元/秒,这在 AI 视频模型里是一个相当有竞争力的价格。
目前比较优秀的模型,每秒成本一般在 1 元左右。世超周围也有不少编辑部小伙伴表示,现在好的视频模型太贵,大伙儿非必要都不舍得用。
所以,如果 HappyHorse 能保持这个价格优势,再把模型短板补上,对一些小工作室,或者个人使用来说,还是有很大吸引力的。
总的来说,不管是开年的 Seedance,还是现在的 HappyHorse,咱们都能明显感觉到,国产视频模型已经不再是 Veo、Sora 后面的小跟班,反过来要教这些海外模型学做 AI 了。
即使它们还不完美,依然翻车,但这些 AI 模型能力的持续进化,成本的大幅优化,正在一点点改变视频内容的生产方式。
过去做一条商业广告片、短剧、电影,需要支撑一整个团队的预算。现在,一个普通创作者靠参考图和提示词,居然也能摸到专业影像的门槛。
希望视频模型继续照这个势头卷下去,以后普通人想看点好剧,可能真的只需要烧烧 token,在家里动动手指了。
撰文:咸咸
编辑:面线
美编:素描
图片、资料来源:
X、HappyHorse 官网