HappyHorse-1.0凭什么盲测屠榜?4月30日上线前,我替你研究透了

问AI · 张迪的可灵经验如何影响HappyHorse的技术路线?
图片

Hi,大家好!我是蜡笔,你的AI入门学习指南💡


HappyHorse是阿里ATH创新事业部正在内测中的产品;于4.10日在微博发布确认;因在全球盲测中屠榜第一而闻名,上线前就已经在全球盲测里干掉了Seedance2.0和Kling。


图片


不过我深挖下信息,发现一切皆有可能的。



01

HappyHorse负责人

特意去搜集下:ATH创新事业部背景,张迪其人,有着"可灵之父"的履历,上海交通大学计算机硕士,2010年加入阿里做广告算法,后来跳到快手,2023年开始主导大模型和视觉生成,可灵AI就是他带出来的。

2025年8月,快手内部调整,张迪卸任离开。然后他去了B站。待了一个多月,又走了。

2025年11月,他回到阿里,进了淘天集团「未来生活实验室」,直接向淘天技术总裁汇报。

一个做出可灵的人,带着可灵的经验,重新做一个视频模型;这并非籍籍无名之人,这种积累不是从零开始,而是有优秀视觉模型经验的积累。这也是为什么HappyHorse一出来就能屠榜吧。


02

HappyHorse模型跟其它的异同?

分享一个倒放老师测评合集,已征得本人授权。

 该视频疑似AI生成

很可惜上述对比,没有抽到seedance2.0的对比,因为是随机的。

根据现有的内容分析,HappyHorse解决了一个很多人都会遇到的难题,用AI生成视频,加了配音,嘴型对不上。HappyHorse换了新思路:视频和音频同时生成技术上叫单流Transformer架构,40层,约150亿参数,一次推理同步输出视频和音频。结果就是:口型对得上,环境音自然,音效跟画面是一体的,不需要额外处理。

一个简单的类比:其他模型像先拍画面再后期配音,HappyHorse像拍电影时现场同期收音。还有一个优点: 它用了DMD-2蒸馏技术,只需8步去噪,生成速度比普通扩散模型快不少,按目前测评反馈,约38秒生成一段视频。

不过目前最火的seedance2.0其实也做到了画面音效统一的效果,Seedance 2.0 用的是 双分支架构 视频和音频各走一条分支,两条分支通过"跨模态注意力桥接模块"实时联动。简单说:两个人一起干活,随时互相对齐,视觉流管画面,音频流管声音,底层训练时就绑在一起了。

图片


03

盲测屠榜就是最好的吗

Artificial Analysis是一个独立的AI模型评测平台,视频生成榜单叫Video Arena:用的是盲测机制:把不同模型生成的视频混在一起,让用户在不知道是哪个模型的情况下投票选更好的,最后用Elo积分排名。这种方式相对客观,因为用户没有品牌偏见。

附上地址:

https://artificialanalysis.ai


图片


HappyHorse在这个榜单的文生视频(T2V)和图生视频(I2V)两个赛道同时登顶,超过了Seedance 2.0和Kling 3.0

但有个事大家不要误解:盲测第一≠全场景最强。

根据已知信息,首先两个模型在可实现的多模态程度都不一样,而且Elo积分反映的是综合观感:画面好不好看、动作流不流畅、整体有没有电影感。它不能告诉你这个模型在你的具体使用场景里表现怎样

HappyHorse是以匿名方式登上榜单的:先屠榜,再公布自己是谁。这种打法不排除是一种营销策略,但也说明团队很清楚自己产品的实力,也清楚怎么制造话题。

我猜,大家都希望HappyHorse给力一些,毕竟有些模型一家独大,一个月已经涨价好几回了,怨声载道,但又不得不用,因为确实目前最好。



04

HappHorse现在能用吗

结论:现在还不能用

HappyHorse-1.0目前处于内测阶段,计划2026年4月30日开放API接入,看到lovart官方有发也会接入。

截止(4.12)为止,官方已经明确发出警告:目前网上流传的所有"HappyHorse官网"、"内测申请入口"、"内测码领取"链接,全部不是真实官方渠道。我自己都被骗了好几回😂,所以这次好好做功课才分享出来。

在那之前,普通用户没有官方渠道可以使用,不排除发布前自媒体博主有内测渠道。如果哪位大佬有,求个内测机会(鞠躬)!

想尝鲜的,去Artificial Analysis盲测试试;也可以关注我,只要得到内测机会,我会第一时间分享。


最后
写在最后

HappyHorse这次最值得关注的,不是它屠了哪个榜,而是它选择的技术方向:音视频联合生成

甚至还还有计划开源的传果方向在实际使用中真的稳定,接下来半年会有越来越多的模型跟进做同样的事。

HappyHorse不一定是终点,但它会是这个方向被认真对待的起点。

不过盲测第一是真的,架构创新是真的。但实际创作场景里稳不稳定、提示词好不好写、有没有奇怪的失控——这些只有上手用了才知道。

4月30日,我会第一时间去测,出亲测对比。 如果你也在等,关注我,一起看结果。如果能得到内测机会,会更早!!


既然看到这里了

点赞
在看
转发

THANKS FOR READING