HappyHorse-1.0:登顶 AI 视频生成排行榜的神秘匿名模型
HappyHorse-1.0 在短时间内登顶 Artificial Analysis 视频排行榜,成为 2026 年 4 月最受关注的 AI 视频模型。
但排行榜第一对普通用户意味着什么?测试数据表现优异,实际可用性却存在问题——没有公开 API、没有开源权重、上线时间未定。HappyHorse 究竟是真正强大的视频模型,还是仅仅数据好看?

核心结论:从第三方排行榜数据来看,HappyHorse-1.0 确实表现出色,特别是在无音频图生视频领域优势明显。但目前尚未开放 API 和权重,上线时间也未明确,普通用户暂时无法使用。如果需要立即可用的方案,Seedance 2.0 和 grok-imagine-video 是更实际的选择。
什么是 HappyHorse-1.0
HappyHorse-1.0 是一款神秘的 AI 视频生成模型,于 2026 年 4 月突然出现在 Artificial Analysis 视频竞技场。凭借优异的测试成绩,它迅速登上多个榜单前列,特别是在「文生视频(无音频)」和「图生视频(无音频)」两个类别表现突出,一度占据榜首位置。根据其 X 账号 @HappyHorseATH 在 2026 年 4 月 10 日发布的官方说明:

这表明 HappyHorse-1.0 目前仍处于内部测试阶段,尚未开放任何公开 API、官方网站或下载渠道。市面上声称提供 HappyHorse 服务的第三方网站,均与官方团队无关,需要谨慎辨别。
作为阿里巴巴 ATH AI 创新单元的项目,HappyHorse-1.0 采用统一的单流 Transformer 架构,支持文生视频、图生视频以及同步音频生成。团队公布的内部测试结果显示,该模型在画质、文本对齐、物理真实度和唇形同步(多语言)等方面表现优异,尤其在无音频视频生成任务上优势明显。
团队表示正在进行最后的优化工作,准备就绪后将公布更多信息。如果 HappyHorse 正式上线,有望成为 2026 年最值得期待的 AI 视频工具之一。
4.27HappyHorse 官方宣称的优势
文生视频与图生视频统一架构。官方表示 HappyHorse 通过同一套 40 层 Transformer 完成两种生成模式,而非分离的两套系统。如果这一点得到验证,理论上可以减少双模型架构常见的性能开销和画质不一致问题。
高分辨率输出与性能优势。HappyHorse 宣称最高可生成 1080p 视频,在 H100 级别硬件上低分辨率输出速度更快。这些数据值得关注,但目前均来自官方自测,尚未经过独立机构验证。
音视频联合生成。官方文档称 HappyHorse 可在单次计算中同时生成画面和多语言音频。这是产品宣传中较为突出的特性,不过目前最有说服力的证据仍是排行榜表现,普通用户尚无法直接体验。
官方内部测试:HappyHorse 对比 OVI 1.1 与 LTX 2.3
官网公布了一项四个维度的质量对比数据。需要注意的是,这些数据来自模型方的内部测试,而非 Artificial Analysis 的独立评估。
| 模型 | 视觉质量(越高越好) | 文本对齐(越高越好) | 物理规律(越高越好) | WER(越低越好) |
|---|---|---|---|---|
| OVI 1.1 | 4.73 | 4.10 | 4.41 | 40.45% |
| LTX 2.3 | 4.76 | 4.12 | 4.56 | 19.23% |
| HappyHorse 1.0 | 4.80 | 4.18 | 4.52 | 14.60% |
数据来源:HappyHorse-1.0 官网,基于 2000 次人工对比评估。
词错率(WER)用于衡量唇形同步准确度,数值越低表示效果越好。HappyHorse 的 14.60% 明显低于 LTX 2.3 的 19.23%,更远低于 OVI 1.1 的 40.45%,这与其在 Artificial Analysis 竞技场图生视频类别中的高分表现相符。
现在可以使用HappyHorse AI吗?
基本无法使用。目前 HappyHorse-1.0 更像是「排行榜上的一个名字」,而非可直接投入使用的工具。官网提到即将开源,但 GitHub 和模型库链接仍显示「即将推出」,没有实际的代码仓库或可下载的权重文件。
市面上确实存在一些使用 HappyHorse 名称的网站,但无法确认它们使用的就是 Artificial Analysis 上的那个模型。这个区别很重要。目前最好将 HappyHorse 理解为一个测试成绩优异的模型,而非普通用户可以自行部署使用的工具。
HappyHorse 1.0 实际表现:竞技场数据
HappyHorse-1.0 最具说服力的证据并非来自官网,而是来自 Artificial Analysis。该平台让用户在不知道模型名称的情况下对比两段生成视频,因此在评估画质时,这份排行榜数据比官方自述更具参考价值。
截至 2026 年 4 月初,HappyHorse-1.0 在多个类别中排名第一或接近第一,最明显的优势出现在无音频图生视频类别。

Artificial Analysis 文生视频排行榜截图(2026 年 4 月,无音频类别中 HappyHorse-1.0 位列第一)。
文生视频与图生视频 ELO 排名(各类别前五)
| 类别 | 排名 | 模型 | ELO |
|---|---|---|---|
| 文生视频 · 无音频 | |||
| T2V 无音频 | 1 | HappyHorse-1.0 | 1,360 |
| T2V 无音频 | 2 | Dreamina Seedance 2.0 720p | 1,273 |
| T2V 无音频 | 3 | SkyReels V4 | 1,244 |
| T2V 无音频 | 4 | Kling 3.0 1080p (Pro) | 1,243 |
| T2V 无音频 | 5 | grok-imagine-video | 1,230 |
| 文生视频 · 有音频 | |||
| T2V 有音频 | 1 | Dreamina Seedance 2.0 720p | 1,220 |
| T2V 有音频 | 2 | HappyHorse-1.0 | 1,217 |
| T2V 有音频 | 3 | SkyReels V4 | 1,140 |
| T2V 有音频 | 4 | Kling 3.0 Omni 1080p (Pro) | 1,106 |
| T2V 有音频 | 5 | Kling 3.0 1080p (Pro) | 1,102 |
| 图生视频 · 无音频 | |||
| I2V 无音频 | 1 | HappyHorse-1.0 | 1,403 |
| I2V 无音频 | 2 | Dreamina Seedance 2.0 720p | 1,355 |
| I2V 无音频 | 3 | grok-imagine-video | 1,332 |
| I2V 无音频 | 4 | PixVerse V6 | 1,322 |
| I2V 无音频 | 5 | Kling 3.0 Omni 1080p (Pro) | 1,298 |
| 图生视频 · 有音频 | |||
| I2V 有音频 | 1 | HappyHorse-1.0 | 1,159 |
| I2V 有音频 | 2 | Dreamina Seedance 2.0 720p | 1,158 |
| I2V 有音频 | 3 | SkyReels V4 | 1,083 |
| I2V 有音频 | 4 | Veo 3.1 Fast | 1,076 |
| I2V 有音频 | 5 | grok-imagine-video | 1,072 |
关键观察结果
无音频图生视频领先最为明显。HappyHorse-1.0 Elo 为 1,403,Dreamina Seedance 2.0 为 1,355,相差 48 分。在 Elo 体系下,约 40 分的差距意味着用户能够稳定分辨出质量差异,这是当前数据中最清晰的质量差别证据。
无音频文生视频领先 Seedance 2.0 达 87 分。Elo 为 1,360 对 1,273。需要注意的是,Seedance 样本量为 8,379,HappyHorse 为 6,214,前者的分数更加稳定;随着投票数量增加,HappyHorse 的分数可能还会发生变化。
有音频文生视频基本持平。1,220(Seedance)对 1,217(HappyHorse),误差范围约为正负 7 至 10 分,3 分的差距在误差范围内。从现有数据来看,Seedance 2.0 在音画同步方面仍具有实际优势,音频处理更为成熟。
有音频图生视频同样持平。1,159 对 1,158,误差范围约为正负 10 分,仅凭这一数据无法区分优劣。
HappyHorse AI 与竞品对比
| 模型 | 文生无音频 | 图生无音频 | API | 价格 |
|---|---|---|---|---|
| HappyHorse-1.0 | 1,360(第 1) | 1,403(第 1) | 无 | 待定 |
| Dreamina Seedance 2.0 720p | 1,273(第 2) | 1,355(第 2) | 视平台而定 | 视平台而定 |
| SkyReels V4 | 1,244(第 3) | 1,295(第 6) | 有 | $7.20/分钟 |
| Kling 3.0 1080p (Pro) | 1,243(第 4) | - | 有 | $13.44/分钟 |
| grok-imagine-video | 1,230(第 5) | 1,332(第 3) | 有 | $4.20/分钟 |
| PixVerse V6 | - | 1,322(第 4) | 有 | $5.40/分钟 |
如果仅从排行榜来看,HappyHorse-1.0 确实位列第一梯队。但如果考虑「当前可用性」,情况则完全不同。
Seedance 2.0 仍然是最强的可用替代方案,因为它已经在 SeaArt AI 平台上线,并且在文生和图生两类任务上都具有很强的竞争力。grok-imagine-video 虽然性能稍弱,但更容易获取,成本也更容易接受。因此 HappyHorse 虽然是排行榜上最亮眼的模型,但尚未成为生产环境中最实用的选择。

HappyHorse-1.0真的超越了Seedance 2.0吗?
从数据上看确实如此,在四个类别中有两类领先,且差距具有实际意义。但在实际应用中,情况会更加复杂。
在无音频文生视频中,HappyHorse 领先 87 个 Elo 分(1,360 对 1,273)。在无音频图生视频中,差距为 48 分(1,403 对 1,355)。这两个差距都足够大,能够反映盲测中稳定、一致的用户偏好,而非统计误差。
但在有音频类别中,领先优势消失。有音频文生视频:Seedance 1,220,HappyHorse 1,217,3 分的差距没有统计意义。有音频图生视频:1,159 对 1,158,几乎相同。在需要旁白、对白、同步音效等依赖音频的场景中,Seedance 2.0 与 HappyHorse 表现相当。
还需要考虑可用性差距。Seedance 2.0 是当前可以直接使用的产品;HappyHorse-1.0 仍然只是排行榜上的一个名字,没有 API,也没有权重。说 HappyHorse「超越」Seedance 2.0,在无音频画质这个角度是成立的;但如果用来指导「当前应该选择哪个模型」,这个结论就不成立了。
仍有待核实的内容
HappyHorse-1.0 的归属问题已在 2026 年 4 月 10 日由官方澄清:模型由阿里巴巴 ATH AI 创新单元(隶属 Alibaba Token Hub)研发,目前仍处于内部测试和最后优化阶段。阿里巴巴已向多家媒体确认,@HappyHorseATH 也进行了间接回应。此前关于淘天集团或 Sand.ai 的猜测,已被这份官方声明取代。

实际使用中更值得关注的两点尚未得到证实:
第一,部分报道声称基础模型、蒸馏模型、超分辨率模型和推理代码「已全部发布」「全面开源」。但 GitHub 和模型库链接仍显示「即将推出」,没有公开仓库、可下载权重或许可文件。
第二,广泛流传的 150 亿参数量仍缺少一手技术文档的确认,多出现在二手营销页面,未经独立核实。这不等于该数字不准确,只是说明关于 HappyHorse 被重复最多的技术说法,其可靠程度仍低于排行榜结果本身。
此外,团队尚未发布完整的 Model Card 或详细技术报告。竞技场测试目前主要集中在无音频视频,完整同步音频能力的展示仍然有限。API 测试预计将于 4 月 27 日起在阿里云百炼平台进行,届时将会有更多细节公布。
HappyHorse-1.0 在全球视频生成基准(文生视频、图生视频和视频编辑)中表现强劲,团队正处于最后冲刺阶段。开源落地和技术规格验证,是当前最实际的关注点。随着 API 逐步开放,上述未决问题有望很快得到解答。
HappyHorse AI 的定价及使用方式
HappyHorse-1.0 本身暂时没有公开定价,因为在 Artificial Analysis 上排名的这个模型既没有公开 API,也没有官方托管产品,因此无法直接评估成本。
一些使用 HappyHorse 名称的网站提供免费额度或付费套餐,但无法明确证实它们后台使用的就是排行榜上的那个模型。如果需要立即可用的方案,更合理的做法是横向比较 Seedance 2.0、SkyReels V4 或 grok-imagine-video,而非等待 HappyHorse 尚不明确的定价。
HappyHorse 的优势与短板
在所有数据中,无音频图生视频的结果最为可信。相对 Seedance 2.0 有 48 分的 Elo 差距(1,403 对 1,355),且有超过 6000 次投票,绝非统计误差。在这个分差下,用户能够稳定分辨出输出质量的优劣。如果重点是将静态图转换为动态视频,特别是人物场景,这是 HappyHorse-1.0 相比当下所有可用方案都展示出真实画质优势的类别。
无音频文生视频的 87 分领先看起来更大,但需要注意前提:Seedance 样本量为 8,379,HappyHorse 为 6,214,前者分数更加稳定,后者仍会随投票数量波动。新模型在最初几周出现大幅波动并不罕见,后续走向很关键。
音频方面建议保持谨慎预期。有音频文生视频中 Seedance 2.0 仅领先 3 分,统计上等同于平局。但 Artificial Analysis 用于该项测试的片段(高尔夫球在杯沿滚动并伴随特定音效)本身就是高难度的音画同步考题,3 分只能说明两者接近,无法证明 HappyHorse 更强。
真正「不完整」的是 Elo 以外的一切:尚无独立实验室完整拆解架构;无人能够复现官网基准中的词错率;推理速度据称来自单张 H100 的成绩,而非同行评议数据。在权重公布并建立正规测试流程之前,技术宣传与排行榜数据应当分开看待:听起来合理,但仍未得到证实。
延伸阅读:Seedance 2.0 评测:多模态 AI 视频创作实测
常见问题
我现在能免费使用 HappyHorse AI 吗?
并非如大多数用户所预期的那样。登上排行榜的 HappyHorse-1.0 尚未开放权重或 API。确实存在一些使用 HappyHorse 名称的网站,但无法证实它们使用的就是 Artificial Analysis 名单上的同一模型。
抛开排行榜,HappyHorse 真的比 Seedance 2.0 更好用吗?
仅部分成立。HappyHorse 在无音频类别,特别是无音频图生视频中领先明显。但在有音频类别中优势消失,而且 Seedance 2.0 因为已经在各平台上线,实际操作层面仍然更加便捷。
目前哪种视频模型在图像到视频的质量方面领先?
根据 Artificial Analysis 截至 2026 年 4 月 8 日的盲测数据,HappyHorse-1.0 在有音频和无音频两类图生视频中均位列第一:无音频 Elo 为 1,403,有音频 Elo 为 1,159。相对 Dreamina Seedance 2.0,无音频分差为 48 分,具有统计意义;有音频仅差 1 分,可视为平局。
图生视频与文生视频有何区别?HappyHorse 更擅长哪个?
文生视频仅凭文字提示生成片段;图生视频以参考图为起始帧向前演绎动态。HappyHorse-1.0 通过同一套统一流程完成两者,而非两套独立模型。从现有排行榜来看,无音频图生视频领先第二名的幅度最大(48 分);无音频文生视频表面领先 87 分,但该分项上 Seedance 2.0 样本更多,分数更加稳定。
HappyHorse-1.0 是谁开发的?
官方已于 2026 年 4 月 10 日确认,项目隶属阿里巴巴 ATH AI 创新单元(Alibaba Token Hub)。此前关于 Sand.ai 或淘天集团的猜测,已被官方声明取代。团队仍在进行最后优化,尚未向公众开放。
官网写「已全部发布」,为何仍然下载不到?
开源尚未落地。官网称基础模型、蒸馏模型、超分辨率模型与推理代码计划发布;截至 2026 年 4 月,GitHub 与模型库链接仍未激活,没有公开仓库或可下载权重。团队表示 API 测试阶段将于 4 月 27 日起在阿里云百炼平台进行,届时可能会披露更多信息。
音频是与画面一起生成,还是后期拼接?
根据官方文档,音频与画面在同一次计算中生成,而非后期配音或事后叠加。模型从一开始就将文本、画面与音频 token 一并处理。排行榜数据与这一说法相符:HappyHorse 在有音频图生视频中排名第一(Elo 1,159),有音频文生视频中排名第二(Elo 1,217);文生有音频分项中 Seedance 2.0 领先 3 分,统计上视为平局。
HappyHorse 的唇形同步准确度与其他模型相比如何?
根据 happyhorse-ai.com 公布的内部基准,HappyHorse-1.0 词错率为 14.60%,约等于每 100 个口语词中有 14 个与唇形不匹配。同场评估中 LTX 2.3 为 19.23%,OVI 1.1 为 40.45%,数值越低越好。上述数据来自模型方组织的 2000 次人工对比评估,尚未被第三方独立复现。
总结
HappyHorse AI 在排行榜上的表现确实出色。每个类别超过 5000 次盲测数据不会说谎,它反映了用户更偏好哪种输出。在大多数类别中它都胜过 Kling 3.0 和 Dreamina Seedance 2.0,最大领先优势出现在无音频图生视频。
但可用性是另一个问题:没有公开 API,没有权重,没有确定的公开发布日期。网页端那些使用 HappyHorse 名称的生成器虽然可以访问,但它们是独立产品,无法证实使用的就是排行榜上的那个模型。
HappyHorse-1.0 更像是一个测试基准,而非当前可以用于业务的工具。排行榜数据真实可信,但落地条件尚不具备。如果在 HappyHorse 尚不可用期间需要同级别的替代品,SeaArt AI 目前已经运行 Seedance 2.0 和 grok-imagine-video。等 HappyHorse 开放权重或 API 后,它与当前可用方案之间的画质差距,足以值得重新评估。


