2026年4月27日,阿里巴巴集团旗下视频生成模型HappyHorse1.0正式开启灰度测试。该模型依托原生多模态架构,采用音视频联合生成方案,面向广告、电商、短剧、社媒创意等内容生产场景,提供从智能生成到编辑的一体化创作能力。官网720P视频生成刊例价为0.9元/秒,专业会员包月价格叠加限时折扣后为0.44元/秒;1080P视频生成刊例价1.6元/秒,专业会员包月价格叠加限时折扣后为0.78元/秒。全球专业创作者和企业级客户可通过HappyHorse官网和阿里云百炼平台注册使用,大众用户可在千问App体验。
技术架构与核心能力
HappyHorse1.0采用150亿参数、40层单流自注意力Transformer架构,将文本、视频、音频的token统一压入同一序列进行联合训练,中间32层参数共享。这种原生音视频联合生成方案区别于传统的“先生成视频再配音”方式,能够一次性生成带同步音效和口型匹配的视频。模型支持7种语言的口型同步,在画面质感与光影效果、运镜与转场流畅度以及人物真实感等方面表现优秀。
模型主要包含视频生成和视频编辑两大功能模块。视频生成功能涵盖主流的文生视频、图生视频以及多图参考生视频能力;视频编辑功能支持对视频进行灵活的二次创作。模型支持最长15秒的多镜头连贯叙事,具备多画幅适配与1080P超分输出能力。支持的视频比例包括16:9、4:3、3:4、1:1、9:16共5个常规视频比例,一次可生成视频时长在3-15秒之间。
性能表现与评测数据
在国际权威评测平台ArtificialAnalysis的VideoArena榜单中,HappyHorse1.0曾以匿名身份参与评测[citation:available:3]。根据2026年4月7日的评测数据,该模型在文生视频任务中ELO评分达到1384分,领先字节跳动Seedance2.0超过100分;在图生视频任务中评分达到1413分,刷新该平台历史纪录[citation:available:3]。在ArtificialAnalysis的AIVideoArena总体评分中,HappyHorse1.0已超过Seedance2.0和Kling3.0,位列全球视频生成模型前茅。
从具体评测指标来看,HappyHorse1.0在物理一致性方面得分为4.52分(满分5分),视觉质量得分为4.80分,文本对齐得分为4.18分。在公开测试任务“一颗橡皮筋球沿楼梯弹跳而下,左转进入卫生间,在瓷砖上反弹后落入马桶”中,模型生成的视频运动轨迹连贯、物体碰撞逻辑一致。另一则小朋友拍照的实测片段显示,人物动作自然、画面细节完整,能够满足日常内容创作的基础要求。
价格体系与成本优势
HappyHorse官网采用积分制计费体系,新用户注册即赠送66积分。根据实测数据,生成3秒视频需要消耗19积分,5秒需消耗32个积分,10秒则需消耗63积分。千问APP提供的体验额度更大,用户每日有10个额度的体验额,生成5秒视频消耗1个额度,10秒消耗2个额度。
与行业同类产品相比,HappyHorse1.0在价格上具备明显优势。以720P视频生成为例,HappyHorse1.0专业会员包月价格叠加限时折扣后为0.44元/秒,而字节跳动Seedance2.0在视频生成价格上每秒约高出0.1元。百度蒸汽机模型Turbo版生成一段5秒720p的一体化有声视频价格为1.4元,相当于0.28元/秒。生数科技Vidu2.0的720P每秒单价为0.258元/秒。火山引擎豆包大模型1.6的视频生成模型Seedance1.0pro每生成一条5秒的1080P视频需3.67元,相当于0.734元/秒。
行业竞争格局
国内视频生成模型市场正经历快速发展和激烈竞争。2025年6月,火山引擎发布豆包大模型1.6、视频生成模型Seedance1.0pro等核心技术,其中Seedance1.0pro模型每千tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元。2025年8月,百度蒸汽机模型完成大幅度升级,Turbo版生成一段5秒720p的一体化有声视频价格为1.4元,将视频生成模型价格降至行业价格的70%水平。2025年9月,可灵AI推出视频生成可灵2.5Turbo模型,相比2.1模型同档位便宜近30%。
从订阅模式来看,海螺AI最高级别会员月费为1399元/月,为目前国内视频生成模型定价之最。可灵AI的收费标准分为黄金会员66元/月、铂金会员266元/月、钻石会员666元/月、黑金会员1314元/月。即梦AI定价分为三档,基础会员、标准会员、高级会员的月费分别是79元、239元、649元。
技术团队与研发背景
HappyHorse1.0由阿里巴巴ATH创新事业部主导研发。该团队由前快手副总裁张迪带队推进,张迪曾被称为“可灵之父”,于2025年底回归阿里后参与相关方向布局[citation:available:3]。阿里巴巴副总裁郑波团队也参与了该模型的研发工作[citation:available:3]。
阿里巴巴在视频生成领域已有长期技术积累。2025年12月,阿里巴巴旗下千问APP正式上线视频生成模型“万相2.6”,并向所有用户免费开放。2026年4月3日,阿里巴巴发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型,拥有全面的创作控制力。万相2.7视频生成模型已在千问App上线,支持视频编辑、视频续写与动作模仿三大核心功能。
应用场景与市场定位
HappyHorse1.0主要面向广告、电商、短剧、社媒创意等内容生产场景。麦斯国际技术合伙人李明在体验后表示,在首帧图清楚干净、提示词明确的情况下,产出结果具有可用性,漫剧人物的转场方面多数时候能生成不错的结果。李明指出,创作者最关心的三件事是成本、速度、一致性。中小型创作者一天可能需要产出200分钟以上的视频内容,目前AI视频模型的成本并不低,创作者普遍希望成本能降下来。
从生成效率来看,实测显示使用HappyHorse1.0生成一段时长8至10秒的视频约需3分钟。单张H100显卡生成5秒1080P视频仅需38秒,速度是同类主流模型的2-3倍。在画面镜头方面,模型能够灵活自如地运镜,实现从远景到近景的顺畅切换,依据提示词的内容,光影效果呈现出较为自然的变化,画面中人物的口型与演唱歌词的节奏保持一致。
生态布局与入口策略
阿里巴巴在AI视频生成领域采取了双入口策略。在移动端,HappyHorse嵌入千问App;在PC端,开放创作网页版,形成面向普通用户与创作者的双入口。千问App自2025年11月17日公测以来,以惊人速度持续迭代,一个月内更新18个版本,覆盖创作、学习、办公三大核心场景。
阿里云百炼平台作为企业级入口,为专业创作者和企业客户提供API接口服务。ATH创新事业部已启动“AI时代全新交互方式探索计划”,HappyHorse为该计划的重要组成部分。该模型计划后续逐步开放API接口,目前产品正由内测向灰度测试过渡。
行业影响与发展趋势
视频生成技术正从单镜头或短片段生成能力向多镜头组织能力演进。相较于此前以单镜头或短片段生成能力为主的主流视频模型,HappyHorse1.0在叙事结构层面进一步增强多镜头组织能力,使生成内容在表达形式上更接近影视级叙事逻辑。当视频生成技术仍在围绕画面稳定性与生成质量持续优化时,更高层级的叙事能力正在成为新的技术焦点。
万兴科技董事长吴太兵认为,视频生成行业一定是价格战和非价格战并行的。非价格战即技术的斗争,行业发展非常快,但是现在远没达到终点。目前视频生成的模型成本依然太高,需要通过整合生态合作来解决。对于未来,吴太兵表示不管是价格战和非价格战都会是一个积极的参与者。
实测体验与用户反馈
灰度测试开启后,创作者迅速展开应用实践,生成内容涵盖TVB港风短片、老电影复古风格等多种类型,在叙事表达、音画同步及风格一致性方面表现较为稳定。多位创作者表示,该模型在生成效率与综合成本方面优势明显,适用于电商短视频、广告素材及内容创作等多类场景。
短视频创作者@剪辑阿凯分享的实测感受显示,HappyHorse1.0的画面流畅度和物体一致性,能覆盖短视频创作的常见需求。在画面质感方面,无论是人物肤质,还是烟气水雾,均可呈现出电影级质感,尤其擅长大光圈、浅景深、强氛围感的中近景镜头表达,支持拉近、拉远、景深变换等多种运镜方式。
技术挑战与未来展望
当前AI视频生成领域仍面临诸多技术挑战。很多AI视频创作团队的抽卡率达到50%至60%,这说明当前市场视频生成的可控性还有比较大的提升空间。小体量创作者对速度要求高,希望几分钟内能生成视频,大体量创作者会选择多种工具辅助,追求更快的效果。在一致性方面,产出越稳定越好,人工介入越少越好。
阿里巴巴ATH创新事业部表示,已启动“AI时代全新交互方式探索计划”,HappyHorse为该计划的重要组成部分,更多的产品将会陆续推出。随着视频生成技术的不断成熟和成本的持续下降,AI视频生成有望在广告营销、影视制作、教育课件、虚拟直播等领域得到更广泛应用。
