一、阿里 ATH 事业群发布 HappyOyster 开放式世界模型
2026 年 4 月 16 日,阿里巴巴 ATH(Alibaba Token Hub)创新事业部正式发布首款开放式世界模型产品 HappyOyster(快乐生蚝),并于当日开启内测。该模型是阿里继视频生成模型 HappyHorse(快乐马)后,在 AI 世界模型领域的又一重磅产品。
(一)核心技术架构:原生多模态设计
HappyOyster 采用原生多模态架构,区别于传统 “视觉编码器 + 变分自编码器” 的组合式设计,从底层实现文本、图像、音频、视频等多模态输入与输出的统一处理。这种架构避免了模块割裂带来的协同损耗,实现端到端跨模态理解与生成,保证内容在时空维度的高度一致性。
(二)核心能力:实时世界创建与交互
流式生成与实时响应:不同于传统 AI 视频工具 “输入提示词→等待渲染→获得成片” 的一次性流程,HappyOyster 采用流式生成技术,在生成过程中可持续接收用户指令,画面实时响应、持续演绎。
两大核心交互模式
导演模式(Direct):支持最长3 分钟、最高720p分辨率的实时画面生成,用户可通过文字、语音、图像等多模态输入,随时切换镜头、改写剧情、调度角色。
漫游模式(Wander):支持1 分钟连续实时位移探索,用户以第一人称视角在生成的 3D 空间自由移动,支持键盘控制与摄像头实时驱动。
物理规律模拟:可生成具备物理一致性的完整 3D 空间,准确模拟光照、重力、碰撞、流体变化等物理现象,角色动作与场景因果保持时间和逻辑连续。
(三)内测与应用场景
HappyOyster 已正式开启内测,面向影视制作、游戏开发、数字孪生等领域开放申请。用户生成的数字世界可完整保存,并开放给其他用户二次创作。官方网站happyoyster.cn已上线,提供首批测试资格申请。
二、高德 ABot-PhysWorld 登顶国际权威评测
2026 年 4 月 15 日,阿里巴巴旗下高德研发的ABot-PhysWorld在世界模型领域国际权威评测WorldArena中登顶榜首。该评测由清华大学牵头,联合普林斯顿大学、新加坡国立大学、北京大学、香港大学等 8 所全球顶尖学术机构共同构建。
(一)评测体系与结果
WorldArena 评测体系包含16 项核心指标与3 类真实应用任务,从感知精度、物理规律理解、三维空间认知、动态预测能力等维度对模型进行全面评估。ABot-PhysWorld 以显著优势超越 GigaWorld、Google Veo 等国际知名模型,登顶榜首。
(二)核心技术优势
ABot-PhysWorld 属于高德 ABot 系列模型,核心优势体现在物理规律深度内化与长程动态预测能力:
物理现象精准模拟:可准确预见物体在复杂交互下的运动轨迹,包括滑动、倾倒、堆叠、流体变化等。
多步因果逻辑一致:在长时序模拟中保持高度逻辑连贯性,成功模拟数十秒的物理交互过程。
实用级生成能力:从 “演示级” 生成跨越至 “实用级”,可应用于任务规划、异常预判、自主决策等场景。
(三)技术布局与行业意义
ABot-PhysWorld 是高德 ABot 系列模型的重要组成部分。2026 年 2 月,高德发布具身操作基座模型 ABot-M0 与具身导航基座模型 ABot-N0,一举拿下全球 11 项权威评测第一。此次 ABot-PhysWorld 登顶,标志高德在具身智能领域构建了完整技术矩阵。
三、中国 AI 世界模型领域实现全面突破
2026 年 4 月 15-16 日,阿里巴巴先后发布 HappyOyster 与 ABot-PhysWorld 两款世界模型产品,分别在实时世界创建与物理规律模拟两大核心方向取得突破。
(一)技术路线与竞争格局
HappyOyster:对标谷歌 Genie 3,主打实时交互与长时序世界生成,在流式生成、多模态协同、实时可控性上形成差异化优势。
ABot-PhysWorld:聚焦物理规律理解与长程动态预测,在具身智能、机器人控制、工业模拟等领域具备核心价值。
(二)行业影响与意义
技术领先性:两款产品分别在实时世界模型与物理模拟世界模型领域达到国际领先水平,验证中国在 AI 基础模型领域的技术实力。
应用场景拓展:从视频生成、内容创作延伸至数字孪生、机器人控制、工业仿真、自动驾驶等领域,推动 AI 从 “内容生成” 向 “世界模拟” 跨越。
产业生态构建:阿里、高德等企业持续布局世界模型,形成技术、产品、应用的完整生态,助力中国 AI 产业高质量发展。
四、结语
2026 年 4 月 16 日,阿里 ATH 事业群发布 HappyOyster 开放式世界模型,高德 ABot-PhysWorld 登顶 WorldArena 国际评测,标志中国在具身智能世界模型领域实现关键突破。两款产品分别在实时世界创建、物理规律模拟两大方向取得技术领先,将为影视、游戏、工业、机器人等行业带来革命性应用价值,推动 AI 从内容生成迈向世界模拟的全新阶段。
