首页 企业动态 腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架 麦享科技12月17日消息,今日,腾讯混元宣布,腾讯混元世界模型1.5正式发布,只需输入文字描述或者图片即可创建专属的…

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

麦享科技12月17日消息,今日,腾讯混元宣布,腾讯混元世界模型1.5正式发布,只需输入文字描述或者图片即可创建专属的互动世界。

通过键盘、鼠标或手柄,即可实时控制虚拟相机的移动和转向,让用户可以像玩游戏一样自由探索AI生成的世界。

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

该模型首次开源业界最系统、最全面的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路、全环节,并提出了重构记忆力、长上下文蒸馏、基于3D的自回归扩散模型强化学习等算法模块。 

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

腾讯混元世界模型1.5发布!首次开源业界最全面实时世界模型框架

戏场景生成

混元世界模型1.5具备三大核心能力:

1、实时的交互生成:通过原创的Context Forcing蒸馏方案以及流式推理优化,模型可以按照24 FPS的速度生成720P的高清视频;

2、长范围的3D一致性:通过重构记忆机制(Reconstituted Memory),模型支持分钟级内容的几何一致性生成,可用于构建高质量的3D空间模拟器;

3、多样化的交互体验:混元世界模型可广泛适用于不同风格的游戏或者现实场景,以及第一和第三人称视角,也支持实时文本触发事件和视频续写等功能。 

据介绍,混元世界模型1.5的核心是WorldPlay自回归扩散模型,采用Next-Frames-Prediction的视觉自回归任务进行训练,实现长范围几何一致性的实时交互式世界建模,破解了业界满足实时性与几何一致性的难题。

AD 麦享生活

网购比价查优惠券就用麦享生活
领打车|外卖红包|美团|抖音团购也用麦享生活
各大应用商店均可搜索安装【麦享生活APP】

文章来源【快科技】,转载请注明出处,本文链接 : https://www.bltcool.com/65440.html
上一篇
下一篇

为您推荐

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部