麦享科技8月7日消息,据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型——Genie 3。
该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 “可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。
DeepMind视Genie 3为迈向通用人工智能(AGI) 的重要里程碑。它能为 AI 智能体提供广阔、逼真的训练场,同时在游戏开发、教育模拟、创意设计等领域开辟全新应用场景。
例如,仓库机器人可在该模型生成的虚拟环境中,无风险地学习应对各种突发状况,从而提升实际部署表现。
然而,Genie 3目前仍面临挑战:其支持的连续交互时长仅数分钟,远未达到理想状态(如数小时)。此外,AI智能体在模拟环境中的交互能力,尤其是处理复杂多智能体交互方面,仍需大幅提升。
为优化模型并评估潜在伦理风险,DeepMind目前以研究预览形式,向部分学者和创作者开放Genie 3,旨在收集专业反馈以驱动后续迭代。