谷歌DeepMind推出AI基础世界模型Genie：110亿参数、可基于图片生成2D游戏

PA一线｜2024-02-27 17:21

PANews 2月27日消息，谷歌DeepMind推出了名为Genie的新型AI基础世界交互模型，该模型拥有110亿个参数，标志着AI领域的一次革命性突破。Genie能够基于用户输入的图片和提示词，生成一款较为完整的2D平台游戏。该模型由三个核心部分构成：潜在动作模型、视频tokenizer以及动态模型。这三个组件的合作使Genie能够创建具有高度交互性和可控性的虚拟世界。

经过超过20万小时的2D游戏视频训练，Genie目前仍处于研究预览版阶段，生成的游戏更贴近于2D平台游戏而非完整的VR游戏。此外，Genie不仅能生成游戏图像和其他资源，还能把用户的草图转化为一个完全实现的开放世界。通过预测玩家操作后的下一像素帧，Genie还可用于设计和创作领域，极大地扩展了创作者的想象空间。

原文链接