Hasty Briefsbeta

双语

Tiny worlds: A minimal implementation of DeepMind's Genie world model

5 months ago
  • #deep-learning
  • #autoregressive
  • #world-models
  • TinyWorlds是一个基于Google Deepmind Genie架构的极简自回归世界模型。
  • 它通过自回归的无监督方法帮助理解可扩展的世界模型。
  • 安装步骤包括克隆代码库、安装依赖项及设置环境变量。
  • 训练需要下载数据集并使用配置文件运行训练脚本。
  • 推理需加载预训练检查点并运行推理脚本。
  • 世界模型将环境当前状态映射至下一状态,将信息压缩为规律。
  • TinyWorlds使用离散令牌简化动态预测,包含三大模块:视频分词器、动作分词器和动态模型。
  • 时空变换器(STT)通过空间与时间注意力层处理视频数据。
  • 变分自编码器(VAE)用于量化和分词处理。
  • 动作分词器能在无先验动作数据的情况下推断帧间动作。
  • 动态模型根据历史令牌和动作预测未来帧。
  • 数据被处理为.h5格式,支持PicoDoom、Pong、Zelda等数据集。
  • 支持Torch的编译、DDP、AMP、TF32等特性以加速训练推理。
  • 未来改进方向包括专家混合系统、新优化器及多GPU扩展。