Hasty Briefsbeta

双语

Discovering state-of-the-art reinforcement learning algorithms

7 months ago
  • #Meta-Learning
  • #Reinforcement Learning
  • #Artificial Intelligence
  • 人类和动物使用进化形成的强化学习(RL)机制。
  • 人工代理通常使用手工设计的学习规则。
  • 研究表明机器能自主发现最先进的强化学习算法。
  • 通过在复杂环境中对智能体群体进行元学习,最终实现了这一发现。
  • 在Atari基准测试中,该发现的学习规则优于人工设计的规则。
  • 在未见过的测试基准上,其表现也超越了最先进的强化学习算法。
  • 研究结果表明,先进的人工智能可能很快将依赖于自动发现的强化学习算法。