Discovering state-of-the-art reinforcement learning algorithms
7 months ago
- #Meta-Learning
- #Reinforcement Learning
- #Artificial Intelligence
- 人类和动物使用进化形成的强化学习(RL)机制。
- 人工代理通常使用手工设计的学习规则。
- 研究表明机器能自主发现最先进的强化学习算法。
- 通过在复杂环境中对智能体群体进行元学习,最终实现了这一发现。
- 在Atari基准测试中,该发现的学习规则优于人工设计的规则。
- 在未见过的测试基准上,其表现也超越了最先进的强化学习算法。
- 研究结果表明,先进的人工智能可能很快将依赖于自动发现的强化学习算法。