Hasty Briefsbeta

双语

Discovering state-of-the-art reinforcement learning algorithms

7 months ago

#Meta-Learning
#Reinforcement Learning
#Artificial Intelligence

人类和动物使用进化形成的强化学习（RL）机制。
人工代理通常使用手工设计的学习规则。
研究表明机器能自主发现最先进的强化学习算法。
通过在复杂环境中对智能体群体进行元学习，最终实现了这一发现。
在Atari基准测试中，该发现的学习规则优于人工设计的规则。
在未见过的测试基准上，其表现也超越了最先进的强化学习算法。
研究结果表明，先进的人工智能可能很快将依赖于自动发现的强化学习算法。