Solving a Million-Step LLM Task with Zero Errors
6 months ago
- #Task Decomposition
- #Large Language Models
- #Artificial Intelligence
- 大语言模型在推理和工具使用方面取得了显著进展,但由于持续存在的错误率,在扩展流程中仍存在困难。
- 最新实验表明,大语言模型在需要超过数百步操作的任务中会失败,例如河内塔基准测试。
- MAKER系统作为首个能零错误完成百万步大语言模型任务的解决方案,通过极致任务分解实现突破。
- 该方法采用微智能体处理子任务,并通过多智能体投票实现每一步的错误校正。
- 大规模分解的代理流程(MDAPs)可能使组织和社会层面的复杂问题得以解决,而无需单纯依赖大语言模型的改进。