Hasty Briefsbeta

双语

Solving a Million-Step LLM Task with Zero Errors

6 months ago

#Task Decomposition
#Large Language Models
#Artificial Intelligence

大语言模型在推理和工具使用方面取得了显著进展，但由于持续存在的错误率，在扩展流程中仍存在困难。
最新实验表明，大语言模型在需要超过数百步操作的任务中会失败，例如河内塔基准测试。
MAKER系统作为首个能零错误完成百万步大语言模型任务的解决方案，通过极致任务分解实现突破。
该方法采用微智能体处理子任务，并通过多智能体投票实现每一步的错误校正。
大规模分解的代理流程（MDAPs）可能使组织和社会层面的复杂问题得以解决，而无需单纯依赖大语言模型的改进。