Hasty Briefsbeta

双语

Enabling small language models to solve complex reasoning tasks

5 months ago
  • #MIT Research
  • #AI
  • #Language Models
  • 语言模型(LMs)虽然在简单任务上表现出色,但在数独、高级谜题和数学证明等复杂任务上仍存在困难。
  • 麻省理工学院研究人员开发了DisCIPL协作框架,通过让大型语言模型规划任务并委托给小型语言模型,实现效率与准确性的双重提升。
  • DisCIPL采用LLaMPPL编程语言向小型模型传递指令和约束条件,显著改善其响应质量。
  • 该系统在准确性和效率上超越GPT-4o和o1等领先模型,同时实现显著成本节约。
  • DisCIPL特别擅长需要严格遵循规则的任务,如撰写受限句子、制定购物清单和规划旅行路线。
  • 框架中的小型语言模型成本更低且可扩展,通过并行执行仅需大型模型极小部分成本。
  • 未来计划将DisCIPL扩展至数学推理和模糊偏好任务领域,并测试与更大型模型的协作效果。