Hasty Briefsbeta

双语

The M×N problem of tool calling and open-source models

7 days ago
  • #open models
  • #tool calling
  • #wire formats
  • 与闭源模型进行工具调用无缝衔接,但开源模型引入了线格式依赖,若不支持可能导致输出混乱。
  • 不同模型系列,如Harmony、DeepSeek和GLM5,以不相容的线格式编码工具调用,这些格式拥有独特的词汇表和序列化方案。
  • 解析模型输出需要在每个应用中为每种模型实现定制方案(如vLLM、SGLang),导致bug和逆向工程挑战。
  • 通用解析器难以应对线格式的开放性特性,无法处理非标准设计,造成如推理令牌泄漏到参数等问题。
  • 语法引擎和输出解析器都需要相同的模型特定格式知识,但它们独立开发,导致生态系统中重复投入。
  • 需要一个共享的声明式规范来描述工具调用的线格式,以标准化配置并减少工具间的逆向工程工作量。