Hasty Briefsbeta

双语

Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing

9 months ago
  • #LLM
  • #Machine Learning
  • #AI Optimization
  • Avengers-Pro 是一个面向大语言模型的测试时路由框架,旨在优化性能与效率。
  • 该系统通过性能-效率评分机制,动态将查询路由至最合适的模型。
  • Avengers-Pro 取得突破性成果,平均准确率超越GPT-5-medium达7%以上。
  • 在降低27%成本时保持最强单体模型精度,以降低63%成本实现约90%性能表现。
  • 该框架构建了帕累托前沿,可在任意给定成本下提供最优精度,反之亦然。
  • Avengers-Pro 的代码已开源发布。