Hasty Briefsbeta

双语

Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing

9 months ago

#LLM
#Machine Learning
#AI Optimization

Avengers-Pro 是一个面向大语言模型的测试时路由框架，旨在优化性能与效率。
该系统通过性能-效率评分机制，动态将查询路由至最合适的模型。
Avengers-Pro 取得突破性成果，平均准确率超越GPT-5-medium达7%以上。
在降低27%成本时保持最强单体模型精度，以降低63%成本实现约90%性能表现。
该框架构建了帕累托前沿，可在任意给定成本下提供最优精度，反之亦然。
Avengers-Pro 的代码已开源发布。