Show HN: AgentReady – Drop-in proxy that cuts LLM token costs 40-60%
2 days ago
- #proxy
- #LLM
- #optimization
- AgentReady Proxy通过压缩提示词将LLM令牌成本降低40-60%
- 采用确定性规则压缩技术(约5毫秒开销,无需二次LLM调用)
- 自动删除填充词、冗余短语、连接词、重复行和多余空格
- 完整保留语义、代码块、URL、数字、日期及句子结构
- 支持多语言:英语、意大利语、法语、德语、西班牙语
- 可通过base_url替换或monkey-patching轻松集成OpenAI SDK
- 提供三档压缩级别:轻度(10-20%)、标准(20-40%)、激进(35-55%)
- Beta阶段免费,正式版按令牌计费且节省显著
- 兼容GPT-4/Claude/Gemini,输出质量影响极小(BLEU/ROUGE分数差异<2%)
- 安全保障:上游API密钥直接透传,永不存储或记录