Hasty Briefsbeta

双语

Show HN: AgentReady – Drop-in proxy that cuts LLM token costs 40-60%

2 days ago
  • #proxy
  • #LLM
  • #optimization
  • AgentReady Proxy通过压缩提示词将LLM令牌成本降低40-60%
  • 采用确定性规则压缩技术(约5毫秒开销,无需二次LLM调用)
  • 自动删除填充词、冗余短语、连接词、重复行和多余空格
  • 完整保留语义、代码块、URL、数字、日期及句子结构
  • 支持多语言:英语、意大利语、法语、德语、西班牙语
  • 可通过base_url替换或monkey-patching轻松集成OpenAI SDK
  • 提供三档压缩级别:轻度(10-20%)、标准(20-40%)、激进(35-55%)
  • Beta阶段免费,正式版按令牌计费且节省显著
  • 兼容GPT-4/Claude/Gemini,输出质量影响极小(BLEU/ROUGE分数差异<2%)
  • 安全保障:上游API密钥直接透传,永不存储或记录