Hasty Briefsbeta

双语

Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU

4 months ago
  • #MMU-RAG
  • #deep-learning
  • #research-agent
  • TTD-RAG是专为MMU-RAG竞赛研发的深度研究智能体
  • 该系统实现了'测试时扩散深度研究者(TTD-DR)'框架
  • 报告生成被建模为迭代式的'去噪'过程
  • 核心特性包括:测试时扩散框架、基于检索的报告级去噪、组件级自我进化、高性能服务
  • 智能体分三阶段运行:规划与初稿生成、迭代搜索与去噪、最终报告生成
  • 采用技术栈:FastAPI框架、vLLM推理引擎、千问/Qwen3-4B-Instruct-2507模型、Qwen3重排序器0.6B版本、FineWeb搜索API、Docker容器化
  • 部署要求:Docker环境、配备24GB以上显存的NVIDIA显卡、需配置FINEWEB_API_KEY和OPENROUTER_API_KEY密钥
  • API接口包含:健康检查、动态评估(/run)、静态评估(/evaluate)端点
  • 提供AWS CLI命令用于将Docker镜像推送至竞赛ECR仓库