Show HN: OSS implementation of Test Time Diffusion that runs on a 24gb GPU
4 months ago
- #MMU-RAG
- #deep-learning
- #research-agent
- TTD-RAG是专为MMU-RAG竞赛研发的深度研究智能体
- 该系统实现了'测试时扩散深度研究者(TTD-DR)'框架
- 报告生成被建模为迭代式的'去噪'过程
- 核心特性包括:测试时扩散框架、基于检索的报告级去噪、组件级自我进化、高性能服务
- 智能体分三阶段运行:规划与初稿生成、迭代搜索与去噪、最终报告生成
- 采用技术栈:FastAPI框架、vLLM推理引擎、千问/Qwen3-4B-Instruct-2507模型、Qwen3重排序器0.6B版本、FineWeb搜索API、Docker容器化
- 部署要求:Docker环境、配备24GB以上显存的NVIDIA显卡、需配置FINEWEB_API_KEY和OPENROUTER_API_KEY密钥
- API接口包含:健康检查、动态评估(/run)、静态评估(/evaluate)端点
- 提供AWS CLI命令用于将Docker镜像推送至竞赛ECR仓库