Hasty Briefsbeta

双语

CodeScientist: Automated scientific discovery system for code-based experiments

a year ago

#automated-experimentation
#LLM
#scientific-discovery

CodeScientist是一个端到端的半自动化科学发现系统，能够设计、迭代和分析以Python代码形式表达的科学实验。
该系统通过遗传突变（LLM-as-a-mutator范式）结合科学论文和代码示例来生成新颖想法。
包含实验构建器组件，可自动在容器中创建、运行和调试实验代码，并生成结果报告。
支持两种运行模式：人工介入循环（主要模式）和全自动模式（效率较低）。
代码库包含开源软件、安装说明、研究报告、原始数据（实验代码/日志/想法等）和示例论文。
核心功能包括：从论文生成创意、手动/自动创建实验、批量自主实验、元分析及外部系统集成。
安装要求Ubuntu Linux（或MacOS）、Python 3.12、Latex发行版及Modal.com账户（用于云容器执行）。
用户可通过添加领域专业论文和代码块扩展系统能力。
内置成本估算工具管理LLM API使用，设有硬性限制防止费用失控。
示例实验展示了系统验证假设的能力，如LLM置信度与准确性、状态复杂性影响、知识图谱代理等研究。