Secrets of DeepSeek AI model revealed in landmark paper
8 months ago
- #DeepSeek
- #Machine Learning
- #Artificial Intelligence
- 深度求索的AI模型R1在数学和编程等推理任务上表现优异,是美国开发工具的廉价竞争对手
- R1是'开放权重'模型,可供下载,在Hugging Face平台下载量已达1090万次
- 训练R1花费29.4万美元,加上基础大语言模型的600万美元,成本远低于竞品
- R1是首个经过同行评议的主流大语言模型,为AI发展的透明度树立了新标准
- 深度求索采用纯强化学习训练R1,使其自主发展出推理策略
- R1对AI研究产生重要影响,推动了2025年大语言模型强化学习领域的工作