Claude vs. Gemini: Testing on 1M Tokens of Context
9 months ago
- #AI
- #Gemini
- #Claude Sonnet 4
- Anthropic发布了拥有100万token上下文窗口的Claude Sonnet 4模型,单次提示可处理相当于《哈利波特》全集的文本量
- 测试主要包含三个维度:长文本分析、长代码分析及AI外交博弈
- 在文本分析中,Claude Sonnet 4响应速度优于Gemini系列且幻觉更少,但答案详细程度稍逊
- 代码分析环节Claude得分低于Gemini模型,仅保持微弱的速度优势
- AI外交博弈测试中,Claude Sonnet 4以未经优化的提示模板取得第二名成绩
- 定价方面,Claude Sonnet 4每百万token收费6美元,而Gemini Pro和Flash分别定价2.5美元和0.3美元
- 该模型适合追求响应速度与可靠性的场景,但需要深度分析的任务仍推荐使用Gemini