Hasty Briefsbeta

双语

Claude vs. Gemini: Testing on 1M Tokens of Context

9 months ago

#AI
#Gemini
#Claude Sonnet 4

Anthropic发布了拥有100万token上下文窗口的Claude Sonnet 4模型，单次提示可处理相当于《哈利波特》全集的文本量
测试主要包含三个维度：长文本分析、长代码分析及AI外交博弈
在文本分析中，Claude Sonnet 4响应速度优于Gemini系列且幻觉更少，但答案详细程度稍逊
代码分析环节Claude得分低于Gemini模型，仅保持微弱的速度优势
AI外交博弈测试中，Claude Sonnet 4以未经优化的提示模板取得第二名成绩
定价方面，Claude Sonnet 4每百万token收费6美元，而Gemini Pro和Flash分别定价2.5美元和0.3美元
该模型适合追求响应速度与可靠性的场景，但需要深度分析的任务仍推荐使用Gemini