Hasty Briefsbeta

双语

Claude vs. Gemini: Testing on 1M Tokens of Context

9 months ago
  • #AI
  • #Gemini
  • #Claude Sonnet 4
  • Anthropic发布了拥有100万token上下文窗口的Claude Sonnet 4模型,单次提示可处理相当于《哈利波特》全集的文本量
  • 测试主要包含三个维度:长文本分析、长代码分析及AI外交博弈
  • 在文本分析中,Claude Sonnet 4响应速度优于Gemini系列且幻觉更少,但答案详细程度稍逊
  • 代码分析环节Claude得分低于Gemini模型,仅保持微弱的速度优势
  • AI外交博弈测试中,Claude Sonnet 4以未经优化的提示模板取得第二名成绩
  • 定价方面,Claude Sonnet 4每百万token收费6美元,而Gemini Pro和Flash分别定价2.5美元和0.3美元
  • 该模型适合追求响应速度与可靠性的场景,但需要深度分析的任务仍推荐使用Gemini