Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark
6 months ago
- #Benchmark
- #AI
- #Gemini 3 Pro
- 谷歌发布了Gemini 3 Pro,这是Gemini 2.5的升级版,性能已对标主流竞品模型
- Gemini 3 Pro保持相同知识截止日期(2025年1月),支持100万输入token和6.4万输出token,支持多模态输入(文本/图像/音频/视频)
- 基准测试显示Gemini 3 Pro在标准测试中略优于Claude 4.5 Sonnet和GPT-5.1
- Gemini 3 Pro定价高于Gemini 2.5,但低于Claude Sonnet 4.5
- Gemini 3 Pro通过复杂图像测试,成功生成精确的屏幕阅读器替代文本
- 市政会议音频转录测试部分成功,存在时间戳不准确问题
- Gemini 3 Pro新增'思考级别'功能(低/高),通过鹈鹕SVG基准测试进行演示
- 新版鹈鹕基准测试引入更精细的评估标准,专门检验AI生成复杂SVG图像的能力