Hasty Briefsbeta

双语

Trying out Gemini 3 Pro with audio transcription and a new pelican benchmark

6 months ago

#Benchmark
#AI
#Gemini 3 Pro

谷歌发布了Gemini 3 Pro，这是Gemini 2.5的升级版，性能已对标主流竞品模型
Gemini 3 Pro保持相同知识截止日期（2025年1月），支持100万输入token和6.4万输出token，支持多模态输入（文本/图像/音频/视频）
基准测试显示Gemini 3 Pro在标准测试中略优于Claude 4.5 Sonnet和GPT-5.1
Gemini 3 Pro定价高于Gemini 2.5，但低于Claude Sonnet 4.5
Gemini 3 Pro通过复杂图像测试，成功生成精确的屏幕阅读器替代文本
市政会议音频转录测试部分成功，存在时间戳不准确问题
Gemini 3 Pro新增'思考级别'功能（低/高），通过鹈鹕SVG基准测试进行演示
新版鹈鹕基准测试引入更精细的评估标准，专门检验AI生成复杂SVG图像的能力