Realtime regression in non-English production voice agents
2 days ago
- #non-English performance
- #model regression
- #AI voice platform
- 一个使用OpenAI实时API的生成式AI语音平台,在从已验证模型'gpt-realtime-mini-2025-10-06'迁移到替换模型'gpt-realtime-mini'时出现性能退化,尤其在罗马尼亚语等非英语场景下更为明显。
- 新模型表现出更差的语言质量和对业务数据的忠实度,包括虚构不存在的部门和服务,而经过严格可靠性测试的旧快照模型则无此问题。
- 此问题影响了跨数十个地点的企业推广,波及实时AI电话通话、预约总结、客户关系管理记录、运营报告和客户信任。
- 证据包括对比两种模型的转录示例,引发了对其更广泛非英语性能问题的担忧。
- 人们质疑是否有人观察到类似的退化现象,OpenAI是否追踪特定语言问题,以及当替代模型在行为上不等价时,是否存在延长访问或迁移的途径。