Meta Omnilingual ASR: Advancing Automatic Speech Recognition for 1600 Languages
6 months ago
- #Multilingual
- #AI
- #Speech Recognition
- Meta旗下FAIR团队推出Omnilingual ASR系统,支持超过1,600种语言,包含500种低资源语言
- 开源Omnilingual wav2vec 2.0——70亿参数的多语言语音表征模型
- 发布Omnilingual ASR语料库,涵盖350种弱势语言的转录语音数据
- 推出两种架构变体:增强版wav2vec 2.0编码器与面向字符标记的双解码器方案
- LLM-ASR实现突破性表现,78%语言字符错误率低于10%
- 情境学习技术仅需少量音频-文本样本即可转录未支持语言
- 发布全系列模型(轻量级3亿参数版至旗舰70亿参数版),均采用Apache 2.0许可
- 与全球合作伙伴及本土社区协作,收集并转录弱势语言数据
- Omnilingual ASR语料库成为现有最大规模的超低资源自发语音识别数据集