Hasty Briefsbeta

双语

Meta Omnilingual ASR: Advancing Automatic Speech Recognition for 1600 Languages

6 months ago
  • #Multilingual
  • #AI
  • #Speech Recognition
  • Meta旗下FAIR团队推出Omnilingual ASR系统,支持超过1,600种语言,包含500种低资源语言
  • 开源Omnilingual wav2vec 2.0——70亿参数的多语言语音表征模型
  • 发布Omnilingual ASR语料库,涵盖350种弱势语言的转录语音数据
  • 推出两种架构变体:增强版wav2vec 2.0编码器与面向字符标记的双解码器方案
  • LLM-ASR实现突破性表现,78%语言字符错误率低于10%
  • 情境学习技术仅需少量音频-文本样本即可转录未支持语言
  • 发布全系列模型(轻量级3亿参数版至旗舰70亿参数版),均采用Apache 2.0许可
  • 与全球合作伙伴及本土社区协作,收集并转录弱势语言数据
  • Omnilingual ASR语料库成为现有最大规模的超低资源自发语音识别数据集