Hasty Briefsbeta

双语

Meta Omnilingual ASR: Advancing Automatic Speech Recognition for 1600 Languages

6 months ago

#Multilingual
#AI
#Speech Recognition

Meta旗下FAIR团队推出Omnilingual ASR系统，支持超过1,600种语言，包含500种低资源语言
开源Omnilingual wav2vec 2.0——70亿参数的多语言语音表征模型
发布Omnilingual ASR语料库，涵盖350种弱势语言的转录语音数据
推出两种架构变体：增强版wav2vec 2.0编码器与面向字符标记的双解码器方案
LLM-ASR实现突破性表现，78%语言字符错误率低于10%
情境学习技术仅需少量音频-文本样本即可转录未支持语言
发布全系列模型（轻量级3亿参数版至旗舰70亿参数版），均采用Apache 2.0许可
与全球合作伙伴及本土社区协作，收集并转录弱势语言数据
Omnilingual ASR语料库成为现有最大规模的超低资源自发语音识别数据集