Hasty Briefsbeta

双语

Nvidia releases open dataset, 2 models for multilingual speech AI

9 months ago

#Multilingual
#AI
#Speech Recognition

英伟达发布支持25种欧洲语言的新数据集和模型，用于AI语音识别与翻译。
开源多语言语音数据集Granary包含约一百万小时音频，专为AI训练打造。
英伟达Canary-1b-v2和Parakeet-tdt-0.6b-v3模型提供高质量转录与翻译，针对不同任务进行性能优化。
Granary通过增强未标注的公共语音数据解决资源匮乏问题，特别支持弱势语种发展。
新模型与数据集已在Hugging Face平台开放，相关技术方案同步共享以加速语音AI创新。