Hasty Briefsbeta

双语

Nvidia releases open dataset, 2 models for multilingual speech AI

9 months ago
  • #Multilingual
  • #AI
  • #Speech Recognition
  • 英伟达发布支持25种欧洲语言的新数据集和模型,用于AI语音识别与翻译。
  • 开源多语言语音数据集Granary包含约一百万小时音频,专为AI训练打造。
  • 英伟达Canary-1b-v2和Parakeet-tdt-0.6b-v3模型提供高质量转录与翻译,针对不同任务进行性能优化。
  • Granary通过增强未标注的公共语音数据解决资源匮乏问题,特别支持弱势语种发展。
  • 新模型与数据集已在Hugging Face平台开放,相关技术方案同步共享以加速语音AI创新。