Hasty Briefsbeta

双语

Mistralai/Voxtral-Mini-3B-2507 · Hugging Face

10 months ago
  • #Multilingual
  • #AI
  • #Speech Recognition
  • Voxtral Mini 1.0 (3B) 是 Ministral 3B 的增强版本,具备先进的音频输入功能。
  • 它在语音转录、翻译和音频理解方面表现出色。
  • 主要功能包括专用转录模式、长文本上下文支持(32k tokens)、内置问答与摘要、多语言支持,以及语音触发的函数调用。
  • 基准测试结果展示了其在音频和文本任务中的性能表现。
  • 支持通过 vLLM 等框架使用,并提供具体的安装和配置说明。
  • 提供了使用 Python 代码片段实现音频指令和转录功能的示例。
  • 运行 Voxtral-Mini-3B-2507 需要约 9.5 GB 的 GPU 显存。