[浏览需要 0 积分] 发布于 2025-01-27 22:38:08

我们开源了FireRedASR，包括技术报告、模型、推理代码

我们开源了 FireRedASR，包括技术报告、模型、推理代码
高准确率：在中文普通话公开测试集上，FireRedASR 字错误率(CER) 3.05%，比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4%
高实用性：在多种实际中文普通话场景上，比起商业 ASR API 和其他模型，CER 相对降低 24%-40%
多种能力：除了普通话，在普通话子方言和英语上，也有不俗表现；此外，在唱歌歌词识别上，CER 比其他模型相对低 50%-67%
发布即开源：模型分为 FireRedASR-LLM 和 FireRedASR-AED 两种，为不同需求而打造。FireRedASR-AED-L (1.1B)已开源，FireRedASR-LLM-L(8.3B)和其他 size(XS/S/M)的模型预计春节后开源。

论文：https://arxiv.org/pdf/2501.14350
代码：https://github.com/FireRedTeam/FireRedASR
模型：https://huggingface.co/fireredteam/FireRedASR-AED-L

感谢此前相关开源&公开工作！

语音 #语音 #开源项目 #SpeechLLM

浏览 (2128)