我们开源了FireRedASR,包括技术报告、模型、推理代码
我们开源了 FireRedASR,包括技术报告、模型、推理代码
高准确率:在中文普通话公开测试集上,FireRedASR 字错误率(CER) 3.05%,比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4%
高实用性:在多种实际中文普通话场景上,比起商业 ASR API 和其他模型,CER 相对降低 24%-40%
多种能力:除了普通话,在普通话子方言和英语上,也有不俗表现;此外,在唱歌歌词识别上,CER 比其他模型相对低 50%-67%
发布即开源:模型分为 FireRedASR-LLM 和 FireRedASR-AED 两种,为不同需求而打造。FireRedASR-AED-L (1.1B)已开源,FireRedASR-LLM-L(8.3B)和其他 size(XS/S/M)的模型预计春节后开源。
论文:https://arxiv.org/pdf/2501.14350
代码:https://github.com/FireRedTeam/FireRedASR
模型:https://huggingface.co/fireredteam/FireRedASR-AED-L
感谢此前相关开源&公开工作!