- [浏览需要 0 积分] 发布于2025-03-20 14:03:55
开源儿童数据,南开大学
大家好,我们开源了一个 3-5 岁的儿童语音数据集,包括 397 名儿童的 41.25h 的语音,说话人覆盖了 22 个省市,目前已经在 huggingface 上开放下载了,论文链接:https://arxiv.org/abs/2409.18584赞 2评论浏览 131 - [浏览需要 0 积分] 发布于2025-03-06 14:10:10赞 2评论 1浏览 192
- [浏览需要 0 积分] 发布于2025-03-05 16:10:22赞 2评论浏览 192
- [浏览需要 0 积分] 发布于2025-02-27 10:19:11
【JP】High fidelity zero shot speaker adaptation in text to speech synthesis with denoising diffusion GAN
论文链接赞 2评论浏览 306 - [浏览需要 0 积分] 发布于2025-02-21 17:50:45赞 2评论浏览 352
- [浏览需要 0 积分] 发布于2025-02-21 17:11:48赞 2评论浏览 281
- [浏览需要 0 积分] 发布于2025-02-17 14:29:24
【CP】End-to-End Speech Recognition with Pre-trained Masked Language Model
论文链接 We present a novel approach to end-to-end automatic speech recognition (ASR) that utilizes pre-trained masked language mode...赞 2评论 1浏览 345 - [浏览需要 0 积分] 发布于2025-02-11 11:27:05赞 2评论浏览 379
- [浏览需要 0 积分] 发布于2025-02-07 17:23:54赞 2评论浏览 365
- [浏览需要 0 积分] 发布于2025-02-07 11:27:40
【CP】Speech Data Selection for Efficient ASR Fine-Tuning using Domain Classifier and Pseudo-Label Filtering
论文链接赞 2评论浏览 376 - [浏览需要 0 积分] 发布于2025-02-06 19:15:14赞 2评论浏览 372
- [浏览需要 0 积分] 发布于2025-02-05 11:33:08
【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
论文链接赞 2评论浏览 364 - [浏览需要 0 积分] 发布于2025-01-27 22:38:08
我们开源了FireRedASR,包括技术报告、模型、推理代码
我们开源了 FireRedASR,包括技术报告、模型、推理代码 高准确率:在中文普通话公开测试集上,FireRedASR 字错误率(CER) 3.05%,比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4% 高实用性:在多种实际中文普通话...赞 2评论浏览 724 - [浏览需要 0 积分] 发布于2025-01-23 11:35:37赞 2评论浏览 455
- [浏览需要 0 积分] 发布于2025-01-22 14:53:18
【CP】E2 TTS: EMBARRASSINGLY EASY FULLY NON-AUTOREGRESSIVE ZERO-SHOT TTS
论文链接 LJ Speech 数据链接 am 代码链接 1 am 代码链接 2 vocoder 代码链接 网站链接赞 2评论浏览 505 - [浏览需要 0 积分] 发布于2025-01-22 11:34:56赞 2评论浏览 405