- [浏览需要 0 积分] 发布于2025-03-06 14:10:10赞 2评论 1浏览 292
- [浏览需要 0 积分] 发布于2024-12-12 16:51:49
【CP】Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning
论文链接赞 2评论 1浏览 603 - [浏览需要 0 积分] 发布于2024-10-21 14:35:43
【Conference Paper】Streaming Decoder-Only Automatic Speech Recognition with Discrete Speech Units: A Pilot Study
论文链接 代码链接赞 2评论 1浏览 739 - [浏览需要 0 积分] 发布于2024-09-03 15:47:44
【Conference】BENCHMARKING JAPANESE SPEECH RECOGNITION ON ASR-LLM SETUPS WITH MULTI-PASS AUGMENTED GENERATIVE ERROR CORRECTION
论文链接赞 2评论 1浏览 675 - [浏览需要 0 积分] 发布于2024-11-25 17:06:13赞 2评论浏览 484
- [浏览需要 0 积分] 发布于2025-02-21 17:50:45赞 2评论浏览 425
- [浏览需要 0 积分] 发布于2025-02-07 17:23:54赞 2评论浏览 451
- [浏览需要 0 积分] 发布于2025-01-27 22:38:08
我们开源了FireRedASR,包括技术报告、模型、推理代码
我们开源了 FireRedASR,包括技术报告、模型、推理代码 高准确率:在中文普通话公开测试集上,FireRedASR 字错误率(CER) 3.05%,比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4% 高实用性:在多种实际中文普通话...赞 2评论浏览 910 - [浏览需要 0 积分] 发布于2025-02-05 11:33:08
【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
论文链接赞 2评论浏览 461 - [浏览需要 0 积分] 发布于2025-01-14 10:48:48
【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition
论文链接赞 2评论浏览 604 - [浏览需要 0 积分] 发布于2025-01-13 16:03:23赞 2评论浏览 622
- [浏览需要 0 积分] 发布于2024-11-26 20:28:00
【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge
论文链接赞 2评论浏览 477 - [浏览需要 0 积分] 发布于2024-06-19 09:21:10
优秀会议论文—SALM: SPEECH-AUGMENTED LANGUAGE MODEL WITH IN-CONTEXT LEARNING FOR SPEECH RECOGNITION AND TRANSLATION
论文链接 代码链接赞 1评论浏览 911 - [浏览需要 0 积分] 发布于2024-11-12 16:19:22
群友分享
整理了一下最近的端到端语音理解、生成模型,以及对应的 benchmark,欢迎关注&PR https://github.com/ddlBoJack/Awesome-Speech-Language-Model赞 3评论浏览 700 - [浏览需要 0 积分] 发布于2024-11-04 14:54:45
【Conference Paper】BESTOW: EFFICIENT AND STREAMABLE SPEECH LANGUAGE MODEL WITH THE BEST OF TWO WORLDS IN GPT AND T5
论文链接 代码链接赞 2评论浏览 530 - [浏览需要 0 积分] 发布于2024-10-31 17:13:36赞 2评论浏览 845
- [浏览需要 0 积分] 发布于2024-10-21 11:36:01
【Conference Paper】Exploring the limits of decoder-only models trained on public speech recognition corpora
论文链接 代码链接赞 2评论浏览 787 - [浏览需要 0 积分] 发布于2024-10-17 13:58:19赞 2评论浏览 796
- [浏览需要 0 积分] 发布于2024-10-16 15:32:33赞 3评论浏览 881