- [浏览需要 0 积分] 发布于2025-03-06 14:10:10赞 2评论 1浏览 192
- [浏览需要 0 积分] 发布于2024-12-12 16:51:49
【CP】Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning
论文链接赞 2评论 1浏览 448 - [浏览需要 0 积分] 发布于2024-10-21 14:35:43
【Conference Paper】Streaming Decoder-Only Automatic Speech Recognition with Discrete Speech Units: A Pilot Study
论文链接 代码链接赞 2评论 1浏览 601 - [浏览需要 0 积分] 发布于2024-09-03 15:47:44
【Conference】BENCHMARKING JAPANESE SPEECH RECOGNITION ON ASR-LLM SETUPS WITH MULTI-PASS AUGMENTED GENERATIVE ERROR CORRECTION
论文链接赞 2评论 1浏览 577 - [浏览需要 0 积分] 发布于2024-11-25 17:06:13赞 2评论浏览 455
- [浏览需要 0 积分] 发布于2025-02-21 17:50:45赞 2评论浏览 354
- [浏览需要 0 积分] 发布于2025-02-07 17:23:54赞 2评论浏览 368
- [浏览需要 0 积分] 发布于2025-01-27 22:38:08
我们开源了FireRedASR,包括技术报告、模型、推理代码
我们开源了 FireRedASR,包括技术报告、模型、推理代码 高准确率:在中文普通话公开测试集上,FireRedASR 字错误率(CER) 3.05%,比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4% 高实用性:在多种实际中文普通话...赞 2评论浏览 724 - [浏览需要 0 积分] 发布于2025-02-05 11:33:08
【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
论文链接赞 2评论浏览 365 - [浏览需要 0 积分] 发布于2025-01-14 10:48:48
【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition
论文链接赞 2评论浏览 397 - [浏览需要 0 积分] 发布于2025-01-13 16:03:23赞 2评论浏览 405
- [浏览需要 0 积分] 发布于2024-11-26 20:28:00
【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge
论文链接赞 2评论浏览 389 - [浏览需要 0 积分] 发布于2024-06-19 09:21:10
优秀会议论文—SALM: SPEECH-AUGMENTED LANGUAGE MODEL WITH IN-CONTEXT LEARNING FOR SPEECH RECOGNITION AND TRANSLATION
论文链接 代码链接赞 1评论浏览 816 - [浏览需要 0 积分] 发布于2024-11-12 16:19:22
群友分享
整理了一下最近的端到端语音理解、生成模型,以及对应的 benchmark,欢迎关注&PR https://github.com/ddlBoJack/Awesome-Speech-Language-Model赞 3评论浏览 544 - [浏览需要 0 积分] 发布于2024-11-04 14:54:45
【Conference Paper】BESTOW: EFFICIENT AND STREAMABLE SPEECH LANGUAGE MODEL WITH THE BEST OF TWO WORLDS IN GPT AND T5
论文链接 代码链接赞 2评论浏览 460 - [浏览需要 0 积分] 发布于2024-10-31 17:13:36赞 2评论浏览 757
- [浏览需要 0 积分] 发布于2024-10-21 11:36:01
【Conference Paper】Exploring the limits of decoder-only models trained on public speech recognition corpora
论文链接 代码链接赞 2评论浏览 647 - [浏览需要 0 积分] 发布于2024-10-17 13:58:19赞 2评论浏览 699
- [浏览需要 0 积分] 发布于2024-10-16 15:32:33赞 3评论浏览 791