- [浏览需要 0 积分] 发布于2024-03-23 10:30:14
优秀博士论文推荐—李乃寒—面向语音合成的深度学习算法研究与应用
语音合成(speech synthesis,又名 text-to-speech,TTS)是人机交互的重要方法之一,旨在合成清晰且自然的音频。语音合成的应用场景非常广泛,比如手机和个人电脑的语音助手、同声传译的语音输出环节、车载导航播报、新闻朗读等等。通过语...赞 2评论 2浏览 1252 - [浏览需要 0 积分] 发布于2022-05-14 11:37:49
端到端语音识别-01-田正坤
论文优势: (1)CTC 模型介绍 (2)基础 Attention 模型 (3)Encoder 模型探讨 (4)软、硬 Attention 机制 (5)多任务学习结构 (6)Transformer 结构 (7)训练技巧与个人思考 论文下载链接:赞 3评论 22浏览 2489 - [浏览需要 0 积分] 发布于2025-03-06 14:10:10赞 2评论 1浏览 699
- [浏览需要 0 积分] 发布于2025-01-08 13:31:47
【CP】Breaking Through the Spike: Spike Window Decoding for Accelerated and Precise Automatic Speech Recognition
论文链接赞 3评论 1浏览 1149 - [浏览需要 0 积分] 发布于2024-12-24 11:22:07赞 2评论 1浏览 795
- [浏览需要 0 积分] 发布于2024-12-12 16:51:49
【CP】Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning
论文链接赞 2评论 1浏览 972 - [浏览需要 0 积分] 发布于2024-11-08 10:48:20赞 2评论 1浏览 923
- [浏览需要 2 积分] 发布于2024-08-19 14:01:54赞 2评论 1浏览 7
- [浏览需要 0 积分] 发布于2024-10-21 14:35:43
【Conference Paper】Streaming Decoder-Only Automatic Speech Recognition with Discrete Speech Units: A Pilot Study
论文链接 代码链接赞 2评论 1浏览 1069 - [浏览需要 0 积分] 发布于2024-10-08 14:01:36赞 2评论 1浏览 1243
- [浏览需要 0 积分] 发布于2024-10-08 14:40:19赞 2评论 1浏览 1128
- [浏览需要 0 积分] 发布于2024-09-03 15:47:44
【Conference】BENCHMARKING JAPANESE SPEECH RECOGNITION ON ASR-LLM SETUPS WITH MULTI-PASS AUGMENTED GENERATIVE ERROR CORRECTION
论文链接赞 2评论 1浏览 966 - [浏览需要 0 积分] 发布于2024-09-02 19:57:23赞 2评论 1浏览 1112
- [浏览需要 2 积分] 发布于2024-08-29 17:25:59赞 2评论 1浏览 7
- [浏览需要 2 积分] 发布于2024-08-30 17:45:49
【Conference Paper】Re-investigating the Efficient Transfer Learning of Speech Foundation Model using Feature Fusion Methods
论文链接赞 3评论 1浏览 9 - [浏览需要 2 积分] 发布于2024-09-02 16:09:43
【Conference Paper】PARAMETER-EFFICIENT TRANSFER LEARNING UNDER FEDERATED LEARNING FOR AUTOMATIC SPEECH RECOGNITION
论文链接赞 1评论 1浏览 2 - [浏览需要 8 积分] 发布于2024-08-21 13:26:49
【Journal Paper & Codes】Textless Unit-to-Unit training for Many-to-Many Multilingual Speech-to-Speech Translation
论文链接 代码链接 Samples 链接赞 3评论 1浏览 14