SpeechLLM - 话题 | 元语音研究网

Speech

[浏览需要 0 积分] 发布于2025-03-06 14:10:10

【CP】Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets
论文链接代码链接

赞 2

评论 1

浏览 344

语音
Speech

[浏览需要 0 积分] 发布于2024-12-12 16:51:49

【CP】Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning
论文链接

赞 2

评论 1

浏览 661

语音
Speech

[浏览需要 0 积分] 发布于2024-10-21 14:35:43

【Conference Paper】Streaming Decoder-Only Automatic Speech Recognition with Discrete Speech Units: A Pilot Study
论文链接代码链接

赞 2

评论 1

浏览 789

语音
Speech

[浏览需要 0 积分] 发布于2024-09-03 15:47:44

【Conference】BENCHMARKING JAPANESE SPEECH RECOGNITION ON ASR-LLM SETUPS WITH MULTI-PASS AUGMENTED GENERATIVE ERROR CORRECTION
论文链接

赞 2

评论 1

浏览 720

语音
Speech

[浏览需要 0 积分] 发布于2024-11-25 17:06:13

【Conference Paper】WHISMA: A SPEECH-LLM TO PERFORM ZERO-SHOT SPOKEN LANGUAGE UNDERSTANDING
论文链接

赞 2

评论

浏览 501

语音
Speech

[浏览需要 0 积分] 发布于2025-02-21 17:50:45

【资源】AudioLLM / SpeechLLM方向论文、代码、数据汇总GIT
论文链接

赞 2

评论

浏览 455

语音
Speech

[浏览需要 0 积分] 发布于2025-02-21 13:27:08

【TR】OSUM: Advancing Open Speech Understanding Models with Limited Resources in Academia
论文链接代码链接 Large Language Models (LLMs) have made significant progress in various downstream tasks, inspiring the development of ...

赞 3

评论

浏览 508

语音
Speech

[浏览需要 0 积分] 发布于2025-02-07 17:23:54

【CP】ADVANCING MULTI-TALKER ASR PERFORMANCE WITH LARGE LANGUAGE MODELS
论文链接模型结构训练策略

赞 2

评论

浏览 494

语音
METASPEECH

[浏览需要 0 积分] 发布于2025-01-27 22:38:08

我们开源了FireRedASR，包括技术报告、模型、推理代码
我们开源了 FireRedASR，包括技术报告、模型、推理代码高准确率：在中文普通话公开测试集上，FireRedASR 字错误率(CER) 3.05%，比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4% 高实用性：在多种实际中文普通话...

赞 2

评论

浏览 1001

语音
Speech

[浏览需要 0 积分] 发布于2025-02-05 11:33:08

【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
论文链接

赞 2

评论

浏览 508

语音
Speech

[浏览需要 0 积分] 发布于2025-01-14 10:48:48

【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition
论文链接

赞 2

评论

浏览 675

语音
Speech

[浏览需要 0 积分] 发布于2025-01-13 16:03:23

【CP】Transducer-Llama: Integrating LLMs into Streamable Transducer-based Speech Recognition
论文链接

赞 2

评论

浏览 686

语音
Speech

[浏览需要 0 积分] 发布于2024-11-26 20:28:00

【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge
论文链接

赞 2

评论

浏览 531

语音
METASPEECH

[浏览需要 0 积分] 发布于2024-06-19 09:21:10

优秀会议论文—SALM: SPEECH-AUGMENTED LANGUAGE MODEL WITH IN-CONTEXT LEARNING FOR SPEECH RECOGNITION AND TRANSLATION
论文链接代码链接

赞 1

评论

浏览 975

大模型&多模态
METASPEECH

[浏览需要 0 积分] 发布于2024-11-12 16:19:22

群友分享
整理了一下最近的端到端语音理解、生成模型，以及对应的 benchmark，欢迎关注&PR https://github.com/ddlBoJack/Awesome-Speech-Language-Model

赞 3

评论

浏览 754

语音
Speech

[浏览需要 0 积分] 发布于2024-11-04 14:54:45

【Conference Paper】BESTOW: EFFICIENT AND STREAMABLE SPEECH LANGUAGE MODEL WITH THE BEST OF TWO WORLDS IN GPT AND T5
论文链接代码链接

赞 2

评论

浏览 545

语音
Speech

[浏览需要 0 积分] 发布于2024-10-31 17:13:36

【Conference Paper】A SURVEY ON SPEECH LARGE LANGUAGE MODELS
论文链接

赞 2

评论

浏览 896

语音
Speech

[浏览需要 0 积分] 发布于2024-10-21 11:36:01

【Conference Paper】Exploring the limits of decoder-only models trained on public speech recognition corpora
论文链接代码链接

赞 2

评论

浏览 823

语音
Speech

[浏览需要 0 积分] 发布于2024-10-17 13:58:19

【Conference Paper】Efficient Streaming LLM for Speech Recognition
论文链接

赞 2

评论

浏览 848

语音
Speech

[浏览需要 0 积分] 发布于2024-10-16 15:32:33

【Conference Paper】CHAIN-OF-THOUGHT PROMPTING FOR SPEECH TRANSLATION
论文链接

赞 3

评论

浏览 935

语音

METASPEECH
270 帖子 • 51 评论

1656
Speech
166 帖子 • 24 评论

1292
AI柠檬
14 帖子 • 16 评论

512
江南一点红
1 帖子 • 1 评论

46
懵
懵懵懂懂的新手
1 帖子 • 17 评论

39
M
Mephisto
0 帖子 • 4 评论

28
後藤ひとり
0 帖子 • 0 评论

23
心行
2 帖子 • 0 评论

20
出东巷
0 帖子 • 0 评论

15
betciso
0 帖子 • 1 评论

12