AudioLLM - 话题 | 元语音研究网

Speech

[浏览需要 0 积分] 发布于2025-03-06 14:10:10

【CP】Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets
论文链接代码链接

赞 2

评论 1

浏览 700

语音
Speech

[浏览需要 0 积分] 发布于2024-11-08 10:48:20

【Technique Report】Moshi: a speech-text foundation model for real-time dialogue
论文链接

赞 2

评论 1

浏览 924

语音
Speech

[浏览需要 0 积分] 发布于2024-11-20 11:12:26

【Conference Paper】Developing Instruction-Following Speech Language Model Without Speech Instruction-Tuning Data
论文链接代码链接官方链接

赞 2

评论

浏览 983

语音
Speech

[浏览需要 0 积分] 发布于2025-03-05 16:10:22

【CP】Audio-CoT: Exploring Chain-of-Thought Reasoning in Large Audio Language Model
论文链接

赞 2

评论

浏览 676

语音
Speech

[浏览需要 0 积分] 发布于2025-02-21 17:50:45

【资源】AudioLLM / SpeechLLM方向论文、代码、数据汇总GIT
论文链接

赞 2

评论

浏览 770

语音
Speech

[浏览需要 0 积分] 发布于2025-02-21 13:27:08

【TR】OSUM: Advancing Open Speech Understanding Models with Limited Resources in Academia
论文链接代码链接 Large Language Models (LLMs) have made significant progress in various downstream tasks, inspiring the development of ...

赞 3

评论

浏览 895

语音
Speech

[浏览需要 0 积分] 发布于2025-02-07 19:17:38

【Code】k2 官方提供AudioLLM配方，复现Qwen-Audio
代码链接

赞 3

评论

浏览 776

语音
Speech

[浏览需要 0 积分] 发布于2025-02-07 17:23:54

【CP】ADVANCING MULTI-TALKER ASR PERFORMANCE WITH LARGE LANGUAGE MODELS
论文链接模型结构训练策略

赞 2

评论

浏览 715

语音
Speech

[浏览需要 0 积分] 发布于2025-02-05 11:33:08

【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration
论文链接

赞 2

评论

浏览 802

语音
Speech

[浏览需要 0 积分] 发布于2025-01-14 13:33:22

【优秀博士生】Tian-hao Zhang—北京科技大学
学术链接

赞 2

评论

浏览 942

语音
Speech

[浏览需要 0 积分] 发布于2025-01-14 10:48:48

【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition
论文链接

赞 2

评论

浏览 882

语音
Speech

[浏览需要 0 积分] 发布于2024-11-28 19:19:13

【Conference Paper】Contextual Biasing Speech Recognition in Speech-enhanced Large Language Model
论文链接

赞 2

评论

浏览 822

语音
Speech

[浏览需要 0 积分] 发布于2024-11-26 20:28:00

【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge
论文链接

赞 2

评论

浏览 771

语音
Speech

[浏览需要 0 积分] 发布于2024-11-25 17:06:13

【Conference Paper】WHISMA: A SPEECH-LLM TO PERFORM ZERO-SHOT SPOKEN LANGUAGE UNDERSTANDING
论文链接

赞 2

评论

浏览 747

语音
Speech

[浏览需要 0 积分] 发布于2024-10-18 17:35:42

【Tech Report】MooER: LLM-based Speech Recognition and Translation Models from Moore Threads
论文链接代码链接

赞 2

评论

浏览 1243

语音
Speech

[浏览需要 0 积分] 发布于2024-11-19 15:50:25

【Conference Paper】Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study
论文链接

赞 2

评论

浏览 837

语音
Speech

[浏览需要 0 积分] 发布于2024-11-14 14:57:38

【Conference Paper】Freeze-Omni: A Smart and Low Latency Speech-to-speech Dialogue Model with Frozen LLM
论文链接代码链接

赞 2

评论

浏览 983

语音
Speech

[浏览需要 0 积分] 发布于2024-11-13 19:23:16

【Conference Paper】A Full-duplex Speech Dialogue Scheme Based On Large Language Model
论文链接

赞 2

评论

浏览 977

语音
Speech

[浏览需要 0 积分] 发布于2024-11-12 19:56:49

【Conference Paper】Improving Robustness of LLM-based Speech Synthesis by Learning Monotonic Alignment
论文链接

赞 2

评论

浏览 912

语音
Speech

[浏览需要 0 积分] 发布于2024-11-13 13:17:00

【Conference Paper】LLASM: LARGE LANGUAGE AND SPEECH MODEL
论文链接代码链接

赞 2

评论

浏览 850

语音

元语音
347 帖子 • 51 评论

2534
Speech
166 帖子 • 24 评论

1292
AI柠檬
14 帖子 • 16 评论

526
江南一点红
1 帖子 • 1 评论

46
懵
懵懵懂懂的新手
1 帖子 • 17 评论

39
M
Mephisto
0 帖子 • 4 评论

28
後藤ひとり
0 帖子 • 0 评论

23
心行
2 帖子 • 0 评论

20
出东巷
0 帖子 • 0 评论

15
betciso
0 帖子 • 1 评论

12