元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-03-06 14:10:10

      【CP】Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

      论文链接 代码链接
      赞 2
      评论 1
      浏览 292
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-12-12 16:51:49

      【CP】Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning

      论文链接
      赞 2
      评论 1
      浏览 603
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-21 14:35:43

      【Conference Paper】Streaming Decoder-Only Automatic Speech Recognition with Discrete Speech Units: A Pilot Study

      论文链接 代码链接
      赞 2
      评论 1
      浏览 739
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-09-03 15:47:44

      【Conference】BENCHMARKING JAPANESE SPEECH RECOGNITION ON ASR-LLM SETUPS WITH MULTI-PASS AUGMENTED GENERATIVE ERROR CORRECTION

      论文链接
      赞 2
      评论 1
      浏览 675
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-25 17:06:13

      【Conference Paper】WHISMA: A SPEECH-LLM TO PERFORM ZERO-SHOT SPOKEN LANGUAGE UNDERSTANDING

      论文链接
      赞 2
      评论
      浏览 484
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-21 17:50:45

      【资源】AudioLLM / SpeechLLM方向论文、代码、数据汇总GIT

      论文链接
      赞 2
      评论
      浏览 425
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-21 13:27:08

      【TR】OSUM: Advancing Open Speech Understanding Models with Limited Resources in Academia

      论文链接 代码链接 Large Language Models (LLMs) have made significant progress in various downstream tasks, inspiring the development of ...
      赞 3
      评论
      浏览 458
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-07 17:23:54

      【CP】ADVANCING MULTI-TALKER ASR PERFORMANCE WITH LARGE LANGUAGE MODELS

      论文链接 模型结构 训练策略
      赞 2
      评论
      浏览 451
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2025-01-27 22:38:08

      我们开源了FireRedASR,包括技术报告、模型、推理代码

      我们开源了 FireRedASR,包括技术报告、模型、推理代码 高准确率:在中文普通话公开测试集上,FireRedASR 字错误率(CER) 3.05%,比此前 SOTA Seed-ASR 的 3.33% 相对降低 8.4% 高实用性:在多种实际中文普通话...
      赞 2
      评论
      浏览 910
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-05 11:33:08

      【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration

      论文链接
      赞 2
      评论
      浏览 461
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-14 10:48:48

      【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition

      论文链接
      赞 2
      评论
      浏览 604
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-13 16:03:23

      【CP】Transducer-Llama: Integrating LLMs into Streamable Transducer-based Speech Recognition

      论文链接
      赞 2
      评论
      浏览 622
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-26 20:28:00

      【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge

      论文链接
      赞 2
      评论
      浏览 477
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-06-19 09:21:10

      优秀会议论文—SALM: SPEECH-AUGMENTED LANGUAGE MODEL WITH IN-CONTEXT LEARNING FOR SPEECH RECOGNITION AND TRANSLATION

      论文链接 代码链接
      赞 1
      评论
      浏览 911
      大模型&多模态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-11-12 16:19:22

      群友分享

      整理了一下最近的端到端语音理解、生成模型,以及对应的 benchmark,欢迎关注&PR https://github.com/ddlBoJack/Awesome-Speech-Language-Model
      赞 3
      评论
      浏览 700
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-04 14:54:45

      【Conference Paper】BESTOW: EFFICIENT AND STREAMABLE SPEECH LANGUAGE MODEL WITH THE BEST OF TWO WORLDS IN GPT AND T5

      论文链接 代码链接
      赞 2
      评论
      浏览 530
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-31 17:13:36

      【Conference Paper】A SURVEY ON SPEECH LARGE LANGUAGE MODELS

      论文链接
      赞 2
      评论
      浏览 845
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-21 11:36:01

      【Conference Paper】Exploring the limits of decoder-only models trained on public speech recognition corpora

      论文链接 代码链接
      赞 2
      评论
      浏览 787
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-17 13:58:19

      【Conference Paper】Efficient Streaming LLM for Speech Recognition

      论文链接
      赞 2
      评论
      浏览 796
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-16 15:32:33

      【Conference Paper】CHAIN-OF-THOUGHT PROMPTING FOR SPEECH TRANSLATION

      论文链接
      赞 3
      评论
      浏览 881
      语音
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • METASPEECH
      METASPEECH

      269 帖子 • 51 评论

      1646
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      509
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2