元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-03-06 14:10:10

      【CP】Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets

      论文链接 代码链接
      赞 2
      评论 1
      浏览 292
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-08 10:48:20

      【Technique Report】Moshi: a speech-text foundation model for real-time dialogue

      论文链接
      赞 2
      评论 1
      浏览 620
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-14 14:57:38

      【Conference Paper】Freeze-Omni: A Smart and Low Latency Speech-to-speech Dialogue Model with Frozen LLM

      论文链接 代码链接
      赞 2
      评论
      浏览 649
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-07 17:23:54

      【CP】ADVANCING MULTI-TALKER ASR PERFORMANCE WITH LARGE LANGUAGE MODELS

      论文链接 模型结构 训练策略
      赞 2
      评论
      浏览 451
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-02-05 11:33:08

      【TR】FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration

      论文链接
      赞 2
      评论
      浏览 461
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-14 13:33:22

      【优秀博士生】Tian-hao Zhang—北京科技大学

      学术链接
      赞 2
      评论
      浏览 640
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-14 10:48:48

      【CP】A Transcription Prompt-based Efficient Audio Large Language Model for Robust Speech Recognition

      论文链接
      赞 2
      评论
      浏览 603
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-28 19:19:13

      【Conference Paper】Contextual Biasing Speech Recognition in Speech-enhanced Large Language Model

      论文链接
      赞 2
      评论
      浏览 482
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-26 20:28:00

      【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge

      论文链接
      赞 2
      评论
      浏览 477
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-25 17:06:13

      【Conference Paper】WHISMA: A SPEECH-LLM TO PERFORM ZERO-SHOT SPOKEN LANGUAGE UNDERSTANDING

      论文链接
      赞 2
      评论
      浏览 484
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-20 11:12:26

      【Conference Paper】Developing Instruction-Following Speech Language Model Without Speech Instruction-Tuning Data

      论文链接 代码链接 官方链接
      赞 2
      评论
      浏览 676
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-19 15:50:25

      【Conference Paper】Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study

      论文链接
      赞 2
      评论
      浏览 555
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-18 17:35:42

      【Tech Report】MooER: LLM-based Speech Recognition and Translation Models from Moore Threads

      论文链接 代码链接
      赞 2
      评论
      浏览 1001
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-13 19:23:16

      【Conference Paper】A Full-duplex Speech Dialogue Scheme Based On Large Language Model

      论文链接
      赞 2
      评论
      浏览 631
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-12 19:56:49

      【Conference Paper】Improving Robustness of LLM-based Speech Synthesis by Learning Monotonic Alignment

      论文链接
      赞 2
      评论
      浏览 563
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-13 13:17:00

      【Conference Paper】LLASM: LARGE LANGUAGE AND SPEECH MODEL

      论文链接 代码链接
      赞 2
      评论
      浏览 571
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-05 15:14:23

      【Conference Paper】SLAM-AAC: Enhancing Audio Captioning with Paraphrasing Augmentation and CLAP-Refine through LLMs

      论文链接
      赞 2
      评论
      浏览 554
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-11-05 10:04:21

      【Conference Paper】Qwen-Audio: Advancing Universal Audio Understanding via Unified Large-Scale Audio-Language Models

      论文链接
      赞 2
      评论
      浏览 520
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-31 17:13:36

      【Conference Paper】A SURVEY ON SPEECH LARGE LANGUAGE MODELS

      论文链接
      赞 2
      评论
      浏览 845
      语音
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2024-10-24 16:26:57

      【Conference Paper】CMU’s IWSLT 2024 Simultaneous Speech Translation System

      论文链接
      赞 1
      评论
      浏览 704
      语音
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • METASPEECH
      METASPEECH

      269 帖子 • 51 评论

      1646
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      509
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2