元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-05-14 11:37:49

      端到端语音识别-01-田正坤

      论文优势: (1)CTC 模型介绍 (2)基础 Attention 模型 (3)Encoder 模型探讨 (4)软、硬 Attention 机制 (5)多任务学习结构 (6)Transformer 结构 (7)训练技巧与个人思考 论文下载链接:
      赞 3
      评论 13
      浏览 1897
      开源分享
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-03-06 21:41:54

      清华大学 - 语音识别基本法

      下载链接
      赞 6
      评论 37
      浏览 2568
      开源分享
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-08 13:31:47

      【CP】Breaking Through the Spike: Spike Window Decoding for Accelerated and Precise Automatic Speech Recognition

      论文链接
      赞 3
      评论 1
      浏览 819
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-02-25 17:26:40

      ICASSP 2023论文集

      论文链接见隐藏内容
      赞 4
      评论 9
      浏览 1224
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-04-04 11:11:49

      优秀博士论文推荐—中科院北自所—张帅—端到端中英混合语音识别方法研究

      中英混合是指在交流过程中产生的中英文语言切换的现象。随着全球化的进行,中英混合表达已经成为了一种常见的交流方式。某些场景下的中英混合表达尤为多见,比如英文教学课堂、学术会议、跨国企业会议等。这种特殊的语言现象有效地降低了沟通成本,促进了不同文化之间的交流。...
      赞 1
      评论 7
      浏览 1013
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-04-05 20:48:23

      大家有尝试过wenet aishell-1 的 NST训练吗?能复现吗?有在工业界尝试吗?

      wenet 开源了 NST 无监督训练方法,请问有大佬尝试过如下的方法吗?精度如何能复现吗?能在工业界应用吗? https://github.com/wenet-e2e/wenet/tree/main/examples/aishell/NST
      赞 1
      评论 2
      浏览 912
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-03-02 20:04:08

      优秀会议论文推荐—EXPLORING SPEECH RECOGNITION, TRANSLATION, AND UNDERSTANDING WITH DISCRETE SPEECH UNITS: A COMPARATIVE STUDY

      论文链接见隐藏内容
      赞 1
      评论 1
      浏览 721
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2023-05-24 10:22:26

      ASR学习方法

      ASR 开源学习方法,CTC RNNT AED 均有介绍 隐藏内容有 PR 链接
      赞 5
      评论 14
      浏览 1453
      开源分享
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2023-05-27 14:35:52

      CTC尖峰前移方法—BRCTC—Tencent AI Lab

      Vanilla CTC 对齐存在尖峰漂移现象,这使得无法比较准确获取 CTC 对齐结果,上采样后漂移误差更大,如何缓解该问题。 最近,Tencent AI Lab 在 ICLR 2023 提出了 Bayes Risk CTC 通过对候选路径 risk fa...
      赞 3
      评论 8
      浏览 1467
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-05-14 12:19:57

      WFST算法分享-06-厦门大学洪老师

      论文优势: (1)WFST 基础理论介绍 (2)基于 WFST 的 Token Passing 算法流程介绍 (3)解码与剪枝 (4)其他介绍 PPT 下载链接:
      赞 1
      评论 2
      浏览 1825
      技术干货
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-05-13 21:35:58

      WFST算法分享-03-周世玉

      本篇优势: (1)WFST 基本理论介绍与阐述; (2)WFST 基本算子理论阐述、伪代码及推导; (3)WFST 基本应用 (4)其他 PPT 下载链接:
      赞 1
      评论 4
      浏览 1332
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2023-06-20 16:22:48

      CIF-HieraDist

      科院明伦大佬开源 CIF 及其优化算法,在 Aishell-1 Test CER 为 4.1% 隐藏内容有 GitHub 链接
      赞 3
      评论 4
      浏览 1097
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2023-05-21 20:02:26

      热词方案—58同城

      58 同城在 wenet 开源了 热词增强 方案 隐藏内容有 PR 链接
      赞 2
      评论 3
      浏览 1222
      开源分享
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2023-05-18 09:55:01

      英文ASR 中如何解决中文外来词识别问题

      大家伙有在做英文 ASR 过程中,遇到 中文外来词识别问题吗? 如 sichuan、jinan、sichuan kuaixian 等中文外来词识别薄弱的问题吗? 请问大家怎么解决或者缓解的方法?
      赞
      评论 2
      浏览 988
      交流讨论
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-03-27 20:42:14

      gmm-decoder-simple学习

      最您偶然在 B 站发现了 simple-decoder(gmm-decoder-simple)源码讲解,非常细致,细节把握很到位,强烈建议大家进行学习。 非常适合大家学习 WFST 构图与搜索,同时完全适合迁移到端到端 EESEN 方式进行解码! Rede...
      赞 2
      评论 1
      浏览 1488
      技术干货
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-03-17 11:02:02

      语音识别构图与加速方案

      听说**公司,基于 WFST 解码在推理与搜索速度比同级 kaldi 解码速度(以 online2-wav-nnet3-latgen-faster 为例)快 20+ 倍,请问有大佬们如何能加速 WFST 搜索呢? 前提是保持解码精度基本不变的情况下。
      赞 1
      评论 2
      浏览 1427
      交流讨论
    • AI柠檬
      AI柠檬 AI柠檬
      [浏览需要 0 积分] 发布于2022-03-05 19:58:42
      【开源】ASRT开源语音识别系统 v1.1.1 版发布! 本次发布的版本使用了更多的开源数据集进行了训练,模型识别效果更鲁棒,泛化性更强!本版本中模型参数文件的效果比上一个版本的更佳。一个性能更好的基于http的API接口被加入其中。 大家可以到GitHub的Release页面下载到最新的服务端程序,自带已经训练好的模型文件,可以直接部署调用接口。欢迎大家和我们在元语音研究网一起交流学习~ https://github.com/nl8590687/ASRT_SpeechRecognition/releases/tag/v1.1.1
      赞 1
      评论 1
      浏览 1279
      开源分享
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-02-25 12:16:13
      kaldi鉴别性训练完毕后,使用区分性训练基本可以得到一致的ASR精度提升。 但是以CTC为例的端到端模型在基本训练完毕后retrain区分性训练(mmi),在精度上没有传统模型表现好呢(偶现区分性较好)?并且训练差的比例大幅会高于训练好的比例。
      赞 2
      评论 1
      浏览 1691
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-03-06 21:56:13

      语音相关论文

      下载链接
      赞 1
      评论
      浏览 775
      开源分享
    • Speech
      Speech Speech
      [浏览需要 0 积分] 发布于2025-01-14 13:49:18

      【优秀博士生】Jia-ming Zhou—南开大学

      学术链接
      赞 2
      评论
      浏览 551
      语音
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • METASPEECH
      METASPEECH

      269 帖子 • 51 评论

      1646
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      509
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2