- 发布于2022-05-14 11:37:49
端到端语音识别-01-田正坤
论文优势: (1)CTC 模型介绍 (2)基础 Attention 模型 (3)Encoder 模型探讨 (4)软、硬 Attention 机制 (5)多任务学习结构 (6)Transformer 结构 (7)训练技巧与个人思考 论文下载链接:赞评论 2浏览 751 - 发布于2022-05-14 12:19:57
WFST算法分享-06-厦门大学洪老师
论文优势: (1)WFST 基础理论介绍 (2)基于 WFST 的 Token Passing 算法流程介绍 (3)解码与剪枝 (4)其他介绍 PPT 下载链接:赞 1评论 2浏览 1022 - 发布于2022-05-13 21:35:58赞 1评论 4浏览 636
- 发布于2023-06-20 16:22:48赞 3评论 4浏览 433
- 发布于2023-05-27 15:02:02
语音识别-Branchformer
aishell-1 测试 branchformer,在该数据集上测试该方案,精度一直没有超过 conformer,确定有提升吗,大家训练该网络模型有什么 tricks 或者好的思想吗? 隐藏内容有 PR 链接赞 1评论浏览 220 - 发布于2023-05-21 20:11:53
wenet dynamic 与 static 训练模式
测试 wenet dynamic train 与 static train,static train 收敛速度与训练稳定性均优于 dynamic,有什么可以加速 dynamic 训练收敛速度与稳定性的方法吗?赞评论浏览 220 - 发布于2023-05-21 20:08:17赞评论浏览 243
- 发布于2023-05-19 10:40:29
Intermediate/Self-Conditioned CTC
espnet 开源了 Intermediate/Self-Conditioned CTC 两种 CTC 正则方法,大家伙有测试过二者与 基础 CTC 性能与精度比较吗? 隐藏内容有 PR 链接赞评论 1浏览 369 - 发布于2023-05-18 09:55:01
英文ASR 中如何解决中文外来词识别问题
大家伙有在做英文 ASR 过程中,遇到 中文外来词识别问题吗? 如 sichuan、jinan、sichuan kuaixian 等中文外来词识别薄弱的问题吗? 请问大家怎么解决或者缓解的方法?赞评论 2浏览 367 - 赞 1评论浏览 191
- 发布于2022-11-27 21:15:50
Java读取并解析wav格式文件
本文将主要介绍如何使用 Java 语言读取文件并解析 wave 格式,并以代码形式进行展开。代码主要包含三个功能类,分别为:Wave、DataParseUtils 和 Common。 本代码已用于 GitHub 上开源的 ASRT 语音识别系统的 Java...赞 2评论浏览 455 - 发布于2022-10-26 10:27:37
kaldi解码器
推荐语音识别解码器介绍: Git 链接 1、Simple Decode 2、Lattice Simple Decode 3、Faster Decode 4、Hashlist 5、Lattice Faster Decode赞 2评论浏览 754