METASPEECH
[浏览需要 0 积分] 发布于

WFST算法分享-06-厦门大学洪老师

论文优势:
(1)WFST 基础理论介绍
(2)基于 WFST 的 Token Passing 算法流程介绍
(3)解码与剪枝
(4)其他介绍
PPT 下载链接:

浏览 (1807)
点赞 (1)
收藏
2条评论
云卷云舒
云卷云舒
学习
点赞
评论
昔年旧友
昔年旧友
大佬可以咨询你一下 关于MCNN+CTC这方面的问题嘛?我在复现过程中遇到了一个问题 声音的音频一直是可变的 应该怎么控制才可以正常卷积呢
点赞
评论
METASPEECH
这个是很早之前的研究啦,多路卷积现在视频动作识别中被称为多流,一般我们都是不同的通道采用不同的特征,最后再进行融合。 不过多流技术我并不很看好,因为研究认为,多流效果基本等价于先融合再单流。 除非有特别的场合,如code-switch、视频动作识别特殊的场合,一般我们不建议使用多流。
点赞
评论
METASPEECH
ASR多研究网络细节而不是随意的堆叠网络,not work,MCNN-CTC是很早之前的研究,当时受到研究限制,现在可以多研究些语音算法细节,而不是网络随意堆叠
点赞
评论
昔年旧友
大佬 意思是这个MCNN不是适合用在语音识别方面对吗?
ASR多研究网络细节而不是随意的堆叠网络,not work,MCNN-CTC是很早之前的研究,当时受到研究限制,现在可以多研究些语音算法细节,而不是网络随意堆叠
点赞
评论