METASPEECH
发布于

语音识别构图与加速方案

听说**公司,基于 WFST 解码在推理与搜索速度比同级 kaldi 解码速度(以 online2-wav-nnet3-latgen-faster 为例)快 20+ 倍,请问有大佬们如何能加速 WFST 搜索呢?
前提是保持解码精度基本不变的情况下。

浏览 (861)
点赞 (1)
收藏
2条评论
METASPEECH
METASPEECH
据说将FST图转化为FSG也会有一定程度的加速与内存优化
点赞
评论
METASPEECH
METASPEECH
笔者从解码策略,如跳帧,beam以及lattice beam剪枝策略上,以及从解码算法上,如FSD等分析,所有上去提升在5倍左右,他们是怎么实现的的呢?
点赞 1
评论