METASPEECH
发布于

英文ASR 中如何解决中文外来词识别问题

大家伙有在做英文 ASR 过程中,遇到 中文外来词识别问题吗?
如 sichuan、jinan、sichuan kuaixian 等中文外来词识别薄弱的问题吗?

请问大家怎么解决或者缓解的方法?

浏览 (460)
点赞
收藏
2条评论
METASPEECH
METASPEECH
英文目前常用方法使用bpe 建模, 但是中文外来词如果用bpe 建模,在识别时 有一些问题,虽然数据可以让模型识别外来词
点赞
评论
Mephisto
kaldi有个extend vocab
点赞
评论
METASPEECH
多谢大佬能给个链接吗?
点赞
评论
METASPEECH
如果说 英文用bpe ,中文用拼音,这样是否会导致训练不同源呢?请大佬帮忙指导
点赞
评论
哈哈,不是大佬,入门级选手。 https://github.com/kaldi-asr/kaldi/blob/master/egs/mini_librispeech/s5/local/grammar/extend_vocab_demo.sh
点赞
评论