优秀博士论文—北自所—董倩倩—面向语音翻译的文本规范化和端到端建模方法研究
语音翻译是指让机器完成从源语言的语音信号自动翻译生成目标语言的文本的过程,其基本设想是让计算机像人类译员一样充当持不同语言说话人之间翻译的角色。伴随着全球化大趋势,国际交流及信息传递日益增长,日常生活、外贸、医疗、电子商务等领域对语音翻译技术拥有着巨大而迫切的需求。主流的语音翻译系统分别独立地训练语音识别模块和机器翻译模块,然后将两个模块进行简单的拼接。近期,随着深度学习技术的发展以及数据爆炸式的增长,研究者们开始了对端到端技术的探索。在此背景下,本文以深度学习技术为理论基础,首先从级联系统出发,研究了级联系统中的文本规范化技术。然后对端到端语音翻译的模型结构和训练方法展开了研究。本文的主要研究成果总结如下。