AI柠檬
[浏览需要 0 积分] 发布于

【持续更新】AI柠檬博客智能语音技术系列文章集整理

1. 智能语音技术教学干货

  1. Python 复现谷歌 SpecAugment 数据增强算法
  2. 还是不会 VAD?带你看懂语音激活检测方法原理
  3. 语音声学特征提取:MFCC 和 LogFBank 算法的原理
  4. 语音声学特征提取:用于 ASRT 的语谱图特征的算法原理与实现

2. ASRT 语音识别开源项目干货教程

开源代码仓:

  1. GitHub: ASRT_SpeechRecognition
  2. GitHub: ASRT_SDK_WinClient
  3. GitHub: ASRT_SDK_Python3
  4. GitHub: ASRT_SDK_Java
  5. GitHub: asrt-sdk-go

教程文章:

  1. ASRT:一个中文语音识别系统
  2. Python 实现录音和播放功能
  3. 教你如何使用 ASRT 训练中文语音识别模型
  4. 教你如何使用 ASRT 部署中文语音识别 API 服务器
  5. C#基于 winmm 实现录音功能
  6. C#在 UWP 中实现录音功能
  7. Java 读取并解析 wav 格式文件

3. 智能语音技术相关资料收集整理

  1. 几个最新免费开源的中文语音数据集
  2. 几个免费开源的英文语音数据集
  3. AI 柠檬语音识别学习路径和入门资料推荐

4. 领域前沿动态和论文分享

  1. [翻译]使用 CTC 进行序列建模
  2. MCNN-CTC:将语音识别错误率再降 12%
  3. [翻译]Deep Speech:中文和英文中的端到端的语音识别
  4. 使用 N-DenseNet 实现城市声音事件分类模型
  5. [论文翻译]SpecAugment:一种用于自动语音识别的简单数据扩增方法
  6. [论文分享]Char2wav 端到端语音合成
  7. [论文分享]用 GAN 从 MFCC 合成语音波形
  8. [论文分享]FastSpeech: 快速鲁棒可控的语音合成
  9. [论文分享]迁移学习实现基于预算的语音识别
  10. 10 分钟标注数据胜过一年前的 960h 数据,FAIR 新研究取得语音识别大进展(模型已开源)
浏览 (844)
点赞 (5)
收藏
评论