- 发布于2024-01-21 15:41:13
语音大模型—Whisper全参数微调
1、Whisper 基础理论 论文链接 2、Finetune 策略 Wenet 代码实现链接 Espnet 代码实现链接 注:Espnet 中支持 LoRA 与 全参数 微调两种策略赞 1评论浏览 140 - 发布于2022-05-14 11:37:49
端到端语音识别-01-田正坤
论文优势: (1)CTC 模型介绍 (2)基础 Attention 模型 (3)Encoder 模型探讨 (4)软、硬 Attention 机制 (5)多任务学习结构 (6)Transformer 结构 (7)训练技巧与个人思考 论文下载链接:赞 1评论 2浏览 849 - 发布于2023-05-27 15:02:02
语音识别-Branchformer
aishell-1 测试 branchformer,在该数据集上测试该方案,精度一直没有超过 conformer,确定有提升吗,大家训练该网络模型有什么 tricks 或者好的思想吗? 隐藏内容有 PR 链接赞 1评论浏览 302 - 发布于2022-05-14 11:25:33赞评论浏览 512
- 发布于2022-05-14 11:20:42
WFST算法分享-04-Hori & Nakamura
本书优势: (1)WFST 基础理论与算法推导 (2)WFST 构图、搜素与优化 (3)静态解码器与动态解码器 (4)注解重点及其他 书籍下载链接:赞评论浏览 714 - 发布于2022-05-03 08:57:55
kaldi-工程化
本次开源来源连接:https://github.com/datemoon/ASR-decoder 开源涉及内容: (1)kaldi 工程化代码,解码及优化 (2)基于能量断点活性检测-vad (3)kaldi 工程化服务 (4)kaldi 对齐到字优化 (...赞 3评论浏览 1244 - 发布于2022-03-25 22:02:20赞 4评论浏览 682
- 发布于2022-03-23 17:07:54赞 2评论浏览 560
- 发布于2022-03-06 22:09:14
kaldi实战
HMM - code -Kaldi kaldi:https://github.com/kaldi-asr/kaldi kaldi 文档:http://www.kaldi-asr.org/ kaldi-help 下载链接赞 1评论浏览 587 - 发布于2022-03-06 22:04:56赞 1评论浏览 547
- 发布于2022-03-06 22:02:04赞 1评论浏览 757
- 发布于2022-03-06 22:00:45赞 2评论浏览 494