元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-05-05 10:04:36

      优秀研究员—Chao Weng

      学术链接
      赞 1
      评论
      浏览 647
      默认分类
    • L
      L Lil2J
      [浏览需要 0 积分] 发布于2024-03-02 21:45:37

      从0开始预训练1.4b中文大模型实践

      简介 这篇文章主要记录了我个人对 1.4b 中文大模型的实践复现过程。我选择了 QWEN 作为基座模型,并训练了一个参数量达到 1.4b 的预训练模型,其中涉及的训练 token 数量约为 8b。在此过程中,我使用了两张 a100 80g 显卡,并耗费了大...
      赞 3
      评论
      浏览 1716
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-01-21 12:10:18

      CMU多语言训练框架—OWSM

      1、算法原理 基础理论 2、算法框架 训练框架
      赞 1
      评论
      浏览 786
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-01-21 11:55:30

      Blank Penalty 算法原理与实现

      1、算法原理 算法介绍 2、算法实现 blank penalty 算法实现 3、算法应用 if blank_penalty > 0.0 logits = self.ctc.ctc_lo(encoder_out) logits[:, :, b...
      赞 1
      评论
      浏览 864
      默认分类
    • AI柠檬
      AI柠檬 AI柠檬
      [浏览需要 0 积分] 发布于2023-05-21 23:35:08
      我发现新版的TensorFlow(2.11及以后)已经不支持在Windows上调用GPU进行模型训练了,装了 TensorFlow 执行 tf.test.is_gpu_available() 结果一直都是False 查到官方仓库上关于此事的Issues链接: https://github.com/tensorflow/tensorflow/issues/60241 其中提到了相关信息,以后Windows上训练只能用WSL了
      赞 1
      评论
      浏览 1231
      默认分类
    • 倦
      倦 倦鳥馀花
      [浏览需要 0 积分] 发布于2022-02-25 16:17:59

      史上训练最简单,音质最好的语音合成系统

      https://github.com/dtx525942103/vits_chinese 提供模型供评估
      赞 7
      评论 17
      浏览 6953
      默认分类
    • T
      T TensorPro
      [浏览需要 0 积分] 发布于2022-02-25 14:49:41
      请教大家一个问题:关于用wenet 的TLG方案时,我在端到端模型上用的是拼音建模,然后通过词典对应到相应的汉字上去,现在TLG解码时,发现很多的删除错误,就是有很多地方没有识别结果。而我看用拼音的模型解码时其实是有识别结果的,不知道有哪位老师遇到过
      赞 1
      评论 3
      浏览 2191
      默认分类
    • 江南一点红
      江南一点红 江南一点红
      [浏览需要 0 积分] 发布于2022-05-19 16:16:36

      PyTorch使用Apple M1芯片加速训练

      摘要 安装 Miniconda3 注意:要启动苹果 M1 系列芯片加速需安装 arm64 架构原生 python 环境! curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOS...
      赞 3
      评论 3
      浏览 1618
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-04-09 13:14:45

      标签同步解码算法-LSD

      标签同步解码算法 ASR 解码加速经典好文,可以在保持准确率基本不变的情况下同步提升字准率: http://cjc.ict.ac.cn/online/onlinepaper/42-7-4-201974193716.pdf
      赞 2
      评论
      浏览 1055
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-04-06 12:07:01

      CTC Prefix Beam Search

      发现一个讲解 CTC 前缀束搜索解码讲解 Git,推荐下! Reference:https://github.com/ZhaoZeyu1995/zhaozeyu1995.github.io/blob/master/_hidden_posts/2021-5-...
      赞 2
      评论
      浏览 1562
      默认分类
    • 家有爱妻是个宝
      家有爱妻是个宝 家有爱妻是个宝
      [浏览需要 0 积分] 发布于2022-04-05 12:50:22

      天津大学认知计算与应用重点实验室语音前端处理与asr小组B站

      https://m.bilibili.com/space/627545197?from=search
      赞 3
      评论 1
      浏览 1391
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-04-03 11:53:54

      MMI基础理论推导

      MMI 基础理论 推导下载链接 Reference:http://placebokkk.github.io/asr/2019/12/24/asr-paper-se-mmi-note.html
      赞 2
      评论
      浏览 1392
      默认分类
    • 倦
      倦 倦鳥馀花
      [浏览需要 0 积分] 发布于2022-03-02 11:30:53

      举世无双语音合成系统 VITS 发展历程

      2021 年 6 月 11 日 VITS 论文和代码发布: 论文:Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech 代码...
      赞 5
      评论 1
      浏览 2599
      默认分类
    • W
      W wbglearn
      [浏览需要 0 积分] 发布于2022-02-25 10:05:22

      语音的预训练最近特别火,大家有实践的吗?

      比如 data2vec 或者 wav2vec 或者 wavlm 等。
      赞 4
      评论 3
      浏览 1510
      默认分类
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2022-02-25 12:16:13
      kaldi鉴别性训练完毕后,使用区分性训练基本可以得到一致的ASR精度提升。 但是以CTC为例的端到端模型在基本训练完毕后retrain区分性训练(mmi),在精度上没有传统模型表现好呢(偶现区分性较好)?并且训练差的比例大幅会高于训练好的比例。
      赞 2
      评论 1
      浏览 1690
      默认分类
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • METASPEECH
      METASPEECH

      269 帖子 • 51 评论

      1646
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      509
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2