元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于2天前

      Qwen3-ASR Technical Report

      论文链接 代码链接 模型链接 SFT 链接 博客链接
      赞 1
      评论
      浏览 14
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于5天前

      VIBEVOICE-ASR Technical Report

      论文链接 代码链接
      赞
      评论
      浏览 31
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于6天前

      《DeltaNet的核心逆矩阵的元素总是在[-1, 1]内》

      https://kexue.fm/archives/11563
      赞
      评论
      浏览 33
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于6天前

      SimulS2S-LLM

      论文链接
      赞
      评论
      浏览 29
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于9天前

      Qwen3-TTS Technical Report

      论文链接 代码链接 Demo 链接 模型链接
      赞
      评论
      浏览 45
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于11天前

      《为什么我们偏爱各向同性?基于最速下降的理解》

      https://kexue.fm/archives/11549 这篇文章我们讨论了一个问题:参数层面上的最速下降,何时才刚好是特征层面上的最速下降?答案正是标题所述的“各向同性”,由此我们得出为什么偏爱各向同性的一个解释——它能同步两个层面上的最速下降,提...
      赞
      评论
      浏览 54
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于11天前

      《让炼丹更科学一些(六):自上而下的精妙构造》

      https://kexue.fm/archives/11540 上文末我们提到终点损失的最优学习率策略的证明困难问题,而在这篇文章中,我们通过自上而下的、小心谨慎的放缩和构造,完成了这个证明,并得到了更高精度的结果,同时讨论了这个结果对学习率的“Warmu...
      赞
      评论
      浏览 32
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于12天前

      【IndexTTS 2】

      论文链接 代码链接 Demo 链接
      赞
      评论
      浏览 56
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于17天前

      MOE结构讲解不错的文章

      文章链接
      赞
      评论
      浏览 34
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于18天前

      IndexTTS 2.5 Technical Report

      论文链接 Demo 链接
      赞
      评论
      浏览 35
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于19天前

      FLOW2GAN: HYBRID FLOW MATCHING AND GAN WITH MULTI-RESOLUTION NETWORK FOR FEW-STEP HIGH-FIDELITY AUDIO GENERATION

      论文链接 代码链接
      赞
      评论
      浏览 57
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于20天前

      【ASR+WFST的第二春】IKFST: IOO and KOO Algorithms for Accelerated and Precise WFST-based End-to-End Automatic Speech Recognition

      论文链接
      赞 1
      评论
      浏览 192
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于20天前

      向量量化-RVQ/FSQ实现代码

      代码链接
      赞
      评论
      浏览 55
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于23天前

      《让炼丹更科学一些(五):基于梯度精调学习率》

      https://kexue.fm/archives/11530 这篇文章开始,我们考虑基于梯度的学习率调度,它有助于我们了解诸如 Warmup、Decay 等学习率策略的原理,也能为各种自适应学习率优化器提供有益的参考。
      赞
      评论
      浏览 60
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于23天前

      【内源性奖励】GENERALIST REWARD MODELS: FOUND INSIDE LARGE LANGUAGE MODELS

      论文链接
      赞
      评论
      浏览 36
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于24天前

      Qwen 门控注意力Gated Attention

      论文链接 解读链接
      赞
      评论
      浏览 40
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于24天前

      杰出研究员-Jason Wei

      网站链接 思考 Google Scholar
      赞
      评论
      浏览 49
      语音
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于26天前

      MULTILINGUAL VISUAL SPEECH RECOGNITION WITH A SINGLE MODEL BY LEARNING WITH DISCRETE VISUAL SPEECH UNITS

      论文链接
      赞
      评论
      浏览 50
      大模型&多模态
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于27天前

      SLAM-Omni

      论文链接 代码链接 数据链接 Demo 链接
      赞 1
      评论
      浏览 61
      大模型&多模态
    • 元语音
      元语音 元语音
      [浏览需要 0 积分] 发布于27天前

      OSUM-EChat

      论文链接 代码链接
      赞
      评论
      浏览 54
      语音
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • 元语音
      元语音

      320 帖子 • 51 评论

      2186
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      519
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2