- [浏览需要 0 积分] 发布于6小时前
FireRedASR2S: A State-of-the-Art Industrial-Grade All-in-One Automatic Speech Recognition System
论文链接 代码链接赞评论浏览 6 - [浏览需要 0 积分] 发布于4天前赞评论浏览 16
- [浏览需要 0 积分] 发布于14天前赞评论浏览 44
- [浏览需要 0 积分] 发布于2026-02-09 11:22:11赞评论浏览 84
- [浏览需要 0 积分] 发布于2026-02-05 21:04:01
《Adam优化器的最优超参数是β1=β2 ?》
https://kexue.fm/archives/11593 在这篇文章中,我们对 Adam 优化器的 β1,β2 参数做了一些分析,从稳定性角度表明 β1=β2 通常是一个较优的选择,它可以理解为信噪比感知下的最速下降。赞评论浏览 84 - [浏览需要 0 积分] 发布于2026-02-05 11:14:20
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
论文链接 Demo 链接赞评论浏览 68 - [浏览需要 0 积分] 发布于2026-01-30 16:24:37赞 2评论浏览 117
- [浏览需要 0 积分] 发布于2026-01-26 11:09:51赞评论浏览 102
- [浏览需要 0 积分] 发布于2026-01-23 17:00:55赞评论浏览 108
- [浏览需要 0 积分] 发布于2026-01-20 20:54:26
《为什么我们偏爱各向同性?基于最速下降的理解》
https://kexue.fm/archives/11549 这篇文章我们讨论了一个问题:参数层面上的最速下降,何时才刚好是特征层面上的最速下降?答案正是标题所述的“各向同性”,由此我们得出为什么偏爱各向同性的一个解释——它能同步两个层面上的最速下降,提...赞评论浏览 116 - [浏览需要 0 积分] 发布于2026-01-20 20:53:55
《让炼丹更科学一些(六):自上而下的精妙构造》
https://kexue.fm/archives/11540 上文末我们提到终点损失的最优学习率策略的证明困难问题,而在这篇文章中,我们通过自上而下的、小心谨慎的放缩和构造,完成了这个证明,并得到了更高精度的结果,同时讨论了这个结果对学习率的“Warmu...赞评论浏览 88 - [浏览需要 0 积分] 发布于2026-01-13 16:34:46
FLOW2GAN: HYBRID FLOW MATCHING AND GAN WITH MULTI-RESOLUTION NETWORK FOR FEW-STEP HIGH-FIDELITY AUDIO GENERATION
论文链接 代码链接赞评论浏览 126 - [浏览需要 0 积分] 发布于2026-01-12 15:00:26
【ASR+WFST的第二春】IKFST: IOO and KOO Algorithms for Accelerated and Precise WFST-based End-to-End Automatic Speech Recognition
论文链接赞 1评论浏览 263