首页
推荐
关注
语音
文本
图像
大模型
发帖
登录
首页
话题
发帖
首页
推荐
关注
语音
文本
图像
大模型
消息
登录
最新
推荐
元语音
shylockasr@qq.com
关注
个人成就
积分
2211
话题
322
评论
51
注册排名
3
个人资料
编辑资料
昵称
元语音
签名
shylockasr@qq.com
主页
https://www.meta-speech.com/user/3
粉丝
17
更多
没有更多内容了
粉丝
关注
4
更多
没有更多内容了
关注
话题
文章
元语音
[浏览需要 0 积分] 发布于1天前
《Adam优化器的最优超参数是β1=β2 ?》
https://kexue.fm/archives/11593 在这篇文章中,我们对 Adam 优化器的 β1,β2 参数做了一些分析,从稳定性角度表明 β1=β2 通常是一个较优的选择,它可以理解为信噪比感知下的最速下降。
赞
评论
浏览
10
语音
元语音
[浏览需要 0 积分] 发布于1天前
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
论文链接 Demo 链接
赞
评论
浏览
13
语音
元语音
[浏览需要 0 积分] 发布于7天前
Qwen3-ASR Technical Report
论文链接 代码链接 模型链接 SFT 链接 博客链接
赞
1
评论
浏览
32
语音
元语音
[浏览需要 0 积分] 发布于11天前
VIBEVOICE-ASR Technical Report
论文链接 代码链接
赞
评论
浏览
41
语音
元语音
[浏览需要 0 积分] 发布于11天前
《DeltaNet的核心逆矩阵的元素总是在[-1, 1]内》
https://kexue.fm/archives/11563
赞
评论
浏览
46
语音
元语音
[浏览需要 0 积分] 发布于11天前
SimulS2S-LLM
论文链接
赞
评论
浏览
39
语音
元语音
[浏览需要 0 积分] 发布于14天前
Qwen3-TTS Technical Report
论文链接 代码链接 Demo 链接 模型链接
赞
评论
浏览
65
语音
元语音
[浏览需要 0 积分] 发布于17天前
《为什么我们偏爱各向同性?基于最速下降的理解》
https://kexue.fm/archives/11549 这篇文章我们讨论了一个问题:参数层面上的最速下降,何时才刚好是特征层面上的最速下降?答案正是标题所述的“各向同性”,由此我们得出为什么偏爱各向同性的一个解释——它能同步两个层面上的最速下降,提...
赞
评论
浏览
61
语音
元语音
[浏览需要 0 积分] 发布于17天前
《让炼丹更科学一些(六):自上而下的精妙构造》
https://kexue.fm/archives/11540 上文末我们提到终点损失的最优学习率策略的证明困难问题,而在这篇文章中,我们通过自上而下的、小心谨慎的放缩和构造,完成了这个证明,并得到了更高精度的结果,同时讨论了这个结果对学习率的“Warmu...
赞
评论
浏览
43
语音
元语音
[浏览需要 0 积分] 发布于17天前
【IndexTTS 2】
论文链接 代码链接 Demo 链接
赞
评论
浏览
66
语音
元语音
[浏览需要 0 积分] 发布于22天前
MOE结构讲解不错的文章
文章链接
赞
评论
浏览
42
语音
元语音
[浏览需要 0 积分] 发布于23天前
IndexTTS 2.5 Technical Report
论文链接 Demo 链接
赞
评论
浏览
42
语音
元语音
[浏览需要 0 积分] 发布于24天前
FLOW2GAN: HYBRID FLOW MATCHING AND GAN WITH MULTI-RESOLUTION NETWORK FOR FEW-STEP HIGH-FIDELITY AUDIO GENERATION
论文链接 代码链接
赞
评论
浏览
70
语音
元语音
[浏览需要 0 积分] 发布于25天前
【ASR+WFST的第二春】IKFST: IOO and KOO Algorithms for Accelerated and Precise WFST-based End-to-End Automatic Speech Recognition
论文链接
赞
1
评论
浏览
205
语音
元语音
[浏览需要 0 积分] 发布于25天前
向量量化-RVQ/FSQ实现代码
代码链接
赞
评论
浏览
63
语音
元语音
[浏览需要 0 积分] 发布于28天前
《让炼丹更科学一些(五):基于梯度精调学习率》
https://kexue.fm/archives/11530 这篇文章开始,我们考虑基于梯度的学习率调度,它有助于我们了解诸如 Warmup、Decay 等学习率策略的原理,也能为各种自适应学习率优化器提供有益的参考。
赞
评论
浏览
67
语音
元语音
[浏览需要 0 积分] 发布于28天前
【内源性奖励】GENERALIST REWARD MODELS: FOUND INSIDE LARGE LANGUAGE MODELS
论文链接
赞
评论
浏览
44
语音
元语音
[浏览需要 0 积分] 发布于29天前
Qwen 门控注意力Gated Attention
论文链接 解读链接
赞
评论
浏览
48
语音
元语音
[浏览需要 0 积分] 发布于29天前
杰出研究员-Jason Wei
网站链接 思考 Google Scholar
赞
评论
浏览
57
语音
元语音
[浏览需要 0 积分] 发布于2026-01-06 11:18:31
MULTILINGUAL VISUAL SPEECH RECOGNITION WITH A SINGLE MODEL BY LEARNING WITH DISCRETE VISUAL SPEECH UNITS
论文链接
赞
评论
浏览
59
大模型&多模态
查看更多