元语音

shylockasr@qq.com

元语音

[浏览需要 0 积分] 发布于6天前

VOCOS: CLOSING THE GAP BETWEEN TIME-DOMAIN AND FOURIER-BASED NEURAL VOCODERS FOR HIGHQUALITY AUDIO SYNTHESIS
论文链接模型链接

赞

评论

浏览 23

语音
元语音

[浏览需要 0 积分] 发布于11天前

Align Your Flow: Scaling Continuous-Time Flow Map Distillation
论文链接

赞

评论

浏览 26

语音
元语音

[浏览需要 0 积分] 发布于11天前

MOSS-TTS-v1.5
论文链接模型链接代码链接

赞

评论

浏览 27

语音
元语音

[浏览需要 0 积分] 发布于12天前

FSMN-VAD SFT微调代码
代码链接 Finetune 代码

赞

评论

浏览 29

语音
元语音

[浏览需要 0 积分] 发布于13天前

AISHELL recipe for SenseVoice-small training
代码链接

赞

评论

浏览 29

语音
元语音

[浏览需要 0 积分] 发布于13天前

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization
论文链接代码链接

赞

评论

浏览 30

语音
元语音

[浏览需要 0 积分] 发布于26天前

Zapformer preview
代码链接

赞 1

评论

浏览 173

语音
元语音

[浏览需要 0 积分] 发布于27天前

KIMI2.6 Blog
HF 链接博客链接

赞

评论

浏览 59

语音
元语音

[浏览需要 0 积分] 发布于27天前

LLMs and Speech: Integration vs. Combination
论文链接

赞

评论

浏览 53

语音
元语音

[浏览需要 0 积分] 发布于28天前

DAPO: An Open-Source LLM Reinforcement Learning System at Scale
论文链接讲解链接

赞

评论

浏览 56

语音
元语音

[浏览需要 0 积分] 发布于28天前

FULL-DUPLEX-BENCH V1.5: EVALUATING OVERLAP HANDLING FOR FULL-DUPLEX SPEECH MODELS
论文链接

赞

评论

浏览 106

语音
元语音

[浏览需要 0 积分] 发布于2026-05-21 14:12:55

Qwen3.5-Omni Technical Report
论文链接

赞

评论

浏览 60

语音
元语音

[浏览需要 0 积分] 发布于2026-04-28 13:47:50

KIMI K2.5: VISUAL AGENTIC INTELLIGENCE
论文链接 HF 链接

赞

评论

浏览 119

语音
元语音

[浏览需要 0 积分] 发布于2026-04-23 15:18:21

Group Sequence Policy Optimization
论文链接代码链接

赞

评论

浏览 115

语音
元语音

[浏览需要 0 积分] 发布于2026-04-20 14:34:51

【Code】WFST Decoder with Kaldi
代码链接

赞 1

评论

浏览 87

语音
元语音

[浏览需要 0 积分] 发布于2026-04-14 14:32:17

OmniVoice: Towards Omnilingual Zero-Shot Text-to-Speech with Diffusion Language Models
论文链接代码链接

赞

评论

浏览 109

语音
元语音

[浏览需要 0 积分] 发布于2026-04-13 10:57:20

ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models
论文链接

赞

评论

浏览 180

语音
元语音

[浏览需要 0 积分] 发布于2026-04-01 15:45:28

STEP3-VL-10B Technical Report
论文链接

赞

评论

浏览 130

语音
元语音

[浏览需要 0 积分] 发布于2026-04-01 10:33:28

Empowering Lightweight MLLMs with Reasoning via Long CoT SFT
论文链接

赞

评论

浏览 166

语音
元语音

[浏览需要 0 积分] 发布于2026-03-16 19:55:15

FireRedASR2S: A State-of-the-Art Industrial-Grade All-in-One Automatic Speech Recognition System
论文链接代码链接

赞

评论

浏览 133

语音