语音 - 话题 | 元语音研究网

元语音

[浏览需要 0 积分] 发布于5小时前

ZipVoice: Fast and High-Quality Zero-Shot Text-to-Speech with Flow Matching
论文链接训练代码推理代码 Sherpa-onnx 部署

赞

评论

浏览 6

语音
元语音

[浏览需要 0 积分] 发布于8天前

VOCOS: CLOSING THE GAP BETWEEN TIME-DOMAIN AND FOURIER-BASED NEURAL VOCODERS FOR HIGHQUALITY AUDIO SYNTHESIS
论文链接模型链接

赞

评论

浏览 26

语音
元语音

[浏览需要 0 积分] 发布于12天前

Align Your Flow: Scaling Continuous-Time Flow Map Distillation
论文链接

赞

评论

浏览 29

语音
元语音

[浏览需要 0 积分] 发布于12天前

MOSS-TTS-v1.5
论文链接模型链接代码链接

赞

评论

浏览 30

语音
元语音

[浏览需要 0 积分] 发布于14天前

FSMN-VAD SFT微调代码
代码链接 Finetune 代码

赞

评论

浏览 31

语音
元语音

[浏览需要 0 积分] 发布于14天前

AISHELL recipe for SenseVoice-small training
代码链接

赞

评论

浏览 31

语音
元语音

[浏览需要 0 积分] 发布于15天前

FIPO: Eliciting Deep Reasoning with Future-KL Influenced Policy Optimization
论文链接代码链接

赞

评论

浏览 31

语音
元语音

[浏览需要 0 积分] 发布于2024-03-23 10:30:14

优秀博士论文推荐—李乃寒—面向语音合成的深度学习算法研究与应用
语音合成(speech synthesis，又名 text-to-speech,TTS)是人机交互的重要方法之一，旨在合成清晰且自然的音频。语音合成的应用场景非常广泛，比如手机和个人电脑的语音助手、同声传译的语音输出环节、车载导航播报、新闻朗读等等。通过语...

赞 2

评论 2

浏览 1254

语音
元语音

[浏览需要 0 积分] 发布于27天前

Zapformer preview
代码链接

赞 1

评论

浏览 175

语音
元语音

[浏览需要 0 积分] 发布于28天前

KIMI2.6 Blog
HF 链接博客链接

赞

评论

浏览 61

语音
元语音

[浏览需要 0 积分] 发布于29天前

LLMs and Speech: Integration vs. Combination
论文链接

赞

评论

浏览 55

语音
元语音

[浏览需要 0 积分] 发布于29天前

DAPO: An Open-Source LLM Reinforcement Learning System at Scale
论文链接讲解链接

赞

评论

浏览 61

语音
元语音

[浏览需要 0 积分] 发布于29天前

FULL-DUPLEX-BENCH V1.5: EVALUATING OVERLAP HANDLING FOR FULL-DUPLEX SPEECH MODELS
论文链接

赞

评论

浏览 113

语音
元语音

[浏览需要 0 积分] 发布于2026-05-21 14:12:55

Qwen3.5-Omni Technical Report
论文链接

赞

评论

浏览 62

语音
元语音

[浏览需要 0 积分] 发布于2026-04-28 13:47:50

KIMI K2.5: VISUAL AGENTIC INTELLIGENCE
论文链接 HF 链接

赞

评论

浏览 121

语音
元语音

[浏览需要 0 积分] 发布于2026-04-23 15:18:21

Group Sequence Policy Optimization
论文链接代码链接

赞

评论

浏览 117

语音
元语音

[浏览需要 0 积分] 发布于2026-04-20 14:34:51

【Code】WFST Decoder with Kaldi
代码链接

赞 1

评论

浏览 89

语音
元语音

[浏览需要 0 积分] 发布于2026-04-14 14:32:17

OmniVoice: Towards Omnilingual Zero-Shot Text-to-Speech with Diffusion Language Models
论文链接代码链接

赞

评论

浏览 111

语音
元语音

[浏览需要 0 积分] 发布于2026-04-13 10:57:20

ReMax: A Simple, Effective, and Efficient Reinforcement Learning Method for Aligning Large Language Models
论文链接

赞

评论

浏览 185

语音
元语音

[浏览需要 0 积分] 发布于2026-04-01 15:45:28

STEP3-VL-10B Technical Report
论文链接

赞

评论

浏览 133

语音

元语音
348 帖子 • 51 评论

2545
Speech
166 帖子 • 24 评论

1292
AI柠檬
14 帖子 • 16 评论

526
江南一点红
1 帖子 • 1 评论

46
懵
懵懵懂懂的新手
1 帖子 • 17 评论

39
M
Mephisto
0 帖子 • 4 评论

28
後藤ひとり
0 帖子 • 0 评论

23
心行
2 帖子 • 0 评论

20
出东巷
0 帖子 • 0 评论

15
betciso
0 帖子 • 1 评论

12