- [浏览需要 0 积分] 发布于2024-03-19 11:00:43赞 3评论 1浏览 639
- [浏览需要 0 积分] 发布于2024-02-03 12:32:41赞 1评论浏览 817
- [浏览需要 0 积分] 发布于2024-02-03 12:35:46赞 1评论浏览 930
- [浏览需要 0 积分] 发布于2024-03-06 10:20:49
优秀会议论文推荐—OWSM v3. 1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer
论文链接见隐藏内容赞 1评论浏览 507 - [浏览需要 0 积分] 发布于2024-04-21 19:21:04赞 1评论浏览 493
- [浏览需要 0 积分] 发布于2024-09-05 10:34:32
第一个开源的具有实时对话能力的多模态模型:Mini-Omni
mini-omni 是清华大学启元实验室的开源项目,具有听,说,独立思考能力,在实时语音交互上面可以媲美 gpt-4o github 论文 功能特点 1.实时语音对话功能,无需额外的 ASR 或 TTS 模型。 2. 边思考边对话,支持同时生成文本和音频。...赞 4评论浏览 915 - [浏览需要 0 积分] 发布于2025-03-28 23:33:26
【前沿观察】最新研究:DeepSeek-R1 的性能、安全性和可解释性
随着 DeepSeek-R1 的推出,其在多个领域的卓越表现引起了广泛关注。然而,除了性能,安全性、计算效率和可解释性也成为研究者们关注的重点。以下是对几篇近期发表的 arXiv 论文中关于 DeepSeek-R1 的研究综述。 1. 温度设置与架构对生成...赞 2评论浏览 102