元语音研究网
首页推荐关注语音文本图像大模型
    登录
    首页
    话题
    首页
    推荐
    关注
    语音
    文本
    图像
    大模型
    消息
    登录
    最新
    推荐
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-03-19 11:00:43

      优秀会议论文推荐—Robust Speech Recognition via Large-Scale Weak Supervision

      论文链接见隐藏内容
      赞 3
      评论 1
      浏览 731
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-02-03 12:32:41

      优秀会议论文推荐—Scaling Speech Technology to 1,000+ Languages

      论文链接
      赞 1
      评论
      浏览 905
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-02-03 12:35:46

      优秀会议论文推荐—Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages

      论文链接
      赞 1
      评论
      浏览 1033
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-03-06 10:20:49

      优秀会议论文推荐—OWSM v3. 1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer

      论文链接见隐藏内容
      赞 1
      评论
      浏览 606
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-04-21 19:21:04

      优秀会议论文推荐—Scaling Speech Technology to 1,000+ Languages

      论文链接
      赞 1
      评论
      浏览 539
      语音
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-05-26 19:36:52

      平安科技—音频大模型实验室

      官网
      赞 1
      评论
      浏览 746
      前沿动态
    • METASPEECH
      METASPEECH METASPEECH
      [浏览需要 0 积分] 发布于2024-05-26 20:12:56

      KIMI

      https://kimi.moonshot.cn/
      赞 1
      评论
      浏览 785
      大模型&多模态
    • wang
      wang wang
      [浏览需要 0 积分] 发布于2024-09-05 10:34:32

      第一个开源的具有实时对话能力的多模态模型:Mini-Omni

      mini-omni 是清华大学启元实验室的开源项目,具有听,说,独立思考能力,在实时语音交互上面可以媲美 gpt-4o github 论文 功能特点 1.实时语音对话功能,无需额外的 ASR 或 TTS 模型。 2. 边思考边对话,支持同时生成文本和音频。...
      赞 4
      评论
      浏览 1007
      开源分享
    • AI柠檬
      AI柠檬 AI柠檬
      [浏览需要 0 积分] 发布于2025-03-28 23:33:26

      【前沿观察】最新研究:DeepSeek-R1 的性能、安全性和可解释性

      随着 DeepSeek-R1 的推出,其在多个领域的卓越表现引起了广泛关注。然而,除了性能,安全性、计算效率和可解释性也成为研究者们关注的重点。以下是对几篇近期发表的 arXiv 论文中关于 DeepSeek-R1 的研究综述。 1. 温度设置与架构对生成...
      赞 2
      评论
      浏览 178
      前沿动态
    签到
    0
    立即签到
    公告

    元语音研究网站板块设计:【CP】Conference Paper,【JP】Journal Paper,【TR】Technique Report,【优秀导师】,【优秀研究员】,【优秀博士生】

    积分排行
    • METASPEECH
      METASPEECH

      269 帖子 • 51 评论

      1646
    • Speech
      Speech

      166 帖子 • 24 评论

      1292
    • AI柠檬
      AI柠檬

      14 帖子 • 16 评论

      509
    • 江南一点红
      江南一点红

      1 帖子 • 1 评论

      46
    • 懵
      懵懵懂懂的新手

      1 帖子 • 17 评论

      39
    • M
      Mephisto

      0 帖子 • 4 评论

      28
    • 後藤ひとり
      後藤ひとり

      0 帖子 • 0 评论

      23
    • 心行
      心行

      2 帖子 • 0 评论

      20
    • 出东巷
      出东巷

      0 帖子 • 0 评论

      15
    • betciso
      betciso

      0 帖子 • 1 评论

      12
    关于 标签 友链
    © 2024 元语音研究网   由 AI柠檬 提供技术支持
    沪ICP备2022004527号-2