- [浏览需要 0 积分] 发布于1天前赞 2评论浏览 10
- [浏览需要 0 积分] 发布于2天前
【Technique Report】Mini-Omni2: Towards Open-source GPT-4o with Vision, Speech and Duplex Capabilities
论文链接 代码链接赞 2评论浏览 11 - [浏览需要 0 积分] 发布于5天前
《从Hessian近似看自适应学习率优化器》
https://kexue.fm/archives/10588 本文介绍了从 Newton 法和 Hessian 近似看待 Adam 等自适应学习率优化器的一个视角,并讨论了 Hessian 近似的相关结果。赞 2评论浏览 42 - [浏览需要 0 积分] 发布于5天前赞 3评论浏览 76
- [浏览需要 0 积分] 发布于6天前
【Conference Paper】Contextual Biasing Speech Recognition in Speech-enhanced Large Language Model
论文链接赞 2评论浏览 30 - [浏览需要 0 积分] 发布于7天前
【Conference Paper】Speed of Light Exact Greedy Decoding for RNN-T Speech Recognition Models on GPU
论文链接 代码链接赞 2评论浏览 22 - [浏览需要 0 积分] 发布于8天前
【Conference Paper】Tiny-Align: Bridging Automatic Speech Recognition and Large Language Model on the Edge
论文链接赞 2评论浏览 27 - [浏览需要 0 积分] 发布于9天前赞 2评论浏览 32
- [浏览需要 0 积分] 发布于12天前赞 2评论浏览 58
- [浏览需要 0 积分] 发布于15天前
【Conference Paper】Developing Instruction-Following Speech Language Model Without Speech Instruction-Tuning Data
论文链接 代码链接 官方链接赞 2评论浏览 75 - [浏览需要 0 积分] 发布于15天前赞 2评论浏览 72
- [浏览需要 0 积分] 发布于16天前
【Conference Paper】Paraformer-v2: An improved non-autoregressive transformer for noise-robust speech recognition
论文链接赞 2评论浏览 101 - [浏览需要 0 积分] 发布于16天前赞 2评论浏览 90
- [浏览需要 0 积分] 发布于17天前
【Conference Paper】CJST: CTC Compressor based Joint Speech and Text Training for Decoder-Only ASR
论文链接赞 2评论浏览 65