元语音 [浏览需要 0 积分] 发布于 2025-03-05 11:34:22 《MoE环游记:3、换个思路来分配》 https://kexue.fm/archives/10757 本文介绍了 MoE 负载均衡问题的 Loss-Free 方法,它由 DeepSeek 提出,其核心在于通过引入一个简单的偏置项来实现负载均衡。本文进一步思考了它与 Aux Loss 的联系,以及它在类似数学问题上的应用潜力。 文本 #文本#苏神 2 浏览 (543) 点赞 (2) 收藏