METASPEECH [浏览需要 0 积分] 发布于 2025-05-17 10:28:42 《MoE环游记:5、均匀分布的反思》 https://kexue.fm/archives/10945 本文介绍了 MoE 的 Shared Expert 和 Fine-Grained Expert 策略,并指出它们某种程度上都体现了负载均衡的非最优性。 文本 #文本#苏神 1 浏览 (40) 点赞 (1) 收藏