TE
科技回声
首页
24小时热榜
最新
最佳
问答
展示
工作
中文
GitHub
Twitter
首页
Muon Is Scalable for LLM Training
5 点
作者
renonce
3 个月前
1 comment
yorwba
3 个月前
For people who want to know more about the Muon optimizer: <a href="https://kellerjordan.github.io/posts/muon/" rel="nofollow">https://kellerjordan.github.io/posts/muon/</a>