Muon悄悄「饿死」25%的神经元：Aurora修复后数据效率翻百倍

作者: MarsBit 快讯 2026-05-10 11:52:34

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

据动察 Beating 监测，Tilde Research 发现，被 DeepSeek V4、Kimi K2.5、GLM-5 等头部模型采用的优化器 Muon 有一个隐藏缺陷：它会在训练早期让 MLP 层超过四分之一的神经元永久死亡。团队据此设计了替代优化器 Aurora 并开源。一个 1.1B 模型仅用约 100B token，就在 HellaSwag、Winogrande 等语言理解基准上逼平了用 36T token 训练的 Qwen3-1.7B。问题出在 Muon 处理 MLP 权重矩阵时的一个数学特性上。训练初期，一部分神经元碰巧收到了较弱的梯度信号。AdamW 等传统优化器会逐参数归一化，自然拉平这种差异；但 Muon 的正交化步骤会把弱信号原封不动地传下去。弱的神经元持续得到弱更新，越来越沉默，形成「强者恒强」的死循环。到训练第 500 步，已有超过四分之一的神经元实质性死亡，白白浪费了参数容量。此前的改进版 NorMuon 通过强制拉平每行更新幅度来缓解，但代价是破坏了更新矩阵的正交性（正交化让每步更新尽可能高效，是 Muon 的核心优势），损失了优化精度。Aurora 把「更新均匀」和「正交性」设为联合约束，用交替迭代同时满足两者：既让每个神经元都得到公平的学习机会，又不牺牲更新精度。未调参的 Aurora 仅比 Muon 多 6% 计算开销，可直接替换。在 modded-nanoGPT 优化跑分中，Aurora 以 3175 步刷新了当前最优纪录。Aurora 的优势还会随 MLP 宽度增大而放大，扩展系数越高，改善越明显。代码和 1.1B 预训练模型均已开源。

Wasabi Protocol更新安全事件处理进展：尚未达成用户赔付最终方案

我国经济增长动能澎湃

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

某鲸鱼地址从OKX提币1.24万枚ETH，两地址合计提币超3万枚ETH

火星财经消息，8 月 30 日，据链上数据分析师余烬监测，某鲸鱼地址在过去 4 小时内从 OKX 提出 12,410 枚 ETH (约合 5403 万美元)。该地址和昨天同样从 OKX 提币

2025-08-30 10:20:01
荷兰众议院推进备受争议的 36% 税收法案，适用范围涵盖加密货币

火星财经消息，据 Cointelegraph 报道，荷兰众议院于 2 月 13 日通过一项立法提案，拟对储蓄及包括加密货币在内的大部分流动性投资征收 36% 的资本利得税。该提案以 93 票赞成

2026-02-14 09:09:44
数据：540.55 枚 BTC 从匿名地址转出，经中转后流入 Wintermute

火星财经消息，据 Arkham 数据，在 09:51，540.55 枚 BTC（价值约 4535 万美元）从一匿名地址（1MSa7...开头）转出至另一匿名地址（1KbDE...开头）。随后，该

2026-01-31 10:03:01
波段巨鲸pfm.eth止损卖出全部1896枚ETH，亏损25万美元

火星财经消息，9 月 10 日，据链上分析师 Ai 姨（@ai_9684xtpa）监测，波段巨鲸 pfm.eth 于 10 小时前以 4196.31 美元的价格卖出全部 1896 枚 ETH，亏

2025-09-10 09:41:01
币安将调整LINAUSDT永续合约参数

火星财经消息, 据官方公告，币安将于 2025 年 3 月 25 日 9：00（UTC）调整 USD�MLINAUSDT 永续合约的 ticksize 和最小交易量，其中 ticksize 由

2025-03-24 21:02:01
英国上市公司 Satsuma Technology 卖出 579 枚比特币，总持仓量降至 620 枚

火星财经消息，据 BitcoinTreasuries.NET 监测，英国上市公司 Satsuma Technology 卖出 579 枚比特币，总持仓量降至 620 枚。

2025-12-12 11:18:06
火币HTX质押借币USDT活期产品当前利率低至3.36%

火星财经消息，火币HTX官网数据显示，平台当前的质押借币USDT活期产品年币息率仅为3.36%，相较于行业平均水平有显著优势。此外，火币HTX质押借币BTC活期产品年币息率低至0.5%，ETH活

2025-04-25 16:59:14
分析：160万个地址曾以97,200美元均价买入157万枚BTC，正形成阻力位

火星财经消息，2 月 12 日，据 Intotheblock 披露，160 万个地址曾以 97,200 美元的平均价格累计购买 157 万枚 BTC，目前正在形成一个阻力位。由于这些持有者目前

2025-02-12 17:12:01

币种	价格	涨跌幅
BTC 比特币	￥780,779.71 $109,400.40	-0.3%
ETH 以太坊	￥28,519.55 $3,996.07	-1.19%
USDT 泰达币	￥6.50 $0.91130	-5.75%
SOL Solana	￥1,445.15 $202.49	+1.27%
BNB 币安币	￥6,915.37 $968.96	+1.59%
XRP 瑞波币	￥6.50 $0.91130	-5.75%
DOGE 狗狗币	￥1.64 $0.22965	-0.39%
USDC USD	￥7.13 $0.99940	+0.02%
ADA 艾达币	￥5.61 $0.78600	+1.87%
AVAX Avalanche	￥204.61 $28.67	-1.51%
TRX 波场	￥6.50 $0.91130	-5.75%
TON Toncoin	￥19.44 $2.72	+2.14%
SHIB Shiba	￥0.00019 $0.0000260	+5.78 %
XLM 恒星币	￥2,75 $0,38580	-0.85%
DOT 波卡币	￥60.21 $8.31	+2.4 %
LINK ChainLink	￥148.80 $20.85	-0.33%
OKB OK币	￥1,351.87 $189.42	+1.69%
BCH 比特现金	￥6.50 $0.91130	-5.75%
SUI Sui	￥25.56 $3.53	+4.94 %
PEPE Pepe	￥0.0000660 $0.0000093	-1.28%