新闻→技术突破

DeepSeek更新DeepGEMM：Mega MoE融合算子+FP4支持，底层算力再突破

📅 2026年4月20日📰 GitHub⏱️ 阅读时间 11 分钟

🔥 底层算力的「隐形革命」。DeepSeek发布了DeepGEMM开源以来最大规模的更新——Mega MoE融合算子让通信和计算重叠执行，FP4支持将权重内存减半，PDL消除GPU空闲时间。当所有人盯着模型排行榜时，真正决定成本的底层计算正在被重写。

核心数据

四大核心技术突破

1️⃣ Mega MoE 融合算子

2️⃣ FP4 精度支持

3️⃣ PDL 程序化依赖启动

4️⃣ JIT 编译加速

Mega MoE：通信与计算的重叠革命

传统MoE vs Mega MoE

支持的计算功能

为什么底层算力很重要？

💰

更高效的GEMM = 更少的GPU小时 = 更低的训练账单

⚡

MoE融合算子直接减少用户等待时间

🏗️

FP4支持使得万亿参数模型成为可能

DeepSeek的开源策略

📅 开源时间线

🎯 战略定位

硬件要求

📌 为什么这很重要？
大模型的竞争不仅在上面——谁的模型更聪明，也在下面——谁的算力更便宜。DeepGEMM的Mega MoE和FP4更新，直接降低了MoE模型的训练和推理成本。当DeepSeek持续开源底层计算库，它不只是在发布代码，更是在重新定义AI基础设施的成本基准线。