DeepSeek 开源周开启,公布 FlashMLA 项目

DeepSeek 开源周正式开始,首个项目 FlashMLA 亮相。

这是专为英伟达 Hopper GPU 设计的高效 MLA 解码内核,用于优化可变长度序列的推理服务。在 H800 SXM5 平台上表现出色,内存带宽可达 3000GB/s,计算性能达 580TFLOPS,目前在 GitHub 上 Star 数已超 6000。


已发布

分类

来自

标签: