火速！寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源-麦享科技

麦享科技9月29日消息，今天，DeepSeek宣布正式发布DeepSeek-V3.2-Exp模型。

新版本在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。

就在同一天，寒武纪宣布已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配，并开源大模型推理引擎vLLM-MLU源代码。

开发者可以在寒武纪软硬件平台上第一时间体验DeepSeek-V3.2-Exp的亮点。

寒武纪一直重视芯片和算法的联合创新，致力于以软硬件协同的方式，优化大模型部署性能，降低部署成本。

此前，寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化，达成了业界领先的算力利用率水平。

针对本次的DeepSeek-V3.2-Exp新模型架构，寒武纪通过Triton算子开发实现了快速适配，利用BangC融合算子开发实现了极致性能优化，并基于计算与通信的并行策略，再次达成了业界领先的计算效率水平。

寒武纪表示，依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制，叠加寒武纪的极致计算效率，可大幅降低长序列场景下的训推成本，共同为客户提供极具竞争力的软硬件解决方案。

火速！寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源

火速！寒武纪Day 0适配DeepSeek-V3.2-Exp 并同步开源