新一代旗舰级人工智能模型！曝DeepSeekV4春节前后发布-麦享科技

麦享科技1月10日消息，“The Information”报道，两位直接知情人士透露，深度求索（DeepSeek）预计将在未来几周内推（2月中旬农历新年前后）出代号为V4的新一代旗舰级人工智能模型，该模型主打强劲的代码生成能力。

据悉，DeepSeekV4在超长代码提示词的处理与解析上实现了关键突破，支持百万级tokens上下文窗口。

可一次性消化整个中型项目的代码库、技术文档与需求说明，精准理解跨文件依赖关系，解决复杂软件项目开发中的上下文断裂问题，这对开发大型系统、重构遗留代码、理解复杂技术文档具有革命性价值。

V4还解决了AI训练中的一个常见难题 ——数据模式理解能力在训练全阶段无衰减，这与传统模型随着训练次数增加性能下降的情况形成鲜明对比。

该突破使模型能更高效地从海量数据中学习，摆脱单纯记忆数据的局限，形成更深刻的抽象理解能力。

DeepSeek员工基于公司内部基准开展的初步测试显示，该模型在代码生成领域的表现优于Anthropic、Claude、生成式预训练变换器系列（OpenAI GPT）等现有主流模型。

还有行业消息称，V4 可能采用全新的mHC架构，具备更好的并行计算效率和国产芯片适配能力，有望降低部署成本，提高推理速度，为大规模商业化应用奠定基础。

值得一提的是，就在本月4日，DeepSeek 在arXiv上更新了R1论文，页数从22页扩展到86页，新增完整训练管线拆解、20多个评测基准的详细数据，被视为给V4的发布做好了技术准备。

新一代旗舰级人工智能模型！曝DeepSeekV4春节前后发布

新一代旗舰级人工智能模型！曝DeepSeekV4春节前后发布