京东云率先上线MiniMax M3:显著提升模型推理吞吐-麦享科技
麦享科技
前沿资讯网站

京东云率先上线MiniMax M3:显著提升模型推理吞吐

麦享科技6月1日消息,据“京东云”官方公众号发文,MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。

依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。

MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款原生多模态模型,MiniMax M3不仅支持图片与视频输入,还能直接操作电脑桌面。

目前,京东云JoyBuilder已聚合海量通用及行业优质大模型,通过统一标准化接口提供一站式AI能力服务。

企业无需自建算力、复杂架构或组建专业团队,即可快速完成大模型接入与应用落地。

高性能推理服务:依托京东云自研推理引擎,实现毫秒级响应与高并发处理能力,为企业级应用提供稳定、高效的大模型服务支撑。

开放多元的模型生态:聚合百余种主流开源大模型,提供统一模型服务入口和标准化调用接口,满足不同业务场景下的模型选择与应用需求。

全链路可观测运维体系:通过统一监控与可视化管理平台,实现模型服务运行状态、资源消耗及调用情况的实时监测,提升运维效率与服务稳定性。

即日起,用户登录京东云官网,在JoyBuilder模型开发平台页,即可调用最新的MiniMax M3,探索1M超长上下文记忆的全新体验。

https://www.jdcloud.com/cn/products/jdaip

京东云率先上线MiniMax M3:显著提升模型推理吞吐

京东云率先上线MiniMax M3:显著提升模型推理吞吐

未经允许不得转载:麦享科技 » 京东云率先上线MiniMax M3:显著提升模型推理吞吐

相关推荐

  • 暂无文章

评论 抢沙发

评论前必须登录!