国产显卡性能飞跃 摩尔线程S5000优化后AI速度已达NVIDIA H100的60%
麦享科技12月20日消息,前不久国产GPU初创企业摩尔线程上市,市值一度达到了4000多亿元,今天该公司又发布了新一代GPU架构,AI及游戏性能大涨,其中游戏性能飙升了15倍。
即便是当前一代的显卡中,摩尔线程也在不断联合伙伴优化,硅基流动今天宣布在S5000显卡上实现了国产GPU推理性能的飞跃。
根据他们的实测数据,经过系统级工程优化与 FP8 精度加速,摩尔线程 MTT S5000 单卡 Prefill 吞吐达到 4000 tokens/s 以上,Decode 吞吐超过 1000 tokens/s。
这是什么概念,他们对比了NVIDIA的H100显卡,Prefill 阶段同场景下H100 性能约为6500 tokens/s,在 MTT S5000 上实现了4000+ tokens/s 的实测吞吐,达成了NVIDIA H100逾61%的实测性能。
虽然也只是Prefill 阶段的性能,但是S5000能有H100显卡60%以上的性能绝对是国产显卡中的一大进步。

MTT S5000是摩尔线程基于平湖GPU架构推出的AI显卡,首次支持FP8,性能可以达到1024TFLOPS,而H100的FP8性能接近4000TFLOPS。
关于硅基流动与摩尔线程是如何优化S5000显卡的,详情可以参考他们的官方稿件,这件事可以说明国产的显卡尽管参数上可能还落后不少,但通过工程优化还能不断提升性能表现,某些方面是有意想不到的变化的。
摩尔线程现在不足的地方除了硬件规模和工艺受限等因素,软件生态当然也无法跟NVIDIA相比,但这部分随着国内厂商的通力合作已经在起变化,未来几年在硬件规模及软件生态不断发展下,不论是AI还是游戏卡,拿出让NVIDIA感受到压力的产品也不是没可能。


微信扫一扫打赏
支付宝扫一扫打赏