麦享科技9月16日消息,NVIDIA在AI市场大杀四方,不仅是靠GPU性能强大,还有CUDA软件生态,这可以说是他们的AI护城河。
AMD在AI生态上也在抓紧完善,6月份宣布了全新的ROCm 7,今天它正式发布了,这是AMD向CUDA开炮的关键一战,而且还是开源的,目前已经登陆Github。
ROCm 7的升级内容非常多,支持了MI350X及MI355X显卡,支持这两款GPU的KVM直通,支持了PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3 以及JAX 0.6.0等一系列框架。
详细升级内容可以参考ROCm官网:rocm.docs.amd.com。
在此前的发布会上,AMD还提供了ROCm7的实测结果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。
在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。
AMD之前还提到,今年内ROCm7还会不断提升生态支持,加入对锐龙平台笔记本/工作站的支持,完整支持Linux系统,还会正式加入对Windows系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。