CUDA来战 AMD ROCm 7软件平台正式发布:AI性能3.5倍提升

9月16日消息,NVIDIA在AI市场大杀四方,不仅是靠GPU性能强大,还有CUDA软件生态,这可以说是他们的AI护城河。

AMD在AI生态上也在抓紧完善,6月份宣布了全新的ROCm 7,今天它正式发布了,这是AMD向CUDA开炮的关键一战,而且还是开源的,目前已经登陆Github。

ROCm 7的升级内容非常多,支持了MI350X及MI355X显卡,支持这两款GPU的KVM直通,支持了PyTorch 2.7、TensorFlow 2.19.1、ONNX 1.22、Triton 3.3 以及JAX 0.6.0等一系列框架。

详细升级内容可以参考ROCm官网:rocm.docs.amd.com。

在此前的发布会上,AMD还提供了ROCm7的实测结果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。

在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。

AMD之前还提到,今年内ROCm7还会不断提升生态支持,加入对锐龙平台笔记本/工作站的支持,完整支持Linux系统,还会正式加入对Windows系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

相关文章