由 Niles Burbank(AMD 产品管理总监)和 Mayank Daga(AMD 深度学习软件总监)撰写

随着 PyTorch 1.8 版本的发布,我们很高兴地宣布为 ROCm™开放软件平台上的 PyTorch 用户推出了一种新的安装选项。现在,一个可安装的 Python 包已托管在 pytorch.org 上,同时提供了与仅 CPU 配置和其他 GPU 平台的 PyTorch 包相同的简单、可选择的本地安装说明。ROCm 上的 PyTorch 包括使用 AMD 的 MIOpen & RCCL 库进行混合精度和大规模训练的完整功能。这为数据科学家、研究人员、学生以及社区中的其他人提供了一个新选项,让他们可以使用 AMD GPU 加速 PyTorch 入门。

ROCm 生态系统

ROCm 是 AMD 的开源软件平台,用于 GPU 加速高性能计算和机器学习。自 2016 年 ROCm 首次发布以来,ROCm 平台已发展壮大,支持更多的库和工具、更广泛的 Linux®发行版以及一系列新的 GPU。这包括基于 AMD CDNA™架构的 AMD Instinct™ MI100,这是首款基于 AMD CDNA™架构的 GPU。

ROCm 生态系统在支持 PyTorch 方面有着悠久的历史,最初是通过 PyTorch 项目的分支实现的,最近则是通过 ROCm 对 PyTorch 上游代码的支持。PyTorch 用户可以使用 AMD 的公共 PyTorch Docker 镜像安装 PyTorch for ROCm,当然也可以从源代码构建 PyTorch for ROCm。随着 PyTorch 1.8 的发布,现有的安装选项现在得到了一个可安装的 Python 包的补充。

ROCm 的主要关注点一直是大规模的高性能计算。ROCm 和 AMD Instinct 系列数据中心 GPU 的联合能力特别适合数据中心规模的高性能计算挑战。PyTorch 非常适合这个环境,因为高性能计算和机器学习工作流程变得越来越紧密地交织在一起。

使用 PyTorch 入门 ROCm

本 PyTorch 构建的适用范围是支持 ROCm 的 AMD GPU,运行在 Linux 上。ROCm 支持的 GPU 包括 AMD 的所有以计算为中心的数据中心 GPUInstinct 系列,以及一些其他精选 GPU。支持 GPU 的当前列表可以在 ROCm 的 Github 仓库中找到。确认目标系统包含支持的 GPU 以及当前的 ROCm 4.0.1 版本后,PyTorch 的安装遵循与其他 Python 包相同的简单 Pip 安装方式。与适用于其他平台的 PyTorch 构建一样,https://maskerprc.github.io/get-started/locally/上的配置器提供了要运行的特定命令行。

PyTorch for ROCm 是从上游 PyTorch 仓库构建的,是一个功能齐全的实现。值得注意的是,它包括跨多个 GPU 的分布式训练支持,并支持加速混合精度训练。

更多信息

ROCm 支持的 GPU 和操作系统列表可在 https://github.com/RadeonOpenCompute/ROCm 找到。有关 ROCm 平台的一般文档可在 https://rocmdocs.amd.com/en/latest/找到。ROCm 学习中心位于 https://developer.amd.com/resources/rocm-resources/rocm-learning-center/。有关 AMD 在 HPC 和 ML 方面的产品信息,请访问 https://amd.com/hpc。

反馈

激活的用户群体是 PyTorch 生态系统的重要组成部分。我们非常感谢您在 PyTorch 讨论论坛上对 PyTorch for ROCm 体验的反馈,并在适当的情况下通过 Github 报告任何问题。