CentOS中PyTorch的GPU加速怎么做

在CentOS系统中配置PyTorch以使用GPU加速，你需要确保你的系统满足以下条件：

NVIDIA GPU：确保你有一块支持CUDA的NVIDIA GPU。
CUDA Toolkit：安装与你的GPU和PyTorch版本兼容的CUDA Toolkit。
cuDNN：安装与CUDA Toolkit版本兼容的cuDNN库。
NVIDIA驱动程序：安装最新的NVIDIA驱动程序。
PyTorch：安装支持GPU的PyTorch版本。

以下是详细步骤：

1. 安装NVIDIA驱动程序

首先，你需要安装适合你GPU型号的NVIDIA驱动程序。你可以从NVIDIA官方网站下载最新的驱动程序。

# 添加EPEL仓库
sudo yum install epel-release

# 安装NVIDIA驱动程序
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
sudo yum install nvidia-driver-latest-dkms nvidia-settings

# 重启系统
sudo reboot

2. 安装CUDA Toolkit

访问NVIDIA CUDA Toolkit下载页面，选择适合你系统的版本并下载安装脚本。然后运行安装脚本。

# 下载CUDA Toolkit安装脚本
wget https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-11.4.2-1.x86_64.rpm

# 安装CUDA Toolkit
sudo yum localinstall cuda-repo-rhel7-11.4.2-1.x86_64.rpm
sudo yum clean all
sudo yum install cuda

# 设置环境变量
echo 'export PATH=/usr/local/cuda-11.4/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

3. 安装cuDNN

访问NVIDIA cuDNN下载页面，下载与你的CUDA版本兼容的cuDNN库。然后解压并安装。

# 下载cuDNN库
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.4_20210301/cudnn-11.4-linux-x64-v8.2.2.26.tgz

# 解压cuDNN库
tar -xzvf cudnn-11.4-linux-x64-v8.2.2.26.tgz

# 复制cuDNN库到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 安装PyTorch

你可以使用pip或conda安装支持GPU的PyTorch版本。以下是使用pip安装的示例：

# 安装PyTorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu114

5. 验证安装

验证PyTorch是否能够检测到GPU：

import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))

如果输出显示True并且列出了你的GPU型号，那么你已经成功配置了PyTorch的GPU加速。

通过以上步骤，你应该能够在CentOS系统中成功配置PyTorch以使用GPU加速。

1. 安装NVIDIA驱动程序

2. 安装CUDA Toolkit

3. 安装cuDNN

4. 安装PyTorch

5. 验证安装

最新问答

相关标签