在CentOS上设置PyTorch的GPU加速,你需要确保你的系统满足以下条件:
NVIDIA GPU:首先,你需要有一个支持CUDA的NVIDIA GPU。
CUDA Toolkit:安装与你的GPU和PyTorch版本兼容的CUDA Toolkit。
cuDNN:安装与CUDA Toolkit配套的cuDNN库。
NVIDIA驱动程序:确保安装了最新的NVIDIA驱动程序。
Python和PyTorch:安装Python和PyTorch,确保PyTorch版本支持CUDA。
以下是详细的步骤:
首先,你需要安装NVIDIA驱动程序。你可以从NVIDIA官方网站下载适合你GPU型号的驱动程序。
# 添加EPEL仓库
sudo yum install epel-release
# 安装NVIDIA驱动程序
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
sudo yum install nvidia-driver-latest-dkms
# 重启系统
sudo reboot
访问NVIDIA CUDA Toolkit下载页面,选择适合你系统的版本并下载安装脚本。然后运行安装脚本:
# 下载CUDA Toolkit安装脚本
wget https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-11.4.2-1.x86_64.rpm
# 安装CUDA Toolkit
sudo yum localinstall cuda-repo-rhel7-11.4.2-1.x86_64.rpm
sudo yum clean all
sudo yum install cuda
# 设置环境变量
echo 'export PATH=/usr/local/cuda-11.4/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
访问NVIDIA cuDNN下载页面,下载与你的CUDA版本兼容的cuDNN库。然后解压并安装:
# 下载cuDNN库
wget https://developer.download.nvidia.com/compute/machine-learning/repos/rhel7/x86_64/libcudnn8-8.2.2.26-1.cuda11.4.x86_64.rpm
wget https://developer.download.nvidia.com/compute/machine-learning/repos/rhel7/x86_64/libcudnn8-devel-8.2.2.26-1.cuda11.4.x86_64.rpm
# 安装cuDNN库
sudo yum localinstall libcudnn8-8.2.2.26-1.cuda11.4.x86_64.rpm
sudo yum localinstall libcudnn8-devel-8.2.2.26-1.cuda11.4.x86_64.rpm
# 设置环境变量
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
确保你已经安装了Python和pip。然后使用pip安装PyTorch:
# 安装Python和pip
sudo yum install python3 python3-pip
# 安装PyTorch
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu114
验证PyTorch是否能够检测到GPU:
import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))
如果输出显示True并且显示了GPU的名称,那么你的PyTorch GPU加速已经设置成功。
通过以上步骤,你应该能够在CentOS上成功设置PyTorch的GPU加速。