温馨提示×

CentOS中PyTorch的GPU加速怎么做

小樊
31
2025-12-19 19:44:58
栏目: 智能运维

在CentOS系统中配置PyTorch以使用GPU加速,你需要确保你的系统满足以下条件:

  1. NVIDIA GPU:确保你有一块支持CUDA的NVIDIA GPU。

  2. CUDA Toolkit:安装与你的GPU和PyTorch版本兼容的CUDA Toolkit。

  3. cuDNN:安装与CUDA Toolkit版本兼容的cuDNN库。

  4. NVIDIA驱动程序:安装最新的NVIDIA驱动程序。

  5. PyTorch:安装支持GPU的PyTorch版本。

以下是详细步骤:

1. 安装NVIDIA驱动程序

首先,你需要安装适合你GPU型号的NVIDIA驱动程序。你可以从NVIDIA官方网站下载最新的驱动程序。

# 添加EPEL仓库
sudo yum install epel-release

# 安装NVIDIA驱动程序
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
sudo yum install nvidia-driver-latest-dkms nvidia-settings

# 重启系统
sudo reboot

2. 安装CUDA Toolkit

访问NVIDIA CUDA Toolkit下载页面,选择适合你系统的版本并下载安装脚本。然后运行安装脚本。

# 下载CUDA Toolkit安装脚本
wget https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/cuda-repo-rhel7-11.4.2-1.x86_64.rpm

# 安装CUDA Toolkit
sudo yum localinstall cuda-repo-rhel7-11.4.2-1.x86_64.rpm
sudo yum clean all
sudo yum install cuda

# 设置环境变量
echo 'export PATH=/usr/local/cuda-11.4/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

3. 安装cuDNN

访问NVIDIA cuDNN下载页面,下载与你的CUDA版本兼容的cuDNN库。然后解压并安装。

# 下载cuDNN库
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.4_20210301/cudnn-11.4-linux-x64-v8.2.2.26.tgz

# 解压cuDNN库
tar -xzvf cudnn-11.4-linux-x64-v8.2.2.26.tgz

# 复制cuDNN库到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 安装PyTorch

你可以使用pip或conda安装支持GPU的PyTorch版本。以下是使用pip安装的示例:

# 安装PyTorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu114

5. 验证安装

验证PyTorch是否能够检测到GPU:

import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))

如果输出显示True并且列出了你的GPU型号,那么你已经成功配置了PyTorch的GPU加速。

通过以上步骤,你应该能够在CentOS系统中成功配置PyTorch以使用GPU加速。

0