在安装前,确保系统包列表是最新的,并安装构建工具与Python环境:
sudo apt update && sudo apt upgrade -y
sudo apt install -y python3 python3-pip python3-venv build-essential cmake git wget unzip yasm pkg-config libopenblas-dev liblapack-dev libjpeg-dev libpng-dev
这一步为后续安装驱动、CUDA及PyTorch提供基础支持。
PyTorch GPU版本依赖NVIDIA驱动,需先确认驱动是否安装:
nvidia-smi
若命令输出GPU信息(如型号、驱动版本),则驱动已安装;若未安装,可通过以下方式安装:
sudo ubuntu-drivers autoinstall
该命令会根据显卡型号自动安装兼容的最新驱动,安装完成后重启系统:sudo reboot
sudo apt install -y nvidia-driver-470
sudo reboot
重启后再次运行nvidia-smi确认驱动生效。CUDA是PyTorch调用GPU的核心组件,需选择与PyTorch版本兼容的CUDA版本(如PyTorch 2.6.0+对应CUDA 12.6)。以下以CUDA 12.6为例:
.deb文件(如cuda-repo-ubuntu2204-12-6-local_12.6.0-530.30.02-1_amd64.deb)。sudo dpkg -i cuda-repo-ubuntu2204-12-6-local_12.6.0-530.30.02-1_amd64.deb
sudo cp /var/cuda-repo-ubuntu2204-12-6-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt update
sudo apt install -y cuda
~/.bashrc文件,添加以下内容:export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
使环境变量生效:source ~/.bashrc
nvcc --version,若输出CUDA版本信息(如release 12.6),则安装成功。cuDNN是深度学习专用加速库,需与CUDA版本匹配(如CUDA 12.6对应cuDNN 8.9+)。安装步骤:
cuDNN Library for Linux),下载.tgz文件。tar -xzvf cudnn-12.6-linux-x64-v8.9.7.29.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
这一步将cuDNN库文件复制到CUDA目录,供PyTorch调用。通过pip安装PyTorch GPU版本(以PyTorch 2.6.0+cu126为例):
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu126
运行以下Python代码,检查PyTorch是否成功识别GPU:
import torch
print("PyTorch版本:", torch.__version__)
print("CUDA可用性:", torch.cuda.is_available())
if torch.cuda.is_available():
print("CUDA版本:", torch.version.cuda())
print("GPU设备名称:", torch.cuda.get_device_name(0))
若输出中torch.cuda.is_available()为True,且显示GPU设备名称(如NVIDIA GeForce RTX 3060),则说明安装成功。
venv或conda创建虚拟环境,避免依赖冲突(如python3 -m venv pytorch_gpu_env && source pytorch_gpu_env/bin/activate)。