温馨提示×

在CentOS上部署PyTorch应用的步骤

小樊
58
2025-10-01 02:07:45
栏目: 智能运维

在CentOS上部署PyTorch应用的完整步骤

1. 更新系统及安装基础依赖

首先确保系统为最新状态,避免因旧版本软件包导致兼容性问题:

sudo yum update -y

安装Python 3、pip(Python包管理器)及开发工具(用于编译依赖库):

sudo yum install -y python3 python3-pip python3-devel gcc cmake3 git

2. 创建并激活Python虚拟环境(推荐)

为隔离项目依赖,避免与其他项目冲突,建议使用虚拟环境:

python3 -m venv pytorch_env  # 创建名为pytorch_env的虚拟环境
source pytorch_env/bin/activate  # 激活虚拟环境(激活后终端提示符会显示环境名)

3. 安装PyTorch

根据硬件配置选择安装CPU版本GPU版本(需提前确认NVIDIA GPU驱动及CUDA版本):

  • CPU版本(无GPU加速):
    pip install --upgrade pip  # 升级pip至最新版本
    pip install torch torchvision torchaudio
    
  • GPU版本(需CUDA支持):
    访问PyTorch官网,选择对应的CUDA版本(如CUDA 11.7),获取安装命令。例如:
    pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
    

    注:若未安装CUDA Toolkit,需先完成CUDA及cuDNN的安装(详见后续可选步骤)。

4. 验证PyTorch安装

在Python交互环境中运行以下代码,检查PyTorch版本及CUDA是否可用:

import torch
print("PyTorch版本:", torch.__version__)  # 输出PyTorch版本号
print("CUDA是否可用:", torch.cuda.is_available())  # GPU版本应返回True

5. 部署PyTorch应用

将本地编写的PyTorch应用代码(如app.py)上传至服务器(可使用scpSFTP等工具)。激活虚拟环境后运行应用:

source pytorch_env/bin/activate  # 激活虚拟环境
python app.py  # 运行应用(替换为你的主程序文件名)

6. 配置为后台服务(可选,生产环境推荐)

若需让应用随系统启动并持续运行,可使用systemd创建服务:

  • 创建服务文件:
    sudo vi /etc/systemd/system/pytorch_app.service
    
  • 添加以下内容(根据实际路径修改ExecStartWorkingDirectoryUser等参数):
    [Unit]
    Description=PyTorch Application Service
    After=network.target
    
    [Service]
    User=your_username  # 替换为你的系统用户名
    Group=your_groupname  # 替换为你的系统用户组名
    ExecStart=/path/to/pytorch_env/bin/python /path/to/app.py  # 替换为Python环境及应用路径
    WorkingDirectory=/path/to/app_directory  # 替换为应用代码所在目录
    Restart=always  # 应用崩溃后自动重启
    
    [Install]
    WantedBy=multi-user.target
    
  • 保存并退出编辑器(vi中按Esc→输入:wq→回车)。
  • 启动服务并设置开机自启:
    sudo systemctl daemon-reload  # 重新加载systemd配置
    sudo systemctl start pytorch_app  # 启动服务
    sudo systemctl enable pytorch_app  # 设置开机自启
    
  • 查看服务状态:
    sudo systemctl status pytorch_app  # 检查服务是否运行正常
    

可选步骤:安装CUDA及cuDNN(GPU版本必备)

若需使用GPU加速,需提前安装NVIDIA CUDA Toolkit及cuDNN库:

  • 安装CUDA Toolkit

    1. 下载对应版本的CUDA Toolkit(如CUDA 11.7):NVIDIA CUDA下载页面
    2. 运行安装脚本(以.rpm文件为例):
      sudo rpm -i cuda-repo-rhel7-11.7.0-515.43.04.x86_64.rpm
      sudo yum clean all
      sudo yum install -y cuda
      
    3. 配置环境变量(添加至~/.bashrc):
      echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
      echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
      source ~/.bashrc
      
  • 安装cuDNN

    1. 下载与CUDA版本兼容的cuDNN库(需注册NVIDIA开发者账号):NVIDIA cuDNN下载页面
    2. 解压并复制文件至CUDA目录:
      tar -xzvf cudnn-11.7-linux-x64-v8.5.0.96.tgz
      sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
      sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
      sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
      

通过以上步骤,即可在CentOS系统上完成PyTorch应用的部署。根据实际需求调整环境配置(如虚拟环境、后台服务等),确保应用稳定运行。

0