在CentOS上部署PyTorch应用的步骤

在CentOS上部署PyTorch应用的完整步骤

1. 更新系统及安装基础依赖

首先确保系统为最新状态，避免因旧版本软件包导致兼容性问题：

sudo yum update -y

安装Python 3、pip（Python包管理器）及开发工具（用于编译依赖库）：

sudo yum install -y python3 python3-pip python3-devel gcc cmake3 git

2. 创建并激活Python虚拟环境（推荐）

为隔离项目依赖，避免与其他项目冲突，建议使用虚拟环境：

python3 -m venv pytorch_env  # 创建名为pytorch_env的虚拟环境
source pytorch_env/bin/activate  # 激活虚拟环境（激活后终端提示符会显示环境名）

3. 安装PyTorch

根据硬件配置选择安装CPU版本或GPU版本（需提前确认NVIDIA GPU驱动及CUDA版本）：

CPU版本（无GPU加速）：

pip install --upgrade pip  # 升级pip至最新版本
pip install torch torchvision torchaudio

GPU版本（需CUDA支持）：
访问PyTorch官网，选择对应的CUDA版本（如CUDA 11.7），获取安装命令。例如：
```
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
```
注：若未安装CUDA Toolkit，需先完成CUDA及cuDNN的安装（详见后续可选步骤）。

4. 验证PyTorch安装

在Python交互环境中运行以下代码，检查PyTorch版本及CUDA是否可用：

import torch
print("PyTorch版本:", torch.__version__)  # 输出PyTorch版本号
print("CUDA是否可用:", torch.cuda.is_available())  # GPU版本应返回True

5. 部署PyTorch应用

将本地编写的PyTorch应用代码（如app.py）上传至服务器（可使用scp、SFTP等工具）。激活虚拟环境后运行应用：

source pytorch_env/bin/activate  # 激活虚拟环境
python app.py  # 运行应用（替换为你的主程序文件名）

6. 配置为后台服务（可选，生产环境推荐）

若需让应用随系统启动并持续运行，可使用systemd创建服务：

创建服务文件：

sudo vi /etc/systemd/system/pytorch_app.service

添加以下内容（根据实际路径修改ExecStart、WorkingDirectory、User等参数）：

[Unit]
Description=PyTorch Application Service
After=network.target

[Service]
User=your_username  # 替换为你的系统用户名
Group=your_groupname  # 替换为你的系统用户组名
ExecStart=/path/to/pytorch_env/bin/python /path/to/app.py  # 替换为Python环境及应用路径
WorkingDirectory=/path/to/app_directory  # 替换为应用代码所在目录
Restart=always  # 应用崩溃后自动重启

[Install]
WantedBy=multi-user.target

保存并退出编辑器（vi中按Esc→输入:wq→回车）。

启动服务并设置开机自启：

sudo systemctl daemon-reload  # 重新加载systemd配置
sudo systemctl start pytorch_app  # 启动服务
sudo systemctl enable pytorch_app  # 设置开机自启

查看服务状态：

sudo systemctl status pytorch_app  # 检查服务是否运行正常

可选步骤：安装CUDA及cuDNN（GPU版本必备）

若需使用GPU加速，需提前安装NVIDIA CUDA Toolkit及cuDNN库：

安装CUDA Toolkit：

下载对应版本的CUDA Toolkit（如CUDA 11.7）：NVIDIA CUDA下载页面。

运行安装脚本（以.rpm文件为例）：

sudo rpm -i cuda-repo-rhel7-11.7.0-515.43.04.x86_64.rpm
sudo yum clean all
sudo yum install -y cuda

配置环境变量（添加至~/.bashrc）：

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

安装cuDNN：

下载与CUDA版本兼容的cuDNN库（需注册NVIDIA开发者账号）：NVIDIA cuDNN下载页面。

解压并复制文件至CUDA目录：

tar -xzvf cudnn-11.7-linux-x64-v8.5.0.96.tgz
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

通过以上步骤，即可在CentOS系统上完成PyTorch应用的部署。根据实际需求调整环境配置（如虚拟环境、后台服务等），确保应用稳定运行。