Python数据分析Ubuntu如何配置

Ubuntu 下 Python 数据分析环境配置指南

一基础环境准备

更新系统并安装 Python 3 与 pip：
- 命令：sudo apt update && sudo apt install -y python3 python3-pip
建议使用虚拟环境隔离依赖：
- 创建：python3 -m venv ~/venvs/data310
- 激活：source ~/venvs/data310/bin/activate
升级 pip 并配置国内镜像（可选，提升下载速度）：
- 命令：pip install -U pip
- 镜像示例：pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
验证：python -V、pip -V 应显示 Python 3.x 与对应 pip 版本。

二安装常用数据分析库

在已激活的虚拟环境中，安装核心科学计算与可视化库：
- 命令：pip install numpy pandas matplotlib seaborn scipy scikit-learn jupyter
按需扩展：
- 报表导出：pip install reportlab
- 机器学习/深度学习：如 pip install tensorflow（或 pip install torch）
验证安装：
- 进入 Python：python - <<'PY' import sys, numpy, pandas, matplotlib, seaborn, scipy, sklearn, jupyter print("Python:", sys.version) print("NumPy:", numpy.__version__, "Pandas:", pandas.__version__) print("Matplotlib:", matplotlib.__version__, "Seaborn:", seaborn.__version__) print("SciPy:", scipy.__version__, "Scikit-learn:", sklearn.__version__) print("Jupyter:", jupyter.__version__) PY

三使用 Anaconda 的一体化方案（可选）

四快速验证与常见操作

启动 Jupyter Notebook：
- 命令：jupyter notebook
- 浏览器访问：http://localhost:8888
读取数据与基础分析示例：
- 代码示例：
  - import pandas as pd
  - df = pd.read_csv('data.csv')
  - print(df.head())
  - print(df.describe())
  - df.plot(x='date', y='value', kind='line')
  - import matplotlib.pyplot as plt; plt.show()
数据库读取示例（需安装对应驱动，如 PyMySQL）：
- 安装：pip install pymysql sqlalchemy
- 代码示例：
  - from sqlalchemy import create_engine
  - engine = create_engine('mysql+pymysql://user:password@host:3306/db')
  - df = pd.read_sql('SELECT * FROM table_name', engine)

五常见问题与优化建议

最新问答