Ubuntu下Python数据分析环境配置指南
Ubuntu系统通常自带Python 3,但需确认版本(建议Python 3.8及以上)并安装pip(Python包管理工具)。打开终端,执行以下命令:
sudo apt update # 更新软件包列表
sudo apt install python3 python3-pip # 安装Python3及pip
验证安装:
python3 --version # 查看Python版本
pip3 --version # 查看pip版本
若pip未安装或版本过旧,可通过sudo apt install python3-pip安装/更新。
虚拟环境可隔离项目依赖,避免不同项目间的库版本冲突。使用venv模块创建虚拟环境:
python3 -m venv myenv # 创建名为"myenv"的虚拟环境
source myenv/bin/activate # 激活虚拟环境(激活后终端提示符会显示环境名)
退出虚拟环境时,执行deactivate命令。
通过pip安装数据分析必备库,覆盖数值计算、数据处理、可视化及机器学习等场景:
pip3 install numpy pandas matplotlib seaborn scikit-learn # 基础分析库
Jupyter Notebook是交互式数据分析工具,适合探索性分析与结果展示。安装并启动:
pip3 install notebook # 安装Jupyter Notebook
jupyter notebook # 启动服务(默认端口8888)
启动后,终端会显示访问链接(如http://localhost:8888),在浏览器中打开即可创建/编辑Notebook文件(.ipynb格式)。
Anaconda是Python数据科学平台,内置大量科学计算库(如NumPy、Pandas),并提供conda命令管理环境与包,适合新手快速搭建环境。
Anaconda3-2024.05-Linux-x86_64.sh),终端执行:bash Anaconda3-xxxx.xx-Linux-x86_64.sh # 按提示完成安装
conda命令创建环境、安装库:conda create -n myenv python=3.9 # 创建名为"myenv"的环境,指定Python版本
conda activate myenv # 激活环境
conda install numpy pandas matplotlib # 通过conda安装库(自动解决依赖)
Anaconda还提供图形化界面(Anaconda Navigator),可便捷管理环境与启动工具(如Jupyter Notebook)。
创建一个Python脚本(如test_env.py)或Jupyter Notebook,运行以下代码验证库是否正常工作:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 测试NumPy
arr = np.array([1, 2, 3])
print("NumPy数组:", arr)
# 测试Pandas
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print("Pandas DataFrame:\n", df.head())
# 测试Matplotlib
plt.plot([1, 2, 3], [4, 5, 6])
plt.title("Test Plot")
plt.show()
# 测试Seaborn
sns.scatterplot(x=[1, 2, 3], y=[4, 5, 6])
plt.title("Test Seaborn Plot")
plt.show()
若无报错且能正常输出结果,则说明环境配置成功。