Python Pandas怎样进行数据透视

发布时间：2025-12-02 17:34:36 来源：亿速云阅读：97 作者：小樊栏目：编程语言

在Python的Pandas库中，数据透视（pivot）是一种常用的数据重塑技术，它可以将数据从长格式转换为宽格式，以便于分析和可视化。数据透视通常用于处理具有多个分类变量的数据集。

以下是使用Pandas进行数据透视的基本步骤：

导入Pandas库：
```
import pandas as pd
```
创建或加载数据：你可以从CSV文件、Excel文件、数据库或其他来源加载数据。
```
# 从CSV文件加载数据
df = pd.read_csv('data.csv')
```
使用pivot_table函数： pivot_table函数是Pandas中进行数据透视的主要工具。
```
# 创建一个简单的数据透视表
pivot = df.pivot_table(values='Value', index='Row', columns='Column')
```
- values：要聚合的数据列。
- index：用作行索引的列。
- columns：用作列索引的列。
- aggfunc：用于聚合数据的函数，默认为mean。
处理缺失值：数据透视后可能会产生缺失值，可以使用fillna方法来处理。
```
pivot = pivot.fillna(0)  # 将缺失值填充为0
```
重置索引：如果需要将行索引转换为普通列，可以使用reset_index方法。
```
pivot = pivot.reset_index()
```

保存结果：可以将数据透视表保存到新的CSV文件或Excel文件中。

pivot.to_csv('pivot_table.csv', index=False)
pivot.to_excel('pivot_table.xlsx', index=False)

示例

假设我们有一个销售数据集，包含以下列：Date（日期）、Product（产品）、Region（地区）和Sales（销售额）。

import pandas as pd

# 创建示例数据
data = {
    'Date': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
    'Product': ['A', 'B', 'A', 'B'],
    'Region': ['North', 'South', 'North', 'South'],
    'Sales': [100, 150, 200, 250]
}

df = pd.DataFrame(data)

# 创建数据透视表
pivot = df.pivot_table(values='Sales', index='Date', columns='Product', aggfunc='sum')

print(pivot)

输出：

Product     A   B
Date             
2023-01-01  100 150
2023-01-02  200 250

这个数据透视表显示了每个日期下不同产品的总销售额。

通过这些步骤，你可以灵活地使用Pandas进行数据透视，以便更好地理解和分析你的数据。

向AI问一下细节

Python Pandas怎样进行数据透视

示例

猜你喜欢

最新资讯

相关推荐

相关标签