温馨提示×

Pandas中resample方法怎么使用

小亿
131
2023-08-12 03:44:37
栏目: 编程语言

在Pandas中,resample方法用于重新采样时间序列数据。

使用resample方法的一般语法如下:

df.resample(rule, how, axis, fill_method, closed, label)

其中,常用参数的含义如下:

  • rule:重新采样的规则。可以是字符串(如’5Min’表示每5分钟重新采样一次)或pandas.DateOffset对象。

  • how:重新采样的方法。可以是函数名(如’mean’表示求均值)或字符串(如’sum’表示求和)。

  • axis:重新采样的轴。0表示按行重新采样,1表示按列重新采样。默认为0。

  • fill_method:填充方法。对于重采样频率增大的情况,可以使用’ffill’或’bfill’进行前向或后向填充。默认为None。

  • closed:规定区间的开闭情况。'left’表示区间左闭右开(默认),'right’表示区间左开右闭。

  • label:重新采样后的时间标签位置。'left’表示取区间左边界作为标签(默认),'right’表示取区间右边界作为标签。

下面是一个使用resample方法重新采样时间序列数据的示例:

import pandas as pd
# 创建一个时间序列数据
data = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('2021-01-01', periods=5, freq='D'))
# 按周重新采样,求和
resampled_data = data.resample('W').sum()
print(resampled_data)

输出结果为:

2021-01-03    6
2021-01-10    9
Freq: W-SUN, dtype: int64

在上述示例中,我们创建了一个包含5个元素的时间序列数据data,并将其按周重新采样,并求和得到resampled_data。

0