Pandas里怎样进行数据过滤与提取

发布时间：2025-10-01 21:26:44 来源：亿速云阅读：101 作者：小樊栏目：编程语言

在Pandas中，数据过滤和提取可以通过多种方法实现，主要包括使用布尔索引、query() 方法以及 loc[] 和 iloc[] 等。以下是一些常用的方法和示例：

1. 布尔索引

布尔索引是最常用的数据过滤方法之一。你可以根据条件创建一个布尔数组，然后使用这个数组来过滤数据。

import pandas as pd

# 创建一个示例DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [25, 30, 35, 40],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
}
df = pd.DataFrame(data)

# 过滤年龄大于30的数据
filtered_df = df[df['Age'] > 30]
print(filtered_df)

2. `query()` 方法

query() 方法允许你使用字符串表达式来过滤数据，这在处理复杂条件时非常有用。

# 使用query()方法过滤年龄大于30的数据
filtered_df = df.query('Age > 30')
print(filtered_df)

3. `loc[]` 和 `iloc[]`

loc[] 和 iloc[] 是Pandas中用于数据选择的方法。loc[] 基于标签（行和列的名称）进行选择，而 iloc[] 基于位置（行和列的索引）进行选择。

使用 `loc[]`

# 选择特定行和列
subset_df = df.loc[df['Age'] > 30, ['Name', 'City']]
print(subset_df)

使用 `iloc[]`

# 选择第2行到第3行，第0列到第1列的数据
subset_df = df.iloc[1:3, 0:2]
print(subset_df)

4. 组合条件

你可以使用逻辑运算符（如 & 表示 AND，| 表示 OR）来组合多个条件。

# 过滤年龄大于30且城市为'Chicago'的数据
filtered_df = df[(df['Age'] > 30) & (df['City'] == 'Chicago')]
print(filtered_df)

5. 使用 `isin()` 方法

如果你需要过滤数据集中某个列的值是否在给定的列表中，可以使用 isin() 方法。

# 过滤城市为'New York'或'Chicago'的数据
cities = ['New York', 'Chicago']
filtered_df = df[df['City'].isin(cities)]
print(filtered_df)

通过这些方法，你可以灵活地过滤和提取Pandas DataFrame中的数据。根据具体的需求选择合适的方法，可以使数据处理更加高效和简洁。

向AI问一下细节

Pandas里怎样进行数据过滤与提取

1. 布尔索引

2. query() 方法

3. loc[] 和 iloc[]

使用 loc[]

使用 iloc[]

4. 组合条件

5. 使用 isin() 方法

猜你喜欢

最新资讯

相关推荐

相关标签

2. `query()` 方法

3. `loc[]` 和 `iloc[]`

使用 `loc[]`

使用 `iloc[]`

5. 使用 `isin()` 方法