Pandas是一个强大的Python数据分析库,它提供了大量的功能来筛选和排序数据。以下是一些基本的数据筛选和排序方法:
基于列名的筛选:
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
})
# 筛选出年龄大于30岁的行
filtered_df = df[df['Age'] > 30]
print(filtered_df)
基于多个条件的筛选:
# 筛选出年龄大于30岁且城市为'Chicago'的行
filtered_df = df[(df['Age'] > 30) & (df['City'] == 'Chicago')]
print(filtered_df)
使用query方法:
# 使用query方法筛选数据
filtered_df = df.query('Age > 30 and City == "Chicago"')
print(filtered_df)
使用loc和iloc进行位置索引:
# 使用loc根据标签筛选
filtered_df = df.loc[df['Age'] > 30]
# 使用iloc根据位置索引筛选
filtered_df = df.iloc[1:3] # 筛选出第2行到第3行的数据
基于单列排序:
# 按年龄升序排序
sorted_df = df.sort_values(by='Age')
print(sorted_df)
# 按年龄降序排序
sorted_df = df.sort_values(by='Age', ascending=False)
print(sorted_df)
基于多列排序:
# 先按年龄升序排序,再按城市降序排序
sorted_df = df.sort_values(by=['Age', 'City'], ascending=[True, False])
print(sorted_df)
使用sort_index方法:
# 按索引排序
sorted_df = df.sort_index()
print(sorted_df)
# 按索引降序排序
sorted_df = df.sort_index(ascending=False)
print(sorted_df)
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
})
# 筛选出年龄大于30岁的行,并按年龄降序排序
filtered_sorted_df = df[df['Age'] > 30].sort_values(by='Age', ascending=False)
print(filtered_sorted_df)
通过这些方法,你可以灵活地对Pandas DataFrame进行数据筛选和排序操作。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。