温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

R语言和Python中常见的排序函数应用

发布时间:2021-08-10 16:36:23 来源:亿速云 阅读:222 作者:chen 栏目:大数据

本篇内容主要讲解“R语言和Python中常见的排序函数应用”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“R语言和Python中常见的排序函数应用”吧!

排序可能是日常数据清洗过程中比较高频的应用了,今天这一篇给大家介绍R语言和Python中最为常见的排序函数应用。

R语言:

  • sort

  • order

  • rank

  • arrange

排序根据对向量排序和数据框的排序要使用不同的函数,以上四个函数中,前三个是针对向量的,最后一个是针对数据框的。

sort

x<-c(97,93,85,74,32,100,99,67)

sort(x,decreasing=F) #默认是生序排列,其中decreasing参数默认为FALSE。

sort(x,decreasing=T) #降序排列

R语言和Python中常见的排序函数应用

order  

order(x,decreasing=F)  #变量由小到大在原始数据中的位次(默认升序可无需逻辑参数)

order(x,decreasing=T)  #按照由大到小的顺序对应元素在原始向量中的微词。

R语言和Python中常见的排序函数应用

rank:

#rank函数返回向量的秩,即对应元素在原始向量中排名。

rank(x)

基于数据框自身的排序:

当针对数据框进行排序时,如同对数据框进行条件索引一样,也可以基于数据框自身的方法来实现。

(mydata<-data.frame(name=LETTERS[1:10],class=sample(letters[1:4],10,replace=TRUE),value=runif(10,0,5)))

R语言和Python中常见的排序函数应用

mydata[order(mydata$value),] #默认生序排列

mydata[order(mydata$value,decreasing=T),] #根据value降序排列

R语言和Python中常见的排序函数应用

以上这种方式通过基于数据框自身的规则,完成了排序工作(实际上是一种布尔索引),但是不够优雅,写了繁琐的变量名,而且只能根据一个字段来排序。

数据框排序-arrange

arrange函数的存在实在是R语言排序大杀器。

library(dplyr)

mydata%>%plyr::arrange(class,value)

mydata%>%plyr::arrange(class,-value)

R语言和Python中常见的排序函数应用

arrange函数不仅可以实现多变量规则排序,而且可以仅以负号指定降序,语法简洁,功能强大,其中多变量时,一般是分类变量在前,连续变量在后,粒度粗的维度排在最前面,分类变量排序粒度依次递减。最后是连续变量。

-------------

Python:

-------------

  • sort

  • sorted

  • .sort_index

  • .sort_value

列表排序方法:

x=[97,93,85,74,32,100,99,67]

针对list的排序,Python提供有全局的sorted函数以及list自身的sort函数可以完成排序功能。

sorted(x)                           #默认生序

sorted(x,reverse=True)     #指定降序

x.sort()                      #默认生序

x.sort(reverse=True)   #指定降序

R语言和Python中常见的排序函数应用

字典排序方法:

mydata={"A":97,"B":93,"C":85,"D":74,"E":32,"F":100,"G":99,"H":67}

sorted(mydata.keys())               #根据字典的键排序

sorted(mydata.keys(),reverse=True)  #根据字典的键逆排序

R语言和Python中常见的排序函数应用

排序时按照键值对:

sorted(mydata.items(),key=lambda item:item[1])     #根据值字段生序排列

sorted(mydata.items(),key=lambda item:item[1],reverse=True) #根据值字段逆序排列

R语言和Python中常见的排序函数应用

数据框排序:

import pandas as pd

import numpy as np

df1=pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006,1007,1008],

"gender":['male','female','male','female','male','female','male','female'],

"pay":['Y','N','Y','Y','N','Y','N','Y'],

"m-point":[10,12,20,40,40,40,30,20]})

pandas所生成的数据框同样有sort方法。

根据值排序:

df1.sort_values(["id"])                  #使用值进行排序

df1.sort_values(["id"],ascending=False)  #降序排列

df1.sort_values(["pay","m-point"])       #排序多个字段

R语言和Python中常见的排序函数应用

索引排序:

df1=df1.set_index('id')            #设置索引列

df1.sort_index()                   #使用索引进行排序

df1.sort_index(ascending=False)    #使用索引列降序排列

R语言和Python中常见的排序函数应用

R语言和Python中常见的排序函数应用

--------------

本节小结:

-----------

排序函数:

R语言:

向量:

  • sort

  • order

  • rank

数据框:

  • arrange

Python:

列表与字典:

  • sort

  • sorted

数据框:

  • .sort_index

  • .sort_value

到此,相信大家对“R语言和Python中常见的排序函数应用”有了更深的了解,不妨来实际操作一番吧!这里是亿速云网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI