Python笔记:数据排名

183 阅读1分钟

本文简要展示一下,怎么在pandas中用rank()函数进行数据排名。原理不作赘述,具体用法请看示例:

01. 构造数据集


df = pd.DataFrame({
    "序号":range(1,11),
    "商品":["苹果","雪梨","荔枝","龙眼","西瓜","菠萝","黄皮","草莓","橙子","山竹"],
    "销量":[10,20,20,30,30,30,40,50,60,100]
})

df

image.png

02. 算术均值排名

df["排名"] = df["销量"].rank(method = "average")
df

image.png

03. 先出现的值排名优先

df["排名"] = df["销量"].rank(method = "first")
df

image.png

04. 对同一个组使用最大的排名

df["排名"] = df["销量"].rank(method = "max")
df

image.png

05. 对同一个组使用最小的排名

df["排名"] = df["销量"].rank(method = "min")
df

image.png

06. 同组同排名,组间递增1

df["排名"] = df["销量"].rank(method = "dense")
df

image.png

07. 按降序排名

df["排名"] = df["销量"].rank(ascending = False)
df

image.png

08. 按升序排名

df["排名"] = df["销量"].rank(ascending = True)
df

image.png

创作不易,分享难得。如果觉得本文对您有帮助,请不吝动动宝贵的手指帮忙点个赞以示支持一下。后期,我会用心分享更多更精彩、实用的干货给大家,以期共同进步。感谢阅读!