Python学习第三十四天,简易的数据分析(二)

84 阅读1分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第34天,点击查看活动详情

确认缺失值

u_isnull = shopping_data[shopping_data["update_time"].isnull()]
i_isnull = shopping_data[shopping_data["id"].isnull()]
t_isnull = shopping_data[shopping_data["title"].isnull()]
p_isnull = shopping_data[shopping_data["price"].isnull()]
s_isnull = shopping_data[shopping_data["sale_count"].isnull()]
c_isnull = shopping_data[shopping_data["comment_count"].isnull()]
d_isnull = shopping_data[shopping_data["店名"].isnull()]
print(u_isnull)
print(i_isnull)
print(t_isnull)
print(p_isnull)
print(s_isnull)
print(c_isnull)
print(d_isnull)

效果:

image.png

image.png

对缺失值进行操作

这边我是直接将缺失值填0的

shopping_data["sale_count"] = shopping_data["sale_count"].fillna(0)
shopping_data["comment_count"] = shopping_data["comment_count"].fillna(0)
print(shopping_data[shopping_data["sale_count"].isnull()])
print(shopping_data[shopping_data["comment_count"].isnull()])

image.png

数据分析

一切准备工作做好了,那么我们可以开始将这些数据一点点的转化成我们能看懂的图像了。

产品销量前10

这边是使用柱形图进行一个销量前10的排名

sale_rank = shopping_data.groupby("title").sum().sort_values(by="sale_count",ascending=False).head(10)
print(sale_rank)
plt.rcParams['font.sans-serif']=['SimHei']
# 必加,否则会无法显示中文
plt.figure(figsize=[10,10])
plt.title("销量前10")
plt.bar(sale_rank.index,sale_rank["sale_count"])
plt.xticks(rotation=270)
plt.show()

效果:

image.png

image.png 这边这个产品名称太长了,没办法,只能这么看看了。

店面销量前10

使用柱形图做一个店面销量前10的排名

d_rank = shopping_data.groupby("店名").sum().sort_values(by="sale_count",ascending=False).head(10)
print(d_rank)
plt.rcParams['font.sans-serif']=['SimHei']
# 必加,否则会无法显示中文
plt.figure(figsize=[10,10])
plt.title("店面销量前10")
plt.bar(d_rank.index,d_rank["sale_count"])
plt.show()

效果:

image.png

image.png

很明显的相宜本草可以说是一骑绝尘,销量直接拉了第二名将近一半的销量。