「这是我参与2022首次更文挑战的第18天,活动详情查看:2022首次更文挑战」。
终于到数据可视化这一节了,数据会告诉我们现象和规律,但你想掌握其中的现象和规律,可没那么容易。而数据可视化就是将其中的困难降低了一点。
python的库中,matplotlib恐怕是可视化中最常用的了。你可以用它来创建各类图形,如散点图,正弦曲线等等。通常要调用matplotlib库会执行以下这代码:
import matplotlib as plt
举个简单的例子,统计班级同学的身高体重情况,我们先录入数据:
import numpy as np
import matplotlib.pyplot as plt
height = ['165','177','166']
weight = ['51','65','55']
好了数据编好了,下面,我们需要看每位同学的身高体重情况,这怎么看呢?
plt.scatter(height,weight)
看看会发生什么,不知道是啥玩意,原因就是我们没有设置x,y轴,
import numpy as np
import matplotlib.pyplot as plt
height = ['165','177','166']
weight = ['51','65','55']
plt.scatter(height,weight)
plt.xlabel('height')
plt.ylabel('weight')
plt.title('student')
plt.show()
有没发现x轴y轴的数据怎么看起来怪怪的?是因为我们没有给x轴y轴设定值:
plt.xlim(150,180)
plt.ylim(50,70)
我们将上面两行代码加到程序里,看下能不能完成。
结果是让人失望的,这到底是是什么问题呢?
发现了吗?是的,我们输入的是字符串,所以就会有这个问题。看看下面的图,是不是就清晰了呢?
x范围在150-180之间,y范围在50-70之间。还有一种办法就是plt.axis,直接在其后面写上x,y的范围即可,具体使用方式如下:
plt.axis([150,170,50,70])
一般的plot参数(x轴,y轴,线段颜色等等),除了散点图,还有条形图,饼图也很常用,它们的调用语言分别是plt.subplots()然后跟的hist和pie。