由于matplotlib它只专注于绘图,因此如果想从文件中读取输入或进行一些中间计算,那么必须使用Python模块,但不用担心,matplotlib与其他模块具有良好的兼容性,并不涉及过多的技巧。例如,要生成大量统计图形,可能需要使用科学计算包,如Numpy和Python的文件读取I/O模块。在接下来的讲解中会给出相应的示例。
结合Numpy库,绘制曲线图
绘制曲线cos(x),x在[0, 2*pi]区间内:
# cos\_1.py
import math
import matplotlib.pyplot as plt
scale = range(100)
x = [(2 \* math.pi \* i) / len(scale) for i in scale]
y = [math.cos(i) for i in x]
plt.plot(x, y)
plt.show()
若采用Numpy库,则可以使用以下等效代码:
# cos\_2.py
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 2 \* np.pi, 100)
y = np.cos(x)
plt.plot(x, y)
plt.show()
所绘制图形如下所示:
Tips:虽然Numpy对于可视化而言并非必要,但可以看出使用Numpy库可以更加高效。
Numpy可以一次对整个数组执行操作,可以使代码更高效,以绘制[-10,10]区间内的曲线
y
=
x
3
5
x
−
10
y=x^3+5x-10
y=x3+5x−10为例:
# plot\_np.py
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(-10, 10, 800)
y = x \*\* 3 + 5 \* x - 10
plt.plot(x, y)
plt.show()
绘制图形如下
绘制多曲线图
很多时候我们需要对比多组数据,以发现数据间的异同,此时就需要在一张图片上绘制多条曲线——多曲线图,下图展示了在同一图片中绘制函数
y
=
x
y=x
y=x、
y
=
x
2
y=x^2
y=x2,
y
=
l
o
g
e
x
y=log_ex
y=logex以及
y
=
s
i
n
(
x
)
y=sin(x)
y=sin(x):
# plot\_multi\_curve.py
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0.1, 2 \* np.pi, 100)
y_1 = x
y_2 = np.square(x)
y_3 = np.log(x)
y_4 = np.sin(x)
plt.plot(x,y_1)
plt.plot(x,y_2)
plt.plot(x,y_3)
plt.plot(x,y_4)
plt.show()
上述脚本绘制图形如下:
Tips:一条曲线的绘制需要调用一次plt.plot(),而plt.show()只需调用一次。这种延迟呈现机制是matplotlib的核心,我们可以声明在任何时间绘制图形,但只有在调用plt.show()时才会渲染显示图形。
为了更好的说明这种延迟呈现机制,编写以下代码:
# deferred\_rendering.py
import numpy as np
import matplotlib.pyplot as plt
def plot\_func(x, y):
x_s = x[1:] - y[:-1]
y_s = y[1:] - x[:-1]
plt.plot(x[1:], x_s / y_s)
x = np.linspace(-5, 5, 200)
y = np.exp(-x \*\* 2)
plt.plot(x, y)
plot_func(x, y)
plt.show()
绘制图形如下:
可以看到,尽管其中一个plt.plot()是在plot_func函数中调用的,它对图形的呈现没有任何影响,因为plt.plot()只是声明了我们要呈现的内容,但还没有执行渲染。因此可以使用此特性结合for循环、条件判断等语法完成复杂图形的绘制,同时也可以在同一张图中组合不同类型的统计图。
读取数据文件绘制曲线图
很多情况下数据都是存储于文件中,因此,需要首先读取文件中的数据,再进行绘制,说明起见,以.txt文件为例,其他诸如Excel、CSV文件可以使用pandas、numpy等库进行读取。
假设存在data.txt文件如下:
0 1
1 2
2 5
4 17
5 26
6 37
读取数据和绘制的代码如下:
# read\_txt.py
import matplotlib.pyplot as plt
x, y = [], []
for line in open('data.txt', 'r'):
values = [float(s) for s in line.split()]
x.append(values[0])
y.append(values[1])
plt.plot(x, y)
plt.show()
如果使用Numpy库,其等效代码可以写为:
import matplotlib.pyplot as plt
import numpy as np
data = np.loadtxt('data.txt')
plt.plot(data[:,0], data[:,1])
plt.show()
散点图
当绘制曲线图时,我们假设点与点之间存在序列关系。而散点图是简单地绘制点,它们之间并不存在连接。
import numpy as np
import matplotlib.pyplot as plt
data = np.random.rand(1000, 2)
plt.scatter(data[:,0], data[:,1])
plt.show()
Tips:函数plt.scatter()的调用方式与plt.plot()完全相同,分别将点的x和y坐标作为输入参数。
条形图
条形图具有丰富的表现形式,常见的类型包括单组条形图,多组条形图,堆积条形图和对称条形图等。
单组条形图
条形图的每种表现形式都可以绘制成垂直条形图或水平条形图,以单组条形图的两种绘制方式为例。
垂直条形图
import matplotlib.pyplot as plt
data = [10., 20., 5., 15.]
plt.bar(range(len(data)), data)
plt.show()
Tips:plt.plot()函数的作用是:接收两个参数,包括每个条形的x坐标和每个条行的高度。
通过可选参数width,pyplot.bar()提供了一种控制条形图中条状宽度的方法:
import matplotlib.pyplot as plt
data = [10., 20., 5., 15.]
plt.bar(range(len(data)), data, width=0.5)
plt.show()
水平条形图
如果更喜欢水平条形外观,就可以使用plt.barh()函数,在用法方面与plt.bar()基本相同,但是修改条形宽度(或者在水平条形图中应该称为高度)的参数需要使用height:
import matplotlib.pyplot as plt
data = [10., 20., 5., 15.]
plt.barh(range(len(data)), data, height=0.5)
plt.show()
多组条形图
当需要比较不同年份相应季度的销量等此类需求时,我们可能需要多组条形图。
import numpy as np
import matplotlib.pyplot as plt
data = [[10., 20., 30., 20.],[40., 25., 53., 18.],[6., 22., 52., 19.]]
x = np.arange(4)
plt.bar(x + 0.00, data[0], color = 'b', width = 0.25)
plt.bar(x + 0.25, data[1], color = 'g', width = 0.25)
plt.bar(x + 0.50, data[2], color = 'r', width = 0.25)
plt.show()
堆积条形图
通过使用plt.bar()函数中的可选参数,可以绘制堆积条形图。
import matplotlib.pyplot as plt
y_1 = [3., 25., 45., 22.]
y_2 = [6., 25., 50., 25.]
x = range(4)
plt.bar(x, y_1, color = 'b')
plt.bar(x, y_2, color = 'r', bottom = y_1)
plt.show()
Tips:plt.bar()函数的可选参数bottom允许指定条形图的起始值。
可以结合for循环,利用延迟呈现机制堆叠更多的条形:
import numpy as np
import matplotlib.pyplot as plt
data = np.array([[5., 30., 45., 22.], [5., 25., 50., 20.], [1., 2., 1., 1.]])
x = np.arange(data.shape[1])
for i in range(data.shape[0]):
plt.bar(x, data[i], bottom = np.sum(data[:i], axis = 0))
plt.show()
对称条形图
一个简单且有用的技巧是对称绘制两个条形图。例如想要绘制不同年龄段的男性与女性数量的对比:
import numpy as np
import matplotlib.pyplot as plt
w_pop = np.array([5., 30., 45., 22.])
m_pop = np.array( [5., 25., 50., 20.])
x = np.arange(4)
plt.barh(x, w_pop)
plt.barh(x, -m_pop)
plt.show()
(1)Python所有方向的学习路线(新版)
这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
最近我才对这些路线做了一下新的更新,知识体系更全面了。
(2)Python学习视频
包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。
(3)100多个练手项目
我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。