这是我参与「掘金日新计划 · 6 月更文挑战」的第5天,点击查看活动详情
一、Python的矩阵传播机制(Broadcasting)
我们知道在深度学习中经常要操作各种矩阵(matrix) 。
回想一下,我们在操作数组(list)的时候,经常习惯于用**for循环(for-loop)**来对数组的每一个元素进行操作。例如:
my_list = [1,2,3,4]
new_list = []
for each in my_list:
new_list.append(each*2)
print(new_list) # 输出 [2,3,4,5]
复制代码
如果是矩阵呢:
my_matrix = [[1,2,3,4],
[5,6,7,8]]
new_matrix = [[],[]]
for i in range(2):
for j in range(4):
new_matrix[i].append(my_matrix[i][j]*2)
print(new_matrix)# 输出 [[2, 4, 6, 8], [10, 12, 14, 16]]
复制代码
实际上,上面的做法是十分的低效的!数据量小的话还不明显,如果数据量大了,尤其是深度学习中我们处理的矩阵往往巨大,那用for循环去跑一个矩阵,可能要你几个小时甚至几天。
Python考虑到了这一点,这也是本文主要想介绍的**“Python的broadcasting”即传播机制**。
先说一句,python中定义矩阵、处理矩阵,我们一般都用numpy这个库。
二、下面展示什么是python的传播机制
import numpy as np# 先定义一个3×3矩阵 A:
A = np.array(
[[1,2,3],
[4,5,6],
[7,8,9]])
print("A:\n",A)
print("\nA*2:\n",A*2) # 直接用A乘以2
print("\nA+10:\n",A+10) # 直接用A加上10
复制代码
运行结果:
A:
[[1 2 3]
[4 5 6]
[7 8 9]]
A*2:
[[ 2 4 6]
[ 8 10 12]
[14 16 18]]
A+10:
[[11 12 13]
[14 15 16]
[17 18 19]]
复制代码
接着,再看看矩阵×(+)矩阵:
#定义一个3×1矩阵(此时也可叫向量了)
B = np.array([[10],
[100],
[1000]])
print("\nB:\n",B)
print("\nA+B:\n",A+B)
print("\nA*B:\n",A*B)
复制代码
运行结果:
B:
[[ 10]
[ 100]
[1000]]
A+B:
[[ 11 12 13]
[ 104 105 106]
[1007 1008 1009]]
A*B:
[[ 10 20 30]
[ 400 500 600]
[7000 8000 9000]]
复制代码
可见,虽然A和B的形状不一样,一个是3×3,一个是3×1,但是我们在python中可以直接相加、相乘,相减相除也可以。
也许看到这,大家都对broadcasting有感觉了。
作者:北江爱国
链接:juejin.cn/post/708739…
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。