Python之numpy库

147 阅读7分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

Numpy

是什么

www.numpy.org.cn/user/ numpy中文官网

科学计算库,处理多维数组【列表,矩阵】的数值运算

与matlab比较

www.numpy.org.cn/user/numpy_…

NumPy Ndarray 对象

1.NumPy 最重要的一个特点是其 N 维数组对象 ndarray

ndarray 对象是用于存放同类型元素的多维数组

ndarray 中的每个元素在内存中都有相同存储大小的区域

2.ndarray 内部由以下内容组成:

ndarray.png

  • 一个指向数据的指针(内存或内存映射文件中的一块数据)
  • 数据类型或 dtype
  • 一个表示数组形状(shape)的元组,表示各维度大小的元组
  • 一个跨度元组(stride)

3.创建一个 ndarray 只需调用 NumPy 的 array 函数:

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)

参数说明:

名称描述
object数组或嵌套的数列
dtype数组元素的数据类型,可选
copy对象是否需要复制,可选
order创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)
subok默认返回一个与基类类型一致的数组
ndmin指定生成数组的最小维度

NumPy 数据类型

1.numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上

NumPy 数组属性

1.NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度

2.每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)

比如说,二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组

所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数组,第二个轴是底层数组里的数组。

3.NumPy 的数组中比较重要 ndarray 对象属性

属性说明
ndarray.ndim秩,即轴的数量或维度的数量
ndarray.shape数组的维度,对于矩阵,n 行 m 列
ndarray.size数组元素的总个数,相当于 .shape 中 n*m 的值
ndarray.dtypendarray 对象的元素类型
ndarray.itemsizendarray 对象中每个元素的大小,以字节为单位
ndarray.flagsndarray 对象的内存信息
ndarray.realndarray元素的实部
ndarray.imagndarray 元素的虚部
ndarray.data包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。

ndarray.itemsize

以字节的形式返回数组中每一个元素的大小

例如,一个元素类型为 float64 的数组 itemsize 属性值为8(float64 占用 64 个 bits,每个字节长度为 8,所以 64/8,占用 8 个字节)

NumPy 创建数组

numpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组:

numpy.empty([3,2], dtype = float, order = 'C')

numpy.zeros创建指定大小的数组,数组元素以 0 来填充:

numpy.zeros(shape, dtype = float, order = 'C')

numpy.ones创建指定形状的数组,数组元素以 1 来填充:

numpy.ones([2,2], dtype =int, order = 'C')

NumPy 从已有的数组创建数组

将元组转换为 ndarray → numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。

numpy.asarray(a, dtype = None, order = None)

numpy.frombuffer 用于实现动态数组。

numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0)

参数说明:

参数描述
buffer可以是任意对象,会以流的形式读入。
dtype返回数组的数据类型,可选
count读取的数据数量,默认为-1,读取所有数据。
offset读取的起始位置,默认为0。

numpy.fromiter 方法从可迭代对象中建立 ndarray 对象,返回一维数组。

numpy.fromiter(iterable, dtype, count=-1)
参数描述
iterable可迭代对象
dtype返回数组的数据类型
count读取的数据数量,默认为-1,读取所有数据

numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下:

numpy.arange(start, stop, step, dtype)

参数说明:

参数描述
start起始值,默认为0
stop终止值(不包含)
step步长,默认为1
dtype返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。

numpy.linspace 函数用于创建一个一维数组,数组是一个等差数列构成的,格式如下:

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

参数说明:

参数描述
start序列的起始值
stop序列的终止值,如果endpointtrue,该值包含于数列中
num要生成的等步长的样本数量,默认为50
endpoint该值为 true 时,数列中包含stop值,反之不包含,默认是True。
retstep如果为 True 时,生成的数组中会显示间距,反之不显示。
dtypendarray 的数据类型

numpy.logspace 函数用于创建一个于等比数列。格式如下:

np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

base 参数意思是取对数的时候 log 的下标。

参数描述
start序列的起始值为:base ** start
stop序列的终止值为:base ** stop。如果endpointtrue,该值包含于数列中
num要生成的等步长的样本数量,默认为50
endpoint该值为 true 时,数列中中包含stop值,反之不包含,默认是True。
base对数 log 的底数。
dtypendarray 的数据类型

NumPy 切片和索引

ndarray对象的内容可以通过索引或切片来访问和修改

首先通过 arange() 函数创建 ndarray 对象,然后,分别设置起始,终止和步长的参数为 2,7 和 2,通过冒号分隔切片参数 start:stop:step 来进行切片操作

import numpy as np
 
a = np.arange(10)
s = slice(2,7,2)   # 从索引 2 开始到索引 7 停止,间隔为2
print (a[s])
​
a = np.arange(10)  
b = a[2:7:2]   # 从索引 2 开始到索引 7 停止,间隔为 2
print(b)

冒号 : 的解释:

如果只放置一个参数,如 [2] ,将返回与该索引相对应的单个元素。

如果为 [2:] ,表示从该索引开始以后的所有项都将被提取。

如果使用了两个参数,如 [2:7] ,那么则提取两个索引(不包括停止索引)之间的项。

NumPy 高级索引

除了之前看到的用整数和切片的索引外,数组可以由整数数组索引、布尔索引及花式索引。

整数数组索引

布尔索引

print  ('大于 5 的元素是:')
print (x[x >  5])

使用 ~ (取补运算符)来过滤 NaN

np.iscomplex(a)判断是否为复数

花式索引

花式索引根据索引数组的值作为目标数组的某个轴的下标来取值

花式索引指的是利用整数数组进行索引

对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应下标的行;如果目标是二维数组,那么就是对应位置的元素

NumPy 广播(Broadcast)

1.如果两个数组 a 和 b 形状相同,即满足 a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘,a+b的结果就是a与b数组对应位相加

要求维数相同,且各维度的长度相同。

2.当运算中的 2 个数组的形状不同时,numpy 将自动触发广播机制

# numpy的广播机制
a = np.array([[0, 0, 0],
              [10, 10, 10],
              [20, 20, 20],
              [30, 30, 30]])
b = np.array([1, 2, 3])
bb = np.tile(b, (4, 1))
print(a + +bb)
print(a + b)

NumPy 迭代数组

NumPy 迭代器对象 numpy.nditer 提供了一种灵活访问一个或者多个数组元素的方式

我们使用 arange() 函数创建一个 2X3 数组,并使用 nditer 对它进行迭代

import numpy as np
 
a = np.arange(6).reshape(2,3)
print ('原始数组是:')
print (a)
print ('\n')
print ('迭代输出元素:')
for x in np.nditer(a):
    print (x, end=", " )
print ('\n')