本文已参与「新人创作礼」活动,一起开启掘金创作之路。
Numpy
是什么
www.numpy.org.cn/user/ numpy中文官网
科学计算库,处理多维数组【列表,矩阵】的数值运算
与matlab比较
NumPy Ndarray 对象
1.NumPy 最重要的一个特点是其 N 维数组对象 ndarray
ndarray 对象是用于存放同类型元素的多维数组
ndarray 中的每个元素在内存中都有相同存储大小的区域
2.ndarray 内部由以下内容组成:
- 一个指向数据的指针(内存或内存映射文件中的一块数据)
- 数据类型或 dtype
- 一个表示数组形状(shape)的元组,表示各维度大小的元组
- 一个跨度元组(stride)
3.创建一个 ndarray 只需调用 NumPy 的 array 函数:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
参数说明:
| 名称 | 描述 |
|---|---|
| object | 数组或嵌套的数列 |
| dtype | 数组元素的数据类型,可选 |
| copy | 对象是否需要复制,可选 |
| order | 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认) |
| subok | 默认返回一个与基类类型一致的数组 |
| ndmin | 指定生成数组的最小维度 |
NumPy 数据类型
1.numpy 支持的数据类型比 Python 内置的类型要多很多,基本上可以和 C 语言的数据类型对应上
NumPy 数组属性
1.NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度
2.每一个线性的数组称为是一个轴(axis),也就是维度(dimensions)
比如说,二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组
所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数组,第二个轴是底层数组里的数组。
3.NumPy 的数组中比较重要 ndarray 对象属性
| 属性 | 说明 |
|---|---|
| ndarray.ndim | 秩,即轴的数量或维度的数量 |
| ndarray.shape | 数组的维度,对于矩阵,n 行 m 列 |
| ndarray.size | 数组元素的总个数,相当于 .shape 中 n*m 的值 |
| ndarray.dtype | ndarray 对象的元素类型 |
| ndarray.itemsize | ndarray 对象中每个元素的大小,以字节为单位 |
| ndarray.flags | ndarray 对象的内存信息 |
| ndarray.real | ndarray元素的实部 |
| ndarray.imag | ndarray 元素的虚部 |
| ndarray.data | 包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性。 |
ndarray.itemsize
以字节的形式返回数组中每一个元素的大小
例如,一个元素类型为 float64 的数组 itemsize 属性值为8(float64 占用 64 个 bits,每个字节长度为 8,所以 64/8,占用 8 个字节)
NumPy 创建数组
numpy.empty 方法用来创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组:
numpy.empty([3,2], dtype = float, order = 'C')
numpy.zeros创建指定大小的数组,数组元素以 0 来填充:
numpy.zeros(shape, dtype = float, order = 'C')
numpy.ones创建指定形状的数组,数组元素以 1 来填充:
numpy.ones([2,2], dtype =int, order = 'C')
NumPy 从已有的数组创建数组
将元组转换为 ndarray → numpy.asarray 类似 numpy.array,但 numpy.asarray 参数只有三个,比 numpy.array 少两个。
numpy.asarray(a, dtype = None, order = None)
numpy.frombuffer 用于实现动态数组。
numpy.frombuffer(buffer, dtype = float, count = -1, offset = 0)
参数说明:
| 参数 | 描述 |
|---|---|
| buffer | 可以是任意对象,会以流的形式读入。 |
| dtype | 返回数组的数据类型,可选 |
| count | 读取的数据数量,默认为-1,读取所有数据。 |
| offset | 读取的起始位置,默认为0。 |
numpy.fromiter 方法从可迭代对象中建立 ndarray 对象,返回一维数组。
numpy.fromiter(iterable, dtype, count=-1)
| 参数 | 描述 |
|---|---|
| iterable | 可迭代对象 |
| dtype | 返回数组的数据类型 |
| count | 读取的数据数量,默认为-1,读取所有数据 |
numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象,函数格式如下:
numpy.arange(start, stop, step, dtype)
参数说明:
| 参数 | 描述 |
|---|---|
start | 起始值,默认为0 |
stop | 终止值(不包含) |
step | 步长,默认为1 |
dtype | 返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。 |
numpy.linspace 函数用于创建一个一维数组,数组是一个等差数列构成的,格式如下:
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
参数说明:
| 参数 | 描述 |
|---|---|
start | 序列的起始值 |
stop | 序列的终止值,如果endpoint为true,该值包含于数列中 |
num | 要生成的等步长的样本数量,默认为50 |
endpoint | 该值为 true 时,数列中包含stop值,反之不包含,默认是True。 |
retstep | 如果为 True 时,生成的数组中会显示间距,反之不显示。 |
dtype | ndarray 的数据类型 |
numpy.logspace 函数用于创建一个于等比数列。格式如下:
np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)
base 参数意思是取对数的时候 log 的下标。
| 参数 | 描述 |
|---|---|
start | 序列的起始值为:base ** start |
stop | 序列的终止值为:base ** stop。如果endpoint为true,该值包含于数列中 |
num | 要生成的等步长的样本数量,默认为50 |
endpoint | 该值为 true 时,数列中中包含stop值,反之不包含,默认是True。 |
base | 对数 log 的底数。 |
dtype | ndarray 的数据类型 |
NumPy 切片和索引
ndarray对象的内容可以通过索引或切片来访问和修改
首先通过 arange() 函数创建 ndarray 对象,然后,分别设置起始,终止和步长的参数为 2,7 和 2,通过冒号分隔切片参数 start:stop:step 来进行切片操作
import numpy as np
a = np.arange(10)
s = slice(2,7,2) # 从索引 2 开始到索引 7 停止,间隔为2
print (a[s])
a = np.arange(10)
b = a[2:7:2] # 从索引 2 开始到索引 7 停止,间隔为 2
print(b)
冒号 : 的解释:
如果只放置一个参数,如 [2] ,将返回与该索引相对应的单个元素。
如果为 [2:] ,表示从该索引开始以后的所有项都将被提取。
如果使用了两个参数,如 [2:7] ,那么则提取两个索引(不包括停止索引)之间的项。
NumPy 高级索引
除了之前看到的用整数和切片的索引外,数组可以由整数数组索引、布尔索引及花式索引。
整数数组索引
布尔索引
print ('大于 5 的元素是:')
print (x[x > 5])
使用 ~ (取补运算符)来过滤 NaN
np.iscomplex(a)判断是否为复数
花式索引
花式索引根据索引数组的值作为目标数组的某个轴的下标来取值
花式索引指的是利用整数数组进行索引
对于使用一维整型数组作为索引,如果目标是一维数组,那么索引的结果就是对应下标的行;如果目标是二维数组,那么就是对应位置的元素
NumPy 广播(Broadcast)
1.如果两个数组 a 和 b 形状相同,即满足 a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘,a+b的结果就是a与b数组对应位相加
要求维数相同,且各维度的长度相同。
2.当运算中的 2 个数组的形状不同时,numpy 将自动触发广播机制
# numpy的广播机制
a = np.array([[0, 0, 0],
[10, 10, 10],
[20, 20, 20],
[30, 30, 30]])
b = np.array([1, 2, 3])
bb = np.tile(b, (4, 1))
print(a + +bb)
print(a + b)
NumPy 迭代数组
NumPy 迭代器对象 numpy.nditer 提供了一种灵活访问一个或者多个数组元素的方式
我们使用 arange() 函数创建一个 2X3 数组,并使用 nditer 对它进行迭代
import numpy as np
a = np.arange(6).reshape(2,3)
print ('原始数组是:')
print (a)
print ('\n')
print ('迭代输出元素:')
for x in np.nditer(a):
print (x, end=", " )
print ('\n')