【机器学习-库②】numpy库

84 阅读1分钟

numpy 是一个用于科学计算的 Python 库,它在机器学习中扮演了重要的角色,提供了高效的多维数组操作和数学函数。以下是一些典型的机器学习场景和示例,涉及到 numpy 库的应用:

1. 数据预处理:

在数据预处理阶段,你通常需要对数据进行变换、标准化、归一化等操作。numpy 的数组操作能够方便地进行这些操作。

```
import numpy as np

# 数据标准化
mean = np.mean(data)
std = np.std(data)
standardized_data = (data - mean) / std
```

2. 特征工程

在特征工程中,你可能需要对特征进行构造、选择和转换。numpy 提供了丰富的数学函数来支持这些操作。

```
pythonCopy code
# 多项式特征构造
polynomial_features = np.column_stack([data**i for i in range(1, degree+1)])
```

3. 矩阵运算:

机器学习中经常涉及矩阵运算,例如线性代数操作、协方差矩阵计算等。

```
# 矩阵相乘
product = np.dot(matrix1, matrix2)

# 计算协方差矩阵
covariance_matrix = np.cov(data, rowvar=False)
```

4. 特征选择

在特征选择中,你可能需要计算特征之间的相关性或信息增益等指标。

```
# 计算相关系数矩阵
correlation_matrix = np.corrcoef(features, rowvar=False)
```

5. 随机数生成:

机器学习中经常需要生成随机数,numpy 提供了丰富的随机数生成函数。

```
pythonCopy code
# 生成服从正态分布的随机数
random_data = np.random.normal(mean, std, size)
```

6. 正态分布和线性分布

np.linspace(1, 22, 100),#等距返回一个数据
np.random.normal(3, 1, 100),均值是3,方差是1100个点的正态分布