机器学习如何使用线性代数来解决数据问题机器或计算机只理解数字。而这些数字需要以一种方式来表示和处理，让机器通过从数据中学

How Machine Learning Uses Linear Algebra to Solve Data Problems

机器或计算机只理解数字。而这些数字需要以一种方式来表示和处理，让机器通过从数据中学习而不是从预定义的指令中学习来解决问题（如编程的情况）。

所有类型的编程都在某种程度上使用数学。机器学习涉及对数据进行编程，以学习最能描述数据的函数。

使用数据寻找函数的最佳参数的问题（或过程）在ML中被称为模型训练 。

因此，简而言之，机器学习是通过编程来优化可能的最佳解决方案--而我们需要数学来理解这个问题是如何解决的。

为ML学习数学的第一步是学习线性代数。

线性代数是解决机器学习模型中代表数据以及计算问题的数学基础。

它是数组的数学- 技术上被称为向量、矩阵和张量。

常见的应用领域--线性代数在行动

1-6

来源：https://www.wiplane.com/p/foundations-for-data-science-ml

在ML背景下，开发模型的所有主要阶段都有线性代数在幕后运行。

由线性代数促成的重要应用领域有。

数据和学习模型表示
词嵌入
降维

数据表示

ML模型的燃料，也就是数据，在你把它输入你的模型之前需要转换成数组。对这些数组进行的计算包括像矩阵乘法（点积）这样的操作。这进一步返回的输出也被表示为数字的转换矩阵/张量。

词嵌入

不要担心这里的术语--它只是用较小维度的向量来表示大维度的数据（想想你的数据中有大量的变量）。

embed

自然语言处理（NLP）处理的是文本数据。处理文本意味着理解大量词汇的含义。每个词都代表不同的含义，可能与另一个词相似。线性代数中的向量嵌入使我们能够更有效地表示这些词。

特征向量(SVD)

最后，像特征向量这样的概念使我们能够减少数据的特征或维度的数量，同时使用称为主成分分析的东西来保持所有的本质**。**

从数据到矢量

2-2

来源：https://www.wiplane.com/p/foundations-for-data-science-ml

线性代数基本上是处理向量和矩阵（不同形状的数组）以及对这些数组的操作。在NumPy中，向量基本上是一个一维的数字数组，但从几何学的角度看，它们有大小和方向。

4-2

来源：https://www.wiplane.com/p/foundations-for-data-science-ml

我们的数据可以用向量来表示。在上图中，该数据中的一行是由一个特征向量表示的，它有3个元素或组件，代表3个不同的维度。向量中的N个条目使其成为n维向量空间，在这种情况下，我们可以看到3维空间。

深度学习--通过神经网络流动的张量

我们可以在今天所有的主要应用中看到线性代数的作用。例如，对LinkedIn或Twitter帖子的情感分析（嵌入），从X射线图像中检测肺部感染的类型（计算机视觉），或任何语音到文本的机器人（NLP）。

所有这些数据类型都在张量中用数字表示。我们运行矢量操作，使用神经网络从其中学习模式。然后，它输出一个经过处理的张量，而张量又被解码以产生模型的最终推断。

每个阶段都对这些数据数组进行数学运算。

降维--矢量空间转换

5-2

来源：https://www.wiplane.com/p/foundations-for-data-science-ml

谈到嵌入，你基本上可以认为一个n维的向量被替换成另一个属于低维空间的向量。这更有意义，而且是克服了计算上的复杂性。

例如，这里是一个3维的向量被2维空间所取代。但是你可以把它推导到一个真实世界的场景，在那里你有非常多的维度。

减少维度并不意味着放弃数据中的特征。相反，它是关于寻找新的特征，这些特征是原始特征的线性函数，并保留了原始特征的方差。

找到这些新的变量（特征）就可以找到主成分（PC）。然后，这就会汇聚到解决特征向量和特征值问题。

大量使用线性代数的行业

现在，我希望你已经相信线性代数正在推动当今众多领域的ML计划。如果没有，这里列举了一些例子。

统计学
化学物理学
基因组学
词嵌入--神经网络/深度学习
机器人学
图像处理
量子物理学

你应该知道多少线性代数才能开始学习ML/DL？

现在，重要的问题是你如何能学会对这些线性代数的概念进行编程。答案是你不需要重新发明轮子，你只需要在计算上理解矢量代数的基础知识，然后你再学习用NumPy对这些概念进行编程。

NumPy是一个科学计算包，它使我们能够获得线性代数的所有基本概念。它的速度很快，因为它运行的是编译过的C代码，它有大量的数学和科学函数供我们使用。

机器学习如何使用线性代数来解决数据问题

常见的应用领域--线性代数在行动

数据表示

词嵌入

特征向量(SVD)

从数据到矢量

深度学习--通过神经网络流动的张量

降维--矢量空间转换

推荐引擎--利用嵌入技术

大量使用线性代数的行业

你应该知道多少线性代数才能开始学习ML/DL？

推荐资源