Mathematical notationMathematical notation(数学符号) 我尝试这本书的数学内容

Mathematical notation(数学符号)

我尝试这本书的数学内容控制在必要的最低需求，以达到对该领域的正确理解。然而，这一最低的水平是非零的，因该强调的是，良好的微积分，线性代数和概率论的掌握是清晰理解现代模式识别和机器学习技术的必然条件。然而，本书的重点传达潜在的概念，而不是数学的严谨性。

我试图在整本书中使用一致的符号，尽管有时这意味着要背离相应研究文献中使用的一些惯例。向量用小写黑体罗马字母表示，如 $x$ ,所有向量都假定为列向量。上标 $T$ 表示矩阵或向量的转置，因此 $x^t$ 将是行向量。大写的粗体罗马字体，如 $M$ ，表示矩阵。 $(w1,...,wM)$ 表示有M个行向量，对应的列向量记为 $w=(w1,....wM)^T$ 。

符号 $[a,b]$ 用来表示闭区间从 $a$ 到 $b$ ,这是间隔包括 $a$ 和 $b$ 的值，而 $(a,b)$ 表示相应的开区间，区间排除 $a$ 和 $b$ 。同样， $[a,b)$ 表示一个区间，其中包括 $a$ 但不包括 $b$ 。在大多数情况下，无论怎样，我们不需要详细讨论是否包含间隔的端点这样的细节。

$M * M$ 单位矩阵(也称为单位矩阵)表示为 $I_M$ ,简写为 $I$ ，维度上没有歧义。他有元素 $I_{ij}$ 等于1 $i=j$ 和 0 如果 $i\neq j$

函数记为 $f[y]$ ，其中 $y(x)$ 是某个函数。函数的概念将在附录D中讨论。

$g(x)=O(f(x))$ 表示 $|f(x)/g(x)|$ 有界为 $x\rightarrow\infty$ 。例如，如果 $g(x)=3x^2+2$ ，那么 $g(x)=O(x^2)$ 。

函数 $f(x,y)$ 对随机变量 $x$ 的期望用 $E_x[f(x,y)]$ 表示。在没有歧义的情况下，哪个变量被平均了，这将被简化，省略后缀，例如 $E[x]$ 。如果 $x$ 的分布以另一个变量 $z$ 为条件，则相应的条件期望为 $E_x[f(x)|z]$ 。类似地，方差记为 $var[f(x)]$ ，对于向量变量协方差记为 $cov[f(x)]$ 。我们还应使用 $cov[x]$ 作为 $cov[x,x]$ 的简写符号。期望和协方差的概念将在1.2.2节中介绍。

如果我们有 $N$ 个值 $x_1,...,x_N$ 采用向量 $x=(x_1,...,x_D)^T$ ，我们可以将观察到一个数据矩阵 $X$ 的 $n^{th}$ 行对应的行向量 $x^T_n$ 。因此 $n,i$ 元素的x对应的 $i^{th}$ 元素的 $n^{th}$ 观测 $X_n$ 。一维变量的情况下，我们应当表示 $x$ 的矩阵,它是一个列向量,其中 $n^{th}$ 元素是 $x_n$ 。注意， $x$ (有维度 $N$ )使用不用的字体来区分 $x$ （有维度 $D$ ).