Mathematical notation

354 阅读2分钟

Mathematical notation(数学符号)

我尝试这本书的数学内容控制在必要的最低需求,以达到对该领域的正确理解。然而,这一最低的水平是非零的,因该强调的是,良好的微积分,线性代数和概率论的掌握是清晰理解现代模式识别和机器学习技术的必然条件。然而,本书的重点传达潜在的概念,而不是数学的严谨性。

  我试图在整本书中使用一致的符号,尽管有时这意味着要背离相应研究文献中使用的一些惯例。向量用小写黑体罗马字母表示,如xx,所有向量都假定为列向量。上标TT表示矩阵或向量的转置,因此xtx^t将是行向量。大写的粗体罗马字体,如MM,表示矩阵。(w1,...,wM)(w1,...,wM)表示有M个行向量,对应的列向量记为w=(w1,....wM)Tw=(w1,....wM)^T

  符号[a,b][a,b]用来表示闭区间从aabb,这是间隔包括aabb的值,而(a,b)(a,b)表示相应的开区间,区间排除aabb。同样,[a,b)[a,b)表示一个区间,其中包括aa但不包括bb。在大多数情况下,无论怎样,我们不需要详细讨论是否包含间隔的端点这样的细节。

  MMM * M单位矩阵(也称为单位矩阵)表示为IMI_M,简写为II,维度上没有歧义。他有元素IijI_{ij}等于1 i=ji=j 和 0 如果iji\neq j

  函数记为f[y]f[y],其中y(x)y(x)是某个函数。函数的概念将在附录D中讨论。

  g(x)=O(f(x))g(x)=O(f(x))表示f(x)/g(x)|f(x)/g(x)|有界为xx\rightarrow\infty。例如,如果g(x)=3x2+2g(x)=3x^2+2,那么g(x)=O(x2)g(x)=O(x^2)

  函数f(x,y)f(x,y)对随机变量xx的期望用Ex[f(x,y)]E_x[f(x,y)]表示。在没有歧义的情况下,哪个变量被平均了,这将被简化,省略后缀,例如E[x]E[x]。如果xx的分布以另一个变量zz为条件,则相应的条件期望为Ex[f(x)z]E_x[f(x)|z]。类似地,方差记为var[f(x)]var[f(x)],对于向量变量协方差记为cov[f(x)]cov[f(x)]。我们还应使用cov[x]cov[x]作为cov[x,x]cov[x,x]的简写符号。期望和协方差的概念将在1.2.2节中介绍。

  如果我们有NN个值x1,...,xNx_1,...,x_N采用向量x=(x1,...,xD)Tx=(x_1,...,x_D)^T,我们可以将观察到一个数据矩阵XXnthn^{th}行对应的行向量xnTx^T_n。因此n,in,i元素的x对应的ithi^{th}元素的nthn^{th}观测XnX_n。一维变量的情况下,我们应当表示xx的矩阵,它是一个列向量,其中nthn^{th}元素是xnx_n。注意,xx(有维度NN)使用不用的字体来区分xx(有维度DD).