Mathematical notation(数学符号)
我尝试这本书的数学内容控制在必要的最低需求,以达到对该领域的正确理解。然而,这一最低的水平是非零的,因该强调的是,良好的微积分,线性代数和概率论的掌握是清晰理解现代模式识别和机器学习技术的必然条件。然而,本书的重点传达潜在的概念,而不是数学的严谨性。
我试图在整本书中使用一致的符号,尽管有时这意味着要背离相应研究文献中使用的一些惯例。向量用小写黑体罗马字母表示,如x,所有向量都假定为列向量。上标T表示矩阵或向量的转置,因此xt将是行向量。大写的粗体罗马字体,如M,表示矩阵。(w1,...,wM)表示有M个行向量,对应的列向量记为w=(w1,....wM)T。
符号[a,b]用来表示闭区间从a到b,这是间隔包括a和b的值,而(a,b)表示相应的开区间,区间排除a和b。同样,[a,b)表示一个区间,其中包括a但不包括b。在大多数情况下,无论怎样,我们不需要详细讨论是否包含间隔的端点这样的细节。
M∗M单位矩阵(也称为单位矩阵)表示为IM,简写为I,维度上没有歧义。他有元素Iij等于1 i=j 和 0 如果i=j
函数记为f[y],其中y(x)是某个函数。函数的概念将在附录D中讨论。
g(x)=O(f(x))表示∣f(x)/g(x)∣有界为x→∞。例如,如果g(x)=3x2+2,那么g(x)=O(x2)。
函数f(x,y)对随机变量x的期望用Ex[f(x,y)]表示。在没有歧义的情况下,哪个变量被平均了,这将被简化,省略后缀,例如E[x]。如果x的分布以另一个变量z为条件,则相应的条件期望为Ex[f(x)∣z]。类似地,方差记为var[f(x)],对于向量变量协方差记为cov[f(x)]。我们还应使用cov[x]作为cov[x,x]的简写符号。期望和协方差的概念将在1.2.2节中介绍。
如果我们有N个值x1,...,xN采用向量x=(x1,...,xD)T,我们可以将观察到一个数据矩阵X的nth行对应的行向量xnT。因此n,i元素的x对应的ith元素的nth观测Xn。一维变量的情况下,我们应当表示x的矩阵,它是一个列向量,其中nth元素是xn。注意,x(有维度N)使用不用的字体来区分x(有维度D).