数学基础系列:极限与连续

326 阅读11分钟

本文整理一些与极限和连续有关的概念和定理。

1 实数线的拓扑

我们先从探讨“距离”的概念出发。我们知道对于x,yRx,y\in R,可以定义一个非负的Euclidean distancexy|x-y|。通过这个,我们可以定义某个点xRx\in Rε\varepsilon-邻域ε\varepsilon-neighbourhood)为集合S(x,ε)={y:xy<ε}S(x,\varepsilon)=\{y:|x-y|\lt \varepsilon\},其中ε>0\varepsilon\gt 0

如果对于集合ARA\subseteq RxA\forall x\in A,都ε>0\exists \varepsilon\gt 0,使得该点的ε\varepsilon-邻域是AA的子集,这样的集合AA开集(open set)RR\emptyset也都为开集。

RR上的所有开集组成的collection,称为topology of RR(拓扑),或者usual topology on RR(通常拓扑)。我们还可以在RR的子集或子空间(subspace)上讨论topology,对于ASRA\subseteq \mathbb{S}\subseteq R,如果xA\forall x\in A,都S(x,ε)\exists S(x,\varepsilon),使得S(x,ε)SAS(x,\varepsilon)\cap \mathbb{S} \subseteq A,就称AAS\mathbb{S}中是的(AA is open in S\mathbb{S})。比如[0,1)[0,1),在RR中不是开的,但在S=[0,2]\mathbb{S}=[0,2]中是开的。所有这些集合定义了relative topology on S\mathbb{S}(相对拓扑),由定义直接可得以下定理。

定理:若AARR中是开的,则ASA\cap \mathbb{S}在relative topology on S\mathbb{S}中是开的。

对于某个点xRx\in R,若ε>0\forall \varepsilon \gt 0AS(x,ε)A\cap S(x,\varepsilon)均为非空集合,则称xx为集合AA的一个闭包点(closure point),它不一定是AA中的元素。AA的所有的闭包点组成了AA闭包(closure),记作Aˉ\bar A(A)(A)^-

对于某个点xRx\in R,若它是A{x}A-\{x\}的闭包点,则称它是AA会聚点(accumulation point)。若xxAA的闭包点且xAx\notin A,则xx也是AA的会聚点。而那些不是会聚点的闭包点,就是AA孤点(isolated point)。比如集合A={0}[1,2]A=\{0\}\cup[1,2],则x=0x=0AA的孤点。

若点xAˉx\in \bar A满足ε>0\forall \varepsilon\gt 0AcS(x,ε)A^c\cap S(x,\varepsilon)均非空,则xx称为集合AA边界点boundary point)。可以将AA的所有边界点组成的集合记为A\partial A,则Aˉ=AA\bar A = A\cup\partial A

AA内部interior)就是集合Ao=AAA^o=A-\partial A

闭集Closed set)就是包含了该集合自己所有的闭包点的集合,对这样的集合来说,Aˉ=A\bar A=A

定理RR上的开集,其补集是闭集。

这是闭集的另一个定义。可以看出,RR\emptyset都既是开集又是闭集。推广至relative topologies,有如下定理。

定理:若AASR\mathbb{S}\subseteq R中是开的,则SA\mathbb{S}-AS\mathbb{S}中是闭的。

定理:(1)开集的collection的并是开的;(2)若AABB都是开的,那么ABA\cap B也是开的。

定理:每个开集ARA\in R都可表达为可数个不交开区间的并。

定理B\mathscr{B}包含了RR中的开集和闭集。

若一个collection C\mathscr{C}满足对于一个ARA\subseteq RABCBA\subseteq \cup_{B\in\mathscr{C}}B,则称C\mathscr{C}AA的一个覆盖covering)。若这里每个BB都是开集,则称该覆盖为开覆盖open covering)。

定理 (Lindelof's covering theorem):对于由RR上的开子集组成的任意的一个collectionC\mathscr{C},必定存在可数的subcollection {BiC,iN}\{B_i\in \mathscr{C}, i\in N\},使得

BCB=i=1Bi\cup_{B \in \mathscr{C}} B = \cup_{i=1}^{\infty} B_i

这也就是说,若C\mathscr{C}RR中某个集合的覆盖,那么它必定包含了一个可数的子覆盖。这也叫Lindelof property

由覆盖的概念,可以导出一个更重要的概念:紧致性compactness):若对于集合AA每个AA开覆盖都包含了一个有限的子覆盖,则称AA紧的compact)。

理解这个概念的关键在于“每个”和“开覆盖”。举个例子,对于(0,1](0,1],可数collection{(1/n,1],nN}\{(1/n,1],n\in N\}是一个开覆盖,但没有有限的子覆盖,因此(0,1](0,1]不是紧的。

xA\exists x\in Aε>0\varepsilon \gt 0AS(x,ε)A\subseteq S(x,\varepsilon),则称AA有界的bounded)。换句话说,有界集合必须被一个有限区间所包含。有了有界的概念,我们回到紧致性。

定理:在RR中的一个集合是紧的,当且仅当它是闭的、有界的。

对于AA的子集BB,若BABˉB\subseteq A\subseteq \bar B,则称BBAA稠密dense)。

定理:若AARR上的区间,CAC\subseteq A是一个可数集合,则ACA-CAA中稠密。

2 序列和极限

实序列(real sequence)是一个从NNRR的映射,定义域中的元素称为indices,它们的值域称为序列的项/成员/坐标(terms/members/coordinates)。

{xn}1\{x_n\}_1^{\infty} 收敛于converge to)极限xx,若ε>0\forall \varepsilon \gt 0Nε\exists N_\varepsilon,使得n>Nε,xnx<ε\forall n>N_\varepsilon, |x_n-x|\lt \varepsilon。若序列趋于±\pm\infty则称发散diverge),有时这也叫在Rˉ\bar R中收敛,这是为了区别它们与那些不收敛到一个固定点的序列。

定理:任意在紧集中的单调序列均收敛。

即使序列不收敛,也可能会无限次地到达某个点。若存在子序列(subsequence){xnk,kN}\{x_{n_k},k\in N\}和常数cc,使得xnkcx_{n_k}\to c,则称cc为序列的聚集点cluster point)。比如序列{(1)n,n=1,2,}\{(-1)^n,n=1,2,\ldots\},可以用它的奇数位置元素和偶数位置元素分别构造出收敛子列。

子序列的概念很重要。典型的推理路线是这样的,先确定一个收敛子列(可能是单调序列),再利用序列的其他特性来说明聚集点是一个极限。由于序列的成员都是在紧集中的,一方面紧集是有界的,所以这样的序列不可能发散至无穷大,另一方面紧集又是闭的,所有的极限点或聚集点都在集合中。

定理:在RR上的紧集中的任意序列,都有至少一个聚集点。

定理:在紧集中的序列,要不就有两个或更多的聚集点,要不就收敛。

例子:考虑序列{1,x,x2,}\{1,x,x^2,\ldots\},若x<1|x|\lt 1则收敛于00,若x=1x=1则收敛于11,若x>1x\gt 1则其在RR中发散,或者叫在Rˉ\bar R中收敛至++\infty,若x=1x=-1则在两个聚集点+1+11-1之间摇摆,若x<1x\lt -1则在RR中发散,或者说在Rˉ\bar R中的两个聚集点++\infty-\infty之间摇摆。

接下来讨论实数序列。实数序列{xn}\{x_n\}上极限superior limit)定义为

lim supnxn=infnsupm>nxm\limsup_n x_n = \inf_n \sup_{m\gt n} x_m

类似可定义下极限inferior limit)为

lim infnxn=(lim supn(xn))=supninfm>nxm\liminf_n x_n = -\left(\limsup_n (-x_n)\right) = \sup_n \inf_{m\gt n} x_m

lim supnxn\limsup_n x_nlim infnxn\liminf_n x_n相等,序列收敛。

这几个概念可用来处理极限问题。有时候,直接假设极限存在是不合理的,但limsup和liminf是总是存在的,只需推导它们,再说明它们相等就行,另一个充分条件是lim infnxn>lim supnxn\liminf_n x_n\gt \limsup_n x_n,也可以推出极限存在。

对于实数序列,有一个判断收敛的Cauchy准则Cauchy criterion):{xn}\{x_n\}收敛,等价于,ε>0\forall \varepsilon\gt 0Nε\exists N_\varepsilon,使得对于n>Nεn\gt N_\varepsilonm>Nεm\gt N_\varepsilon,有xnxm<ε|x_n-x_m|\lt \varepsilon。满足这个条件的,也叫Cauchy序列Cauchy sequence)。满足本节开头对收敛的定义的数列必为Cauchy数列,实数Cauchy数列也必定有极限,两种极限的定义在RR上等价。但Cauchy准则在很多时候更容易检验。

在集合AA中的Cauchy序列,它的极限是AA的会聚点;反之,每个AA的会聚点xx,都存在极限为xx的Cauchy序列。因此,极限点limit point)有时是会聚点(accumulation point)的同义词。

定理:任意实数都是某个有理数Cauchy序列的极限。

该定理意味着,任一实数的任一ε\varepsilon-邻域中,必定存在一个有理数,即QQRR中是稠密的。另外,QQ的补集RQR-Q也是稠密的,因此,正常人的直觉“稠密的集合的补集是稀疏的”是错误的。

定理:任意开区间都是某个端点为有理数的闭子区间序列的极限。

这说明了,开集序列的极限不一定是开的,闭集序列的极限不一定是闭的。但是,非递减的开集序列的极限是开的,非递增的闭集序列的极限是闭的。

3 函数和连续

本节讨论函数及其连续性的概念。现有一个在实变量上的函数f:STf: \mathbb{S}\mapsto \mathbb{T}SR\mathbb{S}\in RTR\mathbb{T}\in R,对于“连续性”(continuity),ffxSx\in\mathbb{S}处连续的正式定义为:ε>0\forall \varepsilon \gt 0δ>0\exists \delta \gt 0,使得只要yx<δ|y-x|\lt \delta就有f(y)f(x)<ε|f(y)-f(x)|\lt \varepsilon。若ffS\mathbb{S}的每个点上都连续,则称它在S\mathbb{S}上连续。

定理:假设f:STf: \mathbb{S}\mapsto \mathbb{T}S\mathbb{S}的所有点上连续,那么,若AAT\mathbb{T}上是开的则f1(A)f^{-1}(A)S\mathbb{S}上是开的,若AAT\mathbb{T}上是闭的则f1(A)f^{-1}(A)S\mathbb{S}上是闭的。

注意,这条定理没有说,若AA是开的则f(A)f(A)是开的。如果一个映射满足若AA是开的则f(A)f(A)是开的,可以称为开映射open mapping)。由于f(Ac)[f(A)]cf(A^c)\neq [f(A)]^c,因此开映射未必是闭映射closed mapping)。但有一种特殊的函数,就是同胚homeomorphism)。同胚是这样的一种函数,它是11-11 onto(满射、单射)、连续,并且反函数也连续。若ff为同胚,则f1f^{-1}也是同胚,同胚既是开映射,又是闭映射。

目前我们定义的连续,是关于函数在某个点处的性质,并不是函数自身的性质,为此还需要引入一致连续uniformly continuous)的概念:x,yS\forall x,y\in \mathbb{S}ε>0\forall \varepsilon\gt 0δ>0\exists \delta\gt 0,使得,只要xy<δ|x-y|\lt \delta,就有f(x)f(y)<ε|f(x)-f(y)|\lt \varepsilon

定理:如果一个函数在紧集S\mathbb{S}上处处连续,则它在S\mathbb{S}上必定是有界且一致连续的。

连续性是关于函数光滑性smoothness)的最弱的概念,另外还有Lipschitz条件、可微、有界变差等概念。

我们来看Lipschitz条件Lipschitz condition):对于某个δ>0\delta\gt 0yS(x,δ)\forall y\in S(x,\delta),若M>0\exists M\gt 0,使得f(y)f(x)Mh(xy)|f(y)-f(x)|\leq Mh(|x-y|),其中h:R+R+h:R^+ \mapsto R^+满足当d0d\downarrow 0h(d)0h(d)\downarrow 0,则称函数ff在点xx处满足Lipschitz条件。若固定MMx,yS\forall x,y\in \mathbb{S}上面的条件都成立,则称ff满足一致Lipschitz条件uniform Lipschitz condition)。

可微diffrentiable)也是一种光滑性的概念。

当定义域是区间时,另一个光滑性的概念是有界变差bounded variation)。若M<\exists M\lt \infty,使得,对于区间[a,b][a,b],任意一种用有限个点a=x0<x1<<xn=ba=x_0\lt x_1\lt \cdots\lt x_n = b产生的划分,满足k=1nf(xi)f(xi1)M\sum_{k=1}^{n} |f(x_i)-f(x_{i-1})|\leq M,则称函数ff是有界变差的。

定理ff是有界变差的,当且仅当存在非递减函数f1f_1f2f_2使得f=f2f1f=f_2-f_1

另外,在[a,b][a,b]上由h(xy)=xyh(|x-y|)=|x-y|满足一致Lipschitz条件的函数,在[a,b][a,b]上是有界变差的。

4 向量向量与函数

以上几节的结论,一般都可推广到RkR^k空间上。

定理:现有f:STf:\mathbb{S}\mapsto\mathbb{T},其中SRk\mathbb{S}\in R^kTRm\mathbb{T}\in R^m,当且仅当ff是连续的时,有:若AAT\mathbb{T}上是开的则f1(A)f^{-1}(A)S\mathbb{S}上是开的,若AAT\mathbb{T}上是闭的则f1(A)f^{-1}(A)S\mathbb{S}上是闭的。

5 函数的序列

取函数fn:ΩTf_n:\Omega \mapsto \mathbb{T},其中TR\mathbb{T}\in RΩ\Omega可以是任意集合(不一定是RR的子集),则{fn,nN+}\{f_n,n\in N+\}就是函数的序列。

若存在一个ffωΩ\forall \omega\in\Omegaε>0\forall \varepsilon\gt 0Nεω\exists N_{\varepsilon \omega},使得当n>Nεωn\gt N_{\varepsilon \omega}时必有fn(ω)f(ω)<ε|f_n(\omega)-f(\omega)|\lt \varepsilon,则称fnf_nΩ\Omega上逐点收敛于ff(converge to ff, pointwise on Ω\Omega)。

同理,我们可以定义函数序列的一致收敛uniform convergence):若存在一个ff,使得ε>0\forall \varepsilon \gt 0,都N\exists N使得当n>Nn\gt N时有supωΩfn(ω)f(ω)<ε\sup_{\omega\in\Omega} |f_n(\omega)-f(\omega)|\lt \varepsilon,则称fnf_nΩ\Omega上一致收敛于ff(converge to ff uniformly on Ω\Omega)。

6 Summability与序关系

对于实数序列{xn}1\{x_n\}_1^{\infty},它的项的和称为级数series),写为n=1xn\sum_{n=1}^{\infty} x_n(或xn\sum x_n)。序列{m=1nxm,nN+}\{\sum_{m=1}^{n} x_m,n\in N+\}称为级数的部分和partial sums)。对于一个级数来说,若部分和收敛于有限的极限,则称该级数收敛。另外,若单调序列{m=1nxm,nN+}\{\sum_{m=1}^{n} |x_m|,n\in N+\}收敛,则称对应的级数绝对收敛converge absolutely)。

比如几何级数geometric seriesj=1xj\sum_{j=1}^{\infty} x^j,若x<1|x|\lt 1则它收敛于1/(1x)1/(1-x),且它也是绝对收敛的,若x=1x=-1则它在两个聚集点1-100之间摇摆,若xx取其他值则它发散。

定理:若级数绝对收敛,则它必收敛。

对应的一个术语叫summability,有时翻译成可求和性,但它是对应于数列的。若级数xn\sum x_n收敛则称{xn}1\{x_n\}_1^{\infty}是summable,若{xn}1\{|x_n|\}_1^{\infty}是summable则称{xn}1\{x_n\}_1^{\infty}是absolutely summable。Summable序列必定收敛于00,反之不然,除非尾部和(tail sums)收敛于00,这是个充要条件,见下面定理。

定理{xn}1\{x_n\}_1^{\infty}是summable,当且仅当nn\to\infty时有m=nxm0\sum_{m=n}^{\infty} x_m\to 0

还有一个比普通的收敛更弱的概念:若{n1m=1nxm}1\{n^{-1}\sum_{m=1}^{n} x_m\}_{1}^{\infty}收敛,则称{xn}1\{x_n\}_1^{\infty}Cesaro-summable的。

定理:若{xn}1\{x_n\}_1^{\infty}收敛于xx,则它的Cesaro和(Cesaro sum)也收敛于xx

注意,不收敛的序列也可能是Cesaro-summable的,比如序列{(1)n}0\{(-1)^n\}_0^{\infty},它不收敛,它的Cesaro和收敛于00,它的部分和序列{m=0n(1)m}0\{\sum_{m=0}^{n}(-1)^m\}_0^{\infty}的Cesaro和收敛于1/21/2

记号xnanx_n\sim a_n表示,N>0,A>0,BA\exists N\gt 0,A\gt 0, B\geq A,使得infnN(xn/an)A\inf_{n\geq N}(x_n / a_n)\geq AsupnN(xn/an)B\sup_{n\geq N}(x_n / a_n)\geq B。下面是有关收敛速率的定理。

定理{xn}\{x_n\}为正的实数序列,xnnαx_n\sim n^{\alpha},则

  • α>1\alpha \gt -1,则m=1nxmn1+α\sum_{m=1}^{n} x_m\sim n^{1+\alpha}
  • α=1\alpha = -1,则m=1nxmlogn\sum_{m=1}^{n} x_m \sim \log n
  • α<1\alpha \lt -1,则m=1nxm<\sum_{m=1}^{n} x_m \lt \inftym=nxm=O(n1+α)\sum_{m=n}^{\infty} x_m=O(n^{1+\alpha})

事实上,xnnαx_n\sim n^{\alpha}就意味着存在A>0A\gt 0BAB \geq A,使得Am=Nnmαm=NnxmBm=NnmαA\sum_{m=N}^{n}m^\alpha \leq \sum_{m=N}^{n}x_m \leq B\sum_{m=N}^{n}m^\alpha,而nn\to\inftym=1nmα\sum_{m=1}^{n} m^\alpha的极限值,就是以α\alpha为参数的Riemann Zeta函数,其中α<1\alpha\lt -1

若对于x>0x\gt 0<ρ<-\infty\lt\rho\lt \infty,当v(0)v\to\infty (0)时,有U(vx)/U(v)xρU(vx)/U(v)\to x^\rho,则称UU是regularly varying at infinity (zero)。若对于x>0x\gt 0,当v(0)v\to\infty (0)时,有L(vx)/L(v)1L(vx)/L(v)\to 1,则称LL是slowly varying at infinity (zero)。显然,一个regularly varying函数UU可以写作U(v)=vρL(v)U(v)=v^\rho L(v),其中LL是slowly varying的。举个例子,(logv)α(\log v)^\alpha对于任意α\alpha都是slowly varying at infinity。

这两种函数都定义在实数上,但也可以限制在N+N^+上,这样就可以将它们的概念引入到正数序列上。

定理:若LL是slowly varying at infinity,则δ>0\forall \delta\gt 0N1\exists N\geq 1,使得v>N\forall v\gt N,都有vδ<L(v)<vδv^{-\delta} \lt L(v) \lt v^{\delta}

推论:若xn=O(nαL(n))x_n=O(n^\alpha L(n)),则n=1xn<\sum_{n=1}^{\infty} x_n \lt\infty,这对于任意的α<1\alpha \lt -1和slowly varying at infinity的函数L(n)L(n)都成立。

定理:若xn1/[n(logn)1+δ]x_n\sim 1/[n(\log n)^{1+\delta}]δ>0\delta\gt 0,则n=1xn<\sum_{n=1}^{\infty} x_n \lt\infty。若δ=0\delta =0,则n=1xnloglogn\sum_{n=1}^{\infty} x_n \sim \log\log n

定理(Feller,1971):若正的单调函数U(v)U(v)满足xD\forall x\in DU(vx)U(v)Ψ(x)\dfrac{U(vx)}{U(v)}\to\Psi(x),其中DDR+R^+上稠密,0<Ψ(x)<0\lt \Psi(x)\lt \infty,则必有Ψ(x)=xρ\Psi(x)=x^\rho,其中<ρ<-\infty\lt \rho\lt\infty

定理:单调的regularly varying的函数的导数,必定regularly varying at \infty

7 Arrays

所谓array,就是定义域为可数的linearly ordered的集合的Cartesian product(或它的子集)的映射。

有限个序列组成的collection{{xnt,t=1,,kn},nN+}\{\{x_{nt},t=1,\ldots,k_n\},n\in N^+\}nn\to\infty时有knk_n \uparrow \infty,称这样的collection为triangular array

Toeplitz's Lemma:假设{yn}\{y_n\}是实数序列,yny_n\to\infty,若{{xnt,t=1,,kn},nN+}\{\{x_{nt},t=1,\ldots,k_n\},n\in N^+\}为triangular array,并且

  1. 对于每个固定的tt,当n0n\to 0时,xnt0x_{nt}\to 0
  2. limnt=1knxntC<\lim\limits_{n\to\infty}\sum\limits_{t=1}^{k_n} |x_{nt}| \leq C \lt \infty
  3. limnt=1knxnt=1\lim\limits_{n\to\infty}\sum\limits_{t=1}^{k_n} x_{nt} = 1

t=1knxntyny\sum_{t=1}^{k_n} x_{nt} y_n \to y。对于y=0y=0,条件3可忽略。

满足上述引理的条件的一个典型例子就是xnt=(s=1nys)1ytx_{nt}=(\sum_{s=1}^{n} y_s)^{-1}y_t,其中{yt}\{y_t\}为正数序列且s=1nys\sum_{s=1}^n y_s\to \infty

Kronecker's Lemma:考虑正数序列{at}1\{a_t\}_1^\infty{xt}1\{x_t\}_1^\infty,其中ata_t\uparrow\infty,若当nn\to\infty时,t=1nxt/atC<\sum_{t=1}^{n} x_t/a_t\to C\lt \infty,则1ant=1nxt0\dfrac{1}{a_n}\sum_{t=1}^{n}x_t\to 0

关于array的收敛性,可以理解为在序列上的概念延伸。考虑子序列{{xmnk,kN+},mN+}\{\{x_{m{n_k}}, k\in N^+\},m\in N^+\},其中{nk,kN+}\{n_k,k\in N^+\}是正整数的递增序列。若xm=limkxmnkx_m = \lim_{k\to\infty} x_{m n_k}对于每个mN+m\in N^+都存在,则称array就是收敛的,它的极限就是无穷序列{xm,m}\{x_m,m\to\infty\},至于这个序列是否收敛,那就是另外一个问题了。

现在考虑一个有界array即supk,mxmnkB<\sup_{k,m} |x_{m{n_k}}|\leq B\lt \infty,由前文定理可知,RR上紧集中的任意序列必有至少一个聚集点,可将{xmnk,kN+}\{x_{m{n_k}},k\in N^+\}的某个聚集点记为xmx_m,这是对于array内部的序列来说的聚集点。那么,对于整个array来说,它有聚集点吗?有如下定理。

定理:对于任一有界array {{xmnk,kN+},mN+}\{\{x_{m{n_k}}, k\in N^+\},m\in N^+\},都存在一个对应的的序列{xm}\{x_m\},它是当kk\to\infty{{xmnk,kN+},mN+}\{\{x_{m{n_k^*}}, k\in N^+\},m\in N^+\}的极限,其中{nk}\{n^*_k\}{nk}\{n_k\}的子序列,且对于每个mm都相同。

参考文献

  • Davidson, J., 1994. Stochastic limit theory: An introduction for econometricians. OUP Oxford.