0. 写在前面
如果说微积分讨论的是“变化”,那么数学分析真正首先要解决的,却不是变化本身,而是无穷过程是否可靠 。我们在初等数学中早就习惯说“越来越接近”“无限逼近”“最后就到了”,可是在严格数学里,这些说法都不够。因为“接近”不是一个情绪词,它必须变成一个可以检验、可以证明、可以反复调用的逻辑结构。
于是,数列极限成为数学分析第一批必须建立的概念。它看起来是在研究形如 { a n } \{a_n\} { a n } 的简单对象,实际上却在触及一个远比“数列”更深的核心:实数系为什么足够好,为什么在 R \mathbb{R} R 中很多无穷过程都不会失控 。
这一章的主题,表面上是“实数理论与数列极限”;但若把一切表述压缩成一句话,那么最值得记住的应当是:数列极限之所以能形成完整理论,不是因为数列本身神奇,而是因为实数系具有完备性。
从这个角度看,极限、单调有界收敛、区间套、Bolzano–Weierstrass 定理、Cauchy 收敛准则、有限覆盖定理、上极限下极限,其实并不是一堆分散结论,而是在从不同方向刻画同一件事:实数中的无穷逼近是可以落地的 。
1. 实数系的公理化描述
在进入数列极限之前,还需要先说明一个更基础的问题:我们所讨论的“实数”究竟是什么样的对象。数学分析并不是在一个模糊的“数”的直觉上展开的,而是在一个满足特定结构公理的数系上展开的。只有当这些基础被交代清楚后,后面的极限、收敛、连续等概念才真正有了可以安放的逻辑地基。
1.1 域结构
实数集 R \mathbb{R} R 上定义了加法与乘法两种运算,它们满足通常的交换律、结合律、分配律,并存在加法单位元 0 0 0 与乘法单位元 1 1 1 (且 1 ≠ 0 1\neq 0 1 = 0 )。对任意实数 a a a ,都存在加法逆元 − a -a − a ;对任意非零实数 a a a ,都存在乘法逆元 a − 1 a^{-1} a − 1 。
这意味着 R \mathbb{R} R 首先是一个域 。我们在初等数学里熟悉的四则运算规则,在这里并不是经验事实,而是结构公理。
1.2 序结构
实数集 R \mathbb{R} R 上还带有一个大小关系 ≤ \le ≤ ,它满足:
自反性 :对任意 a ∈ R a\in\mathbb{R} a ∈ R ,有 a ≤ a a\le a a ≤ a ;
反对称性 :若 a ≤ b a\le b a ≤ b 且 b ≤ a b\le a b ≤ a ,则 a = b a=b a = b ;
传递性 :若 a ≤ b a\le b a ≤ b 且 b ≤ c b\le c b ≤ c ,则 a ≤ c a\le c a ≤ c ;
全序性 :对任意 a , b ∈ R a,b\in\mathbb{R} a , b ∈ R ,必有 a ≤ b a\le b a ≤ b 或 b ≤ a b\le a b ≤ a 。
此外,这个序与加法、乘法相容,即:
若 a ≤ b a\le b a ≤ b ,则对任意 c c c ,有 a + c ≤ b + c a+c\le b+c a + c ≤ b + c ;
若 0 ≤ a 0\le a 0 ≤ a 且 0 ≤ b 0\le b 0 ≤ b ,则 0 ≤ a b 0\le ab 0 ≤ ab 。
这说明 R \mathbb{R} R 不只是会算,而且还能比较大小;并且这种大小关系不会与运算规则冲突。
1.3 完备性
实数系最关键的性质,不是会算,也不是可比,而是完备性 。其经典表述之一是:
公理 1.1(上确界原理)
任一非空且有上界的实数子集,都存在上确界。
这条性质是整个数学分析的灵魂。它保证:只要一个集合在实数轴上被压在某个上边界之下,那么“最靠近顶部的位置”不会缺失。
正因为有了这一点,单调有界数列才一定收敛,闭区间套才不会落空,Cauchy 数列才一定有极限。换句话说,分析学中那些关于“无穷逼近最终能够落地”的定理,背后都站着同一件事:实数系是完备的。
从这个意义上说,所谓“实数理论与数列极限”,其实不是把两个主题并排放在一起,而是在说明:数列极限理论之所以成立,是因为实数系本身具有足够强的结构。
2. 为什么要先讲数列极限
我们先不谈函数,只看一个最朴素的问题。设
a n = 1 + 1 n . a_n=1+\frac1n. a n = 1 + n 1 .
当 n n n 越来越大时,a n a_n a n 明显越来越接近 1 1 1 。但“明显”并不是证明,“越来越接近”也不是定义。一个认真做数学的人必须继续追问:到底接近到什么程度算接近?是不是只要某些项接近就行?前面有限项偏得很远会不会破坏结论?所谓“无限过程的终点”究竟是什么意思?
如果把这个问题放到生活里,其实很好理解。比如一个人向墙边走去,我们说“他快到墙边了”,这句话只有在你事先规定了距离标准后才有意义:一米算到吗,一厘米算到吗,一毫米算到吗?而极限定义所做的事情,就是把这种“你给我多严格的标准,我都能在足够后面满足它”的关系,用一种不可误解的语言写出来。
这就是数学分析的起点。它不是先给你图像,而是先给你逻辑;不是先问“看起来像不像”,而是先问“量词怎么摆”。
3. 数列极限的定义
定义 3.1(数列极限)
设 { a n } \{a_n\} { a n } 是一个实数列,a ∈ R a\in\mathbb{R} a ∈ R 。若对任意 ε > 0 \varepsilon>0 ε > 0 ,都存在正整数 N N N ,使得当 n > N n>N n > N 时,
∣ a n − a ∣ < ε , |a_n-a|<\varepsilon, ∣ a n − a ∣ < ε ,
则称数列 { a n } \{a_n\} { a n } 收敛于 a a a ,或称 a a a 是 { a n } \{a_n\} { a n } 的极限,记作
lim n → ∞ a n = a 或 a n → a . \lim_{n\to\infty}a_n=a
\quad\text{或}\quad
a_n\to a. n → ∞ lim a n = a 或 a n → a .
这个定义短短一行,却几乎浓缩了分析学的全部气质。首先,ε \varepsilon ε 是任意的,不是一个你随手挑的“小数”;其次,N N N 可以依赖于 ε \varepsilon ε ,但不能依赖于 n n n ;最后,条件要求的是“从某一项以后全部满足”,而不是“有无穷多项满足”。换句话说,极限是一个尾部稳定性 的概念,它只关心足够靠后的部分,前面有限项的任性从来不影响极限。
从直觉上说,lim n → ∞ a n = a \lim_{n\to\infty}a_n=a lim n → ∞ a n = a 的意思不是“最后某一项等于 a a a ”,因为数列通常没有“最后一项”;它真正表达的是:你不管把容忍误差压得多小,我都能把数列的尾巴整个塞进这个误差带里 。这就是“趋近”的严格含义。
定义 3.2(发散)
若不存在实数 a a a 使得 a n → a a_n\to a a n → a ,则称数列 { a n } \{a_n\} { a n } 发散。
定义 3.3(有界数列)
若存在常数 M > 0 M>0 M > 0 ,使得对任意 n n n 都有
∣ a n ∣ ≤ M , |a_n|\le M, ∣ a n ∣ ≤ M ,
则称 { a n } \{a_n\} { a n } 为有界数列;若不存在这样的 M M M ,则称其为无界数列。
4. 绝对值与它的基本不等式
在极限理论中,绝对值几乎无处不在。因为“接近”本质上就是差的绝对值小,而几乎所有估计都要靠绝对值把代数问题转化为大小问题。所以在正式推进极限理论之前,最好把几个最基本的不等式单独列出来。
定义 4.1(绝对值)
对任意实数 x x x ,定义
∣ x ∣ = { x , x ≥ 0 , − x , x < 0. |x|=
\begin{cases}
x,& x\ge 0,\\
-x,& x<0.
\end{cases} ∣ x ∣ = { x , − x , x ≥ 0 , x < 0.
它表示 x x x 到原点的距离,因此永远满足
∣ x ∣ ≥ 0 , ∣ x ∣ = 0 ⟺ x = 0. |x|\ge 0,\qquad |x|=0 \Longleftrightarrow x=0. ∣ x ∣ ≥ 0 , ∣ x ∣ = 0 ⟺ x = 0.
性质 4.2
对任意实数 x , y x,y x , y ,有
∣ x y ∣ = ∣ x ∣ ∣ y ∣ , |xy|=|x||y|, ∣ x y ∣ = ∣ x ∣∣ y ∣ ,
∣ x y ∣ = ∣ x ∣ ∣ y ∣ ( y ≠ 0 ) . \left|\frac{x}{y}\right|=\frac{|x|}{|y|}\qquad (y\neq 0). y x = ∣ y ∣ ∣ x ∣ ( y = 0 ) .
定理 4.3(三角不等式)
对任意实数 x , y x,y x , y ,有
∣ x + y ∣ ≤ ∣ x ∣ + ∣ y ∣ . |x+y|\le |x|+|y|. ∣ x + y ∣ ≤ ∣ x ∣ + ∣ y ∣.
这条不等式极其重要。它说明“和的长度不超过长度之和”,本质上是距离概念的代数表达。分析学中大量估计,最终都在反复使用它。
推论 4.4
对任意实数 x , y x,y x , y ,有
∣ ∣ x ∣ − ∣ y ∣ ∣ ≤ ∣ x − y ∣ . \big||x|-|y|\big|\le |x-y|. ∣ x ∣ − ∣ y ∣ ≤ ∣ x − y ∣.
证明
由三角不等式,
∣ x ∣ = ∣ ( x − y ) + y ∣ ≤ ∣ x − y ∣ + ∣ y ∣ , |x|=|(x-y)+y|\le |x-y|+|y|, ∣ x ∣ = ∣ ( x − y ) + y ∣ ≤ ∣ x − y ∣ + ∣ y ∣ ,
故
∣ x ∣ − ∣ y ∣ ≤ ∣ x − y ∣ . |x|-|y|\le |x-y|. ∣ x ∣ − ∣ y ∣ ≤ ∣ x − y ∣.
交换 x , y x,y x , y 的地位,又得
∣ y ∣ − ∣ x ∣ ≤ ∣ x − y ∣ . |y|-|x|\le |x-y|. ∣ y ∣ − ∣ x ∣ ≤ ∣ x − y ∣.
两式合并即得
∣ ∣ x ∣ − ∣ y ∣ ∣ ≤ ∣ x − y ∣ . \big||x|-|y|\big|\le |x-y|. ∣ x ∣ − ∣ y ∣ ≤ ∣ x − y ∣.
推论 4.5
对任意实数 x , y x,y x , y ,有
− ∣ x ∣ ≤ x ≤ ∣ x ∣ , -|x|\le x\le |x|, − ∣ x ∣ ≤ x ≤ ∣ x ∣ ,
∣ x − y ∣ < ε ⟹ − ε < x − y < ε . |x-y|<\varepsilon \Longrightarrow -\varepsilon<x-y<\varepsilon. ∣ x − y ∣ < ε ⟹ − ε < x − y < ε .
这些结论看起来简单,却正是后面极限定义、夹逼估计、误差控制的基本语言。分析学里所谓“会做估计”,往往不是技巧繁复,而是能熟练地把对象塞进绝对值不等式所提供的框架里。
5. 极限的唯一性、保号性与收敛列为什么一定有界
数学分析一旦给出定义,接下来最先关心的,往往不是复杂计算,而是这个定义是否自洽。于是第一个基本结论是:
定理 5.1(极限的唯一性)
若数列 { a n } \{a_n\} { a n } 收敛,则它的极限唯一。
证明
设
lim n → ∞ a n = a , lim n → ∞ a n = b . \lim_{n\to\infty}a_n=a,\qquad \lim_{n\to\infty}a_n=b. n → ∞ lim a n = a , n → ∞ lim a n = b .
若 a ≠ b a\neq b a = b ,取
ε = ∣ a − b ∣ 2 > 0. \varepsilon=\frac{|a-b|}{2}>0. ε = 2 ∣ a − b ∣ > 0.
由 a n → a a_n\to a a n → a ,存在 N 1 N_1 N 1 ,当 n > N 1 n>N_1 n > N 1 时,
∣ a n − a ∣ < ∣ a − b ∣ 2 . |a_n-a|<\frac{|a-b|}{2}. ∣ a n − a ∣ < 2 ∣ a − b ∣ .
由 a n → b a_n\to b a n → b ,存在 N 2 N_2 N 2 ,当 n > N 2 n>N_2 n > N 2 时,
∣ a n − b ∣ < ∣ a − b ∣ 2 . |a_n-b|<\frac{|a-b|}{2}. ∣ a n − b ∣ < 2 ∣ a − b ∣ .
于是当 n > max { N 1 , N 2 } n>\max\{N_1,N_2\} n > max { N 1 , N 2 } 时,由三角不等式可得
∣ a − b ∣ ≤ ∣ a − a n ∣ + ∣ a n − b ∣ < ∣ a − b ∣ 2 + ∣ a − b ∣ 2 = ∣ a − b ∣ , |a-b|\le |a-a_n|+|a_n-b|<\frac{|a-b|}{2}+\frac{|a-b|}{2}=|a-b|, ∣ a − b ∣ ≤ ∣ a − a n ∣ + ∣ a n − b ∣ < 2 ∣ a − b ∣ + 2 ∣ a − b ∣ = ∣ a − b ∣ ,
矛盾。故 a = b a=b a = b 。
极限唯一性意味着“趋于某个值”不是文学修辞,而是严格对象。一个收敛数列不能一半趋于东、一半趋于西;它如果真正收敛,就只能走向一个地方。
定理 5.2(收敛数列必有界)
若 { a n } \{a_n\} { a n } 收敛,则 { a n } \{a_n\} { a n } 必有界。
证明
设 a n → a a_n\to a a n → a 。取 ε = 1 \varepsilon=1 ε = 1 ,则存在 N N N ,使得当 n > N n>N n > N 时,
∣ a n − a ∣ < 1. |a_n-a|<1. ∣ a n − a ∣ < 1.
从而
∣ a n ∣ ≤ ∣ a ∣ + 1 ( n > N ) . |a_n|\le |a|+1\qquad (n>N). ∣ a n ∣ ≤ ∣ a ∣ + 1 ( n > N ) .
再记
M = max { ∣ a 1 ∣ , ∣ a 2 ∣ , … , ∣ a N ∣ , ∣ a ∣ + 1 } , M=\max\{|a_1|,|a_2|,\dots,|a_N|,|a|+1\}, M = max { ∣ a 1 ∣ , ∣ a 2 ∣ , … , ∣ a N ∣ , ∣ a ∣ + 1 } ,
则对任意 n n n ,均有
∣ a n ∣ ≤ M . |a_n|\le M. ∣ a n ∣ ≤ M .
故 { a n } \{a_n\} { a n } 有界。
这个定理常被初学者误读。它说的是“收敛必有界”,并不是“有界必收敛”。例如
a n = ( − 1 ) n a_n=(-1)^n a n = ( − 1 ) n
显然有界,但并不收敛。分析学中很多错误,都是把“必要条件”误当成“充分条件”造成的。
定理 5.3(保号性)
若 a n → a a_n\to a a n → a ,且 a > 0 a>0 a > 0 ,则存在 N N N ,使得当 n > N n>N n > N 时,
同理,若 a < 0 a<0 a < 0 ,则从某一项起 a n < 0 a_n<0 a n < 0 。
证明
当 a > 0 a>0 a > 0 时,取 ε = a 2 \varepsilon=\frac a2 ε = 2 a 。由 a n → a a_n\to a a n → a ,存在 N N N ,当 n > N n>N n > N 时,
∣ a n − a ∣ < a 2 . |a_n-a|<\frac a2. ∣ a n − a ∣ < 2 a .
于是
a n > a − a 2 = a 2 > 0. a_n>a-\frac a2=\frac a2>0. a n > a − 2 a = 2 a > 0.
另一种情形同理。
推论 5.4
若 a n ≥ 0 a_n\ge0 a n ≥ 0 从某一项起成立,且 a n → a a_n\to a a n → a ,则
性质 5.5(去掉有限项不改变极限)
若 a n → a a_n\to a a n → a ,则对任意固定的正整数 p p p ,都有
a n + p → a . a_{n+p}\to a. a n + p → a .
这说明极限只由尾部决定,前面有限项的变化不触及极限的本质。
6. 子列:一个数列内部的隐藏结构
定义 6.1(子列)
设 { a n } \{a_n\} { a n } 是一个数列,{ n k } \{n_k\} { n k } 是严格递增的正整数列,即
n 1 < n 2 < ⋯ < n k < ⋯ , n_1<n_2<\cdots<n_k<\cdots, n 1 < n 2 < ⋯ < n k < ⋯ ,
则称
为 { a n } \{a_n\} { a n } 的一个子列。
子列的意义非常深。它意味着我们并不总是把一个数列看成“整个对象一次性处理”,而是允许从中抽取一条更干净的轨道来观察。一个发散数列,整体也许混乱;但它内部往往埋着收敛结构,而子列就是提取这种结构的工具。
如果说原数列像一条很长的河流,那么子列就像你在河面上选择若干个观测点,只要不打乱先后顺序,就仍能反映这条河某种长期行为。
定理 6.2(收敛列的子列仍收敛到同一极限)
若
则任意子列 { a n k } \{a_{n_k}\} { a n k } 也满足
a n k → a . a_{n_k}\to a. a n k → a .
证明
任取 ε > 0 \varepsilon>0 ε > 0 。由 a n → a a_n\to a a n → a ,存在 N N N ,当 n > N n>N n > N 时,
∣ a n − a ∣ < ε . |a_n-a|<\varepsilon. ∣ a n − a ∣ < ε .
由于 n k → ∞ n_k\to\infty n k → ∞ ,存在 K K K ,当 k > K k>K k > K 时有 n k > N n_k>N n k > N 。于是当 k > K k>K k > K 时,
∣ a n k − a ∣ < ε . |a_{n_k}-a|<\varepsilon. ∣ a n k − a ∣ < ε .
故 a n k → a a_{n_k}\to a a n k → a 。
这个结论的逆命题不成立。一个数列存在收敛子列,并不能说明原列收敛。最经典的例子还是
它有收敛子列 a 2 k = 1 a_{2k}=1 a 2 k = 1 ,也有收敛子列 a 2 k − 1 = − 1 a_{2k-1}=-1 a 2 k − 1 = − 1 ,但原数列本身不收敛。真正重要的是:如果一个数列收敛,那么它的所有子列都会被同一个极限统治;反之,只要能找到两条收敛到不同值的子列,原列就一定发散。
定理 6.3(单调子列定理)
任一数列都存在单调子列。
证明
称下标 n n n 为峰点,如果对一切 m > n m>n m > n 都有
a n ≥ a m . a_n\ge a_m. a n ≥ a m .
若峰点有无穷多个,则按顺序取这些峰点对应的项,可得一个单调递减子列。若峰点只有有限多个,则从某一项起再无峰点,也就是说,对每个充分大的 n n n ,总存在 m > n m>n m > n 使得
于是可以递归选取
n 1 < n 2 < ⋯ < n k < ⋯ n_1<n_2<\cdots<n_k<\cdots n 1 < n 2 < ⋯ < n k < ⋯
使得
a n 1 < a n 2 < ⋯ < a n k < ⋯ , a_{n_1}<a_{n_2}<\cdots<a_{n_k}<\cdots, a n 1 < a n 2 < ⋯ < a n k < ⋯ ,
从而得到单调递增子列。定理得证。
这一定理在形式上很朴素,实则极具分析意味。它说明:即使一个数列整体上杂乱无章,序结构也并未完全消失;只要抽取得当,总能从中分离出一条方向明确的轨道。
7. 极限的四则运算
极限理论若不能运算,就只是定义的陈列。分析学真正进入工作状态,是从运算规则开始的。
定理 7.1(和、差、数乘)
若
a n → a , b n → b , a_n\to a,\qquad b_n\to b, a n → a , b n → b ,
则
a n ± b n → a ± b , λ a n → λ a ( λ ∈ R ) . a_n\pm b_n\to a\pm b,\qquad \lambda a_n\to \lambda a\quad(\lambda\in\mathbb{R}). a n ± b n → a ± b , λ a n → λa ( λ ∈ R ) .
这些结论的证明都直接依赖于三角不等式与极限定义,本质并不复杂。真正稍有技术含量的是乘法。
定理 7.2(乘法)
若
a n → a , b n → b , a_n\to a,\qquad b_n\to b, a n → a , b n → b ,
则
a n b n → a b . a_nb_n\to ab. a n b n → ab .
证明
将差值拆开:
a n b n − a b = a n ( b n − b ) + b ( a n − a ) . a_nb_n-ab=a_n(b_n-b)+b(a_n-a). a n b n − ab = a n ( b n − b ) + b ( a n − a ) .
由 a n → a a_n\to a a n → a 可知 { a n } \{a_n\} { a n } 有界,故存在 M > 0 M>0 M > 0 ,使得
∣ a n ∣ ≤ M . |a_n|\le M. ∣ a n ∣ ≤ M .
于是
∣ a n b n − a b ∣ ≤ ∣ a n ∣ ∣ b n − b ∣ + ∣ b ∣ ∣ a n − a ∣ ≤ M ∣ b n − b ∣ + ∣ b ∣ ∣ a n − a ∣ . |a_nb_n-ab|
\le |a_n||b_n-b|+|b||a_n-a|
\le M|b_n-b|+|b||a_n-a|. ∣ a n b n − ab ∣ ≤ ∣ a n ∣∣ b n − b ∣ + ∣ b ∣∣ a n − a ∣ ≤ M ∣ b n − b ∣ + ∣ b ∣∣ a n − a ∣.
右端两项均趋于 0 0 0 ,故
a n b n → a b . a_nb_n\to ab. a n b n → ab .
定理 7.3(除法)
若
a n → a , b n → b , b ≠ 0 , a_n\to a,\qquad b_n\to b,\qquad b\neq 0, a n → a , b n → b , b = 0 ,
且从某一项起 b n ≠ 0 b_n\neq 0 b n = 0 ,则
a n b n → a b . \frac{a_n}{b_n}\to \frac{a}{b}. b n a n → b a .
这个结论最容易被滥用。分母极限不为零不是装饰条件,而是关键条件。因为只要分母趋于零,倒数就可能整体失控。例如
1 1 / n = n → ∞ . \frac1{1/n}=n\to\infty. 1/ n 1 = n → ∞.
分析学从不允许“形式上看着像”代替条件检查。
定理 7.4(绝对值)
若 a n → a a_n\to a a n → a ,则
∣ a n ∣ → ∣ a ∣ . |a_n|\to |a|. ∣ a n ∣ → ∣ a ∣.
证明
利用不等式
∣ ∣ a n ∣ − ∣ a ∣ ∣ ≤ ∣ a n − a ∣ , \big||a_n|-|a|\big|\le |a_n-a|, ∣ a n ∣ − ∣ a ∣ ≤ ∣ a n − a ∣ ,
右端趋于 0 0 0 ,故结论成立。
8. 无穷小、无穷大与夹逼原理
定义 8.1(无穷小数列)
若
则称 { a n } \{a_n\} { a n } 为无穷小数列 。
这个术语十分自然,因为任何收敛都可以写成“极限值 + 一个趋于零的误差”。也就是说,
a n → a ⟺ a n = a + α n , α n → 0. a_n\to a
\quad\Longleftrightarrow\quad
a_n=a+\alpha_n,\ \alpha_n\to 0. a n → a ⟺ a n = a + α n , α n → 0.
所以极限理论归根到底都在处理“误差能否压到零”。
性质 8.2(无穷小的运算)
若 α n , β n \alpha_n,\beta_n α n , β n 都是无穷小,则
α n ± β n → 0 , c α n → 0. \alpha_n\pm\beta_n\to 0,\qquad c\alpha_n\to 0. α n ± β n → 0 , c α n → 0.
若 { β n } \{\beta_n\} { β n } 有界,则
α n β n → 0. \alpha_n\beta_n\to 0. α n β n → 0.
这些性质看似平常,实际上在整章中反复出现。分析学里大量证明,无非是在把一个复杂对象拆成“有界量”与“无穷小”的组合。
定义 8.3(趋于无穷大)
若对任意 M > 0 M>0 M > 0 ,存在 N N N ,使得当 n > N n>N n > N 时,
则称
a n → + ∞ . a_n\to +\infty. a n → + ∞.
类似可定义 a n → − ∞ a_n\to-\infty a n → − ∞ 以及 ∣ a n ∣ → ∞ |a_n|\to\infty ∣ a n ∣ → ∞ 。
这些概念看似只是术语变化,实际上是把“没有有限极限,但有明确逃逸方向”的行为也纳入了分析框架。数学分析从不害怕无穷,它只害怕没有定义的无穷。
性质 8.4(无穷大的基本性质)
若 a n → + ∞ a_n\to+\infty a n → + ∞ ,则从某一项起 a n > 0 a_n>0 a n > 0 ,且
1 a n → 0. \frac1{a_n}\to 0. a n 1 → 0.
反过来,若从某一项起 a n > 0 a_n>0 a n > 0 且
1 a n → 0 , \frac1{a_n}\to 0, a n 1 → 0 ,
则
a n → + ∞ . a_n\to+\infty. a n → + ∞.
定理 8.5(夹逼定理)
若从某一项起有
a n ≤ b n ≤ c n , a_n\le b_n\le c_n, a n ≤ b n ≤ c n ,
且
lim n → ∞ a n = lim n → ∞ c n = a , \lim_{n\to\infty}a_n=\lim_{n\to\infty}c_n=a, n → ∞ lim a n = n → ∞ lim c n = a ,
则
lim n → ∞ b n = a . \lim_{n\to\infty}b_n=a. n → ∞ lim b n = a .
夹逼原理的意味非常深:它告诉我们,极限并不总是靠“直接算”得到,很多时候是靠序关系“围”出来的。一个对象本身太难控制时,只要它夹在两个可控对象之间,就仍然能被极限理论制服。
例如
lim n → ∞ sin n n = 0 \lim_{n\to\infty}\frac{\sin n}{n}=0 n → ∞ lim n sin n = 0
并不是因为 sin n \sin n sin n 本身好处理,恰恰相反,sin n \sin n sin n 的震荡让它很难直接谈“趋于某值”;但由于
− 1 ≤ sin n ≤ 1 , -1\le \sin n\le 1, − 1 ≤ sin n ≤ 1 ,
所以
− 1 n ≤ sin n n ≤ 1 n , -\frac1n\le \frac{\sin n}{n}\le \frac1n, − n 1 ≤ n sin n ≤ n 1 ,
两侧都趋于 0 0 0 ,于是中间也趋于 0 0 0 。
这很像现实中的判断:当你无法直接测出某件事的精确值时,只要你能不断把它夹在越来越窄的上下界之间,它的真实位置就被唯一地逼出来了。
9. 单调数列:顺序结构第一次直接触及完备性
定义 9.1(单调数列)
若对一切 n n n 都有
a n ≤ a n + 1 , a_n\le a_{n+1}, a n ≤ a n + 1 ,
则称 { a n } \{a_n\} { a n } 为单调递增数列;若
a n ≥ a n + 1 , a_n\ge a_{n+1}, a n ≥ a n + 1 ,
则称其为单调递减数列。
单调性意味着数列有方向:要么一直向上,要么一直向下。可仅有方向还不够,真正产生极限的是“方向 + 约束”。于是我们得到整章最关键的定理之一。
定理 9.2(单调有界收敛定理)
若数列 { a n } \{a_n\} { a n } 单调递增且有上界,则 { a n } \{a_n\} { a n } 收敛;其极限恰为集合
E = { a n : n ∈ N ∗ } E=\{a_n:n\in\mathbb{N}^*\} E = { a n : n ∈ N ∗ }
的上确界:
lim n → ∞ a n = sup E . \lim_{n\to\infty}a_n=\sup E. n → ∞ lim a n = sup E .
类似地,单调递减且有下界的数列必收敛到其下确界。
证明
设 { a n } \{a_n\} { a n } 单调递增且有上界,令
任取 ε > 0 \varepsilon>0 ε > 0 。由于 a a a 是上确界,a − ε a-\varepsilon a − ε 不可能仍是 E E E 的上界,因此存在 N N N ,使得
a N > a − ε . a_N>a-\varepsilon. a N > a − ε .
又因 { a n } \{a_n\} { a n } 单调递增,所以对一切 n ≥ N n\ge N n ≥ N ,有
a − ε < a N ≤ a n ≤ a . a-\varepsilon<a_N\le a_n\le a. a − ε < a N ≤ a n ≤ a .
于是
∣ a n − a ∣ < ε . |a_n-a|<\varepsilon. ∣ a n − a ∣ < ε .
故
这一定理表面上讲的是数列,实则第一次正面使用了实数完备性的核心工具——上确界存在性 。它告诉我们:只要一个数列一直往上走,但又始终被压在某个天花板以下,那么它不会在空中悬着不落;它必定逼近一个确切高度,而这个高度就是上确界。
把这件事放在生活里并不难想象。一个人沿着楼梯不断往上走,但楼顶是封死的。你不会相信他能永远“上升”而又永远不“接近某个高度”;如果他真的一直上升又上不去楼顶,那他就必然在某个极限高度附近越来越挤。这种“不会悬空”的性质,正是实数完备性的影子。
10. 闭区间套:点不会凭空消失
数列之外,还有另一种表现完备性的方式,那就是区间套思想。
定理 10.1(闭区间套定理)
设
I n = [ a n , b n ] ( n = 1 , 2 , … ) I_n=[a_n,b_n]\qquad (n=1,2,\dots) I n = [ a n , b n ] ( n = 1 , 2 , … )
满足
I n + 1 ⊂ I n , I n ≠ ∅ . I_{n+1}\subset I_n,\qquad I_n\neq\varnothing. I n + 1 ⊂ I n , I n = ∅ .
则
⋂ n = 1 ∞ I n ≠ ∅ . \bigcap_{n=1}^{\infty}I_n\neq\varnothing. n = 1 ⋂ ∞ I n = ∅ .
若再有
b n − a n → 0 , b_n-a_n\to 0, b n − a n → 0 ,
则该交集只含一个点。
这一定理的几何直觉极其自然:一层一层往里缩的闭区间,不可能把点全部“挤没”;如果区间长度还趋于零,那么最后留下的只能是唯一一点。
可它真正重要之处不在几何,而在逻辑。它说明:在实数轴上,只要你不断缩小封闭范围,并且每一步都不让对象逃走,那么最终一定能锁定某个点 。分析学里很多存在性证明,本质上都在重复这一模式:先构造一串越来越小的合法区域,再用完备性保证目标对象没有消失。
11. 有界数列中的收敛结构:Bolzano–Weierstrass 定理
到这里,一个自然问题出现了:有界但不收敛的数列怎么办?例如
a n = ( − 1 ) n a_n=(-1)^n a n = ( − 1 ) n
就是有界的,但它不收敛。难道有界性就完全失去价值了吗?当然不是。
定理 11.1(Bolzano–Weierstrass)
任一有界数列必有收敛子列。
这个结论非常有力量。它告诉我们:哪怕整个数列看起来摇摆、震荡、拒绝统一,但只要它被限制在有限范围内,内部就一定埋着某条收敛轨道。整体可能混乱,局部却不能完全无序;有界性不足以保证全局收敛,却足以保证局部收敛结构的存在。
例如对于
a n = ( − 1 ) n , a_n=(-1)^n, a n = ( − 1 ) n ,
偶数项子列恒为 1 1 1 ,奇数项子列恒为 − 1 -1 − 1 。它本身不收敛,但它的内部结构并不空洞,而是清楚地分裂成两条稳定轨道。
分析学在这里透露出一种非常深的思想:当你无法控制整个对象时,可以先控制其中的一部分,再用“抽取子列”的方式保存长期行为。 这不仅适用于实数数列,后来在函数列、测度论、泛函分析里都会不断重现。
12. Cauchy 收敛准则:不先知道极限,也能判断收敛
极限定义有一个天然的不便:它预先假设你已经知道极限 a a a 是谁。但在很多问题里,我们根本不知道极限值,只想知道“它到底有没有极限”。这就引出了分析学最典型的“内部判据”。
定义 12.1(Cauchy 数列)
若对任意 ε > 0 \varepsilon>0 ε > 0 ,存在 N N N ,使得当 m , n > N m,n>N m , n > N 时,
∣ a n − a m ∣ < ε , |a_n-a_m|<\varepsilon, ∣ a n − a m ∣ < ε ,
则称 { a n } \{a_n\} { a n } 为 Cauchy 数列 。
Cauchy 条件不再问“它靠近谁”,而是只问“它后面的项彼此是否越来越靠近”。这就像一群人向某个未知地点移动,我们暂时不知道终点在哪,但如果他们在足够后面已经始终彼此靠得非常近,那就说明整个队伍的行为已经稳定了。
定理 12.2(Cauchy 收敛准则)
在实数域 R \mathbb{R} R 中,数列收敛当且仅当它是 Cauchy 数列。
证明思路
“收敛 ⇒ \Rightarrow ⇒ Cauchy” 很直接。若 a n → a a_n\to a a n → a ,则当 m , n m,n m , n 都足够大时,
∣ a n − a m ∣ ≤ ∣ a n − a ∣ + ∣ a m − a ∣ , |a_n-a_m|\le |a_n-a|+|a_m-a|, ∣ a n − a m ∣ ≤ ∣ a n − a ∣ + ∣ a m − a ∣ ,
右端可同时做得任意小。
真正深刻的是“Cauchy ⇒ \Rightarrow ⇒ 收敛”。这在有理数域 Q \mathbb{Q} Q 中并不成立,但在 R \mathbb{R} R 中成立。其证明通常分两步:先由 Cauchy 性推出有界,再由 Bolzano–Weierstrass 定理抽出一个收敛子列,最后利用 Cauchy 条件把整个原列强行拉向同一极限。
这件事几乎可以被视为“实数完备性”的另一种定义。因为它说的正是:只要一个过程在内部已经稳定了,实数就一定给它一个真正的归宿。
13. 上界、下界、上确界、下确界与实数的完备性
前面已经多次使用“上确界”这个概念,现在应当把它正式说清楚。
定义 13.1(上界与下界)
设 E ⊂ R E\subset\mathbb{R} E ⊂ R 。若存在实数 M M M ,使得对一切 x ∈ E x\in E x ∈ E ,有
则称 M M M 是 E E E 的一个上界。若存在实数 m m m ,使得对一切 x ∈ E x\in E x ∈ E ,有
则称 m m m 是 E E E 的一个下界。
定义 13.2(上确界与下确界)
若 E E E 非空且有上界,则所有上界中最小的那个数称为 E E E 的上确界 ,记作
若 E E E 非空且有下界,则所有下界中最大的那个数称为 E E E 的下确界 ,记作
数学分析里,真正重要的不是“上界”本身,而是:只要集合非空且有上界,上确界就存在于实数中。 这正是实数完备性的经典表述之一。它保证了“最接近上边界但又不一定属于集合”的那个数不会缺席。
这件事在 Q \mathbb{Q} Q 中是会失败的。比如集合
E = { x ∈ Q : x 2 < 2 } E=\{x\in\mathbb{Q}:x^2<2\} E = { x ∈ Q : x 2 < 2 }
在有理数域里有上界,但没有有理上确界。因为真正应该充当边界的是 2 \sqrt2 2 ,而 2 ∉ Q \sqrt2\notin\mathbb{Q} 2 ∈ / Q 。这正说明有理数并不完备,而实数之所以能承载极限理论,正是因为它把这种“边界缺位”补齐了。
14. 阿基米德性质与有理数的稠密性
实数除了完备性之外,还有两个在分析中经常默认使用、但非常值得单独说清楚的基础性质:阿基米德性质与有理数的稠密性。它们分别说明:实数系里不存在“无限大”或“无限小”的神秘数层级;同时,在任意两个不同实数之间,总能插入一个有理数。
定理 14.1(阿基米德性质)
对任意实数 x x x ,都存在正整数 n n n ,使得
等价地说,对任意正实数 ε > 0 \varepsilon>0 ε > 0 ,都存在正整数 n n n ,使得
1 n < ε . \frac1n<\varepsilon. n 1 < ε .
证明
反设存在某个实数 x x x ,使得对一切正整数 n n n 都有
则正整数集
N ∗ = { 1 , 2 , 3 , … } \mathbb N^*=\{1,2,3,\dots\} N ∗ = { 1 , 2 , 3 , … }
是一个非空且有上界的集合。由上确界原理,设
a = sup N ∗ . a=\sup \mathbb N^*. a = sup N ∗ .
于是 a − 1 a-1 a − 1 不可能仍是上界,因此存在正整数 m m m ,使得
于是
但 m + 1 m+1 m + 1 仍是正整数,这与 a a a 是正整数集的上界矛盾。故原假设不成立,命题得证。
阿基米德性质的意义很深。它保证自然数不会被某个有限实数“全部压住”,也保证 1 / n 1/n 1/ n 的确可以无限趋小。许多极限论证中“取 n n n 足够大”这件事,背后其实都在使用这条性质。
定理 14.2(有理数的稠密性)
若 a , b ∈ R a,b\in\mathbb R a , b ∈ R 且 a < b a<b a < b ,则存在有理数 r ∈ Q r\in\mathbb Q r ∈ Q ,使得
证明
由 b − a > 0 b-a>0 b − a > 0 及阿基米德性质,存在正整数 n n n ,使得
1 n < b − a . \frac1n<b-a. n 1 < b − a .
于是
再由整数的基本性质,可取整数 m m m 满足
令
r = m n , r=\frac{m}{n}, r = n m ,
则 r ∈ Q r\in\mathbb Q r ∈ Q ,且
故命题成立。
这条定理说明:有理数虽然只是实数中的一部分,但它在实数轴上分布得极其“密”。你无论在两点之间留下多窄的缝隙,都一定能塞进一个有理数。
这也是为什么分析学里常常可以先在有理数层面做逼近,再把结论推广到实数层面。稠密性所表达的,不是“有理数已经够用”,而是“有理数可以作为逼近实数的骨架”。
推论 14.3
若 a < b a<b a < b ,则不仅存在有理数 r r r 使得 a < r < b a<r<b a < r < b ,也存在无理数 ξ \xi ξ 使得
这说明实数轴上的任一区间都同时包含有理数与无理数。连续统并不是由某一类数孤立构成的,而是两者以极细密的方式交织在一起。
15. 开覆盖、有限覆盖与 Lebesgue 数:紧性的另一种语言
定义 15.1(开覆盖)
设 E ⊂ R E\subset\mathbb{R} E ⊂ R 。若一族开集 { G λ } λ ∈ Λ \{G_\lambda\}_{\lambda\in\Lambda} { G λ } λ ∈ Λ 满足
E ⊂ ⋃ λ ∈ Λ G λ , E\subset \bigcup_{\lambda\in\Lambda}G_\lambda, E ⊂ λ ∈ Λ ⋃ G λ ,
则称这族开集为 E E E 的一个开覆盖。
定理 15.2(有限覆盖定理,Heine–Borel)
闭区间 [ a , b ] [a,b] [ a , b ] 的任一开覆盖都存在有限子覆盖。也就是说,若
[ a , b ] ⊂ ⋃ λ ∈ Λ G λ , [a,b]\subset \bigcup_{\lambda\in\Lambda}G_\lambda, [ a , b ] ⊂ λ ∈ Λ ⋃ G λ ,
其中每个 G λ G_\lambda G λ 都是开集,则存在有限多个指标 λ 1 , … , λ m \lambda_1,\dots,\lambda_m λ 1 , … , λ m ,使得
[ a , b ] ⊂ G λ 1 ∪ ⋯ ∪ G λ m . [a,b]\subset G_{\lambda_1}\cup\cdots\cup G_{\lambda_m}. [ a , b ] ⊂ G λ 1 ∪ ⋯ ∪ G λ m .
这个定理说明闭区间不仅是有界的,而且在拓扑意义下是“紧”的。它与单调有界收敛、区间套定理、Bolzano–Weierstrass 定理、Cauchy 收敛准则在本质上属于同一层次,都是实数完备性的不同面相。
定义 15.3(Lebesgue 数)
设 U \mathcal U U 是集合 E E E 的一个开覆盖。若存在 δ > 0 \delta>0 δ > 0 ,使得对任意 x ∈ E x\in E x ∈ E ,都存在某个 U ∈ U U\in\mathcal U U ∈ U 满足
( x − δ , x + δ ) ∩ E ⊂ U , (x-\delta,x+\delta)\cap E\subset U, ( x − δ , x + δ ) ∩ E ⊂ U ,
则称 δ \delta δ 为开覆盖 U \mathcal U U 的一个 Lebesgue 数。
引理 15.4(Lebesgue 数引理)
闭区间 [ a , b ] [a,b] [ a , b ] 的任一开覆盖都存在 Lebesgue 数。
Lebesgue 数引理表达的是一种更细致的紧性:不仅整个区间能被有限个开集覆盖,而且还存在一个统一的尺度,使得足够短的局部区间必然完整落入某个覆盖集之中。分析学的很多局部—整体论证,正是依赖这种“存在统一尺度”的性质。
16. 极限点、上极限与下极限:当数列不收敛时,还能说什么
定义 16.1(极限点)
设 E ⊂ R E\subset\mathbb{R} E ⊂ R 。若对任意 ε > 0 \varepsilon>0 ε > 0 ,开区间
( x − ε , x + ε ) (x-\varepsilon,x+\varepsilon) ( x − ε , x + ε )
内总存在一点 y ∈ E y\in E y ∈ E 且 y ≠ x y\neq x y = x ,则称 x x x 为集合 E E E 的一个极限点。
这个概念看似属于点集论,实际上与数列语言完全相通:一个点是集合的极限点,当且仅当可以在集合中取出一个收敛到它而又不恒等于它的数列。
不是每个数列都收敛,但分析学不会因此沉默。对于一般数列,我们仍希望刻画它尾部的长期振荡范围,这就引出了上极限与下极限。
定义 16.2(上极限与下极限)
设
E n = { a n , a n + 1 , a n + 2 , … } , E_n=\{a_n,a_{n+1},a_{n+2},\dots\}, E n = { a n , a n + 1 , a n + 2 , … } ,
并记
α n = inf E n , β n = sup E n . \alpha_n=\inf E_n,\qquad \beta_n=\sup E_n. α n = inf E n , β n = sup E n .
由于尾集 E n E_n E n 随 n n n 增大而缩小,所以 { α n } \{\alpha_n\} { α n } 单调递增,{ β n } \{\beta_n\} { β n } 单调递减。于是可以定义
lim inf n → ∞ a n = lim n → ∞ α n , lim sup n → ∞ a n = lim n → ∞ β n . \liminf_{n\to\infty}a_n=\lim_{n\to\infty}\alpha_n,\qquad
\limsup_{n\to\infty}a_n=\lim_{n\to\infty}\beta_n. n → ∞ lim inf a n = n → ∞ lim α n , n → ∞ lim sup a n = n → ∞ lim β n .
它们分别表示:从某一项以后看,数列尾巴能长期保持的最低水平与最高水平。
这个定义十分精巧。它不是盯着每一项的瞬时波动,而是在看“尾部整体还能到哪儿”。因此它非常适合描述震荡数列。例如
a n = ( − 1 ) n , a_n=(-1)^n, a n = ( − 1 ) n ,
则
lim sup n → ∞ a n = 1 , lim inf n → ∞ a n = − 1. \limsup_{n\to\infty}a_n=1,\qquad
\liminf_{n\to\infty}a_n=-1. n → ∞ lim sup a n = 1 , n → ∞ lim inf a n = − 1.
这恰好说明它的尾部始终在 − 1 -1 − 1 与 1 1 1 之间跳动,并且永远不会塌缩到一个点。
定理 16.3
总有
lim inf n → ∞ a n ≤ lim sup n → ∞ a n . \liminf_{n\to\infty}a_n\le \limsup_{n\to\infty}a_n. n → ∞ lim inf a n ≤ n → ∞ lim sup a n .
并且
a n 收敛 ⟺ lim inf n → ∞ a n = lim sup n → ∞ a n . a_n\ \text{收敛}
\quad\Longleftrightarrow\quad
\liminf_{n\to\infty}a_n=\limsup_{n\to\infty}a_n. a n 收敛 ⟺ n → ∞ lim inf a n = n → ∞ lim sup a n .
这一定理非常漂亮。因为它告诉我们,数列收敛的本质,就是尾部振荡区间最终缩成一个点。若这个区间还保留正长度,数列就仍在摇摆;只有上下边界最终合并,极限才真正诞生。
定理 16.4(上下极限与子列极限)
若数列 { a n } \{a_n\} { a n } 有界,则存在子列 { a n k } \{a_{n_k}\} { a n k } 与 { a m k } \{a_{m_k}\} { a m k } ,使得
a n k → lim sup n → ∞ a n , a m k → lim inf n → ∞ a n . a_{n_k}\to \limsup_{n\to\infty}a_n,\qquad a_{m_k}\to \liminf_{n\to\infty}a_n. a n k → n → ∞ lim sup a n , a m k → n → ∞ lim inf a n .
换言之,上极限与下极限本身一定是原数列的子列极限。
定理 16.5(任意子列极限的夹持)
若 q q q 是数列 { a n } \{a_n\} { a n } 的任一子列极限,则
lim inf n → ∞ a n ≤ q ≤ lim sup n → ∞ a n . \liminf_{n\to\infty}a_n\le q\le \limsup_{n\to\infty}a_n. n → ∞ lim inf a n ≤ q ≤ n → ∞ lim sup a n .
定理 16.6(上下极限的常用性质)
对任意实数列 { a n } , { b n } \{a_n\},\{b_n\} { a n } , { b n } ,有
lim sup n → ∞ ( − a n ) = − lim inf n → ∞ a n , lim inf n → ∞ ( − a n ) = − lim sup n → ∞ a n . \limsup_{n\to\infty}(-a_n)=-\liminf_{n\to\infty}a_n,\qquad
\liminf_{n\to\infty}(-a_n)=-\limsup_{n\to\infty}a_n. n → ∞ lim sup ( − a n ) = − n → ∞ lim inf a n , n → ∞ lim inf ( − a n ) = − n → ∞ lim sup a n .
若从某一项起 a n ≤ b n a_n\le b_n a n ≤ b n ,则
lim sup n → ∞ a n ≤ lim sup n → ∞ b n , lim inf n → ∞ a n ≤ lim inf n → ∞ b n . \limsup_{n\to\infty}a_n\le \limsup_{n\to\infty}b_n,\qquad
\liminf_{n\to\infty}a_n\le \liminf_{n\to\infty}b_n. n → ∞ lim sup a n ≤ n → ∞ lim sup b n , n → ∞ lim inf a n ≤ n → ∞ lim inf b n .
并且
lim sup n → ∞ ( a n + b n ) ≤ lim sup n → ∞ a n + lim sup n → ∞ b n , \limsup_{n\to\infty}(a_n+b_n)\le \limsup_{n\to\infty}a_n+\limsup_{n\to\infty}b_n, n → ∞ lim sup ( a n + b n ) ≤ n → ∞ lim sup a n + n → ∞ lim sup b n ,
lim inf n → ∞ ( a n + b n ) ≥ lim inf n → ∞ a n + lim inf n → ∞ b n . \liminf_{n\to\infty}(a_n+b_n)\ge \liminf_{n\to\infty}a_n+\liminf_{n\to\infty}b_n. n → ∞ lim inf ( a n + b n ) ≥ n → ∞ lim inf a n + n → ∞ lim inf b n .
若 c n → c c_n\to c c n → c ,则
lim sup n → ∞ ( a n + c n ) = lim sup n → ∞ a n + c , lim inf n → ∞ ( a n + c n ) = lim inf n → ∞ a n + c . \limsup_{n\to\infty}(a_n+c_n)=\limsup_{n\to\infty}a_n+c,\qquad
\liminf_{n\to\infty}(a_n+c_n)=\liminf_{n\to\infty}a_n+c. n → ∞ lim sup ( a n + c n ) = n → ∞ lim sup a n + c , n → ∞ lim inf ( a n + c n ) = n → ∞ lim inf a n + c .
这些性质说明,上下极限虽然服务于发散数列,但并未失去代数结构;相反,它们以一种更柔性的方式保存了极限运算的骨架。
17. Stolz 定理:数列极限中的“离散洛必达法则”
在具体计算中,某些数列极限看起来很难直接处理,特别是分子分母都以求和、递推或幂次形式给出时,这时一个非常有力的工具便是 Stolz 定理。
定理 17.1(Stolz)
设 { b n } \{b_n\} { b n } 严格单调增加且
b n → + ∞ . b_n\to+\infty. b n → + ∞.
若极限
lim n → ∞ a n − a n − 1 b n − b n − 1 = A \lim_{n\to\infty}\frac{a_n-a_{n-1}}{b_n-b_{n-1}}=A n → ∞ lim b n − b n − 1 a n − a n − 1 = A
存在,则
lim n → ∞ a n b n = A . \lim_{n\to\infty}\frac{a_n}{b_n}=A. n → ∞ lim b n a n = A .
这一定理本质上是在说:对于离散对象,如果整体比值难算,可以先看“相邻增量”的比值。它很像微积分中的洛必达法则,只不过后者面向连续变量,而 Stolz 面向数列。
推论 17.2(上下极限形式)
在上述条件下,还成立
lim inf n → ∞ a n − a n − 1 b n − b n − 1 ≤ lim inf n → ∞ a n b n ≤ lim sup n → ∞ a n b n ≤ lim sup n → ∞ a n − a n − 1 b n − b n − 1 . \liminf_{n\to\infty}\frac{a_n-a_{n-1}}{b_n-b_{n-1}}
\le
\liminf_{n\to\infty}\frac{a_n}{b_n}
\le
\limsup_{n\to\infty}\frac{a_n}{b_n}
\le
\limsup_{n\to\infty}\frac{a_n-a_{n-1}}{b_n-b_{n-1}}. n → ∞ lim inf b n − b n − 1 a n − a n − 1 ≤ n → ∞ lim inf b n a n ≤ n → ∞ lim sup b n a n ≤ n → ∞ lim sup b n − b n − 1 a n − a n − 1 .
这个推论说明,即使差商极限不存在,差商的上下极限也仍足以控制原比值的上下极限。
例如求
lim n → ∞ 1 + 2 + ⋯ + n n 2 , \lim_{n\to\infty}\frac{1+2+\cdots+n}{n^2}, n → ∞ lim n 2 1 + 2 + ⋯ + n ,
若硬用求和公式当然也能做,但用 Stolz 更能看出结构。令
a n = 1 + 2 + ⋯ + n , b n = n 2 , a_n=1+2+\cdots+n,\qquad b_n=n^2, a n = 1 + 2 + ⋯ + n , b n = n 2 ,
则
a n − a n − 1 b n − b n − 1 = n 2 n − 1 → 1 2 . \frac{a_n-a_{n-1}}{b_n-b_{n-1}}
=\frac{n}{2n-1}\to\frac12. b n − b n − 1 a n − a n − 1 = 2 n − 1 n → 2 1 .
故
lim n → ∞ 1 + 2 + ⋯ + n n 2 = 1 2 . \lim_{n\to\infty}\frac{1+2+\cdots+n}{n^2}=\frac12. n → ∞ lim n 2 1 + 2 + ⋯ + n = 2 1 .
分析学中好的工具往往不是“更复杂”,而是“更贴结构”。Stolz 定理之所以漂亮,就在于它抓住了离散增长的本质。
18. 常数 e e e 的出现:极限如何生出新的数
在数列极限这一章里,最著名的常数大概就是
e = lim n → ∞ ( 1 + 1 n ) n . e=\lim_{n\to\infty}\left(1+\frac1n\right)^n. e = n → ∞ lim ( 1 + n 1 ) n .
这不是一个凭空定义的神秘数,而是无穷逼近在最自然情形下自动长出来的常数。它出现在复利问题中,出现在指数函数与对数函数中,出现在微分方程与幂级数中。可以说,e e e 是“连续增长”这一观念的数值化身。
从分析上看,需要先证明
( 1 + 1 n ) n \left(1+\frac1n\right)^n ( 1 + n 1 ) n
确实收敛。常见做法是证明它单调递增且有上界,因此由单调有界收敛定理知其极限存在。这个极限记作 e e e 。
更进一步,还可以证明
e = ∑ k = 0 ∞ 1 k ! . e=\sum_{k=0}^\infty\frac1{k!}. e = k = 0 ∑ ∞ k ! 1 .
这说明 e e e 并不是只属于某一种定义方式,而是在不同分析结构中反复以同一面目出现。一个真正重要的数学常数,往往都有这种“多重定义最终会合”的性质。
定理 18.1(e e e 的无理性)
自然常数 e e e 是无理数。
证明
反设
其中 p , q p,q p , q 为正整数。由
e = ∑ k = 0 ∞ 1 k ! e=\sum_{k=0}^{\infty}\frac1{k!} e = k = 0 ∑ ∞ k ! 1
得
q ! e = ∑ k = 0 q q ! k ! + ∑ k = q + 1 ∞ q ! k ! . q!e=\sum_{k=0}^{q}\frac{q!}{k!}+\sum_{k=q+1}^{\infty}\frac{q!}{k!}. q ! e = k = 0 ∑ q k ! q ! + k = q + 1 ∑ ∞ k ! q ! .
第一项是整数。记第二项为 R R R ,则
0 < R < ∑ m = 1 ∞ 1 ( q + 1 ) m = 1 q < 1. 0<R<\sum_{m=1}^{\infty}\frac1{(q+1)^m}=\frac1q<1. 0 < R < m = 1 ∑ ∞ ( q + 1 ) m 1 = q 1 < 1.
于是 q ! e q!e q ! e 介于某个整数与其后继整数之间,不可能为整数;但另一方面
q ! e = q ! ⋅ p q = p ( q − 1 ) ! q!e=q!\cdot\frac pq=p(q-1)! q ! e = q ! ⋅ q p = p ( q − 1 )!
明明是整数,矛盾。故 e e e 为无理数。
这个证明极为典型。它不依赖繁复技巧,而是通过一个非常精细的余项估计,把“整性”与“严格介于两整数之间”直接对撞。分析学最漂亮的证明,常常正具有这种锋利而克制的气质。
19. [ 0 , 1 ] [0,1] [ 0 , 1 ] 的不可数性:实数的丰度
定理 19.1
闭区间 [ 0 , 1 ] [0,1] [ 0 , 1 ] 上的点集不可数。
证明(Cantor 对角线法)
反设 [ 0 , 1 ] [0,1] [ 0 , 1 ] 可数,则其中所有点都可排成一列
x 1 , x 2 , x 3 , … x_1,x_2,x_3,\dots x 1 , x 2 , x 3 , …
并将每个 x n x_n x n 写成十进制小数
x n = 0. a n 1 a n 2 a n 3 ⋯ x_n=0.a_{n1}a_{n2}a_{n3}\cdots x n = 0. a n 1 a n 2 a n 3 ⋯
这里约定总取不以无限个 9 9 9 结尾的表示。现构造一个新数
y = 0. b 1 b 2 b 3 ⋯ y=0.b_1b_2b_3\cdots y = 0. b 1 b 2 b 3 ⋯
其中对每个 n n n ,令
b n = { 1 , a n n ≠ 1 , 2 , a n n = 1. b_n=
\begin{cases}
1,& a_{nn}\neq 1,\\
2,& a_{nn}=1.
\end{cases} b n = { 1 , 2 , a nn = 1 , a nn = 1.
于是 y ∈ [ 0 , 1 ] y\in[0,1] y ∈ [ 0 , 1 ] ,且对每个 n n n ,y y y 的第 n n n 位小数与 x n x_n x n 的第 n n n 位不同,所以
y ≠ x n ( ∀ n ) . y\neq x_n\qquad (\forall n). y = x n ( ∀ n ) .
这与“x 1 , x 2 , x 3 , … x_1,x_2,x_3,\dots x 1 , x 2 , x 3 , … 已经列出了 [ 0 , 1 ] [0,1] [ 0 , 1 ] 中全部点”矛盾。故 [ 0 , 1 ] [0,1] [ 0 , 1 ] 不可数。
这个定理表明,实数集的丰富程度远远超过自然数与有理数。分析学中的连续性、极限点、紧性与完备性,正是建立在这样一种不可数而稠密的对象之上。
20. Dedekind 分割与完备性的几种等价面孔
定义 20.1(Dedekind 分割)
设 Q = A ∪ B \mathbb Q=A\cup B Q = A ∪ B ,其中 A , B A,B A , B 非空,满足
A ∩ B = ∅ , A\cap B=\varnothing, A ∩ B = ∅ ,
a < b ( ∀ a ∈ A , ∀ b ∈ B ) , a<b\qquad (\forall a\in A,\ \forall b\in B), a < b ( ∀ a ∈ A , ∀ b ∈ B ) ,
并且 A A A 中没有最大元,则称 ( A , B ) (A,B) ( A , B ) 为一个 Dedekind 分割。
Dedekind 分割的思想是:用有理数集的一次“无缝切开”来刻画一个实数的位置。若这个切口恰好落在有理数上,就对应某个有理数;若这个切口落在有理数体系无法填补的地方,就对应一个无理数。
定理 20.2
每一个 Dedekind 分割都唯一确定一个实数;反过来,每一个实数都唯一对应一个 Dedekind 分割。
定理 20.3(完备性诸命题的等价性)
在实数系中,下列命题彼此等价:
上确界原理 , \text{上确界原理}, 上确界原理 ,
单调有界收敛定理 , \text{单调有界收敛定理}, 单调有界收敛定理 ,
闭区间套定理 , \text{闭区间套定理}, 闭区间套定理 ,
Bolzano–Weierstrass 定理 , \text{Bolzano–Weierstrass 定理}, Bolzano–Weierstrass 定理 ,
Cauchy 收敛准则 , \text{Cauchy 收敛准则}, Cauchy 收敛准则 ,
有限覆盖定理 . \text{有限覆盖定理}. 有限覆盖定理 .
这些命题的表述方式不同:有的偏序结构,有的偏拓扑性质,有的偏数列语言;但它们共同刻画的是同一事实——实数系是完备的 。
21. 常见错误与分析学的分寸
这一章最常见的错误,不是不会算,而是逻辑分寸不到位。
第一类错误是量词顺序写错。极限定义中,“对任意 ε > 0 \varepsilon>0 ε > 0 ,存在 N N N ”这个顺序不可交换。一旦写成“存在 N N N ,使对任意 ε \varepsilon ε ”之类,整个命题就变了味。分析学最基本的训练,不是技巧,而是量词纪律。
第二类错误是把“有界”当成“收敛”。有界只是说不逃走,不代表会停下;( − 1 ) n (-1)^n ( − 1 ) n 永远在有限范围内震荡,却永远不给你极限。
第三类错误是只要看到子列收敛,就误以为原列收敛。子列揭示的是局部结构,不是整体命运。只有当所有可能的子列都被同一个值统治时,原列才可能真正收敛。
第四类错误是滥用极限运算,尤其在分母趋于零时照搬“商的极限等于极限的商”。分析学最忌讳形式主义,任何运算定理都必须逐条核对前提。
第五类错误是把直觉当证明。图像、感觉、经验、口头描述都可以帮助理解,但它们永远不能替代证明。数学分析最重要的气质之一,就是对“看起来差不多”的持续不信任。
22. 小结
实数理论与数列极限,是数学分析真正的开篇。它教给我们的不是几个零散公式,而是一整套处理无穷过程的语言。极限定义把“趋近”变成可检验的逻辑命题;极限运算说明这种语言可计算;单调有界收敛、闭区间套、Bolzano–Weierstrass、有限覆盖定理与 Cauchy 准则则从不同方向证明:在实数中,无穷逼近不是一句空话,而是可以抵达的对象;上极限下极限又进一步告诉我们,即使收敛失败,尾部行为依然能够被精确刻画。
所以这一章最应该记住的,不是某条单独的公式,而是这样一句话:数学分析中的极限理论,本质上是实数完备性在无穷过程中的展开。