数学基础系列:集合与数

209 阅读8分钟

本文旨在整理一些集合论中的基础概念与定理,主要出处见参考文献。

本文只列出特别简单的证明,略去复杂的证明。

1 集合论基础

首先,我们介绍Cartesian product(笛卡尔积、直积)A×BA\times B,就是从AA中、BB中各取一个元素组成的有序数对。如果是nn个集合,它们的Cartesian product就是一个nn-tuples:

×i=1nAi={(a1,,an):aiAi,i=1,,n}\times_{i=1}^n A_i = \{(a_1,\ldots,a_n):a_i\in A_i,i=1,\ldots,n\}

所谓Relation(关系),是A×AA\times A的任一子集,就叫a relation RR on set AA。如果(x,y)R(x,y)\in R,则可写为xRyxRyRR可能的性质有:

  • Reflexive(自反性):xRxxRx
  • Symmetric(对称性):若xRyxRy则必有yRxyRx
  • Antisymmetric(反对称):若xRyxRyyRxyRx,则必有x=yx=y
  • Transitive(传递性):若xRyxRyyRzyRz,则必有xRzxRz

Equivalence relation(等价关系),就是自反、对称、传递的关系。

给定AA上的一个equivalence relation RR,那么AA中的元素xxequivalence class(等价类),就是集合Ex={yA:xRy}E_x = \{y\in A:xRy\}。若ExE_xEyE_yxxyy的等价类,那么必有ExEy=E_x\cap E_y=\emptyEx=EyE_x=E_y

自反、反对称、传递的relation,就叫partial ordering(偏序),可以用符号\geq\leq表示。对于任意partial ordering,如果将其中的(x,x)(x,x)元素剔除,就变成了strict ordering,用符号>\gt<\lt表示,这种relation不再是自反的和反对称的,但依旧有传递性。如果对于集合AA,每一对(x,y)A×A(x,y)\in A\times A都满足x<yx\lt yx>yx\gt yx=yx=y这三种中的一种,那么称AAlinearly ordered。再进一步,定义集合AA的最小元素为aAa\in A,它满足xA,ax\forall x\in A, a\leq x(最大元素可类似定义),那么,如果linearly orderedAA的每一个子集都有一个最小元素,则称AAwell-ordered

一个mapping/transformation/function定义为T:XYT:X\mapsto Y,这是一种将XX中的每个元素与YY中唯一一个元素联系起来的规则。XX称为domain(定义域)YYcodomain(到达域),集合GT={(x,y):xX,y=T(x)}X×YG_T=\{(x,y):x\in X,y=T(x)\}\subseteq X\times Y称为graph of TT。集合T(A)={T(x):xA}YT(A)=\{T(x):x\in A\}\subseteq Y称为AATT下的image,对于BYB\subseteq Y,集合T1(B)={x:T(x)B}XT^{-1}(B)=\{x:T(x) \in B\}\subseteq X称为BBTT下的inverse image。集合T(X)T(X)称为TTrange(值域),若T(X)=YT(X)=Y则称该mapping为from XX onto YY,中文叫满射,否则是into YY。若每个yy都是唯一的xXx\in X的image,则该mapping是one-to-one,或记为11-11,中文叫单射。

XX中的每个元素与YY中不一定唯一的元素对应起来的规则,称为correspendence,T1T^{-1}就是一个correspendence,但未必是mapping。若mapping是11-11且是onto的,则称该mapping为one-to-one correspendence。如果在XXYY上都定义了partial ordering,那么如果对于一个mapping,T(x1)T(x2)T(x_1)\leq T(x_2)当且仅当x1x2x_1\leq x_2,就称该mapping为order-preserving。若XX是partial ordered,用\leq表示,那么一个11-11 mapping可以**induce(诱导)**在codomain上的一个partial ordering。若这个mapping还是onto,那么XX上的linear ordering可以induce一个YY上的linear ordering。

集合中的元素个数称为集合的cardinalitycardinal number(基数)。若AABB之间存在11-11 correspondence,那么两个集合equipotent(等势)

2 可数集合

将正自然数集合N+N^+的cardinal number记为\aleph。如果一个无限集合中的元素,与N+N^+中的元素存在111-1 correspondence,那么称该集合为countabledenumerable(可数的)。

整数集ZZ是可数的,因为对于任意nN+n\in N^+,让它对应于n/2(1)nZ\lfloor n/2\rfloor (-1)^n\in Z即可。

定理:有理数集QQ可数。

定理:The union of a countable collection of countable sets is a countable set.

注:Collection有的地方翻译为“搜集”,可理解为允许有重复元素的集合。

3 实数连续统

定理:实数集RR是不可数的。

RR的cardinal number为cc,则有<c\aleph<c

定理:任意开区间不可数。

定理:任意开区间与RR是equipotent的。

对于开区间(a,b)(a,b),将任意xRx\in R映射为y=a+b2+(ba)x2(1+x)y=\dfrac{a+b}{2}+\dfrac{(b-a)x}{2(1+|x|)}可证。

定理:实数平面R2=R×RR^2=R\times RRR是equipotent的。

定理:任意开区间都包含至少一个有理数。

对于开区间(a,b)(a,b),不妨假设a0a\geq 0,取qq为比1/(ba)1/(b-a)大的最小整数,取pp为比qbqb大的最小整数,则必有(p1)/q(a,b)(p-1)/q \in (a,b),而(p1)/qQ(p-1)/q \in Q

推论:Every collection of disjoint open intervals is countable.

因为每个开区间都至少包含一个有理数,这些不相连的开区间的collection可用其中每个开区间中的任一有理数建立对应关系,而有理数集是可数的。

下面再介绍一些有关集合的定义。集合ARA\subset R的supremum,如果存在,就是对于任意xAx\in A都满足xyx\leq y的最小的yy,可写为supA\sup A;反之可定义集合AA的infimum,写为infA\inf A。对于RR的某个子集,如果有上界,必有supremum,如果有下界,必有infimum。若定义extended real line Rˉ=R{,+}\bar R=R\cup \{-\infty,+\infty\}(即将无穷大也看作一个元素),那么所有集合都有supremum和infimum。另外记Rˉ+=R{+}\bar R^+=R\cup\{+\infty\}

4 集合的序列

Monotone sequence(单调序列)就是non-decreasing(指n,AnAn+1\forall n, A_n\subseteq A_{n+1})或non-increasingn,AnAn+1\forall n, A_{n}\supseteq A_{n+1})的序列,也有严格的单调序列,即将包含关系换成严格包含关系\subset\supset

序列的limit(极限)AA,就是对于non-decreasing序列的A=n=1AnA=\cup_{n=1}^{\infty}A_n,或对于non-increasing序列的A=n=1AnA=\cap_{n=1}^{\infty}A_n,分别可写为AnAA_n\uparrow AAnAA_n\downarrow A,或一般地,limnAn=A\lim\limits_{n\to\infty}A_n = A,或AnAA_n\to A

对于任意集合序列{An}\{A_n\},集合Bn=m=nAmB_n=\cup_{m=n}^{\infty}A_m必为non-increasing序列,因此B=limnBnB=\lim\limits_{n\to\infty}B_n存在,称它为{An}\{A_n\}的superior limit,写为lim supnAn\limsup_n A_n。反之,non-decreasing序列Cn=m=nAmC_n=\cap_{m=n}^{\infty}A_m的极限CC,就是{An}\{A_n\}的inferior limit,写为lim infnAn\liminf_n A_n。正式定义为

lim supnAn=n=1(m=nAm)lim infnAn=n=1(m=nAm)\begin{aligned} \limsup_n A_n = \cap_{n=1}^\infty (\cup_{m=n}^\infty A_m)\\ \liminf_n A_n = \cup_{n=1}^\infty (\cap_{m=n}^\infty A_m) \end{aligned}

由De Morgan' s laws,lim infnAn=(lim supnAnc)c\liminf_n A_n = \left(\limsup_n A_n^c \right)^c

lim supnAn\limsup_n A_n其实就是infinitely many(无穷多)个AnA_n中都含有的元素的集合,lim infnAn\liminf_n A_n就是all but a finite number(除有限)个AnA_n外,其他AnA_n中都含有的元素的集合。

以上概念提供了一种集合序列的收敛准则:lim infnAnlim supnAn\liminf_n A_n\subseteq \limsup_n A_n,若两个集合不相等,则说明{An}\{A_n\}不收敛。

5 子集的类

所有XX的子集的集合成为XX的power set(幂集),记为2X2^X。对于一个countable set,认为它的power set有22^\aleph个元素。

定理2=c2^\aleph = c

接下来,要研究的是给定集合的子集的一些性质。Power set一般对研究的问题来说会显得太大了,以下的一系列定义,目的是要定义出2X2^X的某个子集,使得该子集对于研究的问题来说足够大,而其性质又让我们可以容易地处理。一般方法是,先选出一些已知性质的集合,组成一个基本的collection,再用一些特定操作,创造出新的集合加入其中。

定义 Ring(环):由集合XX的子集组成的非空类(nonempty class)R\mathscr{R},若满足如下性质则为ring:

  • R\empty\in\mathscr{R}
  • ARA\in\mathscr{R}BRB\in\mathscr{R},则ABRA\cup B\in \mathscr{R}ABRA\cap B\in \mathscr{R}ABRA- B\in \mathscr{R}

Ring对于union、intersection、difference的操作是closed(闭的)。但ring中不一定含有全集XX自身,若加入XX,就成了field(或algebra)定义:

定义 Field(域):由XX的子集组成的classF\mathscr{F},若满足如下性质则为field:

  • XFX\in\mathscr{F}
  • AFA\in\mathscr{F},则AcFA^c\in\mathscr{F}
  • AFA\in\mathscr{F}BFB\in\mathscr{F},则ABFA\cup B\in \mathscr{F}

如果给定了一个collectionC\mathscr{C},将它理解为“种子”,去生成field,那么称最小的含有C\mathscr{C}的field为field generated by C\mathscr{C}

Ring和field的概念在概率论中应用起来还是会有些限制,因此引入以下定义:

定义 Semi-ring:由集合XX的子集组成的非空类(nonempty class)S\mathscr{S},若满足如下性质则为semi-ring:

  • S\empty\in\mathscr{S}
  • ASA\in\mathscr{S}BSB\in\mathscr{S},则ABSA\cap B\in \mathscr{S}
  • ASA\in\mathscr{S}BSB\in\mathscr{S}ABA \subseteq B,则n<\exist n\lt \infty,使得BA=j=1nCjB-A=\cup_{j=1}^{n} C_j,其中CjSC_j\in\mathscr{S}且对于jjj\neq j'来说CjCj=C_j\cap C_{j'}=\empty

其中的第三个性质,简单来说就是S\mathscr{S}中任意两个集合的的差,可以分解为有限个S\mathscr{S}中集合的union。

再在semi-ring中加入XX自身,就变成了semi-algebra

6 Sigma fields

上一节说到field对complement和finite union的操作是closed,我们接着将它的finite union操作扩展到极限处,这就有了如下概念。

定义 σ\sigma-field(sigma-algebra):由XX的子集组成的classF\mathscr{F},若满足如下性质则为sigma-field:

  • XFX\in\mathscr{F}
  • AFA\in\mathscr{F},则AcFA^c\in\mathscr{F}
  • {An,nN+}\{A_n,n\in N^+\}F\mathscr{F}中的集合的序列,则n=1AnF\cup_{n=1}^{\infty} A_n\in \mathscr{F}

σ\sigma-field对于complement和countable union是closed。若给定一个collectionC\mathscr{C},所有含有C\mathscr{C}σ\sigma-field的交集,就叫σ\sigma-field generated by C\mathscr{C},可记为σ(C)\sigma(\mathscr{C})

定理:若C\mathscr{C}是一个finite collection,则σ(C)\sigma(\mathscr{C})也是finite,否则σ(C)\sigma(\mathscr{C})总是uncountable。

若取X=RX=RC={(,r]:rQ}\mathscr{C}=\{(-\infty,r]: r\in Q\},则σ(C)\sigma(\mathscr{C})就叫Borel field of RR,一般可记为B\mathscr{B}。许多不同的collection都可以生成出B\mathscr{B}。若给定一个实区间II,则BI={BI:BB}\mathscr{B}_I = \{B\cap I: B\in\mathscr{B}\}称为the restnctlon of B\mathscr{B} to II,或Borel field on II。事实上,BI\mathscr{B}_I可由C={(,r]I:rQ}\mathscr{C}=\{(-\infty,r]\cap I: r\in Q\}生成。

对于两个σ\sigma-field的union不一定是σ\sigma-field,将最小的包含了两个σ\sigma-fieldF\mathscr{F}G\mathscr{G}中所有元素的σ\sigma-field记为FG\mathscr{F}\vee\mathscr{G}。但对于两个σ\sigma-field的intersectionFG={A:AFandAG}\mathscr{F}\cap\mathscr{G}=\{A:A\in \mathscr{F} \quad\text{and} \quad A \in\mathscr{G}\},它必定是σ\sigma-field,为了统一符号,可以写为FG\mathscr{F}\wedge\mathscr{G},它就是保证元素同时属于F\mathscr{F}G\mathscr{G}的最大的σ\sigma-field。这两个概念都可以推广到可数多个的情形。

概率论和测度论中,大量的工作都是在证明某个class of sets是σ\sigma-field。对于证明来说,σ\sigma-field定义中的三条性质,前两条都很容易验证,但最后一条要验证却很困难。为此我们定义一种monotone class(单调类)M\mathscr{M},它也是由一些集合组成:若{An}\{A_n\}是monotone sequence,有极限AA,且n,AnM\forall n, A_n\in\mathscr{M},则AMA\in \mathscr{M},称这样的M\mathscr{M}为monotone class。利用它和下面的定理,可以方便地证明一些class是σ\sigma-field。

定理F\mathscr{F}σ\sigma-field,当且仅当F\mathscr{F}是field且它是一个monotone class。

利用这个定理,在考虑一个class是不是σ\sigma-field时,我们只需要考虑monotone sequences的极限是否属于它即可。

另一个常用的技巧是Dynkin's π\pi-λ\lambda Theorem。对此需要先介绍两个概念做铺垫。

定义 π\pi-system:有一个classP\mathscr{P},若APA\in\mathscr{P}BPB\in\mathscr{P},则ABPA\cap B \in \mathscr{P},那么P\mathscr{P}就是π\pi-system。

定义 λ\lambda-system:有一个classL\mathscr{L},若它满足以下性质,那么L\mathscr{L}就是λ\lambda-system:

  • XLX\in \mathscr{L}
  • ALA\in\mathscr{L}BLB\in\mathscr{L}BAB\subseteq A,则ABLA-B\in\mathscr{L}
  • {AnL}\{A_n\in\mathscr{L}\}是non-decreasing sequence,且AnAA_n\uparrow A,则ALA\in\mathscr{L}

前两个条件说的是λ\lambda-system对于complement是closed。并且由于第二条意味着n,Bn=An+1AnL\forall n, B_n=A_{n+1}-A_n\in\mathscr{L},所以第三条也说明了,L\mathscr{L}中的disjoint sets的countable union依然在L\mathscr{L}中。利用这点,有以下定理。

定理:一个classL\mathscr{L}λ\lambda-system,当且仅当:

  • XLX\in \mathscr{L}
  • BLB\in\mathscr{L},则BcLB^c\in\mathscr{L}
  • {AnL}\{A_n\in\mathscr{L}\}是disjoint sequence,则nAnL\cup_n A_n\in\mathscr{L}

σ\sigma-field必定是λ\lambda-system,同时是π\pi-system和λ\lambda-system的class必定是σ\sigma-field。

下面的定理用到了这些定义。

定理 Dynkin's π\pi-λ\lambda Theorem:若P\mathscr{P}是一个π\pi-system,L\mathscr{L}是一个λ\lambda-system,且PL\mathscr{P}\subseteq \mathscr{L},则σ(P)L\sigma(\mathscr{P})\subseteq \mathscr{L}

参考文献

  • Davidson, J., 1994. Stochastic limit theory: An introduction for econometricians. OUP Oxford.