证明 Introduction and Proofs
广义上的证明 Proof:确定事实的方法
手段:
- 实验和观察
- 抽样找反例
- 法官-陪审团
- 上帝的话
老板
内心的信念
数学上的证明是通过一系列公理的逻辑推理来验证一个命题
定义:命题 Proposition 是要么为真要么为假的陈述
定义:谓词 Predicate 是一个真值依赖于变量值的命题
定义:如果 p 为假或 q 为真,则蕴含 implication p⟹q 为真
所以猪会飞 ⟹ 我是国王是正确的
定义:公理 axiom 是一个假定为真的命题
例如:如果 a=b 且 b=c,则 a=c
欧几里得几何中的:给定一条直线 l 和不在直线 l 上的点 p,通过点 p 与直线 l 的平行线有且只有一条
但在球面几何中该公理是错误的
公理必须是:
- 一致的 consistent :一个命题不能同时为真或为假
- 完整的 complete :所有命题必须为真或为假
很可惜,根据哥德尔不完备定理,不存在一组一致且完整的公理,即永远无法证明出一些命题的真假
反证法 数学归纳法 Induction
反证法 Proof by contradiction :为了证明 p 为真,通过假设 p 为假推导出错误或矛盾
例如:证明 2 是无理数
假设 2 是有理数,即 2=ba,分数为最简形式
⟹2b2=a2⟹a 为偶数(2∣a)⟹4∣a2⟹4∣2b2⟹2∣b2⟹b 是偶数⟹ba不是最简形式⟹矛盾⟹2是无理数
归纳法公理 Induction axiom :P(n) 为谓词,如果 P(0) 为真且 ∀n∈N,P(n)⟹P(n+1) 为真,那么 ∀n∈N,P(n)为真
类似于推倒多米诺骨牌
例:求证 ∑i=1ni=2n(n+1)
证明:通过归纳法
P(n) 是命题 ∑i=1ni=2n(n+1)
基本情况 Base case :P(0) 为真
归纳步骤 inductive step :对 n≥0,证明 P(n)⟹P(n+1) 为真
假设 P(n) 为真,即
i=1∑ni=2n(n+1)
需要证明
i=1∑n+1i=2(n+1)(n+2)
因为
2n(n+1)+n+1=2(n+1)(n+2)
故得证
一般来说归纳法需要预先知道结论
错误的归纳法证明:所有的马颜色相同
证明:通过归纳法
P(n) 对于所有 n 匹马的集合,马的颜色相同
基本情况:P(1) 正确
归纳步骤:考虑任何马的集合 H1,H2,…,Hn+1,H1,H2,…,Hn 颜色相同,H2,H3,…,Hn+1 颜色相同,则 H1 的颜色 = H2,H3,…,Hn+1 的颜色 = Hn+1 的颜色
这个例子说明归纳法不总是有效的/不能相信数学
该归纳法的错误之处在于 P(1) 无法推导出 P(2),“…”迷惑了我们
对于 2n×2n 的区域,用 L 型的地砖铺,可以在中间留下一个空隙
该命题用归纳法证明起来不方便,尝试加强命题的结论:
对于 2n×2n 的区域,用 L 型的地砖铺,可以在任何位置留下一个空隙
此命题较容易证明,因为在结论增强的同时,归纳法使用的假设也增强了
不变式 强归纳法 Strong Induction
八数码问题:交换了相邻的两个滑块,无法恢复原位
不变式 invariant :为了证明你的系统不能变为一个特定的特殊状态,能在每次移动中,保持初始状态不变,并且不会变成那个特殊状态,与归纳法紧密相关
引理 1:横向移动不改变物品的相对顺序 relative order
证明:观察某个字母从位置 i 变成了 i−1 或 i+1
引理 2:纵向移动改变了两对字母的相对顺序
证明:留给读者自证某个字母从位置 i 变成了 i−3 或 i+3
引理 3:在一次移动中,逆序对的数量只会增加 2、减少 2 或不变
证明:如图所示横向移动:没有改变;纵向移动:改变两对字母的相对顺序
推论 1:在一次移动中,逆序对数的奇偶性不会改变
证明:显然成立增加或减少 2 不会改变奇偶性
引理 4:每个从初始状态得到的状态,逆序对的数量都是奇数
证明:略通过归纳法
P(n) 为任意 n 次移动后逆序对的数量都是奇数
基本情况:P(0) 成立
归纳步骤:每次移动不改变逆序对数的奇偶性
强归纳法:P(n) 为谓词,如果 P(0) 为真且 ∀n∈N,P(0)∧P(1)∧…∧P(n)⟹P(n+1) 为真,那么 ∀n∈N,P(n) 为真
本质上和归纳法是一样的,只是显示表达了归纳法得出了结论
例:对 n 块积木游戏的任意策略都得到相同的分数 S(n)=2n(n−1)
证明:通过强归纳法:
P(n)=2n(n−1)
基本情况:P(0) 成立
归纳步骤:P(n+1)=k(n+1−k)+P(k)+P(n+1−k)
状态机 最大公约数 欧几里得算法 Number Theory
定理:在两个水桶相互倒水的问题中,如果 m∣a 并且 m∣a(即 m 是 a,b 的公约数),则 m∣ 任何得到的结果
状态机:(x,y)
其中,x 表示在 a 桶中的水量,y 表示在 b 桶中的水量
状态转移:
- 倒空:
- (x,y)→(0,y)
- (x,y)→(x,0)
- 装满:
- (x,y)→(a,y)
- (x,y)→(x,b)
- 相互倒:
- (x,y)→(0,x+y),x+y≤b
- (x,y)→(x−(b−y),b)=(x+y−b,b),x+y≥b
- (x,y)→(x+y,0),x+y≤a
- (x,y)→(a,y−(a−x))=(a,y−a+x),x+y≥a
证明:通过归纳法
P(n)为如果(x,y)是在 n 次转移后得到的状态,则 m∣x 并且 m∣y
基本情况:P(0) 成立
归纳步骤:转移得到的状态有 0、a、b、x、y、x+y−a、x+y−b,都能被 m 整除(两个数的线性组合能被它们的公因数整除)
定义:gcd(a,b) 为 a 和 b 的最大公约数 greatest common divisor
定理:任何 a,b 的线性组合都能得到
欧几里得算法(辗转相除法):
存在唯一的 q(商)和 r(余数),使得 b=qa+r,0≤r<a
引理:gcd(a,b)=gcd(rem(b,a),a)
相当于每次减去了一个线性组合,使得得到的数大于 0 且尽量最小,而每次得到的余数减小,故算法会终止
定理:gcd(a,b) 是 a 和 b 的最小正线性组合
同余式 欧拉定理 RSA 加密算法 Number Theory
密码学:
- 提前交换键 keys
- 加密 encryption :m′=Ekeys(m)
- 解密 decryption :m=Dkeys(m′)
图灵密码 v1:
- 提前交换秘密质数 k
- 加密:m′=mk
- 解密:m=m′/k
基于因式分解两个大质数的乘积很困难
问题:捕捉到两个密文 m1′、m2′ 后,gcd(m1′,m2′)=k
图灵密码 v2:
- 提前交换公共质数 p,秘密质数 k
- 加密:密码 m∈0,1,…,p−1,计算 m′=rem(mk,p)
- 解密:m=rem(m′k−1,p)
定义:如果 n∣(x−y),则 x 和 y 被 n 取模同余 congruent,记作 x≡y(modn)
定义:xmodn 的乘法逆元 multiplication inverse,记作 x−1∈{0,1,…n−1},使得 x∗x−1≡1(modn)
已知明文攻击
定义:欧拉函数 Φ(n) 表示在 0 到 n−1 中,与 n 互质的整数的数量
欧拉定理:如果 n 和 k 互质,则 kΦ(n)≡1(modn)
当且仅当 n 和 k 互质时,k 有乘法逆元
引理:如果 n 和 k 互质,ak≡kb(modn),则a≡b(modn)
证明:如果 n 和 k 互质,k1,k2,…,kr 是 {1,2,…,n−1} 中的与 n 互质的数(r=Φ(n)),那么 rem(kk1,n),…,rem(kkr,n)={k1,…,kr}
分为两步:
- 证明前者有 r 个余数
- 证明前者是后者的子集
故:
k1k2…kr={rem(kk1,n),…,rem(kkr,n)}≡k1kk2k…krk(modn)≡k1k2…krkr(modn)
费马小定理:如果 p 是质数,且 k∈1,2,…,p−1,则 kp−1≡1(modn)
本质是欧拉定理在质数时的特殊情况
应用:kkp−2=kp−1≡1(modp),即可得 k−1≡kp−2(modp)
RSA:
- 预先生成公钥和私钥
- 生成两个质数 p 和 q
- n=pq
- 选择一个整数 e,使得 gcd(e,(p−1)(q−1))=1,公钥就是 e 和 n
- 计算 d,使得 de≡1(mod(p−1)(q−1))
- 加密:m′=rem(me,n)
- 解密:m=rem(m′d,n)
图着色问题 NP 完备性 Graph Theory and Coloring
定义:图是 (V,E) 的集合,其中 V 是非空物品的集合,叫做结点 nodes 或顶点 vertex,E 是 V 选择两个结点的集合,叫做边 Edges
定义:如果两个顶点 xi,xj 有边相连,则称 xi,xj 邻接 adjacent
定义:如果 e={xixj} 有边相连,则称 e 与 xixj 关联 incident
定义:与某个顶点关联的边的数量叫作该顶点的度数 degree
定义:如果一个图没有自环或多重边,则该图是简单的 simple
图着色问题:给定图和 k 种颜色,给每个顶点分配颜色使得相邻的顶点颜色不一样
定义:k 的最小值为图色数 X(G)
三色及以上的问题是NP 完全问题
定理:如果图中每个顶点的度数都不超过 d,则基本算法使用最多 d+1 种颜色
证明:归纳法,但是对图的顶点数 n,而不是 d,归纳
定义:如果一个图的顶点 V 可以被分成 VC,VR,且每一条边都连接 VC 和 VR 中的点二分图 bipartite
匹配 二分图 稳定婚姻算法 Matching Problems
定义:给定一个图 G,匹配 matching 是 G 的一个子图,其中每个顶点度数为 1
定义:给定一个匹配,如果 x 和 y 相比他们的伴侣更喜欢彼此,则称x 和 y 的配偶被戴了绿帽子x 和 y 是一对流氓夫妻 rough couple
定义:如果一个匹配中没有流氓夫妇,则称该匹配为稳定匹配 stable
定理: 当同性可以在一起的时候,不存在稳定匹配 (果然同性不是真爱)
证明:反证法
更让人惊讶的是, 在异性才能结婚的世界中,总能找到稳定匹配
算法:男生向未划掉的自己最喜欢的女生表白,女生留下其中最喜欢的,拒绝其余的 (你是个好人),被拒绝的男生划掉该女生,如此循环操作
需要证明:
- TMA 会终止(速度快)
没有人受伤每个人都会找到另一半
没有人被戴绿帽没有流氓夫妇
- TMA 对男生和女生是公平的吗
定理 1:TMA 在不超过 N2+1 天终止
证明:每天都划掉至少一个女孩
不变式:如果一个女生拒绝了一个男生 B,她有比 B 更好的求婚者
证明:对天数归纳
定理 2:每个人都结婚了
证明:反证法,若某个男生没有结婚,则他被所有女生拒绝了
定理 3:TMA 生成了稳定匹配
证明:任何不是一对的 Bob 和 Gail
- 情况 1:Gail 拒绝 Bob ⟹ 她有更喜欢的人
- 情况 2:Gail 没有拒绝 Bob ⟹ Bob 没有向 Gail 表白 ⟹ Bob 被更喜欢的人接受了
定义:一个人可能域是指若他能得到稳定匹配的伴侣的集合
定义:一个人的最优伴侣是他/她的可能域中最喜欢的
定理 4:TMA 让每个男生和他的最优伴侣结婚
定理 5:TMA 让每个女生和他的最坏伴侣结婚
最小权重生成树 Graph Theory: Minimum Spanning Trees
定义:通路 walk 是被边依次相连的顶点序列(点、边可以相同)
定义:路径 path 是顶点不相同的通路(点、边均不相同)
引理:如果存在通路,则存在路径
证明:良序定理:存在最短的通路 + 反证法
定义:如果两点之间有路径,则称两点连通 connected
定义:如果图中任意两点都连通,则该图连通
定义:回路 closed walk 是起点和终点相同的通路
定义:环 cycle 是只有起点和终点相同的回路,即是起点和终点相同的路径
定义:连通且无环的图被称为树 tree
定义:叶结点是树中度为 1 的结点
引理:树的任何连通子图也是一棵树
证明:反证法:若该子图有环,则原图有环,不是树
引理:n 个结点的树有 n-1 条边
证明:归纳法,删除叶结点
定义:连通图生成树 spanning tree 是和原图有相同结点的树
引理:每个连通图都有生成树
证明:反证法
定义:加权图的最小权重生成树
算法:一步一步生成子图,每一步都保持子图无环,添加最小权重的边
引理:S 为算法中已经选择的 m 条边的集合,则 s 为 MST 边的集合的子集
证明:归纳法,添加边生成环,去掉边,注意某条边和此环内另一条边相等的情景(交换生成树)
通信网络 Communication Networks
交换机 Switch,终端 terminal
延迟 latency 是一个包从输入到输出所需时间
直径 diameter 等于最远的输入和输出之间的最小路径的长度
置换 permutation 是将 n={0,1,…,N−1} 映射到另一个集合的函数,没有冲突
堵塞 congestion 等于通过某个交换机的路径数量的最大值
蝴蝶网络:每个交换机都是根据其行和列唯一命名的,用 (b1,…,blogN,l) 表示,其下一个结点是 (b1,…,!bl+1,blogN,l+1) 和 (b1,…,bl+1,blogN,l+1)
Benes:将两个蝴蝶网络背靠背地连接起来
定理:堵塞为 1
证明:归纳法,对 a 归纳,N=2a
约束法:若一个结点有两个输入,则将这两个输入相连;若一个结点有两个输出,则将这两个输出相连。该约束图可以用两种颜色染色
转化为两个小一层的子网
N*N 的网络 |
直径 |
交换机大小 |
交换机数量 |
堵塞 |
二叉树 |
2(1+logN) |
3∗3 |
2N−1 |
N |
2 维数组 |
2N |
2∗2 |
N2 |
2 |
蝴蝶网络 |
2+logN |
2∗2 |
N(1+logN) |
sqrtN 或 N/2 |
Benes |
1+2logN |
2∗2 |
2NlogN |
1 |
欧拉图 竞赛图 Graph Theory
定义:一个欧拉闭迹 Euler tour 是遍历每一条边一次的通路
定理:一个连通图有欧拉闭迹,当且仅当每个顶点度数为偶数
定理:Pij(k) 为从 vk 到 vj 长度为 k 的通路的数量,那么邻接矩阵 Ak=Pij(k)
证明:通过归纳法,对 k 归纳
定义:如果一个有向图每一对结点之间都有有向通路,则该图是强连通的 strongly connected
定义:如果一个有向图没有有向环,则其为有向无环图 DAG
竞赛图 tournament graph:每对结点之间都有有向边相连
定义:有向哈密顿路径 directed Hamilton path 是有向的通路,每个顶点都要访问一次
定理:所有竞赛图都有有向哈密顿路径
证明:归纳法,对结点 n 归纳,考虑将多余的顶点插入到原路径中
菜鸡互啄:如果一只鸡 u 打败了 v,或存在一只或多只鸡 w,u 打败了 w,w 打败了 v,则称 u 打败了 v
如果一只鸡打败了其它所有的鸡,则称此鸡为公鸡中的战斗机
定理:出度最大的鸡一定是鸡王之一
证明:反证法,两种情况同时不满足,则出度不是最大
关系 偏序 拓扑排序 Relations, Partial Orders, and Scheduling
定义:集合 A 到集合 B 的关系 relation 是 A 和 B 的笛卡尔积的子集,即R⊂A×B
写法:(a,b)∈R,或 aRb ,或 a∼Rb
A 的关系是一个子集 R⊂A×A
对于一个有向图 G=(V,E),V=A,E=R
对 A 的关系 R 性质:
- 自反性 reflexive:对所有 x∈A,xRx
- 对称性 symmetric:对所有 x,y∈A,xRy⟹yRx
- 反对称性 antisymmetric:如果 xRy∧yRx⟹x=y
- 传递性 transitivity:如果 xRy∧yRz⟹xRz
例如:
关系 |
自反 |
对称 |
反对称 |
传递 |
x≡y(modn) |
✓ |
✓ |
× |
✓ |
x∣y |
✓ |
× |
✓ |
✓ |
x≤y |
✓ |
× |
✓ |
✓ |
定义:等价关系 equivalence relation 是自反的,对称的,可传递的
定义:A 的分割 partition 是不同的、非空的 A 的子集,其并集为 A
定理:一个集合 A 的等价关系的等价类表示 A 的分化
定义:如果一个关系是自反的,反对称的,可传递的,则该关系是 (弱)偏序 (weak)patrial order 的,关系符号为≤,因为“小于等于”就是一种典型的偏序关系
定义:(A,≤) 被称为偏序集 partially order set,有向图就是一个偏序集
定义:一个偏序集 (A,≤) 的哈斯图 Hasse diagram 是一个有向图,其保留了所有顶点并删除所有自环和通过传递性得到的边
定理:偏序集除了自环外没有有向环
定义:如果既不 a≤b 也不 b≤a,则 a 和 b 是不可比较 incomparable 的
定义:如果 a≤b 或 b≤a,则 a 和 b 是可比较 comparable 的
定义:全序 total order 是每对元素都可以比较的偏序
定义:如果全序和偏序一致,则成为拓扑排序 topological sort
定理:每个偏序集都有拓扑排序
引理:每个有限偏序集都有最小元素
求和 渐进 Sums and Asymptotics
定义:n 年 m 美元年金 n-year $m-payment annuity 是每年付 m 美元,持续 n 年
假设:固定利率 p
V=i=0∑n−1(1+p)im=m1−x1−xn
扰动法 Perturbation method:其实就是错位相减法
推论:如果 ∣x∣<1,则
i=0∑∞xi=1−x1
该级数称为几何级数
∑i=0∞ixi 除了错位相减法以外,还可以使用求导的方法
定理:如果 ∣x∣<1,则
i=0∑∞ixi=(1−x)2x
对于递增函数 f(x),
f(1)+∫1nf(x)dx≤i=1∑nf(i)≤f(n)+∫1nf(x)dx
类似的,递减函数为
f(n)+∫1nf(x)dx≤i=1∑nf(i)≤f(1)+∫1nf(x)dx
定义:g(x)∼h(x) 意思是 limx→∞h(x)g(x)=1
定义:第 n 个调和数 harmonic number 表示为
Hn=i=1∑ni1
Hn=lnn+δ+2n1+12n21+120n4ϵ(n)
其中 0<ϵ(n)<1,欧拉常数 δ=0.577215664…,不知道是无理数还是有理数
斯特林公式 Stirling's Formula:
n!=(en)n2πneϵ(n)
其中 12n+11≤ϵ(n)≤12n1
渐进符号 asymptotic notation:
- f(x)∼g(x):limx→∞g(x)f(x)=1
- f(x)=O(g(x)):limx→∞∣∣∣g(x)f(x)∣∣∣<∞
- f(x)=Ω(g(x)):limx→∞∣∣∣g(x)f(x)∣∣∣>0
- f(x)=Θ(g(x)):limx→∞∣∣∣g(x)f(x)∣∣∣>0 或 <∞
- f(x)=o(g(x)):limx→∞∣∣∣g(x)f(x)∣∣∣=0
- f(x)=ω(g(x)):limx→∞∣∣∣g(x)f(x)∣∣∣=∞
在归纳法中不能使用渐进符号,因为渐进符号用于衡量函数,而归纳法中的谓词表示的是某个数字的特殊情况
分治 递归 Divide and Conquer Recurrences
汉诺塔问题:Tn=1+2Tn−1
证明方法:
归并排序:T(n)=2T(n/2)+n−1
T(n)=2T(n−1)+1⟹T(n)∼2n
T(n)=2T(n/2)+n−1⟹T(n)∼nlogn
S(n)=S(⌊2n⌋)+S(⌈2n⌉)+1⟹S(n)∼n
定义:分治递归 divide and conquer recurrence 的形式为
T(x)=a1T(b1x+ϵ1(x))+a2T(b2x+ϵ2(x))+…+anT(bnx+ϵn(x))+g(x)
其中 ai>0,0<bi<1,∣ϵi(x)∣≤O(log2xx),g(x) 为多项式
Akra&Bazzi‘96 定理:p 满足
i=1∑kaibip=1
那么
T(x)=Θ(xp+xp∫1xup+1g(u)du)
定理:特殊的,如果 g(x)=θ(xt) 且 ∑i=1taibip<1,那么 T(x)=Θ(g(x))
线性递归 Linear Recurrences
定义:线性递归 linear recurrence 的形式为
f(n)=a1f(n−1)+a2f(n−2)+…+adf(n−d)
对于斐波那契数列 f(n)=f(n−1)+f(n−2)
尝试 f(n)=αn,α 是常数
解一元二次方程,得到 α1=21+5,α2=21−5
如果 f(n)=α1n 和 f(n)=α2n 是线性递归的解,则线性组合 f(n)=c1α1n+c2α2n 也是一个解
初值约束解得 c1,c2
解为
f(n)=51(21+5)n−51(21−5)n
对于更一般的线性递归问题,所使用的方法相似,都类似于微分方程(因为这就是微分方程的离散形式)
矩阵的解释可参照线性代数
重根时的情况也类似:若对于 α 有 r 个重根,则根为 αn,nαn,n2αn…nr−1αn
非齐次的情况:
- 视为齐次方程,求齐次解
- 求非齐次的特解 不断
- 通解 = 特解 + 非齐次解
求特解时,例如:若 g(n)=2n+n,猜测 f(n)=a2n+bn+c,若不正确,继续猜测 f(n)=(an+d)2n+bn+c
计数法则 Counting Rules
定义:集合 set 是无序且唯一的元素的 collection,用 {a,b,c} 表示
定义:基数 cardinality 是集合拥有的元素数,用 ∣X∣ 表示
定义:序列 sequence 是有序的 collection(元素可以不唯一),用 (a,b,c) 表示
定义:排列 permutation 是每个元素恰好出现一次的序列
n 个元素的排列数为 n!
定义:函数 functionf:x→y,表示集合 x 到 y 的关系,每个 x 中的元素关系到 y 中的一个元素,x 为定义域 domain,y 为值域 range
定义:如果 y 中的每个元素都至少被映射到一次,则称函数 f:x→y 是满射 surjective 的
定义:如果 y 中的每个元素都最多被映射到一次,则称函数 f:x→y 是单射 injective 的
定义:如果 y 中的每个元素都恰好被映射到一次,则称函数 f:x→y 是双射 bijective 的
映射法则:如果 f:x→y 是
- 满射,则 ∣x∣≥∣y∣
- 单射,则 ∣x∣≤∣y∣
- 双射,则 ∣x∣=∣y∣
广义鸽巢原理 generalized pigeon hole principle:如果 ∣x∣>k∣y∣,那么对于 f:x→y,在 x 中一定存在 k+1 个不同元素映射到 y 中相同元素
证明:反证法
例:选取 10 个随机的两位数,其某一子集的和必然与另一子集相等
证明:
- 该集合子集的大小为 210
- 可能的和最多为 990<1024
定义:“k to 1”函数把 x 中的每 k 个元素映射到 y 中的每个元素
除法法则:如果 f 是“k to 1”函数,则 ∣x∣=k∣y∣
广义乘法法则:s 为长度为 k 的序列的集合,如果第一项有 n1 种选择,然后第二项有 n2 种选择……,则共有 n1n2…nk 种选择
定义:A1×A2×…×An={(a1,a2,…,an):a1∈A1,a2∈A2,…,an∈An}
乘法法则:∣A1×A2×…×An∣=∣A1∣∣A2∣…∣An∣
和法则:如果 A1,A2,…,An 是独立的,那么 ∣A1∪A2∪…∪An∣=∣A1∣+∣A2∣+…+∣An∣
容斥原理:
∣A1∪A2∪…∪An∣=k=1∑n(−1)k+1S⊂{1…n}∧∣S∣=k∑∣∪Ai∣,i∈S
bookkeeper rule:不同字母 l1,l2,…,lk,分别有 n1,n2,…,nk 份,则总共有 n1!n2!…nk!(n1+n2+…+nk)!,也被称为二项式系数
概率介绍 Probability Introduction
世界上三种谎言,分别是谎言、该死的谎言和统计数字(There are three kinds of lies: lies, damnedlies, and statistics)。
——马克·吐温
定义:一个实验的样本空间 sample space 是所有可能的结果的集合
定义:一个结果或样本点包括所有关于实验的信息,包括所有随机选择的值
定义:概率空间 probability space 由样本空间和概率函数组成,记作 Pr
定义:事件 event 是结果的一个子集
“三门问题”:使用树形法,不要依赖于直觉秘密在于当你一开始选择了正确的门时,交换后失败;一开始选择的是错误的时,交换后成功,而一开始选择错误的概率大于选择正确的概率
骰子问题:当扔一次时,A 打败 B,B 打败 C,C 打败 A,概率都是 95,因为概率不可传递
但当扔 k 次时,可以得到任何打败的组合
可以把任何竞赛图关系到抛某个次数的某个骰子上
条件概率 Conditional Probability
条件概率 conditional probability:Pr(A∣B)
定义:如果 Pr(B)=0,Pr(A∣B)=Pr(B)Pr(A∩B)
乘法法则:Pr(∩B)=Pr(B)Pr(A∣B)
医学测试:如果你只按照人群中的比例猜测一个人得病的概率,则比通过有可能失误的测试概率高多了
容斥原理也对条件概率有效
两个航空公司,其中航空公司 A 的每个地点的准点率都比 B 的准点率低,但总体来说准点率更高,原因是它在两者准点率都高的地点有更多的航班
独立性 生日悖论 Independence
定义:如果 Pr(A∣B)=Pr(A) 或 Pr(B)=0,则称 A 对 B 是独立的 independent
另一种等价定义:乘法法则:Pr(A∩B)=Pr(B)Pr(B)
独立的对称性:如果 A 独立于 B,则 B 也独立于 A,故常称 A 与 B 独立
定义:如果事件集合中的所有子集相互独立,则称事件 A1,A2,…,An 相互独立 mutually independent
等价定义(乘法法则形式):Pr(∩Aj)=∏j∈JPr(Aj)
定义:如果任意两对 Ai,Aj 相互独立,则称事件 A1,A2,…,An 两两独立 pairwise independent
生日问题:N 个生日,M 个人,2 个或多个人有相同的生日的概率
Pr(生日不同)=(N−M)!NMN!
使用斯特林公式得到闭式:
Pr(生日不同)∼e(N−M+21)ln(N+MN)−M
当 N=365,m=23 时,概率为 0.49,接近于 21
如果 M=o(N32),则当 m=1.177N 时,有 50% 的概率匹配到相同的生日
随机变量 Random Variables
定义:随机变量 random variable 是函数 R:S(样本空间)→R(真实空间)
定义:指示器 indicator 或 Bernouli 或 characteristic 是值域为 {0,1} 的随机变量
定义:
Pr(R=x)=∑Pr(w)=xPr(w)
随机变量的独立性定义依旧相同,不再赘述
定义:给定随机变量 R,其概率分布函数 probability distribution function 是 f(x)=Pr(R=x)
定义:随机变量 R 的累积分布函数 cumulative distribution function 是 f(x)=Pr(R≤x)
猜数字游戏:出题人预先写好两个数字,挑战者内心均匀想好一个数字,根据亮出的一个数字和内心想好的某个数字的大小关系决定是否要更换所选数字
当挑战者预期的数字是均匀分布时,获胜的概率为 21+2n1,此策略为最优策略
而出题者给出的策略是选择相邻的两个数字,此策略也为最优策略
无偏差二项分布 unbiased binomial distribution:fn(k)=Cnk2−n,是一般情况 p=21 时的特殊情况
一般二项分布 general binomial distribution:fn(k)=Cnkpk(1−p)n−k
fn,p(αn)≤2πα(1−α)n2[αlogαp+(1−α)log1−α1+p]n
当α=p时取最大值为:
fn,p≤2πp(1−p)n1
概率分布的图像最高点为 Θ(π1),指数级缩小,驼峰宽度为 Θ(n)
期望 Expectation
定义:随机变量 R 在样本空间 S 上的期望 expected value
Ex(R)=∑w∈SR(w)Pr(w)
定义:R 的中位数 median 是 x∈range(R) 且满足 Pr(R<x)≤21 且 Pr(R>x)<21
三个人玩猜硬币游戏,其中两个人始终猜测相反的结果,则第三个人最终一定会亏钱,每轮的期望为 −21
所以避免大多数人的选择,虽然失败的概率较大,但成功后获得的收益更大,最终的期望更大
定理:
Ex(R)=∑x∈range(R)xPr(R=x)
定理:如果 R 在自然数上,则
Ex(R)=i=0∑∞Pr(R>i)=i=1∑∞Pr(R≥i)
若信号延迟 D 满足 Pr(D≥i)=i1,则 Ex(D)=∞,但如果仅计算前面有限个数的期望,则为有限值
线性期望:定理:对任何随机变量 R1,R2 来说,Ex(R1+R2)=Ex(R1)+Ex(R2),也可以推广到 n 个数,这些 R 不需要相互独立
每个人随机拿回一顶帽子,则刚好拿回自己帽子的概率
Ex(R)=Ex(R1)+…+Ex(Rn)=Pr(R1=1)+…+Pr(Rn=1)=n1+…+n1=1
相似的,吃饭时随机选择桌子,每个人拿到自己喜欢的菜的期望是 1
定理:概率空间 S 中的事件 A1,A2,…,An⊂S,则这些事件发生的个数的期望是 ∑i=1nPr(Ai)
定理:Pr(T≥1)≤Ex(T),也可写成Pr(T≥1)≤∑i=1nPr(Ai)
墨菲定律:如果有互相独立的事件 A1,A2,…,An,则 Pr(T=0)≤E−Ex(T)
证明:使用了 1−x≤ex
推论:如果有 10 或更多独立的事件可能发生,则则没有事件发生的概率 ≤e−10≤220001
在宏观上的墨菲定律是因为存在着大量可能发生的事件,则其中几乎必然有事件会发生,而我们很难考虑到所有可能发生的情况,所以会对很多几乎不可能发生的情况的发生而感到不可思议
一堆纸牌中有大量的 1,这延长了结束的时间,增加了冲突的概率,故结束时往往会有大量人同步
定理(期望的乘法法则):对任何独立的随机变量 R1,R2,Ex(R1R2)=Ex(R1)Ex(R2),同样可以推广到 n 个随机变量
推论(线性):Ex(aR+b)=aEx(R)+b
一些误区:
- Ex(R1)=Ex(R)1
- Ex(TR)>1无法得出Ex(R)>Ex(T)
事实上有时你可以同时得出 Ex(TR)>1 和 Ex(RT)>1,所以你想要得出哪个结论,就使用相应的方法分析
定义:随机变量 R 的方差 Variance 是Var(R)=Ex((R−Ex(R))2)
之所以使用平方来定义是因为:如果直接使用偏差的平均值,则始终为 0;若使用绝对值,则无法得出一些优秀的定理;若使用四次方则过于麻烦,事实上确实有使用四次方定义的量
定义:标准差 standard deviation σ(R)=Var(R),也称为偏差的均方根 root-mean-square
大偏差 Large Deviations
马尔科夫定理 Markov's theorem:如果 R 是个非负随机变量,则 Pr(R≥x)≤xEx(R)
要求非负是因为证明中使用到了 Ex(R∣R<x)Pr(R<x)≥0
推论:R>0,Pr(R≥cEx(R))≤c1
推论:对 u∈S,如果 R≤u,则 ∀x<u,Pr(R≤x)≤u−xu−Ex(R)
本质上是保证了 u−r>0 的马尔科夫定理
切比雪夫定理 Chebyshev's theorem (方差版本的马尔科夫定理):∀x>0,Pr(∣R−Ex(R)∣≥x)≤x2Var(R)
同样的,也有一个推论:Pr(∣R−Ex(R)∣≥cσ(R))≤c21
注意,这些定理得出的边界都和实际分布无关,事实上是最坏分布下得出的边界
切诺夫界 Chernoff bound:T1,…,Tn 是任何独立的随机变量且 0≤Ti≤1(若不是,则标准化),令 T=∑i=1nTi,则对于所有 c>1,Pr(T≥cEx(T))≤e−zEx(T),其中z=clnc+1−c>0
三者的共同点:Pr(A>B)=Pr(f(A)>f(B))≤f(B)Ex(f(A)),在切比雪夫中使用了平方,在切诺夫中使用了 e 指数
分配网络负载的方法:随机分配,超过 2 倍的概率为 160001
随机游走 Random Walks
赌徒破产问题:一开始有 n 元,赢得 1 元的概率为 p,输掉 1 元的概率为 1-p,重复玩,直到输光钱或赢到 m 元
若获胜概率为 199,由 1000 元赢到 1100 的概率 ≤376481
定义:
- W∗:在到达 0 之前到达 T=n+m 的事件
- D:开始时的钱
- xn=Pr(W∗∣D=n)
xn=⎩⎪⎪⎨⎪⎪⎧0,n=01,n=Tpxn+1+(1−p)xn−1,0<n<T
解得特征根 r1=1,r2=p1−p
若 p<21,代入初值并近似 ≤(1−pp)m,故几乎不可能成功,且答案中与 n 无关马斯克来都被榨干
若 p=21,赢得 m 元的概率为 n+mn所以在“公平”的游戏中,有钱人比没钱人更“公平”
在 x 步后,偏移 drifted 的幅度为 (1−2p)x,摆动 swing 为 Θ(x),偏移比摆动增长更快
有一些样本点会导致永远无法结束,但这些点之和为 0
借用老师画的图:
![偏随机游走](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![无偏随机游走](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
定义:
- S:输光之前的步数
- En=Ex(S∣D=n)
En=⎩⎪⎪⎨⎪⎪⎧0,n=00,n=TpEn+1+(1−p)En−1+1,0<n<T
同样可得出结论:
En=1−2pn−1−2pT(p1−p)T−1(p1−p)n−1
忙活了半天,得出的结论和直观理解的 1−2pn 差不了多少
若 p=21,En=mn
趁早退出定理:如果 p=21,不断地玩,最终一定会破产
证明:反证法(摆动幅度越来越大)