模型
网页间的链接构成一副图
如果有高名次的页面指向一个页面,则该页面有较高的名次,即
π(i)=j∈X∑π(j)P(j,i),i∈X
注意其中 P(j,i) 为指向 i 的链接,单位化后的结果
写成矩阵:
π=πP
还有一重单位化的约束:
i∈X∑π(i)=1
马尔科夫链
可以用公式定义马尔科夫链:
P[X(n+1)=j∣X(n)=i,X(m),m<n]=P(i,j),∀i,j∈X,n≥0
其中 X(n) 表示时间 n 时的状态,X(0) 也称初始状态
该公式揭示了马尔科夫链的几个性质:
矩阵形式
πn=π0Pn
分析
定义:
- 如果可以从任何状态到任何其他状态,则该马尔科夫链是不可约的 irreducible
- 如果马尔科夫链是不可约的,且定义 d(i)=gcd{n≥1∣Pn(i,i)>0},d(i) 对于所有的 i 有相同的 d。若 d=1,则是非周期性的 aperiodic;否则是周期性 d
有限马尔科夫链的大定理:
- 如果马尔科夫链是有限且不可约的,则有独特的不变分布 π 且 π(i) 是长期来看 X(n)=i 的“时间比例”
- 如果也是非周期的,则 Xn 的分布 πn 收敛于 π
对于长期来看 X(n)=i 的“时间比例”有如下数学定义
N→∞limN1n=0∑N−11{X(n)=i}
注:1{X(n)=i} 表示当 X(n)=i 时取 1,否则为 0
为什么这个数会收敛,原因和抛硬币很多次,正面的比例为 50% 一样,是大数定律
强大数法则 Strong Law of Large Numbers
{X(n),n≥1} 是独立的随机变量,平均值为 μ,则当 n→∞ 时
nX(1)+⋯+X(n)→μ
概率为 1
命中时间
到达页面 E 的时间为击中时间 hitting time,表示为 TE
*定义:*平均击中时间
β(i)=E[TE∣X0=i]
可以得到一些方程,如 β(A)=1+21β(B)+21β(D) 等,这些方程组称为第一步方程 first step equations
*定义:*在命中一个状态之前命中另一个状态的概率,如从 i 开始访问 C 再访问 E
α(i)=P[TC<TE∣X0=i]
同样的,也有一些方程,如 α(A)=21α(B)+21α(D)
给出一般化的数学定义和关系:
一、平均命中时间:
β(i)=E[TA∣X0=i],i∈X
β(i)={1+∑jP(i,j)β(j),i∈/A0,i∈A
二、先访问 A 再访问 B 的概率:
α(i)=P[TA<TB∣X0=i],i∈X
α(i)=⎩⎪⎪⎨⎪⎪⎧∑jP(i,j)α(j),i∈/A∪B1,i∈A0,i∈B
三、每次访问 i 时,收集一个值 h(i),直到进入 A
Y=n=0∑TAh(X(n))
γ(i)=E[Y∣X0=i],i∈X
γ(i)={h(i)+∑jP(i,j)γ(j),i∈/Ah(i),i∈A
四、β 为折扣因子:
Z=n=0∑TAβnh(X(n))
δ(i)=E[Z∣X0=i]
δ(i)={h(i)+β∑jP(i,j)δ(j),i∈/Ah(i),i∈A
马尔科夫链还有很多变形
页面排序 B
样本空间
以抛硬币为例,尝试定义样本空间。ω=(ω0,ω1,⋯),ωn∈{0,1} 其中 ω 是抛出的由无数个 0 和 1 组成的序列,定义 Xn(ω)=ωn,即得到 ω∈ω,Xn(ω)∈R 的函数了,这个函数将样本空间中的所有样本与数联系
可以定义样本空间中的概率了:
P({ω∣ω0=a,ω1=b,⋯,ωn=z})=P(X0=1,⋯,Xn=z)=2n+11
对于马尔科夫链,选择样本空间为无限可能的访问序列,叫规范样本空间 canonical sample space
P(X0=i0,X1=i1,⋯,Xn=in)=π0(i0)P(i0,i1)⋯P(in−1,in)
可以发现这个定义和一开始的定义是等价的
抛硬币的大数定律
有两条路径去靠近这个接近 50% 的思想:
概率的收敛:令
Yn=nX0+⋯+Xn−1
有切比雪夫不等式:
P(∣Yn−E(Yn)∣≥ϵ)≤ϵ2var(Yn)
因为
var(Yn)=nvar(X0)
var(X0)=0.25
故
P(∣Yn−0.5∣≥ϵ)≤4nϵ21
当 n→∞,∀ϵ>0,P(∣Yn−0.5∣≥ϵ)→0
这就是弱大数定律,其含义为不收敛为 50% 的概率为 0
**几乎必然收敛:**当 n→∞ 时,
Yn(ω)→0.5
马尔科夫链中的大数定律
Ti 为走一个圈回到某个点的时间,易得该随机变量是独立的,且有一个最大值和最小值,小于无穷,故有
kT1+⋯+Tk→E(T1),k→∞,概率为 1
易得
k→∞limT1+⋯+Tkk=E(T1)1,概率为 1
大定理的证明
定义:mj 为回到 j 的期望时间,即
mj=E[Tj∣X(0)=j],Tj=min{n>0∣X(n)=j}
有这样一个关系:
j∑mj1P(j,i)=mi1
所以得出分布 πi=mi1
多路技术 Multiplexing
共享链接
每个用户独立使用的概率为 p,求超过 m 个活跃用户的概率最多为 5%
高斯随机变量和中心极限定理
平均值为 0,方差为 1 的高斯随机变量 W 的 pdf 为
fW(x)=2π1exp{−2x2}
平均值为 μ,方差为 σ2 的高斯随机变量 X:
X=μ+σW
fX(x)=2πσ21exp{−2σ2(x−μ)2}
中心极限定理:
σnX(1)+⋯+X(n)−nμ⟹N(0,1)
特别的,若 {Y(n),n≥1} 是随机变量,则 Y(n)⟹N(0,1) 即
P(Y(n)≤x)→P(W≤x)
*定义:*分布的收敛,写作 X(n)⟹X,如果
P(X(n)≤X)→P(X≤x),其中P(X=x)=0
伯努利分布与高斯分布的关系:B(N,p)=N(Np,Np(1−p))
置信区间:
- 90%:[μn−1.65nσn,μn+1.65nσn]
- 95%:[μn−2nσn,μn+2nσn]
其中 σn2=n−1∑m=1n(X(m)−μn)2,注意 n−1 是为了无偏
缓冲
λ 为每个时间到达的概率,μ 为完成发送的概率,对于这张图,有
- p2=λ(1−μ)
- p0=μ(1−λ)
- p1=1−p0−p2
平衡方程为:
π(n)=p2π(n−1)+p1π(n)+p0π(n+1)
可得解为:
π(i)=π(0)ρi
其中 ρ=p0p2
由概率相加为 1 可得
π(0)=1−pN+11−p
故得到期望:
E(X)=μ−λλ(1−μ)
平均延时:
W=k≥0∑μk+1ϕ(k)
ϕ(k) 为当一个包裹到达时已经有 k 个包裹的概率
从而得到
W=λ−μ1−μ
利特尔法则 Little's Law:
L=λW
其中 L 是系统中的平均客户,λ 是客户的平均到达速率,W 是客户的平均时间
多重访问
N 个设备,每个设备的传送概率 p,根据伯努利,有
P(X(n)=1)=Np(1−p)N−1
最大的成功速率是当 p=1/N 时,λ∗=e1=0.36
故可以达到 36% 的传递速率,但是需要知道多少设备活跃着
多路技术 B
特征函数
随机变量 X 的特征函数 characteristic function 是
ϕX(u)=E(eiuX)
注意到
ϕX(u)=∫−∞∞eiuxfX(x)dx
即 ϕX(u) 是 fX(x) 的傅里叶变换
若 X=N(0,1),则
ϕX(u)=e−2u2
中心极限定理的证明
ϕY(n)(u)=[1−u2/(2n)+o(1/n)n]→e−u2/2
N(0, 1) 的矩
由 ϕX(u) 的两种表示形式:
ϕX(u)=E(eiuX)=n=1∑∞n!1(iu)nE(Xn)
ϕX(u)=e−u2/2=m=0∑∞m!1(−2u2)m
所以得到
E(X2m)=m!2m(2m)!
注意到 E(X2m+1)=0
两个独立 N(0, 1) 的平方的和
fX,Y(x,y)dxdy=2πdθe−r2/2rdr=fθ(θ)dθ⋅fR(r)dr
可以发现 θ 和 r 无关
特征函数的两个应用
泊松是二项分布的极限:泊松的平均值为 λ 的随机变量可以看做 B(n,λ/n)
对于二项分布,有
E(exp(iuXn))=[1+nλ(eiu−1)]n
对于泊松,有
E(exp(iuX))=exp(λ(eiu−1))
取前者的极限,可得结果
指数是几何的极限:
因为有
n1Xn→X
分别计算两边:
E(eiuX)=λ−iuλ
E(exp(iun1Xn))=λ−iu+o(1/n)λ
误差函数
在计算置信区间时,使用到了 Q(x)=P(X>x)
该函数的上界和下界为:
1+x2x2π1exp(−2x2)≤Q(x)≤x2π1exp(−2x2)
可适应多重访问
调整时间 n 时的设备传递概率 p(n):
p(n+1)=⎩⎪⎪⎨⎪⎪⎧p(n),X(n)=1ap(n),X(n)>1min(bp(n),1),X(n)=0
其中 a∈(0,1),b>1,即思想是如果没有设备传递则增加,在冲突后减小
网络 Networks
传播谣言
树形结构,从上至下传递,每个节点的子节点平均值为 μ,则 Z 为最终收到消息的节点数,有
- 如果 μ<1,则 P(Z<∞)=1,E(Z)<∞
- 如果 μ>1,则 P(Z=∞)>0
瀑布
节点 n 独立听从节点 n-k 的建议,概率为 pk,则最终第一个节点的影响会消失
对于 pk=p,每个节点变红的概率为
θ=e−p1−p
播种市场
每个节点只听左邻居,概率为 p;每个节点收到产品的概率为 λ,该节点变红,则红色节点的比率为
ψ(λ)=0.51−p(1−λ)1+λ−p+λp
如果一个产品的花费为 c,售价为 s,则最大化利润的 λ 为
λ∗=min(1,p(1−p)1/2−(1−p)c0.5(s−c))
制造同意
随机选择三个人,三人的认识变为较多的一方。
媒体的力量:两蓝一红有 1-p 的概率变为蓝色,有 p 的概率不变,p 就代表着媒体的力量。
p(k)=P[Xn+1=k+1∣Xn=k]=(1−p)32N(2N−1)(2N−2)k(k−1)(2N−k)
q(k)=P[Xn+1=k−1∣Xn=k]=32N(2N−1)(2N−2)(2N−k)(2N−k−1)k
故可以求出
a(k)=P[T2N<T0∣X0=k]
最终得到递推关系:
α(k+1)=(1+(1−p)(k−1)2N−k−1)α(k)−(1−p)(k−1)2N−k−1α(k−1)
极化
模型:
-
如果 G(v,w)=1,则 v,w 是朋友
-
随机选取一个人,若其朋友大多为红色,则其变红
有如下结论:系统的状态收敛,但收敛结果是随机的。
- 对于前者,计算朋友之间的不一致程度,发现永远不增加,故收敛
- 对于后者,考虑一个矩形,相对顶点颜色相同,相邻顶点颜色不同,该矩形的收敛状态随机
M/M/1 队列
- 第一个 M 表示两次输入的时间间隔是无记忆的
- 第二个 M 表示服务时间是无记忆的
- 1 表示只有一个服务器
显然,还有其它的变形
易得,
L=E(Xt)=n=0∑∞n(1−ρ)ρn=μ−λλ
W=μ−λ1
队列网络
定义通过队列的速率 λ
λ1=γ1+λ1p1
λ2=γ2+λ2p2
λ3=λ1+λ2
令 ρk=λk/μk,则有唯一的不变分布为:
π(x1,x2,x3)=π1(x1)π2(x2)π3(x3)
π1(n)=(1−ρ1)p1n
π2(n)=(1−ρ2)p2n
π3(a1,…,an)=p(a1)⋯p(an)(1−p3)ρ3n
其中 p(1)=λ1/(λ1+λ2),p(2)=λ2/(λ1+λ2)
让我们惊讶的是,三个队列的分布居然无关,对于每个队列,其可以等效为一个 M/M/1 的队列 λ,μ