概率论笔记

Published: by Creative Commons Licence

  • Tags:

单调函数密度函数

已知随机变量X的概率密度函数fX(x),定义Y=g(X)g是严格单调函数,我们可以用下面的方法计算fY(y)

首先记h=g1。我们计算Y的分布函数。仅考虑递增的情况。

FY(y)=P(Yy)=P(g(X)y)=P(Xh(y))=FX(h(y))

接下来对分布函数进行求导,得到概率密度函数:

fY(y)=FY(y)y=FX(h(y))y=fX(h(y))h(y)=fX(h(y))|h(y)|

绝对值密度函数

Y=|X|,计算,计算FY

如下:

FY(y)=P(Yy)=P(|X|y)=P(yXy)=FX(y)FX(y)

对分布函数求导得到密度函数:

fY(y)=FY(y)y=fX(y)+fX(y)

重期望法则

对于任意两个随机变量X、Y。

E[X]=xfX(x)dx=xdxfX|Y(x|y)fY(y)dy=fY(y)dyxfX|Y(x|y)dx=E[X|Y=y]fY(y)dy=E[E[X|Y]]

离散情况下只需要将积分符号替换为即可。

重方差法则

对于任意两个随机变量X、Y。

var[X]=E[X2]E[X]2=E[E[X2|Y]]E[E[X|Y]]2=E[E[X|Y]2]E[E[X|Y]]2+E[E[X2|Y]]E[E[X|Y]2]=var[E[X|Y]]+E[E[X2|Y]E[X|Y]2]=var[E[X|Y]]+E[var[X|Y]]

矩母函数

随机变量X的矩母函数定义为:

EX(s)=E[esX]

对矩母函数进行求导可以得到:

ddsnMX(s)=ddsnesxfX(x)dx=d(esx)dsnfX(x)dx=xnesxfX(x)dx

s0时有:

ddsnMX(0)=xnfX(x)dx=E[Xn]

两个变量的和

Z=X+Y,计算分布函数得到:

FZ|X(z|x)=P(Zz|X=x)=P(X+Yz|X=x)=P(Yzx)=FY(zx)

对分布函数求导得到密度函数:

fZ|X(z|x)=ddzFZ|X(z|x)=ddzFY(zx)=fY(zx)

同理,当X=ZY时,可以推出

FX|Y(x|y)=FZ(y+x)fX|Y(x|y)=fZ(y+x)

协方差和相关性

定义协方差cov(X,Y)

cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]

定义相关系数ρ(X,Y)

ρ(X,Y)=cov(X,Y)var(X)var(Y)

可以证明施瓦兹不等式:

0E[(XE[XY]E[Y2]Y)2]=E[X22E[XY]E[Y2]XY+(E[XY])2(E[Y2])2Y2]=E[X2]2E[XY]E[Y2]E[XY]+(E[XY])2(E[Y2])2E[Y2]=E[X2](E[XY])2E[Y2]E[X2]E[Y2](E[XY])2

E[Y2]=0时,最终得到的命题也是有效的。

当随机变量XY的相关系数有定义时(var(X),var(Y)>0),记¯X=XE[X]¯Y=YE[Y],利用施瓦兹不等式可以得到:

ρ(X,Y)2=E(¯X¯Y)2E[¯X2]E[¯Y2]11ρ(X,Y)1

下面证明|ρ(X,Y)|=1当且仅当¯Y=k¯X1,其中k是常数。先证明必要性:

ρ(X,Y)=E[k¯X2]k2E[¯X]2=k|k|

再证明充分性,利用施瓦兹不等式可以得到等号成立的必要条件:

E[¯X2]E[¯Y2]=(E[¯X¯Y])2¯X=E[¯X¯Y]E[¯Y2]¯Y=E[¯X2]E[¯Y2]ρ(X,Y)¯Y

马尔可夫链队列问题

队列长度为n,一旦队列满了,新来的信号就会被丢弃。队列被消费的时间遵循强度为λ的指数分布,队列到达信号的时间遵循强度为μ的指数分布。

我们可以建立n+1个状态,第i个状态对应队列包含i个信号。

对于状态i的稳态概率为πi

可以推出:

π0=(1μ)π0+λπ1π1=μλπ0

考虑对于任意i1,有:

πi=μπi1+(1μλ)πi+λπi+1(μ+λ)πi=λπi+λπi+1πi+1=μλπi

容易发现πi是等差数列,可以直接得到πi=(μλ)iπ0。利用稳态概率之和为1继续推导:

π0+π1++πn=1ni=0π0(μλ)i=1π0=(μλ)n+11μλ1πi=(μλ)n+11μλ1(μλ)i

再考虑期望:

E[X]=ni=0iπi=π0ni=0i(μλ)iπ0n(μλ)n+2(n+1)(μλ)n+1+(μλ)(μλ1)2

线性最小均方估计

Θ是均值为μ 方差为σ20 的随机变量,X1,,Xn是一下形式的多个观测值:Xi=Θ+Wi。其中观测误差Wi的均值为0,方差为σ2i。并且假设Θ,W1,,Wn是互不相关的。现在我们通过选择系数使得下面函数取到最小值:

h(a1,,an,b)=12E[(Θni=1aiXib)2]

而最优的取值方案为:

ˆΘ=μ/σ20+ni=1Xi/σ2ini=11/σ2i

证明: 我们需要证明当均方取到最小值时 a1,,an,b 是:

b=μ/σ20ni=11/σ2iaj=1/σ2ini=11/σ2i

换言之,此时均方差的对于a1,,an,b的偏导数均为0。求导得到

hb=E[(ni=1ai1)Θ+ni=1aiWi+b]hai=E[Xi((ni=1ai1)Θ+ni=1aiWi+b)]

根据$b^,a_i^$ 的定义可以得到

ni=1ai=1bμ

替换得到:

hb=E[bμΘ+ni=1aiWi+b]=0

接着处理hai部分:

hai=E[Xi((bμ)Θ+ni=1aiWi+b)]=E[Xi((μΘ)bμ+ni=1aiWi)]=E[(Θ+Wi)((μΘ)bμ+ni=1aiWi)]=aiσ2iσ20bμ=0

至此,证明完毕。