概率论笔记
单调函数密度函数
已知随机变量X的概率密度函数fX(x),定义Y=g(X),g是严格单调函数,我们可以用下面的方法计算fY(y)。
首先记h=g−1。我们计算Y的分布函数。仅考虑递增的情况。
FY(y)=P(Y≤y)=P(g(X)≤y)=P(X≤h(y))=FX(h(y))接下来对分布函数进行求导,得到概率密度函数:
fY(y)=∂FY(y)∂y=∂FX(h(y))∂y=fX(h(y))h′(y)=fX(h(y))|h′(y)|绝对值密度函数
记Y=|X|,计算,计算FY
如下:
FY(y)=P(Y≤y)=P(|X|≤y)=P(−y≤X≤y)=FX(y)−FX(−y)对分布函数求导得到密度函数:
fY(y)=∂FY(y)∂y=fX(y)+fX(−y)重期望法则
对于任意两个随机变量X、Y。
E[X]=∫∞−∞xfX(x)dx=∫∞−∞xdx∫∞−∞fX|Y(x|y)fY(y)dy=∫∞−∞fY(y)dy∫∞−∞xfX|Y(x|y)dx=∫∞−∞E[X|Y=y]fY(y)dy=E[E[X|Y]]离散情况下只需要将积分符号替换为∑即可。
重方差法则
对于任意两个随机变量X、Y。
var[X]=E[X2]−E[X]2=E[E[X2|Y]]−E[E[X|Y]]2=E[E[X|Y]2]−E[E[X|Y]]2+E[E[X2|Y]]−E[E[X|Y]2]=var[E[X|Y]]+E[E[X2|Y]−E[X|Y]2]=var[E[X|Y]]+E[var[X|Y]]矩母函数
随机变量X的矩母函数定义为:
EX(s)=E[esX]对矩母函数进行求导可以得到:
ddsnMX(s)=ddsn∫∞−∞esxfX(x)dx=∫∞−∞d(esx)dsnfX(x)dx=∫∞−∞xnesxfX(x)dx当s取0时有:
ddsnMX(0)=∫∞−∞xnfX(x)dx=E[Xn]两个变量的和
记Z=X+Y,计算分布函数得到:
FZ|X(z|x)=P(Z≤z|X=x)=P(X+Y≤z|X=x)=P(Y≤z−x)=FY(z−x)对分布函数求导得到密度函数:
fZ|X(z|x)=ddzFZ|X(z|x)=ddzFY(z−x)=fY(z−x)同理,当X=Z−Y时,可以推出
FX|Y(x|y)=FZ(y+x)fX|Y(x|y)=fZ(y+x)协方差和相关性
定义协方差cov(X,Y):
cov(X,Y)=E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y]定义相关系数ρ(X,Y):
ρ(X,Y)=cov(X,Y)√var(X)var(Y)可以证明施瓦兹不等式:
0≤E[(X−E[XY]E[Y2]Y)2]=E[X2−2E[XY]E[Y2]XY+(E[XY])2(E[Y2])2Y2]=E[X2]−2E[XY]E[Y2]E[XY]+(E[XY])2(E[Y2])2E[Y2]=E[X2]−(E[XY])2E[Y2]⇒E[X2]E[Y2]≥(E[XY])2当E[Y2]=0时,最终得到的命题也是有效的。
当随机变量X与Y的相关系数有定义时(var(X),var(Y)>0),记¯X=X−E[X],¯Y=Y−E[Y],利用施瓦兹不等式可以得到:
ρ(X,Y)2=E(¯X¯Y)2E[¯X2]E[¯Y2]≤1⇒−1≤ρ(X,Y)≤1下面证明|ρ(X,Y)|=1当且仅当¯Y=k¯X的概率为1,其中k是常数。先证明必要性:
ρ(X,Y)=E[k¯X2]√k2E[¯X]2=k|k|再证明充分性,利用施瓦兹不等式可以得到等号成立的必要条件:
E[¯X2]E[¯Y2]=(E[¯X¯Y])2⇒¯X=E[¯X¯Y]E[¯Y2]¯Y=√E[¯X2]E[¯Y2]ρ(X,Y)¯Y马尔可夫链队列问题
队列长度为n,一旦队列满了,新来的信号就会被丢弃。队列被消费的时间遵循强度为λ的指数分布,队列到达信号的时间遵循强度为μ的指数分布。
我们可以建立n+1个状态,第i个状态对应队列包含i个信号。
对于状态i的稳态概率为πi。
可以推出:
π0=(1−μ)π0+λπ1⇒π1=μλπ0考虑对于任意i≥1,有:
πi=μπi−1+(1−μ−λ)πi+λπi+1⇒(μ+λ)πi=λπi+λπi+1⇒πi+1=μλπi容易发现πi是等差数列,可以直接得到πi=(μλ)iπ0。利用稳态概率之和为1继续推导:
π0+π1+…+πn=1⇒n∑i=0π0(μλ)i=1⇒π0=(μλ)n+1−1μλ−1⇒πi=(μλ)n+1−1μλ−1⋅(μλ)i再考虑期望:
E[X]=n∑i=0iπi=π0n∑i=0i(μλ)i⇒π0⋅n(μλ)n+2−(n+1)(μλ)n+1+(μλ)(μλ−1)2线性最小均方估计
设Θ是均值为μ 方差为σ20 的随机变量,X1,…,Xn是一下形式的多个观测值:Xi=Θ+Wi。其中观测误差Wi的均值为0,方差为σ2i。并且假设Θ,W1,…,Wn是互不相关的。现在我们通过选择系数使得下面函数取到最小值:
h(a1,…,an,b)=12E[(Θ−n∑i=1aiXi−b)2]而最优的取值方案为:
ˆΘ=μ/σ20+∑ni=1Xi/σ2i∑ni=11/σ2i证明: 我们需要证明当均方取到最小值时 a1,…,an,b 是:
b∗=μ/σ20∑ni=11/σ2ia∗j=1/σ2i∑ni=11/σ2i换言之,此时均方差的对于a1,…,an,b的偏导数均为0。求导得到
∂h∂b=E[(n∑i=1a∗i−1)Θ+n∑i=1a∗iWi+b∗]∂h∂ai=E[Xi((n∑i=1a∗i−1)Θ+n∑i=1a∗iWi+b∗)]根据$b^,a_i^$ 的定义可以得到
n∑i=1a∗i=1−b∗μ替换得到:
∂h∂b=E[−b∗μΘ+n∑i=1a∗iWi+b∗]=0接着处理∂h∂ai部分:
∂h∂ai=E[Xi((−b∗μ)Θ+n∑i=1a∗iWi+b∗)]=E[Xi((μ−Θ)b∗μ+n∑i=1a∗iWi)]=E[(Θ+Wi)((μ−Θ)b∗μ+n∑i=1a∗iWi)]=a∗iσ2i−σ20b∗μ=0至此,证明完毕。