边际分布与条件分布

边际分布与条件分布(以二维场合为例)

边际分布

离散随机变量的边际分布函数
考虑离散的二维随机向量(\xi,\eta),\xi\in\{x_1,x_2,...\},\eta\in\{y_1,y_2,...\} ,其分布函数为p(x_i,y_j)=P\{\xi=x_i,\eta=y_j\},i,j=1,2,,...
则对任意固定的ip_1(x_i)=P\{\xi=x_i\}=\sum_{j}P\{\xi=x_i,\eta=y_j\} ,以及任意固定的j,p_2(y_j)=P\{\eta=y_j\}=\sum_{i}P\{\xi=x_i,\eta=y_j\}
p_1(x_i)p_2(y_j) 称为p(x_i,y_j) 的边际分布
连续随机变量的边际分布函数与密度函数
考虑连续的二维随机变量(\xi,\eta) ,其分布函数为F(x,y) ,则可以由F(x,y) 得出\xi\eta 的分布函数
F_1(x)=P\{\xi[InvalidCharacterError: "X\}=P\{\XI<X,\ETA<\INFTY\}=F(X,+\INFTY)<" did not match the Name production] 以及F_2(y)=P\{\eta[InvalidCharacterError: "Y\}=P\{\XI<+\INFTY,\ETA<Y\}=F(+\INFTY,Y)<" did not match the Name production]
其中F_1(x),F_2(y) 称为F(x,y) 的边际分布函数,其对应的密度函数分别为p_1(x)=\int_{-\infty}^{+\infty}p(x,y)dy,p_2(y)=\int_{-\infty}^{+\infty}p(x,y)dx

条件分布

离散随机变量的边际分布函数
考虑离散的二维随机向量(\xi,\eta),\xi\in\{x_1,x_2,...\},\eta\in\{y_1,y_2,...\} ,其分布函数为p(x_i,y_j)=P\{\xi=x_i,\eta=y_j\},i,j=1,2,,...
若已知\xi=x_i(p_1(x_i)>0) ,则事件\{\eta=y_j\} 的条件概率为P\{\eta=y_i|\xi=x_i\}=\frac{P\{\xi=x_i,\eta=y_i\}}{P\{\xi=x_i\}}=\frac{p(x_i,y_j)}{p_1(x_i)}
连续型随机变量的边际分布函数与密度函数
考虑连续的二维随机变量(\xi,\eta) ,其分布函数为F(x,y) ,是绝对连续的,则在\xi=x 成立的条件下,事件\{\eta[InvalidCharacterError: "Y\}<" did not match the Name production] 的条件概率可以这样定义:
P\{\eta[InvalidCharacterError: "Y|\XI=X\}=\LIM_{\DELTA{X}\TO0}P\{\ETA<Y|X\LEQ\XI<X+\DELTA{X}\}=\LIM_{\DELTA{X}\TO0}\FRAC{P\{X\LEQ\XI<X+\DELTA{X},\ETA<Y\}}{P\{X\LEQ\XI<X+\DELTA{X}\}}=" did not match the Name production]
特别地,若存在连续的密度函数且p_1(x)\neq0 ,则有P\{\eta[InvalidCharacterError: "Y|\XI=X\}=\LIM_{\DELTA{X}\TO0}\FRAC{\INT_{X}^{X+\DELTA{X}}\INT_{-\INFTY}^{Y}P(U,V)DUDV}{\INT_{X}^{X+\DELTA{X}}\INT_{-\INFTY}^{+\INFTY}P(U,V)DUDV}=\FRAC{\INT_{-\INFTY}^{Y}P(X,V)DV}{P_1(X)}=\INT_{-\INFTY}^{Y}\FRAC{P(X,V)}{P_1(X)}DV<" did not match the Name production]
因此可知在\xi=x 的条件下p_1(x)\neq0 时,\eta 的分布密度函数为\frac{p(x,y)}{p_1(x)} ,同理在\eta=y 的条件下p_2(y)\neq0 时,\xi 的分布密度函数为\frac{p(x,y)}{p_2(y)}