概率论与数理统计部分

第一章 随机事件与概率

1. 事件的运算律

  • 交换律:AB=BAA \cup B = B \cup AAB=BAA \cap B = B \cap A
  • 德·摩根律(对偶律):AB=AB\overline{A \cup B} = \overline{A} \cap \overline{B}AB=AB\overline{A \cap B} = \overline{A} \cup \overline{B}

2. 概率五大计算公式

  1. 加法公式 P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(AB) P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)
  2. 乘法公式 若P(A)>0P(A)>0,则P(AB)=P(BA)P(A)P(AB) = P(B|A)P(A);若P(B)>0P(B)>0,则P(AB)=P(AB)P(B)P(AB) = P(A|B)P(B)P(AB)>0P(AB)>0,则P(ABC)=P(CAB)P(BA)P(A)=P(CAB)P(AB)P(B)P(ABC) = P(C|AB)P(B|A)P(A) = P(C|AB)P(A|B)P(B)
  3. 全概率公式 P(A)=i=1nP(ABi)P(Bi)P(A) = \sum_{i=1}^{n} P(A|B_i)P(B_i) 其中BiBj=(ij)B_iB_j = \varnothing(i \neq j)i=1nBi=Ω\bigcup_{i=1}^{n} B_i = \Omega
  4. 贝叶斯公式 P(BjA)=P(ABj)P(Bj)i=1nP(ABi)P(Bi)P(B_j|A) = \frac{P(A|B_j)P(B_j)}{\sum_{i=1}^{n} P(A|B_i)P(B_i)} 其中BiBj=(ij)B_iB_j = \varnothing(i \neq j)i=1nBi=Ω\bigcup_{i=1}^{n} B_i = \Omega 【注】上述公式中事件BiB_i的个数可以是可列个。

3. 事件的独立性

  1. 两个事件独立 AABB独立P(AB)=P(A)P(B)\Leftrightarrow P(AB) = P(A)P(B)
  2. 三个事件相互独立 A,B,CA,B,C相互独立{P(AB)=P(A)P(B),P(BC)=P(B)P(C),P(AC)=P(A)P(C),P(ABC)=P(A)P(B)P(C).\Leftrightarrow\begin{cases}P(AB)=P(A)P(B),\\P(BC)=P(B)P(C),\\P(AC)=P(A)P(C),\\P(ABC)=P(A)P(B)P(C).\end{cases}

4. 独立的性质与结论

  1. 若事件A,BA,B相互独立,则AAB\overline{B}A\overline{A}BBA\overline{A}B\overline{B}也相互独立。
  2. 独立的等价说法:若0<P(A)&lt;1,则 事件A,B独立P(AB)=P(A)P(B)P(B)=P(BA)P(B)=P(BA)P(BA)=P(BA).\begin{aligned}事件A,B独立 &\Leftrightarrow P(AB)=P(A)P(B)\\ &\Leftrightarrow P(B)=P(B|A)\\ &\Leftrightarrow P(B)=P(B|\overline{A})\\ &\Leftrightarrow P(B|A)=P(B|\overline{A}).\end{aligned}
  3. A1,A2,,Am,B1,B2,,BnA_1,A_2,\dots,A_m,B_1,B_2,\dots,B_n相互独立,则f(A1,A2,,Am)f(A_1,A_2,\dots,A_m)g(B1,B2,,Bn)g(B_1,B_2,\dots,B_n)也相互独立,其中f()f(\cdot)g()g(\cdot)分别表示对相应事件作任意事件运算。
  4. P(A)=0P(A)=0P(A)=1P(A)=1,则AA与任何事件BB都相互独立。

5. 独立、互斥、互逆的关系

  1. AABB互逆A\Rightarrow ABB互斥,但反之不一定成立;
  2. AABB互斥(或互逆)且均为非零概率事件A\Rightarrow ABB不独立;
  3. AABB相互独立且均为非零概率事件A\Rightarrow ABB不互斥。 【注】一般情况下,独立和互斥无关,独立推不出互斥、互斥也推不出独立。

6. 利用最值关系求概率

  1. {max{X,Y}a}={Xa}{Ya}\{\max\{X,Y\} \leq a\} = \{X \leq a\} \cap \{Y \leq a\}
  2. {max{X,Y}>a}={X>a}{Y>a}\{\max\{X,Y\} > a\} = \{X > a\} \cup \{Y > a\}
  3. {min{X,Y}a}={Xa}{Ya}\{\min\{X,Y\} \leq a\} = \{X \leq a\} \cup \{Y \leq a\}
  4. {min{X,Y}>a}={X>a}{Y>a}\{\min\{X,Y\} > a\} = \{X > a\} \cap \{Y > a\}
  5. {max{X,Y}a}{min{X,Y}a}\{\max\{X,Y\} \leq a\} \subseteq \{\min\{X,Y\} \leq a\}
  6. {min{X,Y}>a}{max{X,Y}>a}\{\min\{X,Y\} > a\} \subseteq \{\max\{X,Y\} > a\}

第二章 随机变量及其分布

1. 分布函数的性质

  1. 非负性:0F(x)10 \leq F(x) \leq 1
  2. 规范性:F()=0F(-\infty)=0F(+)=1F(+\infty)=1
  3. 单调不减性:对于任意x1<x2x_1<x_2,有F(x1)F(x2)F(x_1) \leq F(x_2)
  4. 右连续性:F(x0+0)=F(x0)F(x_0+0)=F(x_0)

2. 密度函数的性质

  1. 非负性:f(x) \geq 0(-\infty<x&lt;+\infty)
  2. 规范性:+f(x)dx=1\int_{-\infty}^{+\infty} f(x)dx = 1
  3. 对于任意实数aab(a<b)b(a<b),有P{a<Xb}=abf(x)dxP\{a<X \leq b\} = \int_{a}^{b} f(x)dx
  4. 对于连续型随机变量XX,有P{X=x}=0P\{X=x\}=0,对xR\forall x \in \mathbb{R}成立。
  5. 连续型随机变量的分布函数F(x)F(x)是连续函数。
  6. f(x)f(x)的连续点处,有F(x)=f(x)F'(x)=f(x)

3. 常用分布(离散型)

  1. 0-1分布:XB(1,p)X \sim B(1,p) P(X=k)=pk(1p)1k,(k=0,1)P(X=k)=p^k(1-p)^{1-k},(k=0,1) EX=pEX=pDX=p(1p)DX=p(1-p)
  2. 二项分布:XB(n,p)X \sim B(n,p) P(X=k)=Cnkpk(1p)nk,(k=0,1,,n)P(X=k)=C_n^k p^k(1-p)^{n-k},(k=0,1,\dots,n) EX=npEX=npDX=np(1p)DX=np(1-p)
  3. 泊松分布:XP(λ)(λ>0)X \sim P(\lambda)(\lambda>0) P(X=k)=λkk!eλ,(k=0,1,2)P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},(k=0,1,2\cdots) EX=λEX=\lambdaDX=λDX=\lambda
  4. 几何分布:XG(p)X \sim G(p) P(X=k)=p(1-p)^{k-1},(0<p&lt;1,k=1,2,\dots) EX=1pEX=\frac{1}{p}DX=1pp2DX=\frac{1-p}{p^2}
  5. 超几何分布:XH(N,M,n)X \sim H(N,M,n) P(X=k)=CMkCNMnkCNn,(k=0,1,,min{n,M})P(X=k)=\frac{C_M^k C_{N-M}^{n-k}}{C_N^n},(k=0,1,\dots,\min\{n,M\})

4. 常用分布(连续型)

  1. 均匀分布:XU(a,b)X \sim U(a,b) f(x)={1ba,a<x<b,0,其他.f(x)=\begin{cases}\frac{1}{b-a},&a<x<b,\\0,&其他.\end{cases} EX=a+b2EX=\frac{a+b}{2}DX=(ba)212DX=\frac{(b-a)^2}{12}
  2. 指数分布:XE(λ)(λ>0)X \sim E(\lambda)(\lambda>0) EX=1λEX=\frac{1}{\lambda}DX=1λ2DX=\frac{1}{\lambda^2}
  3. 正态分布
  • 一般正态分布:XN(μ,σ2)X \sim N(\mu,\sigma^2) f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},(-\infty<x&lt;+\infty,\sigma>0) EX=μEX=\muDX=σ2DX=\sigma^2
  • 标准正态分布:XN(0,1)X \sim N(0,1) \varphi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}(-\infty<x&lt;+\infty) 性质:Φ(x)=1Φ(x)\Phi(-x)=1-\Phi(x)Φ(0)=12\Phi(0)=\frac{1}{2}P{Xa}=2Φ(a)1P\{|X| \leq a\}=2\Phi(a)-1α\alpha分位点:设XN(0,1)X \sim N(0,1),对于给定的\alpha(0&lt;\alpha&lt;1),若uαu_{\alpha}满足P{X>uα}=αP\{X>u_{\alpha}\}=\alpha,则称uαu_{\alpha}为标准正态分布的上α\alpha分位点。
  • 标准正态分布与一般正态分布的关系:正态分布XN(μ,σ2)X \sim N(\mu,\sigma^2)通过线性变换Z=XμσZ=\frac{X-\mu}{\sigma}变为标准正态分布。

5. 一维随机变量函数的分布

  1. 离散型 若P(X=xi)=piP(X=x_i)=p_iY=g(X)Y=g(X),则YY的分布律为P(Y=g(xi))=piP(Y=g(x_i))=p_i
  2. 连续型 分布函数法: FY(y)=P(Yy)=P(g(X)y)=g(x)yfX(x)dxF_Y(y)=P(Y \leq y)=P(g(X) \leq y)=\int_{g(x) \leq y} f_X(x)dx fY(y)=FY(y)f_Y(y)=F_Y'(y)

第三章 多维随机变量及其分布

1. 联合函数的概念与性质

  1. 定义 二维随机变量(X,Y)(X,Y)的联合分布函数F(x,y)=P\{X \leq x,Y \leq y\}(-\infty<x&lt;+\infty,-\infty<y&lt;+\infty),表示{Xx}\{X \leq x\}{Yy}\{Y \leq y\}同时发生的概率。
  2. 性质
  • 非负性:x,yR\forall x,y \in \mathbb{R}0F(x,y)10 \leq F(x,y) \leq 1
  • 规范性:F(,y)=0F(-\infty,y)=0F(x,)=0F(x,-\infty)=0F(,)=0F(-\infty,-\infty)=0F(+,+)=1F(+\infty,+\infty)=1
  • 单调不减性:F(x,y)F(x,y)分别关于xxyy单调不减
  • 右连续性:F(x,y)=F(x+0,y)F(x,y)=F(x+0,y)F(x,y)=F(x,y+0)F(x,y)=F(x,y+0)

2. 二维离散型随机变量及其分布

  1. 定义 若(X,Y)(X,Y)可能取值为有限对或可列无穷多对实数,则称(X,Y)(X,Y)为二维离散型随机变量。
  2. 联合分布律 P(X=xi,Y=yj)=pij,(i,j=1,2,)P(X=x_i,Y=y_j)=p_{ij},(i,j=1,2,\dots)
  3. 边缘分布律 P{X=xi}=j=1+pij=pi(i=1,2,)P\{X=x_i\}=\sum_{j=1}^{+\infty} p_{ij}=p_{i\cdot}(i=1,2,\dots) P{Y=yj}=i=1+pij=pj(j=1,2,)P\{Y=y_j\}=\sum_{i=1}^{+\infty} p_{ij}=p_{\cdot j}(j=1,2,\dots)
  4. 条件分布律
  • 给定Y=yjY=y_jP{Y=yj}>0P\{Y=y_j\}>0P{X=xiY=yj}=pijpjP\{X=x_i|Y=y_j\}=\frac{p_{ij}}{p_{\cdot j}}
  • 给定X=xiX=x_iP{X=xi}>0P\{X=x_i\}>0P{Y=yjX=xi}=pijpiP\{Y=y_j|X=x_i\}=\frac{p_{ij}}{p_{i\cdot}}

3. 二维连续型随机变量及其分布

  1. 定义 若存在非负可积二元函数f(x,y)f(x,y),使得F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y} f(u,v)dudv,则称(X,Y)(X,Y)为二维连续型随机变量,f(x,y)f(x,y)为联合概率密度。
  2. 性质
  • f(x,y) \geq 0(-\infty<x,y&lt;+\infty)
  • ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x,y)dxdy=1
  • P{(X,Y)D}=Df(x,y)dσP\{(X,Y) \in D\}=\iint_D f(x,y)d\sigma
  • f(x,y)f(x,y)连续处,f(x,y)=2F(x,y)xyf(x,y)=\frac{\partial^2 F(x,y)}{\partial x \partial y}
  1. 边缘密度函数 fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty} f(x,y)dyfY(y)=+f(x,y)dxf_Y(y)=\int_{-\infty}^{+\infty} f(x,y)dx
  2. 条件密度函数
  • fY(y)>0f_Y(y)>0时,fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}
  • fX(x)>0f_X(x)>0时,fYX(yx)=f(x,y)fX(x)f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}

4. 两个常见的二维连续型分布

  1. 二维均匀分布
  • 定义:设GG为平面有界区域,面积为G|G|,则 f(x,y)={1G,(x,y)G,0,(x,y)Gf(x,y)=\begin{cases}\frac{1}{|G|},&(x,y) \in G,\\0,&(x,y) \notin G\end{cases}
  • 性质:矩形区域上的二维均匀分布,分量X,YX,Y独立且分别服从一维均匀分布。
  1. 二维正态分布
  • 定义:(X,Y)N(μ1,μ2;σ12,σ22;ρ)(X,Y) \sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho) f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]}\begin{aligned}f(x,y)=&\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left\{\frac{-1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2}-\right.\right.\\&\left.\left.\frac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}\end{aligned}
  • 性质
    1. XN(μ1,σ12)X \sim N(\mu_1,\sigma_1^2)YN(μ2,σ22)Y \sim N(\mu_2,\sigma_2^2)
    2. X,YX,Y独立ρ=0\Leftrightarrow \rho=0
    3. 非零线性组合服从一维正态分布
    4. 线性变换后仍服从二维正态分布

5. 随机变量的独立性

  1. 定义
  • 分布函数:F(x,y)=FX(x)FY(y)F(x,y)=F_X(x)F_Y(y)
  • 离散型:pij=pipjp_{ij}=p_{i\cdot}p_{\cdot j}
  • 连续型:f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)
  1. 性质
  • X,YX,Y独立,则f(X)f(X)g(Y)g(Y)独立
  • 多组独立随机变量的函数仍独立

6. 两个随机变量简单函数的概率分布

  1. 离散型 P(Z=zk)=g(xi,yj)=zkpijP(Z=z_k)=\sum_{g(x_i,y_j)=z_k} p_{ij}
  2. 连续型
  • 分布函数法:FZ(z)=P{g(X,Y)z}=g(x,y)zf(x,y)dxdyF_Z(z)=P\{g(X,Y) \leq z\}=\iint_{g(x,y) \leq z} f(x,y)dxdy
  • 卷积公式(Z=X+YZ=X+Y):fZ(z)=+fX(x)fY(zx)dxf_Z(z)=\int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dxX,YX,Y独立)

第四章 随机变量的数字特征

1. 一维随机变量的数学期望

(1) 离散型

设随机变量XX的分布律为P{X=xi}=pi(i=1,2,)P\{X=x_i\}=p_i(i=1,2,\cdots),若级数i=1xipi\sum_{i=1}^{\infty}x_ip_i绝对收敛,则称EX=i=1xipiEX=\sum_{i=1}^{\infty}x_ip_i为随机变量XX的数学期望。

(2) 连续型

设连续型随机变量XX的概率密度为f(x)f(x),若积分+xf(x)dx\int_{-\infty}^{+\infty}xf(x)dx绝对收敛,则称EX=+xf(x)dxEX=\int_{-\infty}^{+\infty}xf(x)dxXX的数学期望。

(3) 随机变量函数Y=g(X)Y=g(X)的期望

XX是一个随机变量,g(x)g(x)为连续实函数,令Y=g(X)Y=g(X)

  1. 离散型:若XX的分布律为P{X=xi}=pi(i=1,2,)P\{X=x_i\}=p_i(i=1,2,\cdots),则EY=E[g(X)]=i=1g(xi)piEY=E[g(X)]=\sum_{i=1}^{\infty}g(x_i)p_i
  2. 连续型:若XX的密度函数为fX(x)f_X(x),则EY=E[g(X)]=+g(x)fX(x)dxEY=E[g(X)]=\int_{-\infty}^{+\infty}g(x)f_X(x)dx

2. 二维随机变量的数学期望

(1) 离散型

(X,Y)(X,Y)的概率分布为P{X=xi,Y=yj}=pijP\{X=x_i,Y=y_j\}=p_{ij},则EX=ixipi=ijxipijEX=\sum_{i}x_ip_{i\cdot}=\sum_{i}\sum_{j}x_ip_{ij}EY=jyjpj=ijyjpijEY=\sum_{j}y_jp_{\cdot j}=\sum_{i}\sum_{j}y_jp_{ij}

(2) 连续型

(X,Y)(X,Y)的联合概率密度为f(x,y)f(x,y),则EX=+xfX(x)dx=++xf(x,y)dxdyEX=\int_{-\infty}^{+\infty}xf_X(x)dx=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xf(x,y)dxdyEY=+yfY(y)dy=++yf(x,y)dxdyEY=\int_{-\infty}^{+\infty}yf_Y(y)dy=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)dxdy

(3) 随机变量函数Z=g(X,Y)Z=g(X,Y)的期望

(X,Y)(X,Y)为二维随机变量,g(x,y)g(x,y)为二元连续实函数,令Z=g(X,Y)Z=g(X,Y)

  1. 离散型:若(X,Y)(X,Y)的联合分布律为P{X=xi,Y=yj}=pij(i,j=1,2,)P\{X=x_i,Y=y_j\}=p_{ij}(i,j=1,2,\cdots),则EZ=E[g(X,Y)]=i=1j=1g(xi,yj)pijEZ=E[g(X,Y)]=\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}g(x_i,y_j)p_{ij}
  2. 连续型:若(X,Y)(X,Y)的联合密度函数为f(x,y)f(x,y),则EZ=E[g(X,Y)]=++g(x,y)f(x,y)dxdyEZ=E[g(X,Y)]=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy

3. 最值的数学期望

Xi(i=1,2,,n;n2)X_i(i=1,2,\cdots,n;n\geq2)独立同分布,其分布函数为F(x)F(x),概率密度为f(x)f(x),记Y=min{X1,X2,,Xn}Y=\min\{X_1,X_2,\cdots,X_n\}Z=max{X1,X2,,Xn}Z=\max\{X_1,X_2,\cdots,X_n\},则 FY(y)=1[1F(y)]n,fY(y)=n[1F(y)]n1f(y)EY=+yfY(y)dy;F_Y(y)=1-[1-F(y)]^n,f_Y(y)=n[1-F(y)]^{n-1}f(y)\Rightarrow EY=\int_{-\infty}^{+\infty}yf_Y(y)dy; FZ(z)=[F(z)]n,fZ(z)=n[F(z)]n1f(z)EZ=+zfZ(z)dz.F_Z(z)=[F(z)]^n,f_Z(z)=n[F(z)]^{n-1}f(z)\Rightarrow EZ=\int_{-\infty}^{+\infty}zf_Z(z)dz.

4. 数学期望的性质

  1. E(C)=CE(C)=CE(EX)=EXE(EX)=EX
  2. E(CX)=CEXE(CX)=CEX
  3. E(X±Y)=EX±EYE(X\pm Y)=EX\pm EY
  4. XXYY相互独立,则有E(XY)=EXEYE(XY)=EXEY

5. 方差

(1) 随机变量XX的方差定义

XX是一个随机变量,如果E(XEX)2E(X-EX)^2存在,则称DX=E(XEX)2DX=E(X-EX)^2XX的方差,称DX\sqrt{DX}为标准差或均方差。

(2) 方差的计算公式

DX=EX2(EX)2DX=EX^2-(EX)^2

(3) 方差的性质

  1. D(C)=0D(C)=0D[E(X)]=0D[E(X)]=0D[D(X)]=0D[D(X)]=0
  2. D(CX)=C2DXD(CX)=C^2DX
  3. D(C1X+C2)=C12D(X)D(C_1X+C_2)=C_1^2D(X)
  4. D(X±Y)=DX+DY±2cov(X,Y)D(X\pm Y)=DX+DY\pm2\text{cov}(X,Y)
  5. X,YX,Y相互独立,则D(X±Y)=DX+DYD(X\pm Y)=DX+DY

6. 常用分布的EX,DXEX,DX

  1. 0-1分布:EX=pEX=pDX=p(1p)DX=p(1-p)
  2. 二项分布XB(n,p)X\sim B(n,p)EX=npEX=npDX=np(1p)DX=np(1-p)
  3. 泊松分布XP(λ)X\sim P(\lambda)EX=λEX=\lambdaDX=λDX=\lambda
  4. 几何分布XG(p)X\sim G(p)EX=1pEX=\frac{1}{p}DX=1pp2DX=\frac{1-p}{p^2}
  5. 均匀分布XU(a,b)X\sim U(a,b)EX=a+b2EX=\frac{a+b}{2}DX=(ba)212DX=\frac{(b-a)^2}{12}
  6. 指数分布XE(λ)X\sim E(\lambda)EX=1λEX=\frac{1}{\lambda}DX=1λ2DX=\frac{1}{\lambda^2}
  7. 正态分布XN(μ,σ2)X\sim N(\mu,\sigma^2)EX=μEX=\muDX=σ2DX=\sigma^2

7. 亚当夏娃公式

条件期望

  1. 离散型(X,Y)pij(X,Y)\sim p_{ij}E(XY=y)=ixiP{X=xiY=y}E(X|Y=y)=\sum_{i}x_iP\{X=x_i|Y=y\}
  2. 连续型(X,Y)f(x,y)(X,Y)\sim f(x,y)E(XY=y)=+xf(xy)dxE(X|Y=y)=\int_{-\infty}^{+\infty}xf(x|y)dx。 同理可定义E(YX=x)E(Y|X=x)

条件方差

D(XY)=E(X2Y)[E(XY)]2D(X|Y)=E(X^2|Y)-[E(X|Y)]^2

亚当公式

(X,Y)(X,Y)是二维随机变量,且EXEX存在,则EX=E[E(XY)]EX=E[E(X|Y)]

夏娃公式

DX=E[D(XY)]+D[E(XY)]DX=E[D(X|Y)]+D[E(X|Y)]

8. 协方差

(1) 定义

cov(X,Y)=E[(XEX)(YEY)]\text{cov}(X,Y)=E[(X-EX)(Y-EY)]

(2) 计算公式

cov(X,Y)=EXYEXEY\text{cov}(X,Y)=EXY-EXEY

(3) 性质

  1. cov(X,Y)=cov(Y,X)\text{cov}(X,Y)=\text{cov}(Y,X)
  2. cov(X,X)=DX\text{cov}(X,X)=DX
  3. cov(aX,bY)=abcov(X,Y)\text{cov}(aX,bY)=ab\text{cov}(X,Y)
  4. cov(X,C)=0\text{cov}(X,C)=0
  5. cov(k1X1±k2X2,Y)=k1cov(X1,Y)±k2cov(X2,Y)\text{cov}(k_1X_1\pm k_2X_2,Y)=k_1\text{cov}(X_1,Y)\pm k_2\text{cov}(X_2,Y)
  6. XXYY相互独立,则cov(X,Y)=0\text{cov}(X,Y)=0

9. 相关系数

(1) 定义

ρXY=cov(X,Y)DXDY\rho_{XY}=\frac{\text{cov}(X,Y)}{\sqrt{DX}\sqrt{DY}}

(2) 相关系数的性质

  1. ρXY1|\rho_{XY}|\leq1
  2. ρXY=1|\rho_{XY}|=1\Leftrightarrow存在常数a,ba,ba0a\neq0,使P{Y=aX+b}=1P\{Y=aX+b\}=1;当a>0a>0时,ρXY=1\rho_{XY}=1;当a&lt;0时,ρXY=1\rho_{XY}=-1

(3) 不相关的等价说法

ρXY=0cov(X,Y)=0EXY=EXEYD(X±Y)=DX+DY\rho_{XY}=0\Leftrightarrow\text{cov}(X,Y)=0\Leftrightarrow EXY=EXEY\Leftrightarrow D(X\pm Y)=DX+DY

(4) 不相关与独立的关系

  1. X,YX,Y相互独立X\Rightarrow XYY不相关,反之不成立;
  2. (X,Y)N(μ1,μ2;σ12,σ22;ρ)(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho),则XXYY独立和XXYY不相关等价。

10. 切比雪夫不等式

设随机变量XX的期望EXEX,方差DXDX都存在,则对任意ε>0\varepsilon>0均有 P{XEXε}DXε2P\{|X-EX|\geq\varepsilon\}\leq\frac{DX}{\varepsilon^2}P\{|X-EX|&lt;\varepsilon\}\geq1-\frac{DX}{\varepsilon^2}

第五章 大数定律与中心极限定理

1. 大数定律

(1) 依概率收敛

对于随机变量序列X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots和常数aa,如果对于任意给定的正数ε\varepsilon,有 \lim_{n\to\infty}P\{|X_n-a|&lt;\varepsilon\}=1 则称随机变量序列X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots依概率收敛于aa,记作XnPaX_n\stackrel{P}{\to}a

(2) 切比雪夫大数定律

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,数学期望EXiEX_i和方差DXiDX_i均存在,且方差DXiDX_i有公共上界,即存在常数CC,使DXiC(i=1,2,)DX_i\leq C(i=1,2,\cdots),则对于任意给定的正数ε\varepsilon,总有 \lim_{n\to\infty}P\left\{\left|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^nEX_i\right|&lt;\varepsilon\right\}=1

(3) 伯努利大数定律

nAn_Ann次独立重复试验中事件AA发生的次数,pp是事件AA在每次试验中发生的概率,则对于任意正数ε>0\varepsilon>0,有 \lim_{n\to\infty}P\left\{\left|\frac{n_A}{n}-p\right|&lt;\varepsilon\right\}=1

(4) 辛钦大数定律

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,服从相同的分布,具有数学期望EXi=μ(i=1,2,)EX_i=\mu(i=1,2,\cdots),则对于任意给定的正数ε\varepsilon,总有 \lim_{n\to\infty}P\left\{\left|\frac{1}{n}\sum_{i=1}^nX_i-\mu\right|&lt;\varepsilon\right\}=1

2. 中心极限定理

(1) 列维-林德伯格中心极限定理

设随机变量X1,X2,,Xn,X_1,X_2,\cdots,X_n,\cdots相互独立,服从相同的分布,具有数学期望EXi=μEX_i=\mu和方差DXi=σ2>0(i=1,2,)DX_i=\sigma^2>0(i=1,2,\cdots),则对于任意实数xx,有 limnP{i=1nXinμnσx}=Φ(x)\lim_{n\to\infty}P\left\{\frac{\sum_{i=1}^nX_i-n\mu}{\sqrt{n}\sigma}\leq x\right\}=\Phi(x)

(2) 棣莫弗-拉普拉斯中心极限定理

设随机变量XnX_n服从参数为n,p(0<p&lt;1,n=1,2,\cdots)的二项分布,即XnB(n,p)X_n\sim B(n,p),则对于任意实数xx,有 limnP{Xnnpnp(1p)x}=Φ(x)\lim_{n\to\infty}P\left\{\frac{X_n-np}{\sqrt{np(1-p)}}\leq x\right\}=\Phi(x)

第六章 数理统计的基本概念

1. 重要统计量

(1) 样本均值

X=1ni=1nXi,观测值x=1ni=1nxi\overline{X}=\frac{1}{n}\sum_{i=1}^nX_i,\text{观测值}\overline{x}=\frac{1}{n}\sum_{i=1}^nx_i

(2) 样本方差

S2=1n1i=1n(XiX)2,观测值s2=1n1i=1n(xix)2,ES2=σ2S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2,\text{观测值}s^2=\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2,ES^2=\sigma^2

(3) 样本标准差

S=1n1i=1n(XiX)2,观测值s=1n1i=1n(xix)2S=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2},\text{观测值}s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2}

(4) 样本kk阶原点矩

Ak=1ni=1nXik(k=1,2,)A_k=\frac{1}{n}\sum_{i=1}^nX_i^k(k=1,2,\cdots)

(5) 样本kk阶中心矩

bk=1ni=1n(XiX)k(k=2,3,)b_k=\frac{1}{n}\sum_{i=1}^n(X_i-\overline{X})^k(k=2,3,\cdots)

(6) 顺序统计量

设总体XX的分布函数为F(x)F(x)X1,X2,,XnX_1,X_2,\cdots,X_n是来自总体XX的样本,则 FX(n)(x)=P{max(X1,X2,,Xn)x}=[F(x)]nF_{X_{(n)}}(x)=P\{\max(X_1,X_2,\cdots,X_n)\leq x\}=[F(x)]^n FX(1)(x)=P{min(X1,X2,,Xn)x}=1[1F(x)]nF_{X_{(1)}}(x)=P\{\min(X_1,X_2,\cdots,X_n)\leq x\}=1-[1-F(x)]^n

2. 三大分布

(1) χ2\chi^2分布

  1. 典型模式:设随机变量X1,X2,,XnX_1,X_2,\cdots,X_n相互独立,且均服从标准正态分布N(0,1)N(0,1),则随机变量χ2=X12+X22++Xn2\chi^2=X_1^2+X_2^2+\cdots+X_n^2服从自由度为nnχ2\chi^2分布,记作χ2χ2(n)\chi^2\sim\chi^2(n)
  2. 性质:设Xχ2(n1)X\sim\chi^2(n_1)Yχ2(n2)Y\sim\chi^2(n_2),且XXYY相互独立,则X+Yχ2(n1+n2)X+Y\sim\chi^2(n_1+n_2)
  3. 数字特征:Eχ2=nE\chi^2=nDχ2=2nD\chi^2=2n
  4. α\alpha分位点χα2(n)\chi^2_\alpha(n):设χ2χ2(n)\chi^2\sim\chi^2(n),对于任给定的\alpha(0&lt;\alpha&lt;1),称满足条件P{χ2>χα2(n)}=αP\{\chi^2>\chi^2_\alpha(n)\}=\alpha的点χα2(n)\chi^2_\alpha(n)χ2(n)\chi^2(n)的上α\alpha分位点。

(2) tt分布

  1. 典型模式:设随机变量XN(0,1)X\sim N(0,1)Yχ2(n)Y\sim\chi^2(n),且XXYY相互独立,则随机变量t=XY/nt=\frac{X}{\sqrt{Y/n}}服从自由度为nntt分布,记作tt(n)t\sim t(n)
  2. 性质:tt分布的概率密度f(x)f(x)是偶函数,且limnf(x)=12πex22\lim_{n\to\infty}f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}},即当nn充分大时,t(n)t(n)分布近似于N(0,1)N(0,1)分布。
  3. α\alpha分位点tα(n)t_\alpha(n):设tt(n)t\sim t(n),对于任给定的\alpha(0&lt;\alpha&lt;1),称满足条件P{t>tα(n)}=αP\{t>t_\alpha(n)\}=\alpha的点tα(n)t_\alpha(n)t(n)t(n)的上α\alpha分位点。

(3) FF分布

  1. 典型模式:设随机变量Xχ2(m)X\sim\chi^2(m)Yχ2(n)Y\sim\chi^2(n),且XXYY相互独立,则随机变量F=X/mY/nF=\frac{X/m}{Y/n}服从自由度为(m,n)(m,n)FF分布,记作FF(m,n)F\sim F(m,n)
  2. 性质:若FF(m,n)F\sim F(m,n),则1FF(n,m)\frac{1}{F}\sim F(n,m)
  3. α\alpha分位点Fα(m,n)F_\alpha(m,n):设FF(m,n)F\sim F(m,n),对于任给定的\alpha(0&lt;\alpha&lt;1),称满足条件P{F>Fα(m,n)}=αP\{F>F_\alpha(m,n)\}=\alpha的点Fα(m,n)F_\alpha(m,n)F(m,n)F(m,n)的上α\alpha分位点。

3. 一个正态总体抽样分布的重要结论

X1,X2,,XnX_1,X_2,\cdots,X_n是来自正态总体XN(μ,σ2)X\sim N(\mu,\sigma^2)的样本,样本均值为X\overline{X},样本方差为S2S^2,则有

  1. XN(μ,σ2n)\overline{X}\sim N\left(\mu,\frac{\sigma^2}{n}\right)Xμσ/nN(0,1)\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)
  2. X\overline{X}S2S^2相互独立,且(n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)
  3. XμS/nt(n1)\frac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)
  4. 1σ2i=1n(Xiμ)2χ2(n)\frac{1}{\sigma^2}\sum_{i=1}^n(X_i-\mu)^2\sim\chi^2(n)

4. 两个正态总体的抽样分布

XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2)YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2)X1,X2,,Xn1X_1,X_2,\cdots,X_{n_1}Y1,Y2,,Yn2Y_1,Y_2,\cdots,Y_{n_2}分别为来自总体XXYY的样本,且两个样本相互独立,则有

  1. (XY)(μ1μ2)σ12n1+σ22n2N(0,1)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1)
  2. σ12=σ22\sigma_1^2=\sigma_2^2,则(XY)(μ1μ2)Sw1n1+1n2t(n1+n22)\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2),其中Sw2=(n11)S12+(n21)S22n1+n22S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}
  3. 1σ12i=1n1(Xiμ1)2/n11σ22j=1n2(Yjμ2)2/n2F(n1,n2)\frac{\frac{1}{\sigma_1^2}\sum_{i=1}^{n_1}(X_i-\mu_1)^2/n_1}{\frac{1}{\sigma_2^2}\sum_{j=1}^{n_2}(Y_j-\mu_2)^2/n_2}\sim F(n_1,n_2)
  4. S12/σ12S22/σ22F(n11,n21)\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\sim F(n_1-1,n_2-1)

第七章 参数估计与假设检验

1. 矩估计

(1) 原理:样本的kk阶原点矩依概率收敛于总体的kk阶原点矩。 (2) 解题步骤(待估参数为kkθ1,θ2,,θk\theta_1,\theta_2,\cdots,\theta_k

  1. 求出总体的kk阶原点矩μk=EXk(k=1,2,)\mu_k=EX^k(k=1,2,\cdots)
  2. 令样本的kk阶原点矩Ak=1ni=1nXikA_k=\frac{1}{n}\sum_{i=1}^n X_i^k等于总体的kk阶原点矩,即令EXk=1ni=1nXik(k=1,2,)EX^k=\frac{1}{n}\sum_{i=1}^n X_i^k(k=1,2,\cdots)
  3. 解上面的方程(方程组),得θi\theta_i的矩估计量为θ^i(X1,X2,,Xn)\hat{\theta}_i(X_1,X_2,\cdots,X_n),则θi\theta_i的矩估计值为θ^i(x1,x2,,xn)\hat{\theta}_i(x_1,x_2,\cdots,x_n)

【注】当待估参数为1个时,通常令EX=1ni=1nXiEX=\frac{1}{n}\sum_{i=1}^n X_i即可解出θ\theta的矩估计量与相应的矩估计值。

2. 最大似然估计法

(1) XX为连续型随机变量 设总体XX的密度函数为f(x;θ)f(x;\theta)X1,X2,,XnX_1,X_2,\cdots,X_n为取自XX的样本,则 L(x1,x2,,xn;θ)=i=1nf(xi;θ)L(x_1,x_2,\cdots,x_n;\theta)=\prod_{i=1}^n f(x_i;\theta) 称为似然函数,L(x1,x2,,xn;θ)L(x_1,x_2,\cdots,x_n;\theta)关于θ\theta的最大值点θ^\hat{\theta},称为θ\theta的最大似然估计。

(2) XX为离散型随机变量 设总体XX的分布律P{X=ai}=p(ai;θ) (i=1,2,)P\{X=a_i\}=p(a_i;\theta)\ (i=1,2,\cdots)X1,X2,,XnX_1,X_2,\cdots,X_n为取自XX的样本,则X1,X2,,XnX_1,X_2,\cdots,X_n的联合分布律 称为似然函数,L(x1,x2,,xn;θ)L(x_1,x_2,\cdots,x_n;\theta)关于θ\theta的最大值点θ^\hat{\theta},称为θ\theta的最大似然估计。

【注】上面(1),(2)中的θ\theta可以是多个待估参数(θ1,θ2,,θk)(\theta_1,\theta_2,\cdots,\theta_k)

(3) 最大似然估计的解题步骤(待估参数为kkθ1,θ2,,θk\theta_1,\theta_2,\cdots,\theta_k

  1. 写出似然函数 L(x1,x2,,xn;θ1,θ2,,θk)=i=1np(xi;θ1,θ2,,θk), (离散型)L(x_1,x_2,\cdots,x_n;\theta_1,\theta_2,\cdots,\theta_k)=\prod_{i=1}^n p(x_i;\theta_1,\theta_2,\cdots,\theta_k),\ (\text{离散型}) L(x1,x2,,xn;θ1,θ2,,θk)=i=1nf(xi;θ1,θ2,,θk) (连续型)L(x_1,x_2,\cdots,x_n;\theta_1,\theta_2,\cdots,\theta_k)=\prod_{i=1}^n f(x_i;\theta_1,\theta_2,\cdots,\theta_k)\ (\text{连续型})
  2. 取对数lnL\ln L
  3. lnL\ln Lθ1,θ2,,θk\theta_1,\theta_2,\cdots,\theta_k可微,求偏导数lnLθi (i=1,2,,k)\frac{\partial \ln L}{\partial \theta_i}\ (i=1,2,\cdots,k);判断方程组lnLθi=0\frac{\partial \ln L}{\partial \theta_i}=0是否有解,若有解,则其解即为所求最大似然估计;若无解则要考虑极大似然估计的意义(使似然函数取得最大值),此时,估计值常在θi\theta_i的边界点上达到。

【注】对于只有一个未知参数只需将步骤中求偏导变为一元函数求导即可。

3. 估计量的无偏性、有效性、一致性(相合性)

(1) 无偏性 如果θ\theta的估计量θ^(X1,X2,,Xn)\hat{\theta}(X_1,X_2,\cdots,X_n)的数学期望Eθ^E\hat{\theta}存在,且Eθ^=θE\hat{\theta}=\theta,则称θ^(X1,X2,,Xn)\hat{\theta}(X_1,X_2,\cdots,X_n)是未知参数θ\theta的无偏估计量。

(2) 有效性 θ^1(X1,X2,,Xn)\hat{\theta}_1(X_1,X_2,\cdots,X_n)θ^2(X1,X2,,Xn)\hat{\theta}_2(X_1,X_2,\cdots,X_n)都是未知参数θ\theta的无偏估计量,若D(θ^1)D(θ^2)D(\hat{\theta}_1)\leq D(\hat{\theta}_2),且至少对于某一个θΘ\theta\in\Theta上式中的不等号成立,则称θ^1(X1,X2,,Xn)\hat{\theta}_1(X_1,X_2,\cdots,X_n)θ^2(X1,X2,,Xn)\hat{\theta}_2(X_1,X_2,\cdots,X_n)更有效。

(3) 一致性(相合性) 若对任意ε>0\varepsilon>0,有\lim\limits_{n\to\infty} P(|\hat{\theta}-\theta|&lt;\varepsilon)=1,则称θ^\hat{\theta}θ\theta的一致估计量。

4. 区间估计

单正态总体的区间估计 设XN(μ,σ2)X\sim N(\mu,\sigma^2)X1,X2,,XnX_1,X_2,\cdots,X_n为随机样本,样本均值为X\overline{X},样本方差为s2s^2

5. 假设检验

(1) 假设检验的两类错误

  1. 第一类错误(弃真错误) 当H0H_0为真时,而样本值却落入了拒绝域,选择拒绝原假设H0H_0,记犯此类错误的概率α\alpha,即 P{否定H0H0为真}=αP\{\text{否定}H_0|H_0\text{为真}\}=\alpha

  2. 第二类错误(纳伪错误) 当H0H_0为假时,而样本值不在拒绝域,选择接受原假设H0H_0,记犯此类错误的概率β\beta,即 P{接受H0H0为假}=βP\{\text{接受}H_0|H_0\text{为假}\}=\beta

(2) 显著水平为α\alpha的单正态总体均值和方差的假设检验

原假设H0H_0备择假设H1H_1检验统计量拒绝域
μ=μ0\mu=\mu_0μμ0\mu\neq\mu_0U=Xμ0σ/nN(0,1)U=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1)U>uα/2\vert U\vert>u_{\alpha/2}
μ=μ0\mu=\mu_0μμ0\mu\neq\mu_0T=Xμ0S/nt(n1)T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}\sim t(n-1)T>tα/2(n1)\vert T\vert>t_{\alpha/2}(n-1)
σ2=σ02\sigma^2=\sigma_0^2σ2σ02\sigma^2\neq\sigma_0^2χ2=1σ02i=1n(Xiμ)2χ2(n)\chi^2=\frac{1}{\sigma_0^2}\sum_{i=1}^n(X_i-\mu)^2\sim\chi^2(n)χ2>χα/22(n)\chi^2>\chi^2_{\alpha/2}(n)\chi^2&lt;\chi^2_{1-\alpha/2}(n)
σ2=σ02\sigma^2=\sigma_0^2σ2σ02\sigma^2\neq\sigma_0^2χ2=(n1)S2σ02χ2(n1)\chi^2=\frac{(n-1)S^2}{\sigma_0^2}\sim\chi^2(n-1)χ2>χα/22(n1)\chi^2>\chi^2_{\alpha/2}(n-1)\chi^2&lt;\chi^2_{1-\alpha/2}(n-1)
Built with LogoFlowershow