随机试验:随机试验是一个过程,它所产生的试验结果是完全确定的。在每一次重复或者试验中,出现哪种结果完全由偶然性来决定。
样本空间:随机试验的样本空间是试验所有结果组成的一个集合。一种特定的试验结果被称为样本点(sample point), 它是样本空间中的一个元素。
事件是样本点的一个集合。事件的概率等于事件 中所有样本点的概率之和。
条件概率(Conditional Probability):
P ( A | B ) = P ( A ∩ B ) P ( B ) P\left(A\middle| B\right)=\frac{P\left(A\cap B\right)}{P\left(B\right)} P(A∣B)=P(B)P(A∩B)
全概率公式(Law of Total Probability):
P ( A ) = ∑ i = 1 n P ( A ∣ B i ) P ( B i ) P\left(A\right)=\sum_{i=1}^{n}P(A|B_{i})P(B_{i}) P(A)=∑i=1nP(A∣Bi)P(Bi)
贝叶斯公式(Bayes’ Theorem):
P ( B | A ) = P ( A | B ) P ( B ) ∑ i = 1 n P ( A | B i ) P ( B i ) P\left(B\middle| A\right)=\frac{P\left(A\middle| B\right)P\left(B\right)}{\sum_{i=1}^{n}{P\left(A\middle| B_i\right)P\left(B_i\right)}} P(B∣A)=∑i=1nP(A∣Bi)P(Bi)P(A∣B)P(B)
E ( X ) = ∑ i = 1 n x i P ( X = x i ) E(X) = \sum_{i=1}^{n} x_i P(X = x_i) E(X)=∑i=1nxiP(X=xi)
V a r ( X ) = E [ ( X − E ( X ) ) 2 ] = ∑ i = 1 n ( x i − E ( X ) ) 2 P ( X = x i ) Var(X) = E[(X - E(X))^2] = \sum_{i=1}^{n} (x_i - E(X))^2 P(X = x_i) Var(X)=E[(X−E(X))2]=∑i=1n(xi−E(X))2P(X=xi)
C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = ∑ i = 1 n ∑ j = 1 m ( x i − E ( X ) ) ( y j − E ( Y ) ) P ( X = x i , Y = y j ) = E ( X Y ) − E ( X ) E ( Y ) Cov(X, Y) = E[(X - E(X))(Y - E(Y))] = \sum_{i=1}^{n} \sum_{j=1}^{m} (x_i - E(X))(y_j - E(Y)) P(X = x_i, Y = y_j)=E(XY)-E(X)E(Y) Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=∑i=1n∑j=1m(xi−E(X))(yj−E(Y))P(X=xi,Y=yj)=E(XY)−E(X)E(Y)
ρ X , Y = C o v ( X , Y ) σ X σ Y \rho_{X,Y} = \frac{Cov(X, Y)}{\sigma_X \sigma_Y} ρX,Y=σXσYCov(X,Y)
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X) = \int_{-\infty}^{\infty} x f(x) dx E(X)=∫−∞∞xf(x)dx
V a r ( X ) = E [ ( X − E ( X ) ) 2 ] = ∫ − ∞ ∞ ( x − E ( X ) ) 2 f ( x ) d x Var(X) = E[(X - E(X))^2] = \int_{-\infty}^{\infty} (x - E(X))^2 f(x) dx Var(X)=E[(X−E(X))2]=∫−∞∞(x−E(X))2f(x)dx
二项分布可以通过极限过程转换为正态分布。正态分布PDF如下:
f ( x ∣ μ , σ ) = 1 2 π σ 2 e − ( x − μ ) 2 2 σ 2 f(x|\mu, \sigma) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} f(x∣μ,σ)=2πσ21e−2σ2(x−μ)2
泊松分布用于描述在固定时间或空间内随机事件发生的次数,而指数分布是泊松过程中两次事件发生之间的时间间隔的分布。如果一个事件是一个泊松过程,其中事件以平均速率 𝜆发生,那么两次连续事件发生的时间间隔将遵循指数分布。