条件概率
维基百科,自由的百科全书
条件概率就是事件 A 在另外一个事件 B 已经发生条件下的发生概率。条件概率表示为 P(A|B),读作“在 B 条件下 A 的概率”。
联合概率表示两个事件共同发生的概率。A 与 B 的联合概率表示为 或者 P(A,B)。
边缘概率 是某个事件发生的概率,而与其它事件无关。边缘概率是這樣得到的:在聯合概率中,把最終結果中不需要的那些事件合并成其事件的全概率而消失(對离散隨机變量用求和得全概率,對連續隨机變量用積分得全概率)。這稱為邊緣化(marginalization)。A的边缘概率表示为 P(A),B 的边缘概率表示为 P(B)。
需要注意的是,在这些定义中 A 与 B 之间不一定有因果或者时间顺序关系。A 可能会先于 B 发生,也可能相反,也可能二者同时发生。A 可能会导致 B 的发生,也可能相反,也可能二者之间根本就没有因果关系。
例如考虑一些可能是新的信息的概率条件性可以通过贝叶斯定理实现。
目录 |
[编辑] 定义
在同一个样本空间 Ω 中的事件或者子集 A 与 B,如果随机从 Ω 中选出的一个元素属于 B,那么下一个随机选择的元素属于 A 的概率就定义为在 B 的前提下 A 的条件概率。从这个定义中,我们可以得出
分子、分母都除以 或者 |S| 得到
或者
。
[编辑] 统计独立性
当且仅当两个随机事件 A 与 B 满足
的时候,它们才是统计独立的,这样联合概率可以表示为各自概率的简单乘积。
同样,对于两个独立事件 A 与 B 有
以及
换句话说,如果 A 与 B 是相互独立的,那么 A 在 B 这个前提下的条件概率就是 A 自身的概率;同样,B 在 A 的前提下的条件概率就是 B 自身的概率。
[编辑] 互斥性
当且仅当 A 与 B 满足
且 :,
的时候,A 与 B 是互斥的。
因此,
换句话说,如果 B 已经发生,由于 A 不能 B 在同一场合下发生,那么 A 发生的概率为零;同样,如果 A 已经发生,那么 B 发生的概率为零。
[编辑] 其它
- 如果事件 B 的概率 P(B) > 0,那么 Q(A) = P(A | B) 在所有事件 A 上所定义的函数 Q 就是概率测度。
- 如果 P(B) = 0,P(A | B) 没有定义。
- 条件概率可以用决策树进行计算。
[编辑] 条件概率谬论
条件概率的谬论是假设 P(A|B) 大致等于 P(B|A)。数学家John Allen Paulos 在他的《数学盲》一书中指出医生、律师以及其他受过很好教育的非统计学家经常会犯这样的错误。这种错误可以通过用实数而不是概率来描述数据的方法来避免。
P(A|B) 與 P(B|A)的關係如下所示:
下面是一個虛構但寫實的例子,P(A|B) 與 P(B|A)的差距可能令人驚訝,同時也相當明顯。
若想分辨某些個體是否有重大疾病,以便早期治療,我們可能會對一大群人進行檢驗。雖然其益處明顯可見,但同時,檢驗行為有一個地方引起爭議,就是有檢出假陽性的結果的可能:若有個未得疾病的人,卻在初檢時被誤檢為得病,他可能會感到苦惱煩悶,一直持續到更詳細的檢測顯示他並未得病為止。而且就算在告知他其實是健康的人後,也可能因此對他的人生有負面影響。
這個問題的重要性,最適合用條件機率的觀點來解釋。
假設人群中有1%的人罹患此疾病,而其他人是健康的。我們隨機選出任一個體,並將患病以disease、健康以well表示:
- P(disease) = 1% = 0.01 and P(well) = 99% = 0.99.
假設檢驗動作實施在未患病的人身上時,有1%的機率其結果為假陽性(陽性以positive表示)。意即:
- P(positive | well) = 1%,而且P(negative | well) = 99%.
最後,假設檢驗動作實施在患病的人身上時,有1%的機率其結果為假陰性(陰性以negative表示)。意即:
- P(negative | disease) = 1%且P(positive | disease) = 99%。
現在,由計算可知:
是整群人中健康、且測定為陰性者的比率。
是整群人中得病、且測定為陽性者的比率。
是整群人中被測定為假陽性者的比率。
是整群人中被測定為假陰性者的比率。
進一步得出:
是整群人中被測出為陽性者的比率。
是某人被測出為陽性時,實際上真的得了病的機率。
這個例子裡面,我們很輕易可以看出 P(positive|disease)=99% 與 P(disease|positive)=50% 的差距:前者是你得了病,而被檢出為陽性的條件機率;後者是你被檢出為陽性,而你實際上真得了病的條件機率。由我們在本例中所選的數字,最終結果可能令人難以接受:被測定為陽性者,其中的半數實際上是假陽性。
[编辑] 参见
![]() |
概率分布 [ ] | |
---|---|---|
单随机变量 | 多随机变量 | |
离散概率分布 | 伯努利分布 • 二項分佈 • Boltzmann • compound Poisson • degenerate • Gauss-Kuzmin • 幾何分佈 • 超几何分布 • 对数分布 • negative binomial • parabolic fractal • zh-cn:泊松分布;zh-tw:卜氏分配 • Rademacher • Skellam • 離散型均勻分佈 • Yule-Simon • zeta • Zipf • Zipf-Mandelbrot | Ewens • 多項式分配 |
连续概率分布 | Beta • Beta prime • 柯西分布 • 卡方分佈 • 狄拉克δ函数 • Erlang • 指数分布 • 广义误差分布 • F-分布 • fading • Fisher's z • Fisher-Tippett • Gamma • generalized extreme value • generalized hyperbolic • 广义逆高斯分布 • Half-Logistic • Hotelling's T-square • hyperbolic secant • 超指数分布 • hypoexponential • inverse chi-square • 逆高斯分布 • inverse gamma • Kumaraswamy • Landau • 拉普拉斯分布 • Lévy • 稳定分布 • logistic • 对数正态分布 • 麦克斯韦-玻尔兹曼分布 • Maxwell speed • 正态分布 • Pareto • Pearson • polar • raised cosine • Rayleigh • relativistic Breit-Wigner • 萊斯分配 • 學生t-分佈 • 三角形分布 • type-1 Gumbel • type-2 Gumbel • 連續型均勻分布 • Voigt • von Mises • 韋氏分配 • Wigner semicircle | Dirichlet • Kent • 矩陣常態分配 • 多變量常態分配 • von Mises-Fisher • Wigner quasi • Wishart |
其它分布 | Cantor • 条件概率 • exponential family • infinitely divisible • location-scale family • marginal • maximum entropy • phase-type • posterior • prior • quasi • 抽樣分配 • singular |