分散
出典: フリー百科事典『ウィキペディア(Wikipedia)』
分散(ぶんさん、variance)とは、確率論において、確率変数の2次の中心化モーメントの事で、確率変数の分布が期待値からどれだけばらけているかを示す値である。統計学においては、確率変数の分散だけでなく、標本が標本平均からどれだけばらけているかを示す指標として標本分散が用いられる。
[編集] 確率変数の分散
2乗可積分確率変数 X の分散は
で定義される。 別の書き方で
としても同じである。
チェビシェフの不等式の特別な場合として
が導けるが、これは分散が小さくなるほど期待値の近くに変数が分布している事を示すおおざっぱな評価である。
確率変数 X と Y が独立の場合 V[X + Y] = V[X] + V[Y] となる。
[編集] 標本分散
n 個のデータ x1, x2, ..., xn があって、 をそのデータの標本平均とした時に、
の 2 乗の平均
を標本分散という。
標本分散は、無限桁が計算出来る場合には、2 乗の平均から標本平均の 2 乗を引いた値
に等しい。 従って手計算などではこの計算による分散の計算が簡便でよい。しかし、無限桁が扱えないコンピュータでこの式による標本分散を計算すると、桁落ちによる誤差が発生して正しく計算できないおそれがあるので、定義の式で計算した方が良い。
母分散 σ2 の推定値としては
で表される不偏推定量 s2(不偏分散)を用いる事が多い。