平均
出典: フリー百科事典『ウィキペディア(Wikipedia)』
平均(へいきん)とは、観測されるデータから、その散らばり具合を "平らに均す(ならす)" 事によって得られる、統計的な指標である。平均値ともいう。
例えば A, B, C 三人の体重がそれぞれ 55 kg, 60 kg, 80 kg であったとすると、合計は 195 kg であり、これは 65 kg の人が三人いた場合と同じである。 このようなとき、A, B, C の体重の平均は 65 kg であるといわれる。 これは相加平均(後述)の一例であるが、特に断らずに平均という場合の多くは相加平均を指している。母集団ではなく標本から計算しているという意味で、標本平均と呼ぶこともある。
目次 |
[編集] いろいろな平均
n 個のデータ
があるとする。
[編集] 相加平均
上のデータの総和をnで割ったもの
を相加平均(または算術平均)という。 定義から明らかなように、データの総和は相加平均の n 倍と等しい。
[編集] 相乗平均
相加平均で足し算(加法)を考えていたところを、掛け算(乗法)に変えたものが相乗平均(または幾何平均)である。
相乗平均は、n 個のデータを全て掛け合わせたものの n 乗根として
で与えられる。 相乗平均の n 乗はすべてのデータの積に等しい。相乗平均は正値のデータに対してのみ定義される。
[編集] 調和平均
n 個のデータに対して、データの "逆数の相加平均" の逆数
を調和平均と呼ぶ。速さの平均や並列接続された電気抵抗の抵抗値などを考える場合に用いる。調和平均も正値のデータに対してのみ定義される。
[編集] 三種の平均の間の関係
n 個のデータが全て正の時、次のような大小関係が成り立つ。
- 相加平均 ≥ 相乗平均 ≥ 調和平均
なおかつ、等号が成り立つのは、
の時に限る。
[編集] 一般化
[編集] 一般化平均
n 個のデータに対し、パラメータ m を導入して、相加・相乗・調和の三つの平均概念を含む一般化平均を以下のように定める。
ここで、パラメータ m を例えば、m = 1 とすれば相加平均、m = -1 で調和平均、m → 0 の極限では相乗平均を得る。
これはさらに一般化が可能で、可逆な関数 f により
という平均が定義できる。f(x) = x により相加平均が、f(x) = 1/x により調和平均が、f(x) = log(x) により相乗平均がそれぞれ表されている事が分かる。
[編集] 加重平均
観測される値それぞれに重みがある時には、単に相加平均をとるのでなく重みを考慮した平均をとるのが便利である。各データ xi に、重み wi がついているときの加重平均(重み付き平均)は
と定義される。全ての重みが等しければ、これは通常の相加平均である。
[編集] 連続分布の相加平均
観測されるデータ xt が区間 [a, b] 上に連続的に分布しているとき、その相加平均は積分
と定義される。これは離散分布の相加平均に対して、無限個の平均を算出する操作を極限により表したものである。
[編集] 平均を用いる際の注意
調査では、平均は代表値としてしばしば使われる。ただし、それが調査の目的に適切かどうかは検討を必要とする。
いくつか例を上げる。
仮に、ある遊園地に来るグループの人数の平均が3.2人の時には、4人のグループもかなり多いだろう。この場合に観覧車の1部屋の定員を決めるなら、平均値に近い3人にするよりも4人にする方が1グループ単位で乗せられるグループが多くなるため適切であろう。
世帯の貯蓄の事例では、一部の大金持ちの巨大な貯蓄が平均値を引き上げてしまうため、最も多い数の貯蓄額が仮に300万円だとしても平均は700万円くらいになる。従って、一般的な世帯の貯蓄について考察するのが目的ならば中央値や最頻値を用いるべきである。
実験や医学では30例に満たない事例の平均から、何らかの結論を出す必要がある場合もある。この場合は、測定誤差が平均にもかなり混ざっており、統計学的な手法で平均値の精度を計算しないと誤った結論を出すおそれがある。