平均(へいきん)とは、観測されるデータから、その散らばり具合を "平らに均す" ことによって得られる、統計的な指標である。平均値ともいう。
例えば A, B, C 三人の体重がそれぞれ 55 kg, 60 kg, 80 kg であったとすると、合計は 195 kg であり、これは 65 kg の人が三人いた場合と同じである。
このようなとき、A, B, C の体重の平均は 65 kg であるといわれる。
これは次に述べる相加平均の一例であるが、特に断らずに平均という場合の多くは相加平均のことを指している。母集団ではなく標本から計算しているという意味で、標本平均と呼ぶこともある。
調査では、平均は代表値としてしばしば使われる。ただしそれが調査の目的に適切かどうかは検討を必要とする。
いくつかあげてみよう。
仮に、ある遊園地に来るグループの人数の平均が3.2人の時には、4人のグループもかなり多い。この場合、観覧車の1部屋の定員は3人よりも4人の方が適切であろう。
世帯の貯蓄の事例では、平均を取ると一部の大金持ちの貯金が巨大なため、平均値を引き上げてしまう。最も多い数の貯蓄額のが仮に300万円だとしたら、平均は700万円くらいになってしまう。
実験や医学では30例に満たない事例の平均から、なんらかの結論を出す必要がある場合もある。この場合は、測定誤差が平均にもかなり混ざっており、統計学的な手法で平均値の精度を計算しないと誤った結論を出すおそれがある。
また平均では時系列的な変化がわからない。平均身長のように毎年あがっているような調査対象であるかもわからないことに留意するべきである。
いろいろな平均
n 個のデータ
-
があるとする。
相加平均
上のデータの総和を
nで割ったもの
-
を
相加平均(または
算術平均)という。
定義から明らかなように、データの総和は、相加平均の
n 倍と等しい。
相乗平均
相加平均で足し算(加法)を考えていたところを掛け算(乗法)に変えたものが
相乗平均(または
幾何平均)である。
相乗平均は、n 個のデータを全て掛け合わせたものの n 乗根として
-
で与えられる。
相乗平均の
n 乗は、すべてのデータの積に等しい。相乗平均は正値のデータに対してのみ定義される。
調和平均
n 個のデータに対して、データの "逆数の相加平均" の逆数
-
を
調和平均と呼ぶ。速度や、並列につながれた抵抗の電気抵抗等を考える場合、調和平均が"意味のある"平均を与える。調和平均も正値のデータに対してのみ定義される。
三種の平均の間の関係
n 個のデータが全て正のとき、次のような大小関係が成り立つ。
- 相加平均 ≥ 相乗平均 ≥ 調和平均
-
なおかつ、等号が成り立つのは、
-
の時に限る。
特に、「相加平均 ≥ 相乗平均」の関係は、「相加平均と相乗平均の間の関係」と呼ばれる。
一般化
一般化平均
n 個のデータに対し、
パラメータ m を導入して、相加・相乗・調和の三つの平均概念を含む一般平均を以下のように定める。
-
ここで、パラメータ m を例えば、m = 1 とすれば相加平均、m = -1 で調和平均、m → 0 の極限では相乗平均を得る。
これはさらに一般化が可能で、可逆な関数 f により
-
という平均が定義できる。f(x) = x により相加平均が、f(x) = 1/x により調和平均が、f(x) = log(x) により相乗平均がそれぞれ表されていることがわかる。
加重平均
観測される値それぞれに重みがあるときには、単に相加平均をとるのでなく重みを考慮した平均をとるのが便利である。各データ
xi に、重み
wi がついているときの加重平均(重み付き平均)は
-
と定義される。すべての重みが等しければ、これは通常の相加平均である。
連続分布の相加平均
観測されるデータ
xt が
区間 b 上に連続的に分布しているとき、その相加平均は積分
-
と定義される。これは離散分布の相加平均に対して、無限個の平均を算出する操作を
極限により表したものである。
関連項目
統計学 | 初等数学
Mittelwert | Mean | artimeettinen keskiarvo | Media | gemiddelde