Der Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. So wird manchmal in der Geometrie die Seitenhalbierende eines Dreiecks als Median bezeichnet, da sie das Dreieck in zwei flächengleiche Hälften teilt. Häufiger jedoch wird der Begriff in der Statistik verwendet, wo der Median eine Stichprobe oder allgemein eine Wahrscheinlichkeitsverteilung halbiert. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median meistens den Vorteil, robuster gegenüber Ausreißern zu sein.
Median einer Stichprobe
Bei einer sortierten Folge von Messwerten („geordnete
Stichprobe“) ist der
Median der Wert, des Elementes das in der Mitte liegt. Bei einer geraden Anzahl von Messwerten wird je nach Definition eines der beiden mittleren Elemente oder deren arithmetisches Mittel als Median gewählt.
Eine mögliche Definition ist also:
Der Median einer geordneten Stichprobe von Messwerten berechnet sich als
x_{(n+1)/2} & n \; \mathrm{ ungerade} \\
\frac{1}{2} \left( x_{(n/2)} + x_{(n/2\,+\,1)} \right) & n \;\mathrm{ gerade}
\end{cases}
.
Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. in diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian oder der Obermedian genutzt und als Median bezeichnet.
Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei _SELECT mittels des Medians der Mediane.
Beispiele
- Messwerte 1, 2, 4, 5, 18: Ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Der Durchschnitt dagegen ist 6.
- Messwerte 1, 1, 2, 3, 4, 37: Gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Durchschnitt dagegen ist 8.
Median einer Verteilung
Eine Verallgemeinerung des Begriffes liefert die
stochastische Betrachtung einer
Zufallsvariable bzw. deren
Verteilungsfunktion . Dort ist der
Median das 0,5-
Quantil, also
- .
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten
Obermedian.
Er gehört zu den Maßzahlen der
zentralen Verteilung, auch
Lagemaße genannt.
Median von gruppierten Daten
Vor allem in den
Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in
Intervallen gruppiert vorliegen. So wird beispielsweise bei
Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese
Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
Es seien
die Anzahl
aller Daten,
die jeweilige Anzahl der Daten der
-ten Gruppe und
bzw.
die entsprechenden oberen bzw. unteren Intervallgrenzen.
Zunächst wird nun die
mediane Klasse (oder
mediane Gruppe) bestimmt, d.h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z.B. die
-te Gruppe. Wenn keine weiteren Angaben über die
Verteilung der Daten gegeben sind, wird z.B.
Gleichverteilung postuliert, sodass man sich der
linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
-
Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.
Beispiel: Einkommen
| Klasse | Bereich bis | Gruppengröße |
| 1 | mind. 0, weniger als 1500 | 160 |
| 2 | mind. 1500, weniger als 2500 | 320 |
| 3 | mind. 2500, weniger als 3500 | 212 |
, also liegt der Median in der 2. Klasse (d.h. ), da die erste Klasse nur 160 Elemente umfasst.
Somit ergibt sich als Schätzung für den Median .
Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abzissenwert gesucht, der zum Ordinatenwert gehört. Bei kleinerem und geradem kann auch stattdessen der Ordinatenwert gewählt werden.
Vorteile des Medians
Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.
Beispiel:
Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:
- 9 Personen verdienen EUR 1.000 und
- 1 Person verdient EUR 1.000.000 .
Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.
Siehe auch
Statistik | Stochastik | Geometrie
Medián | Median | Median | Mediana | Mediana | Mediaani | חציון | Medián | Mediana (statistica) | Mediana | Mediaan | Mediana | Mediana | Медиана (статистика) | Median | Median