article

Der Median (oder Zentralwert) bezeichnet eine Grenze zwischen zwei Hälften. So wird manchmal in der Geometrie die Seitenhalbierende eines Dreiecks als Median bezeichnet, da sie das Dreieck in zwei flächengleiche Hälften teilt. Häufiger jedoch wird der Begriff in der Statistik verwendet, wo der Median eine Stichprobe oder allgemein eine Wahrscheinlichkeitsverteilung halbiert. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median meistens den Vorteil, robuster gegenüber Ausreißern zu sein.

Median einer Stichprobe


Bei einer sortierten Folge von Messwerten („geordnete Stichprobe“) ist der Median der Wert, des Elementes das in der Mitte liegt. Bei einer geraden Anzahl von Messwerten wird je nach Definition eines der beiden mittleren Elemente oder deren arithmetisches Mittel als Median gewählt.

Eine mögliche Definition ist also:
Der Median \tilde x einer geordneten Stichprobe (x_1, x_2, \dots, x_n) von n Messwerten berechnet sich als

\tilde x =\begin{cases}
x_{(n+1)/2} & n \; \mathrm{ ungerade} \\ \frac{1}{2} \left( x_{(n/2)} + x_{(n/2\,+\,1)} \right) & n \;\mathrm{ gerade} \end{cases} .

Oft möchte man dagegen sicherstellen, dass der Median in jedem Fall eines der Elemente der Stichprobe sein soll. in diesem Fall wird alternativ zu dieser Definition bei einer geraden Anzahl von Elementen entweder der Untermedian \tilde x_u = x_{n/2} oder der Obermedian \tilde x_o = x_{n/2\,+\,1} genutzt und als Median bezeichnet.
Diese Medianbestimmung spielt beispielsweise bei Datenbanksystemen eine große Rolle, wie z. B. bei _SELECT mittels des Medians der Mediane.

Beispiele

  • Messwerte 1, 2, 4, 5, 18: Ungerade Anzahl. Der Median ist der Wert an der mittleren Stelle, also 4. Der Durchschnitt dagegen ist 6.
  • Messwerte 1, 1, 2, 3, 4, 37: Gerade Anzahl. Der Median ist die Hälfte der Summe der beiden mittleren Zahlen, also ½ (2 + 3), also 2,5. Der Durchschnitt dagegen ist 8.

Median einer Verteilung


Eine Verallgemeinerung des Begriffes liefert die stochastische Betrachtung einer Zufallsvariable X bzw. deren Verteilungsfunktion F. Dort ist der Median das 0,5-Quantil, also
\inf\{x\in\R:F(x)\ge \frac 12\}.
Übertragen auf die oben genannte Stichprobe wäre nach dieser Definition der Median vergleichbar mit dem dort erwähnten Obermedian.
Er gehört zu den Maßzahlen der zentralen Verteilung, auch Lagemaße genannt.

Median von gruppierten Daten


Vor allem in den Sozialwissenschaften wird bei Statistiken häufig der Median geschätzt, da nicht alle Daten explizit und exakt gegeben sind, sondern jene nur in Intervallen gruppiert vorliegen. So wird beispielsweise bei Umfragen selten nach dem exakten Gehalt gefragt, sondern nur nach der Einkommensklasse, also dem Bereich, in welchem das Gehalt liegt. Die Berechnungsvorschrift für diese Schätzung unterscheidet sich deswegen von der oben vorgestellten exakten Berechnung des Medians.
Es seien n die Anzahl aller Daten, n_i die jeweilige Anzahl der Daten der i-ten Gruppe und u_i bzw. o_i die entsprechenden oberen bzw. unteren Intervallgrenzen.
Zunächst wird nun die mediane Klasse (oder mediane Gruppe) bestimmt, d.h. diejenige Gruppe, in welche der Median (nach obiger, konventioneller Definition) hineinfällt, z.B. die m-te Gruppe. Wenn keine weiteren Angaben über die Verteilung der Daten gegeben sind, wird z.B. Gleichverteilung postuliert, sodass man sich der linearen Interpolation als Hilfsmittel bedienen kann, um eine Schätzung des Medians der gruppierten Daten zu erhalten:
x_{med} = u_m+\frac{\frac n2 - \sum\limits_{k=1}^{m-1}n_k}{n_m} \cdot (o_m-u_m).

Im Gegensatz zur konventionellen Definition des Medians muss dieser nicht zwangsläufig ein Element aus der tatsächlichen Datenmenge sein, welche in aller Regel nicht bekannt ist.

Beispiel: Einkommen

Klasse (i)Bereich (u_i bis o_i)Gruppengröße (n_i)
1mind. 0, weniger als 1500160
2mind. 1500, weniger als 2500320
3mind. 2500, weniger als 3500212

\frac n2 = \frac{212+320+160}2 = \frac{692}2=346, also liegt der Median in der 2. Klasse (d.h. m=2), da die erste Klasse nur 160 Elemente umfasst.
Somit ergibt sich als Schätzung für den Median x_{med} = 1500+\frac{346-160}{320}\cdot1000 = 2081{,}25.

Eine Veranschaulichung dieses Verfahrens zur Festlegung des Medians bei gruppierten Daten ist die grafische Ermittlung mit Hilfe der Summenkurve. Hier wird der Abzissenwert x_{med}\, gesucht, der zum Ordinatenwert \frac{n}{2} gehört. Bei kleinerem und geradem n kann auch stattdessen der Ordinatenwert \frac{n}{2}+1 gewählt werden.

Vorteile des Medians


Durch seine Resistenz gegen Ausreißer eignet sich der Median besonders gut als Lageparameter für nicht normalverteilte Grundgesamtheiten.

Beispiel:

Die Einkommen einer Gruppe von 10 Personen verteilen sich wie folgt:

  • 9 Personen verdienen EUR 1.000 und
  • 1 Person verdient EUR 1.000.000 .

Das Durchschnittseinkommen beträgt EUR 100.900, der Median jedoch nur EUR 1.000.

Siehe auch


Statistik | Stochastik | Geometrie

Medián | Median | Median | Mediana | Mediana | Mediaani | חציון | Medián | Mediana (statistica) | Mediana | Mediaan | Mediana | Mediana | Медиана (статистика) | Median | Median

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Median".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld