Der Mittelwert ist ein Begriff aus der Mathematik bzw. Statistik. Es sind zwei verschiedene Bedeutungen dieses Begriffs gebräuchlich, die sich allerdings überschneiden.
Zum einen nennt man den Erwartungswert einer Zufallsvariablen Mittelwert.
Zum anderen bezeichnet der Mittelwert, auch Mittel genannt, eine Durchschnittsbildung von verschiedenen Zahlenwerten. Diese Bedeutung wird hier erläutert.
Mittelwerte sind verschiedene mathematisch definierte, meist statistische Kenngrößen, die sich aus einer Reihe von Beobachtungswerten, etwa Messwerten einer Stichprobe, berechnen lassen. Aufgabe des Mittelwertes ist es, Aufschluss über den Durchschnittswert vorliegender Werte zu geben. Es gibt verschiedene Arten von Mittelwerten, wie z. B. geometrisches Mittel und arithmetisches Mittel.
Im Folgenden seien gegebene Messwerte, beispielsweise reelle Zahlen, deren Mittelwert berechnet werden soll.
Arithmetisches Mittel
Das arithmetische Mittel (auch
Durchschnitt) ist der am häufigsten benutzte Mittelwert und wird deshalb auch als Standardmittelwert bezeichnet.
Liegen von einem Merkmal n Beobachtungen vor, errechnet sich das Mittel der Stichprobe als
-
Beispiel für das arithmetische Mittel von 50 und 100:
-
Sind Zufallsvariablen, die unabhängig und identisch verteilt mit Mittelwert bzw. Erwartungswert und Varianz sind, so hat der Stichprobenmittelwert ebenfalls Mittelwert , aber die kleinere Varianz . Hat also eine Zufallsvariable endlichen Mittelwert und endliche Varianz, so folgt aus der Tschebyschow-Ungleichung, dass das arithmetische Mittel einer Stichprobe gegen den Erwartungswert der Zufallsvariablen stochastisch konvergiert. Das arithmetische Mittel ist daher nach vielen Kriterien eine geeignete Schätzung für den Erwartungswert der Verteilung, aus der die Stichprobe stammt. Es ist allerdings sehr empfindlich gegenüber Ausreißern (siehe Median und Sonstige Mittelwerte).
Anwendungsbeispiel
Ein Auto fährt eine Stunde lang 100 km/h und die darauffolgende Stunde 200 km/h. Mit welcher konstanten Geschwindigkeit muss ein anderes Auto fahren, um den selben Weg zurückzulegen?
Der Weg , den das erste Auto insgesamt zurückgelegt hat, beträgt
-
und der des zweiten Autos
-
wobei
die Geschwindigkeit des zweiten Autos ist.
Aus
ergibt sich
-
und damit
-
Gewichtetes arithmetisches Mittel
Das gewichtete Mittel wird beispielsweise verwendet, wenn man Mittelwerte aus
Stichproben der gleichen Grundgesamtheit mit verschiedenen Stichprobenumfängen miteinander kombinieren will:
-
Sind die unabhängig verteilte Zufallsgrößen mit konstantem Erwartungswert aber unterschiedlicher Varianz , so hat der gewichtete Mittelwert ebenfalls Erwartungswert und seine Varianz beträgt
- .
Wählt man
- ,
so vereinfacht sich die Varianz zu
- .
Aus der Cauchy-Schwarzschen Ungleichung folgt
- ,
die Wahl
oder proportional dazu minimiert also die Varianz des gewichteten Mittels.
Mit dieser Formel lassen sich die Gewichte
abhängig von der Varianz des jeweiligen Wertes, der dementsprechend den Mittelwert mehr oder weniger stark beeinflusst, zweckmäßig wählen.
Sind die speziell Stichprobenmittelwerte vom Umfang aus der selben Grundgesamtheit, so hat die Varianz , also die Wahl ist optimal.
Beispiele zum gewichteten arithmetischen Mittel
Das arithmetische Mittel
der
Zahlen 1, 2 und 3 beträgt 2, das arithmetische Mittel
der
Zahlen 4 und 5 beträgt 4,5. Das arithmetische Mittel aller 5 Zahlen ergibt sich als mit dem Stichprobenumfang gewichteten Mittelwert der Teilmittelwerte:
-
Liegen die Beobachtungen als klassierte Häufigkeit vor, kann man das arithmetische Mittel näherungsweise als gewichtetes Mittel bestimmen, wobei die Klassenmitten als Wert und der Klassenumfang als Gewicht zu wählen sind. Sind beispielsweise in einer Schulklasse ein Kind in der Gewichtsklasse 20 bis 25kg, 7 Kinder in der Gewichtsklasse 25 bis 30kg, 8 Kinder in der Gewichtsklasse 30 bis 35kg und 4 Kinder in der Gewichtsklasse 35 bis 40 kg, so lässt sich das Durchschnittsgewicht als
-
abschätzen.
Weiteres Beispiel:
Ein Bauer stellt im Nebenerwerb 100 kg Butter her. 10 kg kann er für 10 €/kg verkaufen, weitere 10 kg für 6 €/kg und den Rest muss er für 3 €/kg verschleudern. Zu welchem (gewichtetem) Durchschnittspreis hat er seine Butter verkauft?
Lösung: (10 kg · 10 €/kg + 10 kg · 6 €/kg + 80 kg · 3 €/kg) / (10 kg + 10 kg + 80 kg) =
400 € / 100 kg = 4 €/kg. Der mit der jeweils verkauften Menge gewichtete Durchschnittspreis entspricht also dem fixen Preis, zu dem die Gesamtmenge verkauft werden müsste, um den gleichen Erlös zu erzielen wie beim Verkauf von Teilmengen zu wechselnden Preisen.
Der Mittelwert einer Funktion
Als Mittelwert der
Riemann-integrierbaren Funktion
wird die Zahl
-
definiert.
Die Bezeichnung Mittelwert ist insofern gerechtfertigt, als für eine äquidistante Zerlegung des Intervalls mit der Schrittweite das arithmetische Mittel
-
gegen
konvergiert, vgl.
[H. Heuser: Lehrbuch der Analysis, Teil 1, 8. Auflage, Teubner, Stuttgart 1990. ISBN 3-519-12231-6].
Ist stetig, so besagt der Mittelwertsatz der Integralrechnung, dass es ein gibt mit , die Funktion nimmt also an mindestens einer Stelle ihren Mittelwert an.
Der Mittelwert der Funktion mit dem Gewicht (wobei für alle ) ist
- .
Für Lebesgue-Integrale im Maßraum mit einem endlichen Maß lässt sich der Mittelwert einer Lebesgue-integrierbaren Funktion als
-
definieren. Handelt es sich um einen
Wahrscheinlichkeitsraum, gilt also
, so nimmt der Mittelwert die Form
-
an; das entspricht genau dem
Erwartungswert von
.
Geometrisches Mittel
Das geometrische Mittel ist die n-te Wurzel aus dem Produkt der Messwerte; es ist ein geeignetes Lagemaß für Größen, von denen das Produkt anstelle der Summe interpretierbar ist, z. B. von Verhältnissen oder Wachstumsraten.
-
Äquivalent dazu gilt
- ,
der Logarithmus des geometrischen Mittels ist also das arithmetische Mittel der Logarithmen, wobei die Basis des Logarithmus beliebig gewählt werden darf, aber auf beiden Seiten natürlich die gleiche sein muss.
Beispiel für das geometrische Mittel von 3 und 300:
-
Im Gegensatz zum arithmetischen Mittel ist das geometrische Mittel offensichtlich nur für nichtnegative Zahlen definiert und meist nur für echt positive Zahlen sinnvoll.
Beispiel:
Das Mittel aus einer Verdopplung und nachfolgender Verachtfachung einer Bakterienkultur ist eine Vervierfachung (nicht eine Vermehrung um den Faktor 5).
Analog zum gewichteten arithmetischen Mittel lässt sich ein mit den Gewichten gewichtetes geometrisches Mittel definieren:
- wobei
Anwendungsbeispiel
Ein Guthaben
G wird im ersten Jahr mit zwei Prozent, im zweiten Jahr mit sieben und im dritten Jahr mit fünf Prozent verzinst. Welcher über die drei Jahre konstanter
Zinssatz p hätte zum Schluss das gleiche Kapital ergeben?
Guthaben am Ende des dritten Jahres:
-
oder mit
Zinsfaktoren geschrieben
-
Mit konstantem Zinsatz
und zugehörigen Zinsfaktor
ergibt sich am Ende ein Guthaben von
-
Mit
ergibt sich
-
und damit berechnet sich der durchschnittliche Zinsfaktor 1+
p zu
-
Der durchschnittliche Zinsatz beträgt also ca 4,646%. Allgemein berechnet sich der durchschnittliche Zinsfaktor also aus dem geometrischen Mittel der Zinsfaktoren der einzelnen Jahre. Wegen der
Ungleichung vom arithmetischen und geometrischen Mittel ist der durchschnittliche Zinssatz kleiner oder bestenfalls gleich dem arithmetische Mittel der Zinssätze, welches in diesem Beispiel
beträgt.
Harmonisches Mittel
Das harmonische Mittel ist definiert als
-
Viele merken sich die Definition leichter in der äquivalenten Form
- ,
der Kehrwert des harmonischen Mittels ist also das arithmetische Mittel der Kehrwerte.
Beispiel für das harmonische Mittel von 5 und 20:
-
Mit dieser Formel ist das harmonische Mittel zunächst nur für von Null verschiedene Zahlen definiert. Geht aber einer der Werte gegen Null, so existiert der Grenzwert des harmonischen Mittels und ist ebenfalls gleich Null. Daher ist es sinnvoll, das harmonische Mittel als Null zu definieren, wenn mindestens eine der zu mittelnden Größen gleich Null ist.
Auch hier lässt sich ein mit den Gewichten gewichtetes harmonisches Mittel definieren:
-
Beispiel: fährt man eine Stunde mit 50 km/h und dann eine Stunde mit 100 km/h, so legt man insgesamt 150 km in 2 Stunden zurück; die Durchschnittsgeschwindigkeit ist 75km/h, also das arithmetische Mittel von 50 und 100. Bezieht man sich hingegen nicht auf die benötigte Zeit, sondern auf die durchfahrene Strecke, so wird die Durchschnittsgeschwindigkeit durch das harmonische Mittel beschrieben: fährt man 100 km mit 50 km/h und dann 100 km mit 100 km/h, so legt man 200 km in 3 Stunden zurück, die Durchschnittsgeschwindigkeit ist 66 2/3 km/h, also das harmonische Mittel von 50 und 100.
Allgemein gilt: Benötigt man für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit ) und für die Teilstrecke die Zeit (also Durchschnittsgeschwindigkeit , so gilt für die Durchschnittsgeschwindigeit über die gesamte Strecke
- .
Die Durchschnittsgeschwindigkeit ist also das mit den Wegstrecken gewichtete harmonische Mittel der Teilgeschwindigkeiten oder das mit der benötigten Zeit gewichtete arithmetische Mittel der Teilgeschwindigkeiten.
Logarithmischer Mittelwert
Der logarithmische Mittelwert
zwischen
und
ist definiert als:
-
Der logarithmische Mittelwert wird beispielsweise bei der verfahrenstechnischen Auslegung von Packungskolonnen genutzt. Er dient dort zur Mittelung der molaren Zusammensetzungen an Kopf und Boden der Kolonne .
Für liegt der logarithmische Mittelwert zwischen dem geometrischen und dem arithmetischen Mittelwert:
-
Eine Verallgemeinerung des logarithmischen Mittelwerts auf mehr als zwei Variablen findet sich beispielsweise in [A.O.Pittenger: The logarithmic mean in n variables. In: Amer. Math. Monthly, 92 (1985), S 99–104.].
Verallgemeinerter Mittelwert
Für
positive Zahlen
definiert man den verallgemeinerten Mittelwert als
-
Die Notation ist nicht einheitlich, alternativ sind auch Schreibweisen wie , oder üblich. Genauso wie die Schreibweise ist anscheinend auch die Aussprache uneinheitlich; möglich sind Varianten wie -tes Mittel, Mittel der Ordnung oder vom Grad oder Mittel mit Exponent .
Mittels geeigneter Wahl des Parameters k können unter anderem die drei obigen Mittelwerte erzeugt werden:
- k -> : ,
- k = -1: Harmonisches Mittel,
- k -> 0: Geometrisches Mittel,
- k = 1: Arithmetisches Mittel,
- k = 2: Quadratisches Mittel oder Effektivwert (in der Elektrotechnik),
- k -> : .
Für n=2 lässt sich das harmonische Mittel auch indirekt berechnen als
.
Die verallgemeinerten Mittelwerte stehen über die einfache Formel
-
mit den Stichprobenmomenten um Null in Beziehung. Außerdem wird in der Stochastik die Konvergenz im p-ten Mittel über diese verallgemeinerten Mittelwerte definiert.
In der Mathematik spielen diese verallgemeinerten Mittelwerte vor allem wegen der Ungleichung der verallgemeinerten Mittelwerte eine Rolle: Für -∞ ≤ s ≤ t ≤ ∞ gilt die Ungleichung:
-
Diese Ungleichung lässt sich z.B. beweisen, indem man setzt und und in die Hölder-Ungleichung mit einsetzt.
Für die Spezialwerte -1, 0, 1, 2 gilt:
.
Dieser Spezialfall lässt sich auch mit der Cauchy-Schwarzschen Ungleichung, die ein Spezialfall der Hölder-Ungleichung ist, beweisen.
Verallgemeinerter Mittelwert (f-Mittel)
Sei f eine auf einem reellen
Intervall streng monotone stetige (und daher invertierbare)
Funktion und
-
Gewichtsfaktoren. Dann ist für
das mit den Gewichten
gewichtete f-Mittel definiert als
- .
Offensichtlich gilt
-
Für erhält man das arithmetische, für das geometrische, und für das verallgemeinerte Mittel mit Exponent .
Dieser Mittelwert lässt sich auf das gewichtete f-Mittel einer Funktion verallgemeinern, wobei als in einem die Bildmenge von umfassenden Intervall streng monoton und stetig sei, verallgemeinern:
-
Winsorisiertes oder gestutztes Mittel
Kann man davon ausgehen, dass die Daten durch "
Ausreißer", d.h. einige wenige zu hohe oder zu niedrige Werte
kontaminiert sind, so
sortiert man die Beobachtungswerte nach aufsteigender Größe, schneidet eine gleiche Anzahl von Werten am Anfang und am Ende der Folge ab und berechnet von den übrig bleibenden Werten den Mittelwert. Ein 10% winsorisiertes Mittel erhält man, wenn man 5% der Gesamtzahl aller Werte am unteren und 5% am oberen Ende auslässt.
Das "a-Mittel"
Für einen gegebenen reellen Vektor
-
mit
-
wird der Ausdruck
-
wobei über alle Permutationen σ von { 1, ...,
n } summiert wird,
als "
a-Mittel"
* der nichtnegativen reellen Zahlen
x1, ...,
xn bezeichnet.
Für den Fall a = (1, 0, ..., 0), ergibt das genau das arithmetische Mittel der Zahlen x1, ..., xn; für den Fall a = (1/n, ..., 1/n) ergibt sich genau das geometrische Mittel.
Für die a-Mittel gilt die Muirhead-Ungleichung
Gleitende Durchschnitte
Gleitende Durchschnitte werden in der dynamischen Analyse von
Messwerten angewandt. Sie sind außerdem ein gängiges Mittel der technischen Analyse in der
Finanzmathematik. Mit gleitenden Durchschnitten kann das
stochastische
Rauschen aus zeitlich voranschreitenden
Signalen herausgefiltert werden. Jedoch muss beachtet werden, dass die meisten gleitenden Durchschnitte dem echten Signal hinterherlaufen. Für vorausschauende Filter siehe z.B.
Kalman-Filter.
Gleitende Durchschnitte benötigen normalerweise eine unabhängige Variable, die die Größe der nachlaufenden Stichprobe bezeichnet, bzw. das Gewicht des vorangehenden Wertes für die exponentiellen gleitenden Durchschnitte.
Gängige gleitende Durchschnitte sind:
- Arithmetische gleitende Durchschnitte (Simple Moving Average, SMA)
- Exponentiell gleitende Durchschnitte (Exponential Moving Average, EMA)
- Doppelt exponentiell gleitende Durchschnitte (Double EMA, DEMA)
- Dreifach, n-fach exponentiell gleitende Durchschnitte (Triple EMA, TEMA)
- Linear gewichtete gleitende Durchschnitte (linear abfallende Gewichtung)
- Quadratisch gewichtete gleitende Durchschnitte
- Weitere Gewichtungen: Sinus, Triangular, ...
In der Finanzliteratur können außerdem sogenannte adaptive gleitende Durchschnitte gefunden werden, die sich automatisch einer sich ändernden Umgebung (andere Volatilität/Streuung etc.) anpassen:
- Kaufmann's adaptive moving average (KAMA)
- Variable Index Dynamic Average (VIDYA)
Siehe auch
Sonstige Mittelwerte
Sonstige Mittelwerte, die in einem eigenen Artikel beschrieben werden sind der
Modus (eigentlich kein Mittelwert, sondern der häufigste Wert) und der
Median, der robust gegenüber extremen Abweichungen, sogenannten
Ausreißern, ist. Der Median ist etwas komplizierter zu berechnen. Daher wird in vielen Statistiken auf das arithmetische Mittel zurückgegriffen, obwohl die Angaben kaum den gewollten Aussagewert haben (Beispiel:
Einkommensverteilung in Deutschland).
Ein anderer Mittelwert ist das arithmetisch-geometrische Mittel, das zwischen dem arithmetischen und geometrischen Mittel liegt.
Quellen
Siehe auch
Weblinks
Arithmetik | Statistik
Střední hodnota | Average | media | 算術平均 | gemiddelde | Gjennomsnitt | Średnia arytmetyczna | Média | Average