article

Die Standardabweichung ist in der Stochastik ein Maß für die Streuung der Werte einer Zufallsvariable um ihren Mittelwert. Sie ist für eine Zufallsvariable X definiert als die positive Quadratwurzel aus deren Varianz und wird als \sigma_x = \sqrt{\operatorname{Var}(X)} notiert. Die Varianz einer Zufallsvariable ist das zentrierte Moment zweiter Ordnung der zugehörigen Verteilung, der Erwartungswert das erste Moment.

Liegt eine Beobachtungsreihe (x_1, x_2, \dots, x_N) der Länge N vor, so sind empirischer Mittelwert und empirische Standardabweichung die zwei wichtigsten Maßzahlen in der Statistik zur Beschreibung der Eigenschaften der Beobachtungsreihe.

Die Standardabweichung heißt auch mittlerer Fehler oder RMS error (von engl. root mean square). Als Abkürzung findet man neben \sigma in Anwendungen oft auch s, m.F. oder englisch rms. In der angewandten Statistik findet man häufig die Kurzschreibweise der Art „Ø 21 ± 4“, was als „Mittelwert 21 und Standardabweichung 4“ zu lesen ist.

Ein Beispiel (mit Schwankungsbreite)


Mittleres Alter (beispielsweise in einer Tanzschule) = (17,5 ± 1,2) Jahre.
Beide Werte zusammen ergeben die mittlere Schwankungsbreite, MW ± s = 16,3 bis 18,7 Jahre.
Sie gilt im Falle normalverteilter Mengen (siehe Glockenkurve) mit einer Wahrscheinlichkeit von ca. 68 % (jene von 2σ mit ca. 95 %). Demnach lässt obige Schwankungsbreite erwarten, dass

  • 16 % der Tanzschüler jünger als 16,3 Jahre sind (und 2 - 3 % unter 15,1 Jahre) und
  • 16 % älter als 18,7 Jahre (und 2 - 3 % über 19,9 Jahre) sind.
Dieses Beispiel hat jedoch kaum Normalverteilung, denn es sind vermutlich von den Kursteilnehmern mehr als 2,5 % älter als 20 Jahre.
  • Faustregeln für die Praxis sind: Werte außerhalb der zwei- bis dreifachen Standardabweichung nennt man Ausreißer. Ausreißer können ein Hinweis auf grobe Fehler der Datenerfassung sein. Es kann den Daten aber auch eine stark schiefe Verteilung zu Grunde liegen. Andererseits muss ca. jeder 20ste Messwert außerhalb der zweifachen Standardabweichung liegen.

Mittlerer Fehler, Streuung und Varianz

Die Standardabweichung (m. F.) ist die Quadratwurzel einer anderen Streuungsmaßzahl, der Varianz. Die Standardabweichung hat gegenüber der Varianz den Vorteil, dass sie die gleiche Einheit hat wie die ursprünglichen Messwerte.

Wenn die Zahl der Kinder in einem Haushalt untersucht wird, so ist die Einheit der Varianz ein Quadratkind, die Einheit der Standardabweichung aber wieder ein Kind.

Mathematische Definition der Standardabweichung


\sigma_x := \sqrt{\frac{1}{N-1} \sum_{i=1}^N{(x_i-\bar{x})^2}}

Dabei ist

  • \sigma_x die Standardabweichung der Einzelmessung
  • N der Umfang der Grundgesamtheit (Anzahl der Werte bzw. Anzahl der Freiheitsgrade)
  • x_i die Merkmalsausprägungen am i-ten Element der Grundgesamtheit (das i-te Element in der Menge der Werte)
  • \bar{x}= \frac{1}{N} \sum_{i=1}^N{x_i} das arithmetische Mittel (empirischer Mittelwert)

Die Standardabweichung des Mittelwertes \sigma_{\bar{x}} ist gegeben durch:

\sigma_{\bar{x}} = \frac{\sigma_x}{\sqrt{N}} = \sqrt {\frac{1}{N(N-1)} \sum_{i=1}^N{(x_i-\bar{x})^2}}

Möchte man die Standardabweichung ohne vorherige Mittelwertberechnung aus der Stichprobe errechnen, ist folgende Formel nützlich:

\sigma_x = \sqrt{\frac{N \sum_{i=1}^N{x_i^2} - (\sum_{i=1}^N{x_i}) ^2}{N (N-1)} }

Faustformel


Zur schnellen Schätzung von \sigma sucht man jenes Sechstel der Werte, die am kleinsten beziehungsweise am größten sind. Die Standardabweichung ist dann die halbe Differenz der beiden Grenzwerte. Bei unübersichtlichen Verteilungen oder wenn man nur „im Kopf“ rechnen kann, geht auch folgende Abschätzung: (Maximalwert-Minimalwert)/3. Erstaunlicherweise liefert diese Schätzung sowohl bei Normalverteilungen wie Gleichverteilungen oder hohen Variationskoeffizienten gute grobe Schätzungen.

Erwartungstreue Schätzung der Standardabweichung aus einer Stichprobe


\hat{\sigma} = \sqrt{\frac{n-1}{2}} \ \frac{\Gamma\left(\frac{n-1}{2}\right)} {\Gamma\left(\frac{n}{2}\right)} \ s

Dabei ist

  • \hat{\sigma} die erwartungstreue Schätzung der Standardabweichung und
  • n der Stichprobenumfang (Weil nur eine Stichprobe, nicht die Gesamtmenge, untersucht wird, muss der Mittelwert aus den Werten der Stichprobe ermittelt werden. Dadurch reduziert sich die Zahl der Freiheitsgrade auf (n-1) )
  • \Gamma(x) die Gammafunktion
  • s die Schätzung für die Standardabweichung

Beispiel

Es wurden bei einer Stichprobe die fünf Werte 3, 4, 5, 6, 7 gemessen. Man soll nun die Schätzung für die Standardabweichung errechnen.

Der Korrekturfaktor ist in diesem Fall

\sqrt{2} \ \frac{\Gamma\left(2\right)}{\Gamma\left(2{,}5\right)} \approx 1{,}063846

und die erwartungstreue Schätzung für die Standardabweichung ist damit näherungsweise 1,064.

Korrekturfaktoren für die erwartungstreue Schätzung der Standardabweichung

-
Stichprobenumfang Korrekturfaktor
-
2 1,253314
-
5 1,063846
-
10 1,028109
-
15 1,018002

Maximum-Likelihood-Schätzung für die Standardabweichung einer Normalverteilung


Die eindimensionale Normalverteilung kann unter anderem so dargestellt werden, dass die Standardabweichung ein Parameter der Verteilung ist. Bei dieser Schätzung kann die Eigenschaft der Maximum-Likelihood-Schätzung genutzt werden, dass eine monotone Transformation einer Maximum-Likelihood-Schätzung eine Maximum-Likelihood-Schätzung für die monotone Transformation des geschätzten Parameters ist. Das bedeutet, dass die Quadratwurzel einer Maximum-Likelihood-Schätzung eines Parameters, der nur positiv sein kann, eine Maximum-Likelihood-Schätzung für die Quadratwurzel dieses Parameters ist.

\hat{\sigma}_{\rm ML} = \sqrt {\frac{1}{n} \sum_{i=1}^n{(X_i-\bar{X})^2}}

Diese Schätzung ist eine Maximum-Likelihood-Schätzung für einen Parameter der Normalverteilung oder für eine Transformation dieses Parameters. Sie ist nicht auf die Schätzung der Standardabweichung einer beliebigen Verteilung zu übertragen.

Die Maximum-Likelihood-Schätzung für die Standardabweichung einer Poisson-Verteilung ist beispielsweise die Quadratwurzel aus dem arithmetischen Mittel.

Als Maximum-Likelihood-Schätzung für die Standardabweichung aus der Stichprobe {3, 4, 5, 6, 7} erhält man also

\hat{\sigma}_{\rm ML} = \sqrt {\frac{1}{5} \cdot 10} = \sqrt{2} \approx 1{,}414

Beispiele


Das aus der Varianz bekannte Würfelbeispiel hier für die Standardabweichung:

Die Standardabweichung beim 500-maligen Würfeln und der Zufallsgröße X: Anzahl der Einsen

\sqrt{ 500 \cdot {1 \over 6} \cdot {5 \over 6}}

Berechnung für auflaufende Messwerte


In Systemen, die kontinuierlich große Mengen an Messwerten erfassen, ist es oft unpraktisch, alle Messwerte zwischenzuspeichern, um die Standardabweichung zu berechnen.

In diesem Zusammenhang ist es günstiger, eine modifizierte Formel zu verwenden, die den kritischen Term \sum_{i=1}^N{(x_i-\bar{x})^2} umgeht. Dieser kann nicht für jeden Messwert sofort berechnet werden, da der Mittelwert \bar{x} nicht konstant ist.

Durch Anwendung der 2. binomischen Formel und der Definition des Mittelwerts \bar{x} = \sum_{i=1}^N \frac{x_i}{N} gelangt man zur Darstellung

\sigma_x = \sqrt{\frac{N \cdot \sum_{i=1}^N{x_i{}^2}-\left(\sum_{i=1}^N{x_i}\right)^2}{N \cdot (N-1)}},

die sich für jeden eintreffenden Messwert sofort aktualisieren lässt, wenn die Summe der Messwerte \sum_{i=1}^N{x_i} sowie die Summe ihrer Quadrate \sum_{i=1}^N{x_i{}^2} mitgeführt und fortlaufend aktualisiert werden.

Siehe auch:


Weblinks


Statistik | Digitale Signalverarbeitung

Desviació típica | Směrodatná odchylka | Standardafvigelse | Standard deviation | Desviación estándar | Standardhälve | Hajontaluku | Écart type | Desviación típica | סטיית תקן | Standardna devijacija | Deviazione standard | 標準偏差 | Standartinis nuokrypis | Standaardafwijking | Standardavvik | Odchylenie standardowe | Desvio padrão | Smerodajná odchýlka | Standardni odklon | Стандардна девијација | Simpangan baku | Standardavvikelse | 標準差

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Standardabweichung".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld