In der Statistik heißen Unterschiede signifikant, wenn sie nur mit einer bestimmten geringen Wahrscheinlichkeit durch Zufall zustande kommen. Die Überprüfung statistischer Signifikanz geschieht unter Anwendung von dem Datenmaterial angepassten Signifikanztests, die eine Abschätzung der Irrtumswahrscheinlichkeit erlauben. Das Quantil der maximal zulässigen geschätzten Irrtumswahrscheinlichkeit wird a priori festgelegt und oft mit bezeichnet, beispielsweise für 5% Irrtumswahrscheinlichkeit. Je geringer diese, desto höher die Informationsqualität.
Die statistische Signifikanz beschreibt den Informationsgehalt eines Ereignisses bzw. einer Messung.
In den oben genannten Beispielen kann man sich nie hundertprozentig sicher sein, dass der Zufall die Ergebnisse nicht verfälscht hat. Man kann aber berechnen, wie wahrscheinlich es ist, dass die gemessenen Ergebnisse nur aufgrund eines ungünstigen Zufalls auftreten. Dieser zufällige Fehler wird allgemein als Fehler 1. Art und die bedingte Wahrscheinlichkeit seines Auftretens unter der Voraussetzung, dass die Nullhypothese richtig ist, als Irrtumswahrscheinlichkeit bezeichnet.
Es hat sich eingebürgert, die Irrtumswahrscheinlichkeit auf 5 Prozent festzulegen. Das bedeutet aber in der Praxis, dass eine von 20 Untersuchungen, bei denen die Nullhypothese richtig ist, zu dem Schluss kommt, sie sei falsch.
Die Wahl des Wertes 5% ist wie folgt motiviert: eine normalverteilte Zufallsgröße nimmt nur mit einer Wahrscheinlichkeit von weniger als 5% einen Wert an, der sich vom Erwartungswert um mehr als die zweifache Standardabweichung unterscheidet. Bei einer Irrtumswahrscheinlichkeit von 5 % spricht man von Signifikanz, wählt man als Grenze für die Irrtumswahrscheinlichkeit den Wert 0,3%, so spricht man von einem hochsignifikanten Ergebnis; die Motivation für den Wert 0,3% ist ähnlich: eine normalverteilte Zufallsgröße nimmt nur mit einer Wahrscheinlichkeit von weniger als 0,3% einen Wert an, der sich vom Erwartungswert um mehr als die dreifache Standardabweichung unterscheidet.
Auch bei tatsächlich oder vorgeblich statistisch signifikanten Aussagen ist immer eine kritische Überprüfung der Versuchsanordnung und -durchführung notwendig. Nur selten genügen wissenschaftliche Untersuchungen den mathematischen Anforderungen an einen aussagefähigen statistischen Test. Bei vielen Studien steht der Wunsch des oder der Studiendurchführenden (z.B. im Rahmen einer Doktorarbeit) nach einem 'signifikanten' Ergebnis bei der Studiendurchführung zu sehr im Vordergrund - Untersuchungen, bei denen die Nullhypothese bestätigt wird, werden nämlich gemeinhin als uninteressant und überflüssig angesehen. Als Hinweise auf die Qualität einer Studie können im medizinischen Umfeld die Eigenschaften "randomisiert", "kontrolliert" und "doppelblind" gelten. Ohne diese sind Aussagen etwa zur Wirksamkeit von Therapien mit äußerster Vorsicht zu behandeln. Sehr schwierig und problematisch ist insbesondere die Interpretation signifikanter Korrelationen in retrospektiven Studien. Zu bedenken ist darüberhinaus stets, dass aus statistisch signifikanten Korrelationen oft fälschlich auf eine vermeintliche Kausalität geschlossen wird (Beispiel: Zwischen 1960 und 1990 korrelierte die Zahl der Störche in Deutschland signifikant mit der Geburtenrate, da beide Zahlen stark gesunken sind, dennoch ist die Kausalität zumindest fraglich).
Studien mit großer Fallzahl führen aufgrund der hohen statistischen Power oft zu hoch signifikanten Ergebnissen. Solche Studien können trotzdem einen geringen Aussagewert haben, wenn die Größe des beobachteten Effekts (oder der gemessene Parameter) nicht klinisch relevant ist. Statistische Signifikanz ist also ein notwendiges Kriterium, aber noch kein hinreichender Beweis für Wirkung eines Medikaments von praktischer Relevanz.
Weitere kritische Prüfsteine vom methodologischen Gesichtspunkt aus sind:
Die Herausgeber der Zeitschrift für Sozialpsychologie erklärten hingegen ausdrücklich, dass die Annahme von Artikeln in ihrer Zeitschrift nicht von der Signifikanz der Ergebnisse abhängt, da die Redaktion einen Kontrapunkt zu dem Ausbreiten des Fehlers 1. Art schaffen wolle. In der Publikation von Ergebnissen klinischer Studien sind derzeit Anstrengungen durch internationale Fachzeitschriften wie auch der forschenden Institutionen (insbesondere Pharmaunternehmen) im Gange, öffentlich zugängliche Datenbanken, in welchen verbindlich alle durchgeführten Studien sowie ihre prospektiv definierten Zielparameter enthalten sind, zu schaffen. Dadurch sollen die Komplettheit der Veröffentlichung auch unangenehmer Resultate überprüfbar und eine Einschätzung des Publikationsbias möglich werden.
Statistical significance | מובהקות סטטיסטית | 有意 | Reikšmingumo lygmuo | Significantie | Significância estatística | Statistical significance | 显著性差异
This article is licensed under the GNU Free Documentation License.
It uses material from the
"Statistische Signifikanz".
Home Page • arts • business • computers • games • health • hospitals • home • kids & teens • news • physicians • recreation• reference • regional • science • shopping • society • sports • world