article

Als Faktorenanalyse (eigentlich Faktorenanalysen) bezeichnet man eine Sammlung häufig gemeinsam angewendeter statistischer Verfahren, mit denen mehrere Variablen zu einigen wenigen Faktoren zusammen gefasst werden können. Man spricht auch von Variablen-Bündelung. Die Faktorenanalyse wird zu den datenreduzierenden (auch dimensionsreduzierenden) statistischen Verfahren geordnet und wird aufgrund zahlreicher Vorteile sehr häufig angewendet.

Für die Berechnung der Faktoren steht eine Vielzahl von Extraktionsmethoden zur Verfügung. Eine häufig angewendete Extraktionsmethode ist die Hauptkomponentenanalyse PCA. Ebenfalls zur Faktorenanalyse zählen Verfahren, die die Qualität der Faktoren abschätzen, indem sie sie in Bezug zu den Ausgangsvariablen setzen. Auch hierfür ist eine Vielzahl alternativer Berechnungen verfügbar. Weiterhin zählen Analyseschritte hinzu, die die inhaltliche Interpretation der Faktoren erleichtern, wie bsw. die Rotationsverfahren.

Eine häufige begriffliche Verwechslung entsteht durch die Annahme, die Faktorenanalyse sei identisch mit der Hauptkomponentenanalyse. Tatsächlich ist die Hauptkomponentenanalyse heute nur ein Extraktionsverfahren, das zudem hinsichtlich der Modellkriterien angepasst wird.

Grundidee der Faktorenanalyse


Informationsverdichtung

Jede Variable enthält beobachtete Information, die Aufschluss über die gesuchte Gesetzmäßigkeit geben kann, für die man sich interessiert. Hierbei wird oft der Stichprobenparameter Varianz heran gezogen, so auch bei der Faktorenanalyse.

Diese Informationen (Varianzanteile) dürfen während statistischer Berechnungen nicht auf Grund mathematischer Operationen verloren gehen, sondern müssen in einem möglichst hohen Grad erhalten bleiben. Sie müssen aber, insbesondere bei umfangreichen Datensätzen, auch soweit verdichtet werden, dass einerseits weitere Berechnungen praktisch durchführbar bleiben, andererseits eine inhaltliche Interpretation noch zulässig ist. Ähnlich wie bei der Komprimierung von Musik- und Videodateien, die mit steigender Verdichtung an Qualität verlieren, ist auch bei der Faktorenanalyse ein Kompromiss zu schließen. Wie viele und welche Faktoren in einem spezifischen Anwendungsfall verwendet werden dürfen, ist kriteriengeleitet festgelegt.

Anders ausgedrückt besteht die Grundidee darin, aus vielen Variablen wenige Faktoren zu extrahieren, welche die selben Informationen enthalten. Falls die Faktoren die Varianz der Variablen gut „erklären“ können, so können die Faktoren bei weiteren Berechnungen anstelle der Variablen verwendet werden. Man spricht auch davon, dass die Faktoren die Variablen „vertreten“ dürfen.

Hypothesenveränderung

Bei der Berechnung der Faktoren bleibt im Idealfall die Information, die in den zahlreichen ursprünglichen Variablen oft redundant vorhanden ist, weitgehend erhalten. Eine Besonderheit beim Umgang mit Faktoren besteht aber darin, dass die gebündelte Information inhaltlich nicht mehr auf dieselbe Weise interpretiert werden darf wie die Rohdaten. Sobald die Faktoren entstanden sind, müssen für ihre weitere Verwendung eigene Hypothesen aufgestellt bzw. die ursprünglichen Hypothesen angepasst werden. Die Faktorenanalyse ist deshalb immer auch hypothesengenerierend.

Voraussetzungen der Faktorenanalyse

  1. Alle Variablen müssen mindestens intervallskaliert sein.
  2. Repräsentativität der Stichprobe
  3. Inhaltlich gute Vorstellung über die Bedeutung der Variablen, da sich Unsicherheiten auf die Interpretation der entstehenden Faktoren auswirken und den Interpretationsspielraum vergrößern.
  4. Die entstehenden Faktoren müssen sich hinsichtlich ihrer Eigenwerte und Ladungen hinreichend gut von einander abgrenzen lassen.

Historisches zur Faktorenanalyse


Die Faktorenanalyse wurde ursprünglich in der wissenschaftlichen Psychologie (Spearman) entwickelt und wird heute häufig in der sozialwissenschaftlichen und psychologischen Forschung eingesetzt. Vereinzelt ist sie in physikalischen, biologischen oder chemischen Disziplinen anzutreffen. Das Ziel bestand darin, zahlreiche sehr ähnliche Variablen, wie sie in Fragebögen häufig vorkommen, zusammenfassen zu können, um die weitere Verwendung des Datenmaterials aufwandsarm zu gestalten.

Grundproblem: In Fragebögen kann ein Persönlichkeitsmerkmal niemals mit einer einzelnen Frage erfasst werden. Stets müssen zahlreiche Items vorgegeben werden. Items, die ähnliche Fragen stellen, können miteinander verbunden werden:

  1. Fühlen Sie sich oft abgeschlagen?
  2. Sind Sie tagsüber oft müde?
  3. Haben Sie das Bedürfnis, sich am Tag ins Bett zu legen?
  4. Empfinden Sie sich oft kraftlos?
  5. Trinken Sie tagsüber viel Kaffee?

Historisch gesucht wurde ein Verfahren, mit dem es möglich ist, die aus diesen 5 Items entstehenden 5 Variablen zu bündeln, d.h. Zusammenhänge zwischen diesen Variablen (Einflussgrößen) darzustellen, indem sie diese anhand ihrer Korrelationen in möglichst wenige, nicht überlappende Faktoren klassifiziert. In diesem Beispiel wäre ein Faktor wünschenswert, der inhaltlich als „müde Abgeschlagenheit“ interpretiert werden könnte. Die Bündelung sollte so erfolgen, dass „müde Abgeschlagenheit“ einen möglichst großen Teil der gemeinsamen Varianz der Variablen 1-5 erklärt, damit bei der weiteren Berechnung nur noch mit diesem einen Faktor gerechnet werden muss. Aus dieser praktischen Notwendigkeit entstand eine Sammlung von Verfahren, die heute allesamt zur Faktorenanalyse zählen.

Ursprünglich wurde von Spearman eine explorative Faktorenanalyse entwickelt, die der Hauptkomponentenanalyse (PCA) sehr ähnlich ist, sich aber von ihr unterscheidet. Beiden gemeinsam ist zunächst ihre Modellannahme:

y = Fx+e.

wobei:

  • y der Vektor der zu erklärenden Variablen
  • F die Ladungsmatrix
  • x ein Vektor von Faktorenwerten
  • e ein Vektor mit Residuen

Ein fundamentaler Unterschied zwischen explorativer Faktorenanalyse und Hauptkomponentenanlyse (PCA) besteht in einer Annahme bezüglich der Korrelation zwischen den Residuen (Messfehler). In der explorativen Faktorenanalyse nimmt man an, die Residuen würden nicht miteinander korrelieren, während in der PCA die Residuen durchaus miteinander korreliert sind/sein können. Das Ganze sieht dann so aus, dass die Korrelationsmatrix der Residuen bei der Faktorenanalyse eine diagonale Matrix ist (d.h. die Elemente ausserhalb der Diagonalen sind gleich 0) und dieselbe Matrix bei der PCA auch Werte ungleich 0 ausserhalb der Diagonalen haben kann.

Dieser „kleine“ aber äußerst feine Unterschied führte zu einem Streit über die Gültigkeit der explorativen Faktorenanalyse (nicht der PCA), der bis heute (also knapp 100 Jahre) anhält (siehe Steiger, J.H. (1979). Factor indeterminacy in the 1930's and in the 1970's... some interesting parallels. Psychometrika, 44, 157–167.).

Historisch weiter entwickelt wurden bsw. die Verfahren:

Allgemeiner Ablauf der Faktorenanalyse


Die Faktorenanalyse wird, unabhängig von den spezifischen Rechenverfahren, stets auf dieselbe Weise durchgeführt. Die folgenden Schritte werden nacheinander eingehalten, können aber bei Bedarf wiederholt ausgeführt werden.

  1. Rohdatenaufbereitung, deskriptive Statistik, Vorbereitung der Variablen
  2. Bestimmung des Extraktionsverfahrens
  3. Extraktion
  4. Festlegung der gültigen Faktoren (kriteriengeleitet)
  5. Hypothesenanpassung
  6. ggf. Rotation
  7. weitere statistische Auswertungen oder
  8. inhaltliche Auswertung der Ergebnisse

Analogie des prinzipiellen Verfahrens

Faktorenanalyse_ii.PNG | Faktorenanalyse_iiI.PNG Folgende Analogie eignet sich, die Faktorenanalyse prinzipiell zu erklären: Auf einer Karte wird die Stadt Braunschweig als Ausgangspunkt markiert. Nun werden von Braunschweig ausgehend vier Pfeile eingezeichnet: nach Hamburg, Bremen, Berlin und Potsdam. Diese Pfeile sollen die Variablen sein. Bei der Faktorenanalyse sollen die vier Variablen zu wenigen Faktoren zusammengefasst werden: Sie ist ein datenreduzierendes Verfahren. Dabei sollen Gruppen von Variablen ermittelt werden, die in etwa in die gleiche Richtung weisen (im mathematischen Sinne also hoch miteinander korreliert sind). Auf der Karte liegen jeweils zwei der vier Pfeile ziemlich eng beieinander und zeigen grob in dieselbe Richtung (nämlich nach Hamburg und Bremen bzw. nach Berlin und Potsdam). Bei der Faktorenanalyse würden nun zwei Faktoren extrahiert und die jeweils ähnlich gerichteten Pfeile bzw. Variablen zusammengefasst werden. Dies führt zu einem Faktor, der als „Nordausrichtung“ interpretiert werden könnte, und zu einem, der als „Ostausrichtung“ interpretiert werden könnte. Somit wurden die vier Variablen auf zwei Faktoren reduziert, die im Wesentlichen deren Richtung angeben. Einem Reisenden ist damit geholfen, da er mit nur zwei statt vier Pfeilen die ungefähre Richtung kennt, in der er höchstwahrscheinlich die vier Städte finden kann.

Auch Orte, die nicht in diesen Richtungen liegen, können gefunden werden. Weiß beispielsweise jemand, dass das Dorf X einen hohen Wert auf dem Nordfaktor und einen geringen Wert auf dem Ostfaktor aufweist, dann kann damit dessen Lage in etwa erfasst werden. Oder umgekehrt, jemand bittet um eine Beschreibung der Lage des Dorfes Y, dann muss keine genaue, für jedes Dorf spezifische Richtung geliefert werden, sondern es reicht aus, die ungefähre Lage auf den Faktoren anzugeben.

Die in diesem Beispiel verwendeten 2 Faktoren reichen also aus, um Reisenden ungefähr den Weg zu weisen, damit sie das Ziel finden. Ähnlich reicht es in statistischen Untersuchungen oft aus, Aussagen über ja/nein-Entscheidungen (z.B. für oder gegen eine Therapieform) anhand ungefährer Ergebnisse zu treffen, solange die Daten hinreichend trivial sind. So könnte eine Faktorisierung von 100 Items eines Fragebogens, der 100 Variablen über den Zweck des Biertrinkens erfasst, hinreichend eindeutig nur wenige Faktoren wie Durst, Spaß am Betrunkensein und Alkoholismus heraus kristallisieren, wobei nur der letzte Faktor eine Therapiebedürftigkeit anzeigt. Man wird sehr viele der Betreffenden finden, ohne ihr Antwortverhalten in allen 100 Fragen exakt analysieren zu müssen, zumal ohnehin nur für oder gegen die Therapie entschieden werden muss.

Mit einer geringen Ungenauigkeit erkauft die Faktorenanalyse eine sehr viel einfachere Auswertung von großen Datensätzen.

Wichtige Begriffe


  • Variablen
    • Es sind immer die zu Beginn der Rechnung vorhandenen Variablen gemeint, die faktorisiert werden sollen. Wenn diese Variablen Messwerte enthalten, soll der Begriff Observable (Beobachtungswerte-Variable) verwendet werden. Die Faktorenanalyse wird in der Praxis meistens an Messwertvariablen durchgeführt. Die Variablen sind deshalb auch meistens manifest. Es ist selbstverständlich auch möglich, eine Faktoranalyse teilweise oder vollständig mit nicht-manifesten Variablen zu rechnen.
    • Die Variablen bilden in einem Datensatz den Ausgangszustand.
  • Faktor
    • Hiermit wird immer eine Variable bezeichnet, die durch Faktorisierung entstanden ist. Der Faktor „bündelt“ die anfänglich vorhandenen Variablen. Ein Faktor ist immer eine latente Variable. Er kann nie Messwerte enthalten und ist ohne eine eigene Hypothese inhaltlich nutzlos. Wenn es nicht möglich ist, den Faktor zu hypothetisieren, kann eine berechnete Faktorenanalyse nicht ausgewertet werden.
    • Der Faktor ist zugleich eine Dimension seines Faktorraumes.
    • Die Faktoren stellen in einem Datensatz den zu erreichenden Zielzustand dar.
  • Faktorraum
    • Ein Raum, der durch die Faktoren aufgespannt wird. Er entsteht durch die Extraktion und ist meist vieldimensional. Von diesen Dimensionen werden nur jene weiterhin genutzt, die genügend Varianz der Variable aufklären. Dies sind meist auch jene, die inhaltlich vorstellbar sind. Der Faktorraum kann durch wiederholte Rechnung der Extraktion mit jeweils veränderten Kriterien optimiert werden.
  • Extraktion
    • Die Rechenmethode, mit der die in den Variablen enthaltene Varianz „extrahiert“ wird. Die Extraktion erzeugt die Faktoren. Es gibt verschiedene Rechenmethoden, die zur Extraktion verwendet werden können. Sie weisen jeweils Vor- und Nachteile auf. Eine allgemeingültige Extraktionsmethode gibt es nicht. Der Anwender muss sich anhand von Kriterien für jene Extraktionsmethode entscheiden, die für ihn am geeignetsten ist.
  • Faktorladung
    • Die Korrelation einer Variablen mit einem Faktor. Man spricht davon, dass Variable X auf den Faktor Y mit dem Wert a lädt. Je kürzer die räumliche Entfernung zwischen Faktor und Variable im Faktorraum, desto höher die Korrelation.
    • Eine Faktorladug von "1" sagt aus, dass der Faktor ebenso gut erklärt wie die Variable selbst, da beide identisch sind. Eine Ladung von „0“ sagt aus, dass der Faktor und die Variable von einander stochastisch unabhängig sind.
  • Eigenwert eines Faktors (engl. ebenfalls eigenvalue genannt)
    • Wert der Gesamtvarianz aller Variablen, den dieser Faktor aufklärt. Der Eigenwert ergibt sich unabhängig von der jeweiligen Extraktionsmethode immer aus der Summe aller quadrierten Faktorladungen des Faktors.
    • Die Eigenwerte der zur Rotation ausgewählten Faktoren ändern sich mit der Rotation (d.h. ein Faktor mit Eigenwert 7 kann nach der Rotation den Eigenwert 5 haben). Die Summe aller Eigenwerte bleibt allerdings gleich.
    • Der Eigenwert ist ein Qualitätskriterium für den Faktor. Je höher der Eigenwert des Faktors, desto lukrativer ist es, ihm eine Hypothese zuzuschreiben, die ihn mit inhaltlichen Aspekten der Untersuchung verbindet.
  • Kommunalität
    • Summe der quadrierten Faktorladungen einer Variablen. Die Kommunalität gibt an, in welchem Maße die Varianz einer Variablen durch alle Faktoren aufgeklärt wird. Eine Variable mit einer geringen Kommunalität wird durch das Modell insgesamt schlecht vertreten.
    • Die Kommunalität ist ein Kriterium dafür, wie gut eine Variable in den Reigen der anderen Variablen passt. Eine geringe Kommunalität weist darauf hin, dass man diese Variable vielleicht zu Unrecht zu den anderen gesteckt hat, weil ihre Varianz stark abweicht. Vermutlich liegt dem Antwortverhalten der Probanden für dieses Item eine andere Gesetzmäßigkeit zugrunde, die man zuvor nicht beachtet hat. So könnte beispielsweise die Variable 5 im obigen Beispiel eine geringe Kommunalität aufweisen, weil Menschen nicht nur Kaffee trinken, wenn sie oft müde sind, sondern einfach, weil er ihnen schmeckt.
  • Rotation
    • Ein statistisches Verfahren, mit dem sich die Interpretation der Faktoren erleichtern lässt.

Überblick über Einzelverfahren der Faktorenanalyse


Extraktionsmethoden

Als Extraktion (auch Extraktionsmethode, Extraktionsalgorithmus) wird jene statistische Rechnung bezeichnet, die zur Bildung der Faktoren führt. Sie wird zuerst durchgeführt. Die Methoden sind teilweise aus anderen Anwendungen entlehnt.

Häufig verwendete Extraktionsmethoden sind:

Rotationsverfahren

Die Rotation ist eine Entscheidungshilfe für die inhaltliche Interpretation der Faktoren. Zur Verfügung stehen verschiedene Verfahren, darunter:

Diese Verfahren nähern sich der Rotationslösung iterativ an und erfordern meist zwischen 10 und 40 Iterationsrechnungen.

Kriterien

Bei der Extraktion entstehen je nach Option und Verfahren sehr viele Faktoren. Nur wenige von ihnen erklären genug Varianz, um ihre weitere Verwendung rechtfertigen zu können. Folgende Kriterien werden an die Faktoren gelegt:


Extraktionsmethode Hauptkomponentenanalyse


Hauptartikel: Hauptkomponentenanalyse

Die Hauptkomponentenanalyse ist wegen ihrer Problemlosigkeit die häufigst verwendete Extraktionsmethode. Mit ihr werden Faktoren ermittelt, die sukzessiv einen maximalen Anteil der Varianz beschreiben. Das bedeutet, dass der erste Faktor den größten Anteil der Varianz beschreibt, der zweite Faktor den zweitgrößten usw. In der Regel sind die extrahierten Faktoren voneinander unabhängig, d. h. ihre Korrelation beträgt 0 bzw. sie sind orthogonal.

Nach der Berechnung gibt der Faktorwert für jeden einzelnen Probanden seine Ausprägung auf den einzelnen Faktoren an. Besonders bekannt ist hier die Berechnung des IQ durch den Faktor g von Charles Spearman. Weitere typische Anwendungen sind Persönlichkeitstests, bei denen die Probanden (z.B. n=1000) einen Fragebogen mit z.B. 60 skalierten Fragen ausfüllen, aus denen 60 Variablen mit Einzelwerten für jeden Probanden resultieren. In diesen werden dann zur Bildung eines schlüssigen Persönlichkeitsbildes Faktoren gesucht. Das können bei der Hauptkomponentenanalyse beispielsweise 8 - 12 sein. Ein solcher Faktor könnte Extraversion/Introversion heißen.

Grundlage für die Berechnung ist eine Korrelationsmatrix.

Mathematisches Vorgehen der Hauptkomponentenanalyse

Faktorenanalyse iiii.PNG Das Prinzip der Hauptkomponentenanalyse lässt sich am besten graphisch verdeutlichen. Wenn n Variablen erfasst werden, spannen diese Variablen einen n-dimensionalen Raum auf, der sich graphisch bei n>3 nicht darstellen lässt. Darum stelle man sich vereinfachend vor, es wären nur zwei Variablen erfasst worden. Diese spannen also ein Koordinatensystem auf (X- und Y-Achse stellen die Variablen dar). Die Punkte im Koordinatensystem stellen die jeweiligen Leistungen der Versuchspersonen (Vpn) auf beiden Variablen dar. Angenommen, beide Variablen seien nun leicht positiv miteinander korreliert (d. h. der Punktschwarm ist in etwa ellipsenförmig mit einer von links unten nach rechts oben verlaufenden großen Achse der Ellipse). Bei der Hauptkomponentenanalyse werden nun – vereinfachend umschrieben – die Faktoren wie folgt extrahiert: Ein Faktor wird genau so in den Punktschwarm gelegt, dass diese die Varianz optimal beschreibt. Das heißt nichts anderes, als dass die Gerade solange gedreht wird, bis sie die Punktwolke maximal approximiert – also bis die Gerade genau durch den maximalen Durchmesser der Ellipse verläuft. Diese Gerade ist der erste Faktor, der nun die Varianz optimal beschreibt. Um den zweiten Faktor zu extrahieren, soll eine zweite Gerade rechtwinklig durch den ersten Faktor verlaufen. Damit ist die Korrelation beider Faktoren miteinander null – sie sind also linear unabhängig. Diese zweite Gerade wird nun solange auf dem ersten Faktor bewegt (immer im rechten Winkel zu diesem), bis sie die maximale Restvarianz der Punktwolke beschreibt, also die Punktwolke auf der zweiten Geraden maximal breit ist. Diese Gerade ist nun der zweite Faktor.

Folgende fiktive Statistik könnte entstehen:

Variable Kommunalität Faktor Eigenw Var kum.Var Var 1 1.00 1 3.7 55.1 55.1 Var 2 1.00 2 3.5 34.3 89.4

Eine wichtige Anmerkung zu diesem Beispiel ist natürlich, dass man in der Forschung viel mehr als nur zwei Ausgangsvariablen untersucht. Die Faktoren stehen deshalb im n-dimensionalen Raum aufeinander, der nicht anschaulich vorgestellt werden kann. Außerdem würde eine Faktorenanalyse, die aus zwei Variablen zwei Faktoren extrahiert, natürlich wenig sinnvoll sein, weil die Zahl der Faktoren sehr viel geringer als die Zahl der Variablen sein soll. Das Beispiel dient der Veranschaulichung des Prinzips.

Folgende fiktive Statistik könnte mit 10 Variablen entstehen:

Variable Kommunalität Faktor Eigenw Var kum.Var in % Var 01 1.00 1 4.7 55.1 55.1 Var 02 1.00 2 4.5 34.3 89.4 Var 03 1.00 3 1.1 5.2 94.6 Var 04 1.00 4 0.9 1.1 95.7 Var 05 1.00 5 0.8 1.0 96.7 Var 06 1.00 6 0.8 0.8 97.5 Var 07 1.00 7 0.5 0.3 97.8 Var 08 1.00 8 0.5 0.2 98.0 Var 09 0.92 9 0.4 0.2 98.2 Var 10 0.31 10 0.3 0.1 98.3

In diesem Beispiel ist nach dem Kaiser-Kriterium die Berücksichtigung von drei Faktoren sinnvoll (Eigenwerte über "1"); nach dem Ellenbogenkriterium hingegen sollen nur zwei Faktoren unterschieden werden (Knick). Nach beiden Kriterien wird ein sehr hoher Anteil der Observablenvarianz aufgeklärt. (89.4 % bzw. 94.6 %) Außerdem zeigt eine geringe Kommunalität der Variable 10 an, dass diese Variable vermutlich zu unrecht in die Rechnung einbezogen wurde. Durch Ausschluß dieser Variable kann möglicherweise eine erneute Rechnung verbessert werden.

Gängige Statistikprogramme wie SPSS oder SAS geben die Faktoren als Variablen in die Datensätze zurück.

Weitere Merkmale der Hauptkomponentenanalyse

Die Diagonalemente der Korrelationsmatrix der zu faktorisierenden Variablen werden eingangs auf "1" gesetzt. Dies entspricht der ersten Schätzung innerhalb des Verfahrens.


Interpretation der Faktoren


Inhaltliche Interpretation

Die Faktoren können inhaltlich gut interpretiert werden, wenn auf ihnen Variablen hoch laden, die inhaltlich eng mit einander verbunden sind. Die Interpretation sollte alle Eigenschaften, die die Variablen erfassen, einbeziehen. Als Name für den Faktor kann ein Substantiv mit mehreren Adjektiven gewählt werden. Wurden beispielsweise Items Fühlen Sie sich oft abgeschlagen?, Sind Sie tagsüber oft müde?, Haben Sie das Bedürfnis, sich am Tag ins Bett zu legen?, Empfinden Sie sich oft kraftlos? und Trinken Sie tagsüber viel Kaffee? faktorisiert, so könnte der Faktor tagesmüde Abgeschlagenheit heissen. In der Statistik ist auch die Bildung von Kunstworten üblich, die sich nicht an grammatischen Regeln orientieren, z.B. kaffetrinkenbewirkendes Tagesabgeschlagenfühlen.

Die inhaltliche Interpretation ist immer mit einer eigenen Hypothese verbunden.

Interpretation mit Hilfe der Rotationstransformation

Ebenso, wie man sich vieldimensionale Räume schwer vorstellen kann, fällt es schwer, sich Eigenschaften vorzustellen, die Extrakte aus Mischungen von Messwerten sind. Die Interpretation der Faktoren kann jedoch durch statistische Verfahren erleichtert werden, die die Datensätze gewissermaßen von verschiedenen Richtung beleuchten. Hierzu zählt das Rotationsverfahren. Es läßt sich unabhängig von der Extraktionsmethode einsetzen und kann durch oben genannte Algorithmen berechnet werden. Meist wird die Varimax-Methode eingesetzt, die orthogonal ist.

Mit einer Testbatterie wurden vier Variablen (Observablen) gewonnen, die die Messwerte eines Rechentests (R), einer Zählaufgabe (Z), eines Lesetests (L) und eines Worttests (W) enthalten. Durch Faktorenanalyse wurden zwei Faktoren extrahiert. Jede der Ausgangsvariablen weist eine Faktorladung auf, die die Korrelation zwischen der Variablen und einem Faktor angibt. Zur Verdeutlichung wird ein Koordinatensystem gezeichnet, in dem die X-Achse dem ersten und die Y-Achse dem zweiten Faktor entspricht. In dieses Koordinatensystem werden nun die Faktorenladungen der vier Ausgangsvariablen eingetragen. Dabei ergebe sich folgender Faktorraum: |Faktor 2 | R | L Z | W | __________|__________Faktor 1 | | | |

Wobei:

Die X-Achse den Faktor 1, die Y-Achse den Faktor 2 darstellt. R, Z, L, W gibt die Position der Faktorladung der Tests in diesem Koordinatensystem wieder. Die Werte entsprechen der Korrelationen der Variablen mit den Faktoren.

Die Skizze zeigt, dass alle vier Ausgangsvariablen hoch mit beiden Faktoren korreliert sind. Wie also sollen die Faktoren interpretiert werden? Während Faktor 1 hier die mathematischen von den sprachliche Kompetenzen noch trennen kann (Vorzeichen), fallen alle vier Variablen auf Faktor 2 zusammen.

Um nun die Faktoren interpretieren zu können, wird das Rotationsverfahren angewendet. Es gibt verschiedene Transformationen – hier soll die am häufigsten verwendete orthogonale Transformationsrotation dargestellt werden.

Orthogonale Rotationstransformation bedeutet, dass das obige Koordinatensystem solange entgegen dem Uhrzeigersinn gedreht wird, bis die einzelnen Variablen jeweils möglichst hoch auf einem Faktor und möglichst niedrig auf dem anderen Faktor laden. Bei dieser Rotation wird aber stets die ursprüngliche Form des Koordinatensystem beibehalten, d. h. beide Faktoren bleiben rechtwinklig zueinander.

In unserem Beispiel könnten das Koordinatensystem um 45° entgegen dem Uhrzeigersinn gedreht werden. Das hätte zur Folge, dass R und Z hoch auf Faktor 2 laden und kaum auf Faktor 1. Und gleichzeitig laden L und W sehr stark auf Faktor 1, aber kaum auf Faktor 2. Dann fiele die Interpretation der Faktoren sehr viel leichter. Da nur die Lese- und Worttests deutlich auf dem ersten Faktor laden, könnte man schlussfolgern, dass der erste Faktor sprachliche Kompetenzen erfasst. Da nur die Rechen- und Zählaufgabe auf Faktor 2 deutlich laden, könnte man diesen als mathematische Kompetenz beschreiben.

Die Rotationsmatrix in diesem fiktiven Fall könnte so aussehen:

Faktor 1 Faktor 2 R .08 .92 Z .03 .89 L .83 -.06 W .82 -.12

Nachteile der Rotationstransformation
Die Rotationstransformation reagiert insbesondere bei wenigen Variablen sehr sensibel auf Messfehler und kurzfristig wirksame Einflüsse.

Probleme der Faktorenanalyse


Das Verfahren der Faktorenanalyse gibt nur an, wie hoch die einzelnen Faktoren mit den jeweiligen Variablen korrelieren. Es bleiben viele Entscheidungen, die der subjektiven Ansicht überlassen sind. Hierzu zählt unter anderem die Anzahl der verwendeten Faktoren sowie die Benennung der Faktoren.

Darüber hinaus müssen die Daten intervallskaliert sein, um für eine Faktorenanalyse geeignet zu sein. Dieses Kriterium wird in der Praxis oft verletzt und Daten werden einer Faktorenanalyse unterzogen, die einem niedrigeren Skalenniveau entsprechen (wie etwa Nominalskalenniveau oder Ordinalskalenniveau).

Außerdem können Daten, die auf einer nicht repräsentativen Stichprobe beruhen, zu falschen Ergebnissen führen.

Siehe auch


Weblinks


Multivariates Verfahren

Factor analysis | Vikipedio:Projekto matematiko/Faktora analitiko | Analyse factorielle des correspondances | 因子分析 | Factoranalyse | Analiza czynnikowa | Analisis faktor

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Faktorenanalyse".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld