Der Expectation-Maximization-Algorithmus (auch EM-Algorithmus) ist ein Algorithmus aus der mathematischen Statistik.
Die Voraussetzung für seine Anwendung besteht darin, dass sich eine beobachtete stochastische Größe als gewichtete Summe mehrerer Zufallsvariablen beschreiben lässt. In diesem Fall können mit Hilfe des EM-Algorithmus bei einer gegebenen Stichprobe sowohl Varianz und Erwartungswert der eingehenden Zufallsvariablen als auch die Gewichte geschätzt werden. Für die Verwendung dieses Verfahrens müssen in der Stichprobe Werte für die beobachtete Zielgröße enthalten sein. Die Eingangsvariablen bilden häufig mehrere Modelle ab, deren Güte anhand des EM-Algorithmus bestimmt werden soll. Das bedeutet, je höher das Gewicht für eine bestimmte Zufallsvariable ist, desto höher wird die Qualität des entsprechenden Modells bewertet. Für den Fall, dass die einzelnen Modelle unabhängig voneinander sind, ermittelt der EM-Algorithmus das optimale Mischungsverhältnis, sodass das aus der gewichteten Summe gebildete kombinierte Modell eine höhere Genauigkeit besitzt als jedes der eingehenden Modelle.
Rein formal wird beim EM-Algorithmus angenommen, dass die Werte der beobachteten stochastischen Größe auf folgende Art und Weise zustandekommen: Wähle zuerst eine der eingehenden Zufallsvariablen aus und übernimm deren Wert als Endergebnis. Das bedeutet, dass genau ein Gewicht den Wert eins annimmt und alle anderen null sind. Bei der Approximation der Gewichte durch den EM-Algorithmus ist dies normalerweise aber nicht mehr der Fall. Die Wahrscheinlichkeitsdichte eines Zielwertes lässt sich bei Normalverteilungsannahme und konstanter Varianz der einzelnen Zufallsvariablen darstellen als:
Dabei besitzen die verwendeten Bezeichnungen folgende Bedeutungen:
Der EM-Algorithmus besteht aus mehreren Iterationen der Schritte Expectation und Maximization.
Anstatt zu maximieren, kann auch maximiert werden, da der Logarithmus eine streng monoton steigende Funktion ist.
| \mathrm{maxarg}_{\mu} \ln \prod_{i=1}^m P(y >h) | = \mathrm{maxarg}_{\mu} \left( \sum_{i=1}^m \left( \ln \frac{1}{\sqrt{2\pi^2}} - \sum_{j=1}^n \frac{1}{2\sigma ^2} E* (y_i-\mu_j)^2 \right) \right) |
| = \mathrm{maxarg}_{\mu} \left( m \ln \frac{1}{\sqrt{2\pi^2}} - \frac{1}{2\sigma^2} \sum_{i=1}^m \sum_{j=1}^n E* (y_i-\mu_j)^2 \right) |
Der Minuend ist eine Konstante, deswegen ist es ausreichend, den Subtrahend zu minimieren:
Eine quadratische Summe ergibt stets einen nichtnegativen Wert. Daher ist das absolute Minimum durch 0 beschränkt und somit auch ein lokales Minimum. Man setze die 1. Ableitung für diesen Term nach jedem auf 0:
,
denn die Ableitung aller Summanden der Summe über j sind 0, außer für j=k. Folglich:
q.e.d.
Expectation-maximization algorithm | Algorithme espérance-maximisation
This article is licensed under the GNU Free Documentation License.
It uses material from the
"EM-Algorithmus".
Home Page • arts • business • computers • games • health • hospitals • home • kids & teens • news • physicians • recreation• reference • regional • science • shopping • society • sports • world