article

Der Expectation-Maximization-Algorithmus (auch EM-Algorithmus) ist ein Algorithmus aus der mathematischen Statistik.

Die Voraussetzung für seine Anwendung besteht darin, dass sich eine beobachtete stochastische Größe als gewichtete Summe mehrerer Zufallsvariablen beschreiben lässt. In diesem Fall können mit Hilfe des EM-Algorithmus bei einer gegebenen Stichprobe sowohl Varianz und Erwartungswert der eingehenden Zufallsvariablen als auch die Gewichte geschätzt werden. Für die Verwendung dieses Verfahrens müssen in der Stichprobe Werte für die beobachtete Zielgröße enthalten sein. Die Eingangsvariablen bilden häufig mehrere Modelle ab, deren Güte anhand des EM-Algorithmus bestimmt werden soll. Das bedeutet, je höher das Gewicht für eine bestimmte Zufallsvariable ist, desto höher wird die Qualität des entsprechenden Modells bewertet. Für den Fall, dass die einzelnen Modelle unabhängig voneinander sind, ermittelt der EM-Algorithmus das optimale Mischungsverhältnis, sodass das aus der gewichteten Summe gebildete kombinierte Modell eine höhere Genauigkeit besitzt als jedes der eingehenden Modelle.

Formulierung als Zufallsexperiment

Rein formal wird beim EM-Algorithmus angenommen, dass die Werte der beobachteten stochastischen Größe auf folgende Art und Weise zustandekommen: Wähle zuerst eine der eingehenden Zufallsvariablen aus und übernimm deren Wert als Endergebnis. Das bedeutet, dass genau ein Gewicht den Wert eins annimmt und alle anderen null sind. Bei der Approximation der Gewichte durch den EM-Algorithmus ist dies normalerweise aber nicht mehr der Fall. Die Wahrscheinlichkeitsdichte eines Zielwertes lässt sich bei Normalverteilungsannahme und konstanter Varianz der einzelnen Zufallsvariablen darstellen als: p(y_i|h)= \frac{1}{\sqrt{2\pi^2}} e^{- \frac{1}{2\sigma^2} \sum_{j=1}^{n} w_{ij}(y_i-\mu_j)^2}

Dabei besitzen die verwendeten Bezeichnungen folgende Bedeutungen:

  • w_{ij}: Gewicht der j-ten Zufallsvariable für den i-ten Wert der Zielgröße
  • n: Anzahl der Gewichte
  • y_i: Wert der i-ten Zielgröße
  • h: Stichprobe
  • \mu_j: Erwartungswert der j-ten Zufallsvariable
  • \sigma^2: Varianz

Lösungsverfahren

Der EM-Algorithmus besteht aus mehreren Iterationen der Schritte Expectation und Maximization.

  • Im Expectation-Schritt werden die Erwartungswerte der Gewichte berechnet unter der Annahme, dass die Erwartungswerte der eingehenden Zufallsvariablen den in Schritt zwei berechneten entsprechen. Dies ist allerdings nur möglich, falls es sich nicht um die erste Iteration handelt.
Die Erwartungswerte lassen sich darstellen als E*=p(X_j=y_i |\mu _j = \mu _{j,\mathrm{appr}})/ \sum _{k=1}^n p(X_k=y_i|\mu_k = \mu_{k,\mathrm{appr}})

  • Im Maximization-Schritt werden die Erwartungwerte der Wahrscheinlichkeitsverteilungen der einzelnen Zufallsvariablen bestimmt, bei denen die Wahrscheinlichkeit für das Eintreffen des Stichprobenergebnisses, unter der Annahme, dass die exakten Werte der Gewichte jeweils ihren Erwartungswerten entsprechen, maximiert wird (Maximum-Likelihood-Algorithmus). Die auf diese Weise geschätzten Erwartungswerte ergeben sich bei Normalverteilungsannahme durch \mu_{j,\mathrm{appr}}=\frac{1}{n} \sum_{i=1}^n E* y_i

Vorteile

  • Kann mit unvollständigen Beobachtungen umgehen

Instanzen des EM-Algorithmus

Beweis für den Maximization-Schritt bei Normalverteilungsannahme

Bewiesen werden soll: \mathrm{maxarg}_{\mu_k}\prod_{i=1}^m P\left( y|h \right) =^? \frac{1}{m} \sum_{i=1}^{m} \frac{1}{2\sigma ^2} E* y_i

Anstatt P(y|h) zu maximieren, kann auch \ln P(y|h) maximiert werden, da der Logarithmus eine streng monoton steigende Funktion ist.

= \mathrm{maxarg}_{\mu} \left( \sum_{i=1}^m \left( \ln \frac{1}{\sqrt{2\pi^2}} - \sum_{j=1}^n \frac{1}{2\sigma ^2} E* (y_i-\mu_j)^2 \right) \right) = \mathrm{maxarg}_{\mu} \left( m \ln \frac{1}{\sqrt{2\pi^2}} - \frac{1}{2\sigma^2} \sum_{i=1}^m \sum_{j=1}^n E* (y_i-\mu_j)^2 \right)
\mathrm{maxarg}_{\mu} \ln \prod_{i=1}^m P(y >h)

Der Minuend ist eine Konstante, deswegen ist es ausreichend, den Subtrahend zu minimieren:

\mathrm{minarg}_{\mu} \left( \frac{1}{2\sigma^2} \sum_{i=1}^m \sum_{j=1}^n E \left\right \left(y_i-\mu_j \right)^2 \right)= \mathrm{minarg}_{\mu} \left(\sum_{i=1}^m \sum_{j=1}^n E* (y_i-\mu_j)^2 \right)

Eine quadratische Summe ergibt stets einen nichtnegativen Wert. Daher ist das absolute Minimum durch 0 beschränkt und somit auch ein lokales Minimum. Man setze die 1. Ableitung für diesen Term t nach jedem \mu_k auf 0:

\frac{\mathrm{d}t}{\mathrm{d}\mu_k} = -2\sum_{i=1}^m E \left\right \left(y_i-\mu_k \right) = 0,

denn die Ableitung aller Summanden der Summe über j sind 0, außer für j=k. Folglich:

\sum_{i=1}^m E* y_i= m\mu_k \quad \Rightarrow \quad \mu_k=\frac{1}{m} \sum_{i=1}^m E\left\right y_i

q.e.d.

Literatur


  • Dempster, A.P., Laird. N.M., Rubin, D.B.: Maximum-Likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, 1977
  • Mitchell, Tom M., Machine Learning. The Mc-Graw-Hill Companies, Inc., 1997
Algorithmus

Expectation-maximization algorithm | Algorithme espérance-maximisation

 

This article is licensed under the GNU Free Documentation License. It uses material from the "EM-Algorithmus".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld