Das Zipf'sche Gesetz (nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren entdeckte) ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann. Häufige Verwendung findet das Gesetz in der Linguistik, speziell in der Korpuslinguistik, wo es zum Beispiel die Häufigkeit von Wörtern in einem Text zur Rangfolge in Beziehung setzt. Das zipfsche Gesetz markierte den Beginn der quantitativen Linguistik.
Ihm liegt ein Potenzgesetz zugrunde, das von der Pareto-Verteilung mathematisch beschrieben wird.
Daneben heißt auch eine Beobachtung zur Sparsamkeit beim Gebrauch einer Sprache (irrtümlicherweise) zipfsches Gesetz (siehe unten)
- | Städte in Deutschland | - | Rang n | Stadt | Einwohner | Bundesland | berechnete Einwohnerzahl | Abweichung | - | Stand 1989 | Stand 1999 | Stand 2003 | - | 1. | Berlin | 3.522.896 | 3.340.887 | 3.388.477 | Berlin | 4.000.000 | 15% | - | 2. | Hamburg | 1.626.220 | 1.704.735 | 1.734.083 | Hamburg | 2.000.000 | 13% | - | 3. | München | 1.206.683 | 1.194.560 | 1.247.873 | Bayern | 1.333.333 | 6% | - | 4. | Köln | 946.280 | 962.507 | 965.954 | Nordrhein-Westfalen | 1.000.000 | 3% | - | 5. | Frankfurt | 635.150 | 643.821 | 643.432 | Hessen | 800.000 | 20% | - | 6. | Dortmund | 594.058 | 590.213 | 589.661 | Nordrhein-Westfalen | 666.666 | 12% | - | 7. | Essen | 624.445 | 599.515 | 589.499 | Nordrhein-Westfalen | 571.428 | -3% | - |
Solche Annäherungen lassen sich für viele Größen, die in eine Rangfolge gestellt werden, ausführen. Weitere Beispiele sind die Energiefreisetzung bei den größten Vulkanausbrüchen, die Wirtschaftskraft der wirtschaftlich stärksten Staaten der Erde.
Zipf nimmt einen einfachen reziproken Zusammenhang zum Rang an: y(Rang) ~ Rang-a. In der ursprünglichen Form ist das zipfsche Gesetz frei von Parametern, es ist a=1.
Die zipfsche Verteilung entspricht genau der Pareto-Verteilung, unter Vertauschung von Ordinate und Abzisse:
Das zipfsche Gesetz gibt den Exponenten a der kumulativen Verteilungsfunktion vor: a=1.
Der Fitwert für die Worthäufigkeiten beträgt jedoch a=0.83, gleichbedeutend mit dem Exponenten apareto=1,20 einer Paretoverteilung und dem Exponenten e einer Potenz-Verteilungsdichtefunktion von e=2,20.
Auch die Verteilung der Buchstaben-Häufigkeiten ähnelt einer zipfschen Verteilung. Die Statistik mit 20-30 Buchstaben ist aber zu schlecht, um den Verlauf mit einer Potenzfunktion anzupassen.
Ein weiteres Beispiel aus dem Artikel Pareto-Verteilung behandelt die Größenverteilung von Städten. Auch hier findet man eine Abhängigkeit, die einem Potenzgesetz gehorcht. Die Grafik rechts stellt die Zipf-Näherung den Messwerten gegenüber. Der lineare Verlauf in der doppelt-logarithmischen Verteilung stützt die Annahme eines Potenzgesetzes. Anders als die Vermutung von Zipf hat der Exponent nicht den Wert 1, sondern den Wert 0.77, entsprechend einem Exponenten einer Potenz-Dichteverteilung von e=2,3.
Die Bedeutung der Zipf-Verteilung liegt in der schnellen qualitativen Beschreibung von Verteilungen aus den unterschiedlichsten Bereichen, während die Pareto-Verteilung den Exponenten der Verteilung verfeinert.
Die Schlagworte Potenzgesetz (power law), Skalengesetz oder Selbstorganisation suchen nach Antworten für das Auftreten von Potenzverteilungen.
George Kingsley Zipf hat noch eine Reihe anderer linguistischer Hypothesen als Gesetze formuliert. Eines davon wird gelegentlich als "falsches" zipfsches Gesetz bezeichnet. In der Linguistik gibt es eine als Gesetz formulierte Beobachtung zur Sparsamkeit im Gebrauch von Sprache, die teilweise auch als "zipfsches Gesetz" kursiert. Sie hängt kaum mit dem Original zusammen und war auch wohl nicht von George Kingsley Zipf beabsichtigt. Auch wenn der Urheber nicht auszumachen ist, ist auch dieses "Zipf'sche" Gesetz eine wichtige und bedeutende Aussage darüber, wie Sprache entsteht.
Dieses "falsche" zipfsche Gesetz besagt, dass Äußerungen in einer Sprache immer aus einem Kompromiss zwischen zwei entgegengesetzten Tendenzen im Sprecher entstehen:
Dieses zipfsche Gesetz ist eine Hypothese über die Veränderung von Phonemen innerhalb einer Sprache(n) im Laufe der Zeit: Durch graduell voranschreitende Anpassungen als Veränderungen bei den gesprochenen Lauten ändert sich ihr Beitrag zur Gesamtinformation, weil sie sich im Zeitablauf dem Lautwert anderer Laute nähern oder sich von ihnen entfernen. Nähert sich ein Laut L1 dem Lautwert des Lauts L2, so wird der Informationswert von L2 immer geringer, was es notwendig macht, auch den Lautwert L2 zu verändern; Annäherung des Lautwerts von L2 an L3 macht Veränderung von L3 notwendig, usw. Diese von der Sprechökonomie losgetretene Entwicklung kann in einer durchgreifenden Veränderung vieler Laute im Rahmen eines Domino-Effektes enden und damit sogar Sprachen gleicher Sprachfamilie entfremden (vgl. Deutsch und Italienisch). Unter der Voraussetzung, dass sich diese Hypothese Zipfs in der Praxis bewährt, könnte sie manchen wichtigen Beitrag in der Phonetik und möglicherweise auch in der Etymologie leisten.
Informetrie | Statistik | Linguistik
Zipf's law | Zipfin laki | Loi de Zipf | Legge di Zipf | ジップの法則 | Zipfdistributie | Prawo Zipfa | Закон Ципфа | Zipfov zakon
This article is licensed under the GNU Free Documentation License.
It uses material from the
"Zipfsches Gesetz".
Home Page • arts • business • computers • games • health • hospitals • home • kids & teens • news • physicians • recreation• reference • regional • science • shopping • society • sports • world