article

Die Buchstabenhäufigkeit ist eine statistische Größe, die in der Entschlüsselung von Substitutionsverfahren in der Kryptoanalyse sowie in der Datenkompression und -kodierung benutzt wird. Die Häufigkeitsverteilung der Buchstaben ist von Sprache zu Sprache verschieden. Die statistische Verteilung der Buchstabenhäufigkeit auf den oberen Plätzen wird vom Zipfschen Gesetz vorhergesagt.

Anwendung


Bei einfachen Verschlüsselungsverfahren wie beispielsweise dem Cäsarchiffre kann ein Text alleine durch Häufigkeitsanalyse entschlüsselt werden. Dabei werden die Häufigkeiten der einzelnen Zeichen im Krüger festgestellt, und dann mit der Häufigkeit der Zeichen in einem deutschen Klartext verglichen. Nun werden die Buchstaben des Geheimtextes durch die "normalen" Buchstaben gleicher Häufigkeit ersetzt. Der häufigste Buchstabe des Geheimtextes entspricht im Geheimtextalphabet dann so eingestellt, dass er dem Klartextbuchstaben "e" entspricht. Diese Methode funktioniert besser, je länger der zu entschlüsselnde Text ist, weil dadurch die statistische Abweichung der gefundenen Buchstabenhäufigkeit von der zu erwartenden Häufigkeit geringer wird.

Für den Maschinenschreibunterricht (siehe Tastschreiben) ist es ungemein wichtig, dass die Lehrkraft über die Buchstabenhäufigkeit in einer Sprache gut informiert ist und die Unterrichtsinhalte entsprechend darauf abgestimmt werden. Häufige Buchstaben wie das E oder das I müssen hinreichend trainiert werden um eine möglichst hohe Anschlagszahl und eine gute Schreibsicherheit zu erzielen.

Spieleverlag von Buchstabenspielen wie Boggle oder Scrabble berücksichtigen bei den nationalen Varianten ebenfalls die Häufigkeit und falls vorhanden, auch die Wertigkeit der Buchstaben.

Eine der ersten Anwendungen war das Morse-Alphabet, das für häufige Zeichen kurze Codes verwendet (zum Beispiel 'e' = '.'); für selten gebrauchte Zeichen dagegen längere Codes (zum Beispiel 'q' = '- -. -').

Weiterführung


Die Weiterführung der Buchstabenhäufigkeit ist die Häufigkeit von Buchstabenpaaren und -tripeln.

Häufigkeiten in der Deutschen Sprache


Die Umlaute ä, ö und ü wurden wie ae, oe und ue gezählt Albrecht Beutelspacher, Kryptologie, 7. Aufl., Wiesbaden: Vieweg Verlagsgesellschaft, 2005, ISBN 3-8348-0014-7, Seite 10. Die beiden Buchstaben e und n treten mit gemeinsam 27,18% am häufigsten auf.
Platz Buchstabe relative
Häufigkeit
1. E 17,40 %
2. N 9,78 %
3. I 7,55 %
4. S 7,27 %
5. R 7,00 %
6. A 6,51 %
7. T 6,15 %
8. D 5,08 %
9. H 4,76 %
10. U 4,35 %
11. L 3,44 %
12. C 3,06 %
13. G 3,01 %
14. M 2,53 %
15. O 2,51 %
16. B 1,89 %
17. W 1,89 %
18. F 1,66 %
19. K 1,21 %
20. Z 1,13 %
21. P 0,79 %
22. V 0,67 %
23. J 0,27 %
24. Y 0,04 %
25. X 0,03 %
26. Q 0,02 %

Weblinks


Weitere Buchstabenprofile


Quellen


Kryptologie | Schreibtechnik

Letter_frequencies | Frecuencia de aparición de letras | Fréquence d'apparition des lettres en français | Türk alfabesindeki harflerin kullanım sıklıkları

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Buchstabenhäufigkeit".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld