article

Die von IBM-PCs und MS-DOS verwandte Codepage 437, auch bekannt als DOS-US oder OEM-US, ist der Original-Zeichensatz des IBM-PC ab 1981 und enthält folgende Zeichen:

  *0 *1 *2 *3 *4 *5 *6 *7 *8 *9 *A *B *C *D *E *F
0* NUL
1* §
2* !"#$%&'()*+,-./
3* 0123456789:;<=>?
4* @ABCDEFGHIJKLMNO
5* PQRSTUVWXYZ[\]^_
6* `abcdefghijklmno
7* pqrstuvwxyz{|}~
8* ÇüéâäàåçêëèïîìÄÅ
9* ÉæÆôöòûùÿÖÜ¢£¥ƒ
A* áíóúñѪº¿¬½¼¡«»
B*
C*
D*
E* αßΓπΣσµτΦΘΩδφε
F* ±÷°·²NBSP

Der Zeichensatz basiert auf ASCII, mit folgenden Änderungen:

  • Dem C0-Steuerzeichenbereich (0x00-0x1F hex) sind Grafikzeichen zugeordnet. Die Codes können sowohl ihrer eigentlichen Funktion zur Steuerung dienen (Unter DOS erzeugt z. B. die Eingabe von „echo“ Leerzeichen Strg-G Enter einen Pieps, und das sogar an der Eingabeaufforderung unter Windows XP) als auch auf dem Bildschirm angezeigt werden, zum Beispiel in einem Texteditor. Die Grafikzeichen sind sehr verschieden, vom Smiley über Spielkarten zu Musiknoten. Auch Code 0x7F, DEL, zeigt eine Grafik – ein Haus.

  • Dem hochbittigen Bereich, 0x80-0xFF, sind verschiedene Symbole zugeordnet: einige europäische Schriftzeichen (lateinische Vokale mit Akzenten usw.) ohne besondere Reihenfolge und unzureichend für die meisten europäischen Sprachen, des Weiteren Blockgrafikzeichen, mathematische Symbole und einige griechische Buchstaben, von denen das kleine Beta auch zugleich als deutsches ß herhalten muss.

  • Der Bereich von 0xC0 bis 0xDF wurde ausschließlich für Grafikzeichen (Rahmenzeichen, engl: "box drawing characters") benutzt, da die VGA- und MDA-Karten des PCs diese Zeichen gesondert behandeln: Im Textmodus wird jedes Zeichen mit 9 Pixeln Breite dargestellt, da dies den Abstand zwischen den Zeichen und damit die Lesbarkeit erhöht. Die Zeichensätze enthalten jedoch nur 8 Pixel breite Zeichen. Der 9. Pixel wird daher normalerweise einfach in der Hintergrundfarbe gezeichnet. Dies hätte bei den Rahmenzeichen jedoch unschöne Lücken zwischen den Zeichen zur Folge. Durch ein spezielles Register in der Grafikkarte lässt sich jedoch aktivieren, dass der 9. Pixel aus dem 8. Pixel gewonnen wird. Dies wird aber nur für die Zeichen aus dem Bereich 0xC0 bis 0xDF angewendet. Aus diesem Grund sind alle Rahmenzeichen, die nach rechts weisende Verbindungslinien enthalten, in diesem Bereich angesiedelt worden.

Das Repertoire von CP437 wurde dem Zeichensatz der Wang-Textverarbeitungs-Maschinen entlehnt, was auch Bill Gates ausdrücklich in einem am 2. Oktober 1995 im Fortune Magazine erschienenen Interview von ihm und Paul Allen zugab:

„... Auch waren wir fasziniert von den speziellen Textverarbeitungssystemen aus dem Hause Wang, denn wir glaubten, daß Allzweck-Maschinen diese Aufgaben genausogut lösen könnten. Aus diesem Grund haben wir auch, als die Zeit kam, die Tastatur vom IBM-PC zu entwerfen, den lustigen Wang-Zeichensatz in die Maschine gepackt – Sie wissen schon, Smiley Faces und Kästchen und Dreiecke und so'n Zeugs. Wir dachten, wir würden eines Tages gern mal einen Klon der Wang-Textverarbeitungs-Software schreiben.“

CP437 ist unbrauchbar für Internationalisierung, denn es fehlen ihm Zeichen, die nötig sind für diverse Sprachen, so etwa À für Französisch; auch hatte er nur wenige griechische Zeichen. Spätere MS-DOS-Zeichensätze, zum Beispiel CP850 (DOS-Latin-1), CP852 (DOS Central-European) und CP737 (DOS Greek), füllten die Lücken für internationale Nutzung, wobei sie insofern zu CP437 kompatibel blieben, als dass sie (außer einigen der Blockgrafikzeichen und mathematischen Symbole) die meisten Zeichen beibehielten. Alle Zeichen aus CP437 sind heute auch im Unicode-Zeichensatz enthalten, sowie in Microsofts WGL4-Zeichensatz und somit auch enthalten in den meisten Schriftarten unter Microsoft Windows, und auch in dem VGA-Font unter Linux (und natürlich den ISO-10646-Fonts für X11).

Wer eine Zuordnungstabelle erstellen möchte, sollte beachten, dass CP437 einige ähnlich aussehende Zeichen über einen Kamm schert: 0xE1 steht sowohl für das deutsche ß (U+00DF) als auch für das kleine Beta (U+03B2); 0xE4 ist zugleich Summenzeichen (U+2211) als auch großes Sigma (U+03A3); 0xE6 ist ebenso das Mikro-Zeichen (U+00B5) wie das kleine griechische my (U+03BC); 0xEA ist zugleich das Ohm-Zeichen als auch das große Omega (U+03A9); und 0xEE ist gleichsam das Element-Zeichen (U+2208) und kleines Epsilon (U+03B5).

Zeichenkodierung

Code page 437 | CP437 | Codepage 437 | CP437 | CP437

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Codepage 437".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld