article

Thai Industrial Standard 620-2533 ist unter der Abkürzung TIS-620 allgemein bekannt als die der verbreitetste Zeichensatz und Zeichenkodierung für die Thailändische Schrift. Der Standard wurde vom Thai Industrial Standards Institute (TISI), einem Organ der königlich-thailändischen Regierung, verabschiedet und ist der allein gültige Standard im Königreich Thailand.

Der beschreibende Name des Standards lautet: "Standard für Codes von thailändischen Buchstaben im Computer" (Thai: รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร).

Der Zusatz "2533" bezieht sich auf die Jahreszahl nach dem buddhistischen Kalender (1990), in dem der Standard veröffentlicht wurde. Die Vorgängerversion, TIS-620-2529 (1986), gilt damit nicht mehr.

Struktur


TIS-620 ist eine konventionelle ASCII-Erweiterung, die zu 7-Bit-ASCII vollständig kompatibel ist und im 8-Bit-Hexadezimal-Bereich zwischen A1 und FB die thailändischen Buchstaben kodiert. Aufgrund der komplexen Platzierung der thailändischen Vokale und Tonzeichen wird TIS-620 nur zum Informationsaustausch verwendet. Für eine korrekte Darstellung wird zusätzlich eine Rendering-Engine für thailändischen Text benötigt.

Varianten


Eine fast identische Version von TIS-620 wurde 1999 als ISO 8859-11 adaptiert. Der einzige Unterschied ist, dass in ISO 8859-11 das Zeichen A0 (Hex) als geschütztes Leerzeichen definiert ist, während es in TIS-620 zwar reserviert, aber nicht definiert ist. (In der Praxis wird dieser kleine Unterschied normalerweise ignoriert.)

Der Zeichensatz ISO 8859-11 wurde auch als ISO-IR-166 bei Ecma International registriert, aber diese Variante enthält auch explizite Escape-Sequenzen, um Anfang und Ende eines thailändischen Wortes zu markieren. (Im Thailändischen werden keine Zwischenräume zwischen den Wörtern gesetzt.)

Die Reihenfolge der Zeichen in TIS-620 wurde in Unicode (ISO 10646) ebenfalls übernommen. Die thailändischen Zeichen reichen in Unicode von U+0E01 bis U+0E7F. TIS-620-Zeichen können ganz einfach nach UTF-16 konvertiert werden. Man muss nur jedem Byte das Präfix 0E hinzufügen und die Hex-Zahl A0 vom Wert abziehen.

TIS-620
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xunused
1x
2xSP!"#sign|$" target="_blank" >*%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZhref="http://articles.gourt.com/de/Backslash">\]*_
6x`abcdefghijklmno
7xpqrstuvwxyz{|}~
8xunused
9x
Ax 
Bx
Cx
Dx  ั  ิ  ี  ึ  ื  ุ  ู  ฺ         ฿
Ex  ็  ่  ้  ๊  ๋  ์  ํ  ๎
Fx        

Eventuell muss die Darstellung im Browser vergrößert werden, um alle Zeichen lesbar darzustellen.

In der oberen Tabelle ist 20 das reguläre SPACE Zeidhen. Die Werte 00-1F, 7F. 80-9F, A0, DB-DE und FC-FF sind in TIS-620 keinen Zeichen zugeordnet.

Weblinks


Zeichenkodierung | Thailand

TIS-620

 

This article is licensed under the GNU Free Documentation License. It uses material from the "TIS-620".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld