article

Der Universal Character Set (UCS) ist eine Zeichenkodierung, die im internationalen Standard ISO/IEC 10646 definiert ist. Für alle praktischen Belange ist dies dasselbe wie Unicode.

Er wird von ISO/IEC/JTC1/SC2/WG2 entwickelt.

Ursprünglich wurden diese beiden Formate definiert:

  • UCS-2: Kodierung in 2 Byte; lässt sich der Code nicht mit 16 Bit darstellen, so werden zwei 16-Bit-Wörter benutzt. Details siehe UTF-16.
  • UCS-4: Kodierung in 4 Byte

Die Gruppe arbeitet sehr eng mit dem Unicode-Konsortium zusammen, die die Standards ständig in neuen Versionen synchronisieren. So ist UCS-2 ein Synonym für UTF-16 und UCS-4 für UTF-32. Aufgrunddessen sind alle Kodierungen aus Interoperabilitätsgründen auf die für Unicode bedeutungsvollen 1.114.112 (= 220+216) Zeichen (von U+00000 bis U+10FFFF) beschränkt.

In der Version ISO/IEC 10646-3:2003 werden die gleichen Formate UTF-8, UTF-16 und UTF-32 beschrieben wie in Unicode 4.0.

Gegenüberstellung der Versionen


  • ISO/IEC 10646-1:1993 ≈ Unicode 1.1
  • ISO/IEC 10646-1:2000 ≈ Unicode 3.0
  • ISO/IEC 10646-2:2001 ≈ Unicode 3.2
  • ISO/IEC 10646-3:2003 ≈ Unicode 4.0

Weblinks


ISO-Standard | Unicode

ISO 10646 | Universal Character Set | ISO 10646 | ISO/CEI 10646 | ISO 10646 | ISO/IEC 10646 | UCS | ISO/IEC 10646 | 通用字符集

 

This article is licensed under the GNU Free Documentation License. It uses material from the "Universal Character Set".

Home Pageartsbusinesscomputersgameshealthhospitalshomekids & teensnewsphysiciansrecreationreferenceregionalscienceshoppingsocietysportsworld