Unicode

aus WB Wiki; freien Wissensdatenbank rund ums Thema Computer
Wechseln zu: Navigation, Suche

Unicode steht als Abkürzung für “Universal Multiple-Octet Coded Character Set”. Man verwendet auch den Begriff „Universal Character Set“ (UCS).

Unicode wurde von der ISO (International Standardization Organization) der UNO verabschiedet und ist der für die internationale Textverarbeitung gestaltete Zeichensatz und das mehrsprachige Pendant zu ASCII.

Da Computer bekanntlich nur mit Zahlen arbeiten, werden Buchstaben und andere Zeichen deshalb Zahlen eindeutig zugeordnet, wenn man sie speichern will.

Neben ASCII gab und gibt es Hunderte unterschiedlicher Kodierungssysteme. Allein innerhalb Europas brauchte man mehrere verschiedene Systeme, um die Zeichensätze der unterschiedlichen Ländersprachen abzudecken. Untereinander sind die herkömmlichen Zeichencodes nicht kompatibel, weil sie für ein und dasselbe Zeichen verschiedene Kodierungen verwenden. Man brauchte also zusätzlich eine Vielzahl von Konvertierungsprogrammen.

Unicode arbeitet dagegen mit einem 16-Bit-Code (216) und ermöglicht so 65.536 verschiedene Zeichen. Unicode gibt unabhängig von Plattform, Programm und Sprache jedem Zeichen eine eigene Nummer und schafft somit erstmalig einen internationalen Standard.

Unicode soll so organisiert und eingesetzt werden können, dass er, unabhängig davon, ob es sich dabei um Textdateien, Datenbanken oder Quellencodes handelt, einen internationalen Umgang mit Dokumenten aller Art erlaubt.