Codierung
Topic outline
-
American Standard Code for Information Interchange
-
- Zeitraum: Entwickelt in den 1960er Jahren
- Zeichensatz: 128 Zeichen
- Druckbare Zeichen: 95 (Buchstaben, Ziffern, Satzzeichen)
- Steuerzeichen: 33 (z.B. Zeilenumbruch, Tabulator)
- Kodierung: 7-Bit-Kodierung, wodurch jedes Zeichen durch eine Zahl von 0 bis 127 dargestellt wird.
Begrenzungen von ASCII
- Sprachunterstützung: Nur für englische Sprache geeignet, da keine Zeichen für andere Sprachen oder Symbole enthalten sind.
- Zeichenanzahl: Sehr begrenzt (nur 128 Zeichen).
Erweiterungen zu ASCII
- ISO 8859:
Eine Reihe von Standards, die ASCII um Zeichen für verschiedene europäische Sprachen erweiterten (8-Bit-Kodierung, 256 Zeichen).
- Windows-1252:
Eine erweiterte Version von ASCII, die in Windows-Betriebssystemen verwendet wird.
-
-
-
- Zeitraum: Entwicklung begann Ende der 1980er Jahre.
- Zeichensatz: Über eine Million Zeichen
- Sprachen: Unterstützt nahezu alle Sprachen der Welt.
- Symbole: Beinhaltet zahlreiche Symbole, Emojis, mathematische Zeichen und mehr.
- Kodierungsformen:
- UTF-8: Variabel, 1 bis 4 Byte pro Zeichen. Kompatibel mit ASCII (die ersten 128 Zeichen sind identisch).
- UTF-16: Variabel, 2 oder 4 Byte pro Zeichen.
- UTF-32: Fest, 4 Byte pro Zeichen.
# Hauptmerkmale und Vorteile von Unicode
- Umfangreicher Zeichensatz: Unterstützt Zeichen für fast alle Sprachen und viele Symbole.
- Kompabilität: UTF-8 ist rückwärtskompatibel mit ASCII.
- Flexibilität: Verschiedene Kodierungsformen (UTF-8, UTF-16, UTF-32) ermöglichen unterschiedliche Kompromisse zwischen Speicherplatz und Einfachheit der Verarbeitung.
-
-
-