Wie Base64-Textkodierung funktioniert

> TEXTKODIERUNG VERSTEHEN | TECHNISCHER LEITFADEN

Was ist Base64-Kodierung?

Base64 ist ein binär-zu-Text-Kodierungsschema, das binäre Daten in ein ASCII-String-Format konvertiert. Es wird häufig verwendet, um Daten zu kodieren, die über Medien übertragen werden müssen, die für Text ausgelegt sind, wie E-Mail-Systeme, URLs und JSON/XML-Dokumente.

Wie funktioniert Base64-Kodierung?

Base64-Kodierung konvertiert binäre Daten in einen Satz von 64 ASCII-Zeichen (A-Z, a-z, 0-9, +, /). Der Kodierungsprozess folgt diesen Schritten:

  1. In Binär konvertieren: Jedes Zeichen wird in seine binäre Darstellung (8 Bits) konvertiert
  2. In 6-Bit-Blöcke gruppieren: Der Binärstrom wird in 6-Bit-Gruppen unterteilt
  3. Auf Base64-Zeichen abbilden: Jede 6-Bit-Gruppe (0-63) wird auf eines von 64 ASCII-Zeichen abgebildet
  4. Auffüllung hinzufügen: Falls erforderlich, werden '='-Zeichen hinzugefügt, um die Ausgabelänge zu einem Vielfachen von 4 zu machen

Zeichenkodierungen: ASCII vs UTF-8 vs UTF-16

ASCII-Kodierung

ASCII verwendet 7 Bits, um 128 Zeichen darzustellen, einschließlich englischer Buchstaben, Ziffern und gängiger Symbole. Es ist die grundlegendste Kodierung und erzeugt die kleinste Base64-Ausgabe für englischen Text.

UTF-8-Kodierung

UTF-8 ist eine Kodierung variabler Länge, die 1-4 Bytes pro Zeichen verwendet. ASCII-Zeichen (0-127) verwenden nur 1 Byte, wodurch UTF-8 effizient für englischen Text ist und gleichzeitig alle Unicode-Zeichen unterstützt.

UTF-16 (Little Endian und Big Endian)

UTF-16 verwendet 2 oder 4 Bytes pro Zeichen. Die Byte-Reihenfolge (Endianness) bestimmt, wie Multi-Byte-Zeichen gespeichert werden.