Reed-Muller-Code

Die Reed-Muller-Codes sind eine Familie von linearen, fehlerkorrigierenden Codes, die im Bereich der Kanalcodierung zur gesicherten Datenübertragung und Datenspeicherung Verwendung finden. Diese Klasse von Codes wurden von Irving S. Reed und David E. Muller entwickelt.

Praxis

Der binäre Reed-Muller-Code wurde von der NASA in den Mariner Expeditionen (1969 bis 1976) zum Mars benutzt, um die vom Mars gemachten Fotos an die Erde zu senden. Im Speziellen wurde bei Mariner 9 ein RM-Code (1, 5) ohne Kontrollmatrix als Hadamard-Code (32, 6, 16) verwendet, das bedeutet, dass sechs Informationsbits in 32 Bit langen Wörtern kodiert waren und das Minimalgewicht der Wörter mindestens 16 betrug, was eine Fehlerkorrektur von 7 Bits ermöglichte. Mit den $2^{6}=64$ Codewörtern wurden Grauwerte eines Bildpunktes kodiert. Mehr dazu im nachfolgenden Beispiel 3 zur NASA Raumsonde Mariner 9.

Konstruktion

Im Folgenden wird beschrieben, wie man eine Erzeugermatrix eines Reed-Muller-Codes der Länge $n=2^{d}$ konstruiert

X=\mathbb {F} _{2}^{d}=\{x_{1},\ldots ,x_{2^{d}}\}

$\mathbb {F} _{n}$ ist eine Teilmenge der nichtnegativen ganzen Zahlen

\mathbb {F} _{n}=\{a\in \mathbb {N} _{0}\;|\;a<n\}

Wir definieren im n-dimensionalen Raum $\mathbb {F} _{2}^{n}$ die Indikatorvektoren :

\mathbb {I} _{A}\in \mathbb {F} _{2}^{n}

auf Untermengen $A\subset X$ durch:

\left(\mathbb {I} _{A}\right)_{i}={\begin{cases}1&{\mbox{ wenn }}x_{i}\in A\\0&{\mbox{ sonst}}\\\end{cases}}

und – ebenfalls in $\mathbb {F} _{2}^{n}$ – die binäre Operation:

w\wedge z=(w_{1}\times z_{1},\ldots ,w_{n}\times z_{n})

die als Keil-Produkt bezeichnet wird.

$\mathbb {F} _{2}^{d}$ ist ein $d$ -dimensionaler Vektorraum über $\mathbb {F} _{2}$ , deshalb ist es möglich zu schreiben:

$(\mathbb {F} _{2})^{d}=\{(y_{1},\ldots ,y_{d})\;|\;y_{i}\in \mathbb {F} _{2}\}$

Wir definieren im $n$ -dimensionalen Raum $\mathbb {F} _{2}^{n}$ die folgenden Vektoren der Länge $n$

$v_{0}=(1,1,\ldots ,1)$ und

v_{i}=\mathbb {I} _{H_{i}}

wobei $H_{i}$ Hyperebenen in $(\mathbb {F} _{2})^{d}$ (mit Dimension $d-1$ ) sind:

H_{i}=\{y\in (\mathbb {F} _{2})^{d}\mid y_{i}=0\}

Der Reed-Muller RM(d, r)-Code der Ordnung $r$ und der Länge $n=2^{d}$ ist derjenige Code, der durch $v_{0}$ und dem Keil-Produkt von bis zu $r$ der $v_{i}$ erzeugt wird (wobei nach Vereinbarung ein Keil-Produkt von weniger als einem Vektor gleich der Identität für diesen Operator ist).

Eigenschaften

Es gelten die folgenden Eigenschaften

Die Menge aller möglichen Keil-Produkte von bis zu d der $v_{i}$ bilden eine Basis von $\mathbb {F} _{2}^{n}$ .
Der RM(d, r)-Code hat den Rang: $\sum _{s=0}^{r}{d \choose s}$
Es gilt $RM(d,r)=RM(d-1,r)|RM(d-1,r-1)$ , wobei $|$ das Bar-Product zweier Codes bezeichnet
RM(d, r) hat die minimale Hamming-Distanz $2^{d-r}$ .

Beispiel 1

Sei $d=3$ . Dann $n=8$ , und

X=\mathbb {F} _{2}^{3}=\{(0,0,0),(0,0,1),\ldots ,(1,1,1)\}.

und

{\begin{matrix}v_{0}&=&(1,1,1,1,1,1,1,1)\\v_{1}&=&(1,0,1,0,1,0,1,0)\\v_{2}&=&(1,1,0,0,1,1,0,0)\\v_{3}&=&(1,1,1,1,0,0,0,0)\\\end{matrix}}

Der RM(3,1)-Code wird erzeugt durch die Menge

\{v_{0},v_{1},v_{2},v_{3}\}

oder genauer durch die Zeilen der Matrix

{\begin{pmatrix}1&1&1&1&1&1&1&1\\1&0&1&0&1&0&1&0\\1&1&0&0&1&1&0&0\\1&1&1&1&0&0&0&0\\\end{pmatrix}}

Beispiel 2

Der RM(3,2)-Code wird erzeugt durch die Menge

\{v_{0},v_{1},v_{2},v_{3},v_{1}\wedge v_{2},v_{1}\wedge v_{3},v_{2}\wedge v_{3}\}

oder genauer durch die Zeilen der Matrix

{\begin{pmatrix}1&1&1&1&1&1&1&1\\1&0&1&0&1&0&1&0\\1&1&0&0&1&1&0&0\\1&1&1&1&0&0&0&0\\1&0&0&0&1&0&0&0\\1&0&1&0&0&0&0&0\\1&1&0&0&0&0&0&0\\\end{pmatrix}}

Beispiel 3: NASA Raumsonde Mariner 9

Bei der NASA Raumsonde Mariner 9 aus dem Jahre 1971 wurde ein Reed-Muller-Code (1, 5) mit fehlender Kontrollmatrix genutzt, der einen Spezialfall allgemeiner Reed-Muller Codes darstellt. Dieser Code war schlussendlich ein Hadamard-Code mit den Parametern (32, 6, 16). Mit diesem RM-Code (32, 6, 16) wurden 32 Bit lange Codewörter übertragen, die $2^{6}=64$ Werte kodierten, wobei die Codewörter untereinander einen Hamming-Abstand von 16 aufwiesen. Diese Parameter wurden aufgrund der Kanalcharakteristik, der Bildauflösung und der Aufnahme- und Übertragungszeiten gewählt, die eine Wortlänge von reichlich 30 Bit sinnvoll machten.

Aufgrund der großen Entfernung zwischen Mars und Erde, und den damals im Vergleich zu heute unfortschrittlichen Übertragungsgeräten, lag die angenommene Bit-Fehlerwahrscheinlichkeit bei 5 %. Daraus ergibt sich aufgrund der Kodierung von einem Grauwert in 6 Bit ohne zusätzliche Fehlerkorrekturmechanismen eine Grauwert-Fehlerwahrscheinlichkeit von 26 %. Das heißt, ca. ein Viertel eines übertragenen Bildes kommt fehlerhaft beim Empfänger an. Durch den Einsatz des RM-Code (32, 6, 16) konnte bei gleicher Bit-Fehlerwahrscheinlichkeit von 5 % die Grauwert-Fehlerwahrscheinlichkeit auf 0,01 % reduziert werden.

Konstruktion

Matrix des Hadamard-Code (32, 6, 16) für den Reed-Muller-Code (1,5) der NASA Raumsonde Mariner 9 (1971/1972). Die Farbe Schwarz kodiert die Binärziffer 1, und die Farbe Weiß kodiert die Binärziffer 0.

Der verwendete RM-Code (32, 6, 16) basiert auf einer Hadamard-Matrix $H_{32}$ .

Die Konstruktion von $H_{32}$ erfolgt rekursiv aus der Hadamard-Matrix

H_{1}={\begin{pmatrix}1\end{pmatrix}}

und der Erzeugungsregel

H_{2n}={\begin{pmatrix}H_{n}&H_{n}\\H_{n}&-H_{n}\end{pmatrix}}

Diese Konstruktion nach Sylvester erzeugt die sogenannten Walsh Matrizen

H_{1}={\begin{pmatrix}1\end{pmatrix}},H_{2}={\begin{pmatrix}1&1\\1&-1\end{pmatrix}},H_{4}={\begin{pmatrix}1&1&1&1\\1&-1&1&-1\\1&1&-1&-1\\1&-1&-1&1\end{pmatrix}},\ldots

die normalisierte Hadamard-Matrizen vom Grad $2^{k}$ darstellen.

Wenn man nun die Hadamard-Matrix $H_{32}$ als Bitmuster interpretiert (bei dem eine 1 für die Binärziffer 1, und eine $-1$ für die Binärziffer 0 steht), dann erhält man 32 Codewörter mit 32 Bit Länge. Jedes dieser Codewörter weist zu jedem anderen Codewort einen Hamming-Abstand von 16 oder 32 auf. Durch Kombination der Hadamard-Matrix $H_{32}$ mit der dazu inversen Hadamard-Matrix $-H_{32}$ erhält man 64 Codewörter mit 32 Bit Länge, bei denen jedes Codewort zu jedem anderen Codewort einen Hamming-Abstand von 16 aufweist. Diese Kombination von $H_{32}$ und $-H_{32}$ definiert dabei einen Hadamard-Code, mit dem sich $2^{6}=64$ Werte kodieren lassen, indem ein Wert $n$ der $n$ -ten Zeile des Codes entspricht. Die nebenstehende Abbildung zeigt den vollständigen Hadamard-Code für RMC (32, 6, 16), wobei die Farbe Schwarz für die Binärziffer 1 und die Farbe Weiß für die Binärziffer 0 steht.

Alternative Charakterisierung

Die Klasse der Reed-Muller-Codes kann man auch mit einer Menge von Abbildungen identifizieren. Betrachte hierzu die Menge

V=\{f{\text{ Abbildung}}\mid f\colon \mathbb {F} _{2}^{m}\rightarrow \mathbb {F} _{2}\}

Eine Abbildung $f\in V$ wird durch ihre ${2^{m}}$ Bilder eindeutig bestimmt, sofern deren Reihenfolge bekannt ist. Daher kann man $f$ auch durch den zugehörigen Bildvektor $(f(0),f(1),\dots ,f(2^{m}-1))\in \mathbb {F} _{2}^{2^{m}}$ darstellen, wobei die Argumente $0,1,\dots ,2^{m}-1$ die $2$ -adische Entwicklung der Elemente aus dem Definitionsbereich $\mathbb {F} _{2}^{m}$ sind. Auf $V$ kann man eine komponentenweise Addition und Multiplikation gemäß den Rechenoperationen in $\mathbb {F} _{2}$ definieren. Genau genommen gibt es einen Ringisomorphismus zwischen der Menge der Abbildungen $V$ und der Menge der Bildvektoren $\mathbb {F} _{2}^{2^{m}}$ , weshalb man eine Abbildung auch mit seinem Bildvektor identifizieren kann: $f=(f(0),f(1),\dots ,f(2^{m}-1))$ . In $V$ liegen spezielle Abbildungen, die sogenannten Koordinatenfunktionen $Z_{i},\;i\in \{1\dots 2^{m}\}$ .

Diese sind wie folgt definiert:

Z_{i}(v):=v_{i}

für

v=(v_{1},\dots ,v_{m})\in \mathbb {F} _{2}^{m}

In der oben eingeführten Vektordarstellung lassen sich die Koordinatenfunktionen auch schreiben als

Z_{i}=(\underbrace {0,\dots ,0} _{2^{i-1}{\text{-mal}}},\underbrace {1,\dots ,1} _{2^{i-1}{\text{-mal}}},\underbrace {0,\dots ,0} _{2^{i-1}{\text{-mal}}},\dots )\in \mathbb {F} _{2}^{2^{m}}

Nun gilt:

Das System der Monome $Z_{i_{1}}\cdot \dots \cdot Z_{i_{k}}$ ( $1\leq i_{1}<\dots <i_{k}\leq m,k=0,\dots ,m$ ) ist eine Basis von $V$ .
Die Teilmenge $\{f\colon \mathbb {F} _{2}^{m}\rightarrow \mathbb {F} _{2}{\text{ Abbildung}}\mid \operatorname {grad} (f)\leq r\}\subseteq V$ entspricht dem Reed-Muller-Code RM(r, m). Hierbei ist $\operatorname {grad} (f)$ der höchste Monomgrad der Koordinatenfunktionen, als deren Summe $f$ gemäß 1. geschrieben werden kann.

Dekodierung

Die Idee ist wie folgt: Jedes Codewort des Reed-Muller-Codes RM(r,m) kann gemäß der obigen alternativen Charakterisierung als Funktion $f$ aus $V$ aufgefasst werden – mit Basisdarstellung in entgegengesetzten Koordinatenfunktionen, d. h. mit eindeutig bestimmten Koeffizienten $m_{I}{\text{ mit }}I\subseteq M$ wobei $M=\{1,\dots ,m\}$ die Menge der Koordinatenfunktionen-Indizes ist. Die Funktion $f$ wird als Bildvektor $(f(0),f(1),\dots ,f(2^{m}-1))$ durch den gestörten Kanal geschickt. Der Empfänger dekodiert das mit Fehler $e$ behaftete Codewort $g=f+e$ , indem er sukzessive die Koeffizienten $m_{I}$ rekonstruiert. Dabei beginnt er mit den Koeffizienten, die zum Monom höchsten Grades $r$ gehören. Hierzu berechnet er das Skalarprodukt von $g$ mit den s.g. charakteristischen Funktionen des Monoms. Dies sind alle Abbildungen vom Grad $m-r$ , wobei die erzeugenden Koordinatenfunktionen auch entgegengesetzt vorkommen können. Der Wert, der mehrheitlich durch die Skalarprodukte berechnet wird, ist der ursprüngliche Monomkoeffizient. Das Verfahren wird mit den Monomen vom Grad $r-1,r-2,\dots ,0$ wiederholt und man erhält hierdurch schließlich $f$ – vorausgesetzt der Fehler $e$ ist nicht zu groß.

Zusammenfassung

Codierungs- und Decodierungsprozess mittels Reed-Muller-Codes im Überblick:

Nachricht $n$ wird in Codewort $c$ übersetzt.
Codewort $c$ kann mit Abbildung $f$ identifiziert werden.
Abbildung $f$ kann auch als Bildvektor $(f(0),f(1),\dots ,f(2^{m}-1))$ dargestellt werden.
Übermittle anstelle der Monomkoeffizienten von $f$ den zugehörigen Bildvektor. Dies liefert Redundanz, die die gewünschte Fehlerkorrektur ermöglicht.
Sende den Bildvektor durch den gestörten Kanal. Es ergibt sich $g=f+e$ mit Fehlervektor $e$ .
Empfange den Bildvektor $g$ und gewinne durch Skalarmultiplikationen mit den Koordinatenfunktionen $Z_{i}$ die ursprünglichen Monomkoeffizienten.
Durch die Monomkoeffizienten berechnet man die/das ursprüngliche Abbildung/Codewort $f=c$ und damit $n$ .

Weblinks

Rekursive Codes mit der Plotkin-Konstruktion (PDF; 1,7 MB) Dissertation zur Konstruktion und Decodierung von Reed-Muller Codes und deren Untercodes (Achtung: Angabe über den RM-Code (32, 6, 16) der Mariner 9 Mission sind nicht korrekt, da nur eine Mächtigkeit des Codes von $2^{5}=32$ Werten angegeben und erläutert wird.)