Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato

Universit`a degli studi di Trieste
Dipartimento di Ingegneria e Architettura
Tesi di Laurea in
Ingegneria Informatica
Algoritmo probabilistico di tipo
Montecarlo per il List Decoding
Relatore Candidato
Prof. Francesco Fabris Daniele Nicassio
Anno Accademico 2015/2016

al caro amico Marco Dalle Feste

Indice
1 Introduzione 7
2 Codifica di canale 11
2.1 Generalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2 Codici correttori . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Decodifica di canale . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.1 Distanza di Hamming e distanza minima di un codice . . . . 13
2.3.2 Decodifica a distanza minima . . . . . . . . . . . . . . . . . 14
2.3.3 Sfera di Hamming . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.4 Raggio di copertura . . . . . . . . . . . . . . . . . . . . . . . 15
2.3.5 Codici perfetti . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Codici lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.1 Campi finiti . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.2 Struttura e codifica dei codici lineari . . . . . . . . . . . . . 17
2.4.3 Codice duale e sindrome di un ennupla . . . . . . . . . . . . 18
2.5 Codici ciclici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.5.1 Costruzione di un codice ciclico a partire dalle radici . . . . 19
2.6 Codici di Hamming . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.7 Codici BCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3 List decoding 23
3.1 Generalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Formalizzazione del problema . . . . . . . . . . . . . . . . . . . . . 24
3.3 Limitazione di Johnson . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4 Algoritmi per il list decoding . . . . . . . . . . . . . . . . . . . . . . 25
3.4.1 Algoritmo di Sudan . . . . . . . . . . . . . . . . . . . . . . . 25
3.4.2 Algoritmo Guruswami-Sudan . . . . . . . . . . . . . . . . . 28
3.4.3 Algoritmo di Wu . . . . . . . . . . . . . . . . . . . . . . . . 29
3.5 Limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
5

4 Studio dello spazio delle parole di codice 33
4.1 Distanza minima, raggio di copertura e Johnson bound . . . . . . . 33
4.2 Calcolo della percentuale di copertura . . . . . . . . . . . . . . . . . 37
4.3 Copertura dello spazio vicino alle parole di codice . . . . . . . . . . 39
5 Proposta di un algoritmo probabilistico 41
5.1 Motivazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2 Probabilità di successo . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.2.1 Descrizione del modello di decodifica . . . . . . . . . . . . . 43
5.2.2 Calcolo probabilità di successo . . . . . . . . . . . . . . . . . 44
5.2.3 Condizioni di funzionamento dell’algoritmo . . . . . . . . . . 45
5.3 Calcolo del numero di tentativi Ni . . . . . . . . . . . . . . . . . . . 45
5.4 Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.5 Condizione di arresto dell’algoritmo . . . . . . . . . . . . . . . . . . 48
6 Implementazione 49
6.1 Libreria di codifica/decodifica BCH . . . . . . . . . . . . . . . . . . 49
6.1.1 Libreria C . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
6.1.2 Libreria MATLAB . . . . . . . . . . . . . . . . . . . . . . . 50
6.1.3 Confronto tra prestazioni MATLAB e C . . . . . . . . . . . 50
6.2 Implementazione dell’algoritmo in MATLAB . . . . . . . . . . . . . 51
6.3 Programma per la validazione dell’algoritmo . . . . . . . . . . . . . 53
7 Risultati 57
7.1 Verifica probabilità di successo . . . . . . . . . . . . . . . . . . . . . 57
7.2 Simulazioni dell’algoritmo completo . . . . . . . . . . . . . . . . . . 58
8 Conclusioni 61
8.1 Obbiettivi raggiunti . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
8.2 Sviluppi futuri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
8.2.1 Confronto con lo stato dell’arte . . . . . . . . . . . . . . . . 61
8.2.2 Analisi ulteriore della probabilità di successo . . . . . . . . . 62
6

Capitolo 1
Introduzione
I codici correttori sono strumenti che servono a garantire una trasmissione robusta
e affidabile attraverso un canale rumoroso. Queste codifiche si realizzano introdu-
cendo una certa quantità di ridondanza nel messaggio originale, in modo che anche
in seguito a un limitato numero di errori di trasmissione quest’ultimo possa essere
recuperato con successo.
Sotto opportune condizioni, la tecnica di decodifica più intuitiva e più utiliz-
zata è la cosiddetta decodifica a distanza minima, che consiste nel decodificare la
ennupla ricevuta con la (o le) parole di codice più vicine secondo una certa metri-
ca. La metrica utilizzata comunemente è la distanza di Hamming la quale, date
due ennuple, rappresenta il numero di posizioni in cui i simboli delle due ennuple
differiscono.
La decodifica a distanza minima è tuttavia un problema di non facile risolu-
zione: una ricerca esauriente delle parole di codice più vicine ha una complessità
computazionale esponenziale. E’ stato infatti dimostrato che il problema della
decodifica a distanza minima è in generale NP-Hard, anche nel caso di codici
strutturati come i codici lineari; nell’articolo [1], Berlekamp, McEliece e van Til-
borg dimostrarono che il relativo problema decisionale risulta NP-completo. Tutto
ciò rese improbabile la realizzazione di un algoritmo efficiente, anche se solo per
qualche classe speciale di codici, che fosse in grado di restituire la più vicina parola
di codice fino a una certa distanza t dal messaggio ricevuto (fissato t massimo
valore di dissimilarità tollerabile). Per questo motivo il problema di trovare una
decodifica efficiente è stato uno dei punti cruciali per lo sviluppo della teoria dei
codici correttori d’errore.
Uno dei primi risultati importanti in questo campo fu ottenuto da Elwyn Ber-
lekamp [2], che nel 1968 riusc`ı a realizzare un algoritmo polinomiale per la deco-
difica dei codici lineari BCH, che erano stati da poco introdotti. James Massey
[6] generalizzò successivamente il lavoro di Berlekamp ai codici di Reed-Solomon.
7

Successivamente a questi risultati si sono susseguiti un numero sempre maggiore
di studi finalizzati alla ricerca di algoritmi efficienti per la decodifica.
Tutti gli algoritmi inizialmente sviluppati erano algoritmi per la decodifica uni-
voca, il cui scopo era individuare la parola più vicina all’ennupla ricevuta. Questa
scelta limita però la capacità correttiva del codice al massimo valore teorico di
t = dmin−1
2
errori, con dmin pari alla minima distanza tra tutte le possibili cop-
pie di parole di codice. Questo limite aveva spinto già negli anni ’50 Elias [3] e
Wozencraft [9] a sviluppare una tecnica di decodifica alternativa, detta list deco-
ding. Il list decoding consiste nell’individuazione, come risultato della decodifica,
di una lista di parole di codice possibili, invece che di una unica, come nel caso
della decodifica univoca. Anche in questo caso la selezione delle parole restituite si
basa su un criterio di distanza minima, ovvero l’algoritmo restituisce una lista di
parole “vicine” all’ennupla ricevuta. Il vantaggio principale di questa tecnica è che
permette, da un punto di vista teorico, di superare la massima capacità correttiva
dmin−1
2
, limite invalicabile nel caso di decodifica univoca.
Dopo la sua introduzione, la tecnica list decoding rimase inutilizzata nella pra-
tica per l’impossibilità di realizzare un algoritmo efficiente che attuasse questo tipo
di decodifica. Bisogna aspettare appena il 1998 perchè si presenti qualche nuovo
risultato a proposito: in quell’anno infatti Madhu Sudan del MIT [8] propone un
algoritmo polinomiale per la decodifica list decoding. Questo è il primo algoritmo
polinomiale di decodifica che permette una capacità correttiva pari a τ ≥ t. L’al-
goritmo proposto da Sudan è però limitato alla classe di codici Reed-Solomon che
abbiano un tasso inferiore ad 1
3
.
L’anno successivo Venkatesan Guruswami [4], studente PhD del MIT, realizza
assieme allo stesso Sudan una versione migliorata dell’algoritmo; essa permette
di superare il precedente limite sul tasso estendendo la procedura ai codici Reed-
Salomon di tasso arbitrario. La nuova versione dell’algoritmo permette inoltre di
creare una lista di parole di codice distanti al più τ dall’ennupla ricevuta, con un
τ maggiore rispetto a quello della versione precedente; in particolare si riesce a
portare il valore di τ alle soglie della limitazione di Johnson, limite che assicura
che la lista prodotta non assuma dimensioni esponenziali.
Questi risultati gettanorono le basi per il lavoro di Yingquan Wu [10], che
nel 2007 realizza un altro algoritmo polinomiale di list decoding per codici Reed-
Solomon e BCH binari. Questo nuovo algoritmo è in grado di raggiungere lo stesso
limite di capacità correttiva dell’algoritmo Guruswami-Sudan (GS) per i codici
Reed-Solomon, mentre per la prima volta si applica anche ai codici BCH; anche in
questo caso si raggiunge un valore di τ pari alla limitazione di Johnson. L’algoritmo
è sempre polinomiale, ma migliora la complessità computazionale che era stata
raggiunta dall’algoritmo GS, portandola a O(n6
(1 −
√
1 − D)8
), con D = dmin
n
distanza minima relativa del codice.
8

Nonostante questi importanti progressi nelle tecniche di decodifica di list de-
coding, sfortunatamente gli algoritmi proposti presentano ancora una complessità
computazionale troppo alta per consentirne un utilizzo in molte applicazioni reali.
Tutti i precedenti algoritmi sono infatti basati su tecniche di geometria algebrica
alquanto pesanti dal punto di vista algoritmico, che riconducono il problema della
decodifica a degli equivalenti problemi di tipo geometrico. Nel caso dell’algoritmo
GS il problema è riformulato come due consecutive operazioni di interpolazione e
fattorizzazione di opportuni polinomi. Nel caso dell’algoritmo di Wu il problema
viene invece trasformato in un equivalente problema di rational curve fitting. Que-
sti modelli algebrico-geometrici si rivelano dunque utili per trovare delle soluzioni
esatte al problema del list decoding, ma danno luogo a degli algoritmi molto pe-
santi dal punto di vista computazionale, anche se formalmente appartenenti alla
categorie dei problemi trattabili.
È quindi evidente la necessità di continuare lo studio e la ricerca di algoritmi
alternativi per la realizzazione di questa decodifica, in modo da cercare di trovare
una soluzione che possa finalmente portare il list decoding, dopo più di mezzo secolo
dalla sua iniziale introduzione, a un impiego più diffuso.
Dalle precedenti considerazioni si può capire che la realizzazione di un algoritmo
esatto per il list decoding è una sfida molto impegnativa, che ha radici forti nella
geometria algebrica e che richiede delle solide basi teoriche in questa disciplina.
In questa tesi proveremo allora a usare un approccio alternativo a quello della
costruzione di un algoritmo esatto, che costituisce lo stato dell’arte. L’approccio
è sicuramente molto meno ambizioso, poiché è basato sulla realizzazione di un
algoritmo probabilistico di tipo Montecarlo; dovremo quindi rinunciare all’idea di
ottenere la lista completa di tutte le parole di codice entro una certa distanza e do-
vremo accontentarci di limitare l’impiego dell’algoritmo ad alcune classi di codici
BCH; non solo: dovremo limitare anche i valori dei parametri, visto l’esplosio-
ne della complessità che deriva spingendosi oltre tali valori. In cambio potremo
disporre di soluzioni corrette con una probabilità controllabile e arbitrariamente
prossima a 1.
Di seguito riassumiamo brevemente il contenuto dei capitoli di questa tesi.
Nel capitolo 2 presenteremo le più importanti definizioni e i teoremi di base
relativi alla codifica di canale, cercando di dare delle basi teoriche per affrontare il
problema della decodifica.
Nel capitolo 3 parleremo del list decoding e analizzeremo più nel dettaglio
gli algoritmi di Sudan, di Guruswami-Sudan e di Wu, che costituiscono lo stato
dell’arte.
Nel capitolo 4 verranno presentati una serie di risultati sulla struttura dello
spazio delle ennuple e delle parole di codice, risultati funzionali all’introduzione
dei concetti che porteranno poi allo sviluppo dell’algoritmo probabilistico.
9

Nel capitolo 5 presenteremo l’idea dell’algoritmo e lo studio della probabilità di
successo, cioè della probabilità che l’algoritmo trovi le parole di codice ricercate.
Nel capitolo 6 si potrà trovare una serie di listati di codice che sono stati
utilizzati per le simulazioni dell’algoritmo e per lo studio dello spazio delle soluzioni,
mentre riserveremo al capitolo 7 la discussione dei risultati ottenuti e al capitolo
8 le conclusioni.
10

Capitolo 2
Codifica di canale
2.1 Generalità
La codifica di canale è quel processo che ha come scopo l’aumento della probabilità
di trasmettere con successo bit di informazione attraverso un canale disturbato.
Essa si realizza tramite l’aggiunta di ridondanza che permette, con il processo di
decodifica, di rilevare o correggere un certo numero di errori che si possono essere
verificati durante la trasmissione delle parole di codice.
Il processo di codifica di canale è fondamentale nel campo delle telecomunica-
zioni, dove è richiesto che grandi quantità d’informazione vengano trasmesse senza
errori attraverso un canale, quale ad esempio un doppino telefonico, una fibra ot-
tica, l’etere nel caso di comunicazioni wireless, ecc. Ogni canale reale viene però
accompagnato da una certa probabilità di errore, che può essere dovuta a rumore,
interferenze, perdite di pacchetti... Si rende dunque necessaria l’introduzione di
una codifica che permetta di correggere eventuali errori verificati durante la tra-
smissione, in modo da aumentare l’affidabilità della comunicazione.
Lo studio di questa problematica trova le sue radici nel lavoro di Claude Elwood
Shannon [7], che nel 1948 è il primo ad affrontare in modo rigoroso e matematico
la teoria delle telecomunicazioni. Nella sua trattazione propone per la prima volta
la nozione di codifica di canale, studiata negli anni successivi prima da Marcel
Golay e poi da Richard Hamming [5], che inventeranno nei due anni successivi i
primissimi codici a correzione d’errore. Dagli anni ’50 l’argomento guadagna un
interesse sempre maggiore che porterà, nei decenni successivi, allo studio e alla
realizzazione di un gran numero di codici a correzione d’errore basati su strutture
algebriche e geometriche sempre più complesse. Al giorno d’oggi i codici corretto-
ri sono largamente usati nel campo delle telecomunicazioni (modem, wifi, sistemi
11

satellitari, ecc.) ma anche in altri campi come ad esempio la memorizzazione di
informazione (CD, DVD, dispositivi di archiviazione magnetici, ecc).
2.2 Codici correttori
Shannon propone, nella sua teoria, il seguente modello: la sorgente d’informazione
trasmette un messaggio di informazione, codificato con un alfabeto Σ. Poiché
la probabilità di errore su un canale reale è maggiore di 0, c’è la possibilità che
il messaggio emesso dalla sorgente non coincida con quello ricevuto. Shannon
propone quindi un’aggiunta sistematica di ridondanza al messaggio originale: essa
consiste nel mappare il messaggio, formato da k elementi di Σ, con una n-upla più
lunga di elementi di Σ, definendo cos`ı la funzione di codifica:
C : Σk
−→ Σn
con n > k.
In questa tesi considereremo principalmente il caso binario, ovvero quello in cui
Σ = {0, 1}, che porta quindi alla funzione di codifica seguente:
C : {0, 1}k
−→ {0, 1}n
I k bit del messaggio originale sono detti bit d’informazione, mentre gli n bit
risultanti formano la parola di codice. L’insieme di tutte le parole di codice forma
invece il dizionario D del codice.
Definizione 2.1. Un codice correttore (o codice blocco) binario, di parametri n e
k, è la terna C = ({0, 1}k
, C, D). I parametri n e k vengono detti rispettivamente
lunghezza e dimensione (o rango) del codice.
Definizione 2.2. Dato un codice correttore C di parametri n e k, si definisce
tasso del codice il rapporto RC = k
n
; esso indica la frazione di bit di informazione
trasmessa per ogni parola di codice. Più alto è il tasso, minore è la ridondanza in-
trodotta e conseguentemente minore sarà la capacità correttiva del codice. D’altro
canto, a parità di bit d’informazione k, più basso è il tasso e minore è la quantità
d’informazione trasmessa a parità di n.
2.3 Decodifica di canale
Le parole di codice formano un sottoinsieme dello spazio {0, 1}n
. Se consideriamo
però che ogni bit ha una certa probabilità di essere modificato da un errore di
12

trasmissione, l’insieme delle ennuple che possono essere ricevute è l’intero insieme
{0, 1}n
. Si rende quindi necessaria una funzione che prenda l’ennupla ricevuta
y e produca una stima ˆc della parola di codice originalmente trasmessa. Questa
funzione, detta funzione di decodifica, è definita come segue:
D : Σn
−→ D
Essa associa una qualsiasi ennupla ricevuta y alla propria stima ˆc ∈ D, sulla base
della decodifica effettuata dal decodificatore di canale. Tramite questa funzione
lo spazio Σn
viene partizionato nelle cosiddette regioni di decodifica, definite come
l’insieme delle ennuple che vengono decodificate con la stessa parola di codice:
Ri = {y ∈ Σn
|D(y) = ci} i = 1..M
con M = |C| numero di parole di codice.
2.3.1 Distanza di Hamming e distanza minima di un codice
Diamo ora tre importanti definizioni che ci aiutano a caratterizzare lo spazio delle
parole di codice di un determinato codice.
Definizione 2.3. Siano u = (u0, u1, ..., un−1), v = (v0, v1, ..., vn−1) ∈ Σn
; si defini-
sce distanza di Hamming dH(u, v) il numero di elementi tali che ui = vi
dH(u, v) = |{i | ui = vi}|
Si verifica con facilità che la distanza di Hamming cos`ı definita risulta essere
una metrica nello spazio Σn
.
Definizione 2.4. Sia u = (u0, u1, ..., un−1) ∈ Σn
; si definisce peso di Hamming
wt(u) il numero di elementi di u diversi da 0:
wt(u) = dH(u, 0)
dove 0 è il vettore nullo.
Definizione 2.5. Sia C un codice correttore di dimensione n. Si definisce distanza
minima di C la distanza di Hamming tra le due parole di codice più vicine:
dmin(C) = min
i=j
dH(wi, wj)
con wi, wj parole del codice C, con i, j ∈ {1..M}
La distanza minima è un parametro molto importante di un codice, poiché
è direttamente collegata al massimo numero di errori che il codice è in grado di
correggere correttamente utilizzando la decodifica a distanza minima.
13

2.3.2 Decodifica a distanza minima
Esistono diversi metodi per attuare la decodifica dell’ennupla ricevuta, ognuno dei
quali definisce una specifica funzione di decodifica D. Il criterio più utilizzato è la
cosiddetta decodifica a distanza minima, che consiste nell’associare alla n-upla y
ricevuta la parola di codice stimata ˆc che è più vicina ad y secondo la distanza di
Hamming.
Utilizzando una funzione di decodifica di questo tipo, si può facilmente calco-
lare il massimo numero di errori che il codice riesce a decodificare correttamente.
Una decodifica corretta si realizza quando la stima ˆc = D(y) corrisponde a c, la
parola di codice trasmessa originalmente.
Supponiamo ora di avere un codice C e la relativa funzione di decodifica a di-
stanza minima D. Sia c l’ennupla trasmessa e y quella ricevuta; D(y) corrisponde
alla parola di codice w ∈ D più vicina secondo la distanza di Hamming. Definiamo
inoltre l’ennupla di errore e, ovvero la ennupla tale che y = c+e, Ora, ricordando
che dmin è la distanza di Hamming tra le due parole di codice più vicine, possiamo
enunciare il seguente
Teorema 2.3.1. Sia c la parola di codice trasmessa, appartenente al dizionario del
codice C. Sia y = c+e l’ennupla ricevuta, con e ennupla di errore dovuta al rumore
durante la trasmissione. Ogni ennupla y = c+e tale che wt(e) ≤ dmin(C)−1
2
sarà
decodificata correttamente, ovvero D(y) = ˆc = c. Questo equivale a dire che il
codice C è in grado di correggere con certezza t = dmin(C)−1
2
errori di trasmissione
(per ogni parola trasmessa).
Criterio a massima verosimiglianza
Il criterio di decodifica a massima verosimiglianza è il criterio di decodifica che
associa all’ennupla ricevuta y la parola di codice ˆw che ha più alta probabilità di
essere stata trasmessa. La relativa funzione di decodifica sarà quindi definita come
segue
Dmv : y −→ ˆw
con ˆw tale che
p(T ˆw/Ry) = max
w∈D
p(Tw/Ry)
con Tw evento che rappresenta la trasmissione di w e Ry evento che rappresenta
la ricezione di y.
Si può dimostrare che il criterio di decodifica a distanza minima corrisponde
al criterio di massima verosimiglianza sotto opportune ipotesi di stazionarietà e
14

assenza di memoria del canale di trasmissione.
Si può facilmente verificare che per correggere un numero di errori pari a t
con il criterio a distanza minima è necessario avere una dmin ≥ 2t + 1. Per poter
effettuare la decodifica correttamente è infatti necessario che l’ennupla ricevuta y
sia più vicina all’originale c che a qualunque altra ennupla. Costruendo un codice
con dmin = 2t+1, è immediato verificare che, se si sono verificati t errori, abbiamo
dH(y, c) = t
e poichè dmin è la distanza minima, per definizione
min
w∈D{c}
dH(c, w) ≥ dmin
Cambiando t bit di c, secondo la distanza di Hamming ci allontaniamo di t unità
da c:
min
w∈D{c}
dH(y, w) ≥ dmin − t = 2t + 1 − t = t + 1
quindi
dH(y, c) = t < t + 1 ≤ min
w∈D{c}
dH(y, w)
che equivale a dire che c è la parola a distanza minima.
2.3.3 Sfera di Hamming
Definizione 2.6. Dato lo spazio qn
delle ennuple su un alfabeto q-ario, si definisce
sfera di Hamming centrata in y e di raggio d l’insieme delle ennuple di qn
che
distano al massimo d da y secondo la distanza di Hamming:
Sy,d = {w | dH(w, y) ≤ d}
2.3.4 Raggio di copertura
Definizione 2.7. Si definisce raggio di copertura di un codice C la minima distanza
R tale che ogni ennupla dello spazio Σn
disti al massimo R dalla parola di codice
più vicina. In altre parole esso costituisce il minimo raggio delle sfere di Hamming
centrate nelle parole di codice tale che l’unione delle sfere corrisponda all’intero
spazio Σn
:
R = min{r | ∀y ∈ Σn
, min
w∈D
dH(w, y) ≤ r}
15

2.3.5 Codici perfetti
Prendiamo in considerazione le regioni di decodifica. Per un codice con capacità
correttiva t, sappiamo che una generica regione di decodifica è formata da tutte
le ennuple che distano al più t dalla parola di codice presa in considerazione. Il
volume delle regioni di decodifica per una capacità correttiva t, che corrisponde
al volume della sfera di Hamming centrata su una qualunque parola di codice, è
quindi pari a
Vd =
t
i=0
n
i
nel caso binario.
Definizione 2.8. Sia C un codice binario di lunghezza n, con un numero di bit
di informazione k e capacità correttiva t. Si dice che C è un codice perfetto se
l’unione delle regioni di decodifica è pari all’intero spazio delle ennuple 2n
. Un
codice di questo tipo garantisce che per ogni y ricevuta la decodifica porti sempre
all’individuazione di una parola di codice con una distanza ≤ t. Formalmente, se
Vd è il volume delle regioni di decodifica del codice, un codice si dice perfetto se
2k
Vd = 2k
t
i=0
n
i
= 2n
⇐⇒
t
i=0
n
i
= 2n−k
Purtroppo, i codici perfetti sono molto rari. Gli unici esempi non banali di
codici perfetti sono i codici a ripetizione, quelli di Hamming e i codici isolati di
Golay.
2.4 Codici lineari
In linea teorica si potrebbe costruire un codice senza preoccuparsi della sua strut-
tura, elencando semplicemente le parole di codice che lo compongono. Tuttavia, se
il dizionario del codice avesse una dimensione molto grande, come di fatto succede
quasi sempre, il numero di parole di codice da analizzare sarebbe molto elevato e
renderebbe il processo di codifica e decodifica altamente inefficiente. Per questo
motivo sono state studiate varie strutture che permettano di costruire un codice in
modo sistematico, garantendo una codifica e una decodifica computazionalmente
più efficiente: una delle più importanti famiglie di codici cos`ı generata sono i codici
lineari.
I codici lineari sono una famiglia di codici costruiti sulla teoria algebrica dei
campi finiti di Galois, di cui diamo qualche rapida definizione prima di parlare più
nel dettaglio delle loro proprietà.
16

2.4.1 Campi finiti
Definizione 2.9. Un campo F è un insieme dotato di due operazioni interne,
addizione (+) e moltiplicazione (·), che soddisfano le seguenti
1. (F, +) è un gruppo abeliano
2. (F {0}, ·) è un gruppo abeliano
3. + e · soddisfano la legge distributiva
Definizione 2.10. Dato q ∈ N, se esiste un campo con q elementi, esso è detto
campo finito di Galois e viene indicato con GF(q) o Fq.
2.4.2 Struttura e codifica dei codici lineari
Dato p primo, m ∈ N+
e fissato quindi q = pm
, indichiamo con Fq un campo
di Galois di q elementi. Consideriamo ora l’insieme Fn
q formato dalle ennuple di
elementi di Fq, che risulta essere uno spazio vettoriale sul campo Fq.
Definizione 2.11. Un codice lineare C di lunghezza n e rango k è un sottospazio
vettoriale di Fn
q di dimensione k.
Un codice lineare C individua un dizionario di parole di codice D, che è l’insieme
delle qk
n-uple costruite su Fq. Poiché D ⊂ Fn
q è uno spazio vettoriale, la somma di
due parole di codice è ancora una parola di codice, cos`ı come il vettore nullo. Da
queste considerazioni possiamo dedurre un’interessante proprietà che caratterizza
la distanza minima di un codice lineare:
dmin = min
i=j
dH(wi, wj) = min
i=j
wt(wi − wj) = min
w∈C
wt(w)
poiché wi − wj = w è ancora una parola di codice.
Per i codici lineari la codifica si riduce ad una mappa tra spazi vettoriali, in
particolare dallo spazio dei messaggi GF(qk
) al sottospazio vettoriale rappresen-
tato dall’insieme delle parole del codice C. Di conseguenza la funzione può essere
definita da una matrice G denominata matrice generatrice di C:
C : GF(qk
) −→ D
la funzione C mappa quindi messaggi a in parole di codice w ottenute tramite la
moltiplicazione tra a e G:
C(a) = w = aG
Le righe della matrice G rappresentano quindi una base per il sottospazio vettoriale
D.
17

2.4.3 Codice duale e sindrome di un ennupla
Dato un codice C, definito come sottospazio vettoriale di GF(qn
), possiamo consi-
derare il suo complemento ortogonale, che rappresenta un sottospazio di dimensione
n − k di GF(qn
). Il codice C⊥
corrispondente a questo sottospazio viene detto co-
dice duale di C. Consideriamo ora la matrice generatrice di C⊥
, che denotiamo con
H. Si ha che ogni n-upla w è parola di codice di C se e solo se è ortogonale ad
ogni riga di H:
w ∈ C ⇐⇒ HwT
= 0
La matrice H è detta matrice di controllo per il codice C, da cui si procede a
definire la seguente
Definizione 2.12. Data un n-upla y ∈ GF(q)n
, viene detta sindrome di y il
vettore
s = HyT
In base a quanto detto della matrice H, sappiamo che se s = 0 allora y è una
parola di codice, altrimenti notiamo che, se prendiamo w ∈ C parola di codice:
y = w + e ⇐⇒ s = HyT
= H(wT
+ eT
) = HwT
+ HeT
= HeT
Quindi la sindrome di una generica ennupla r corrisponde alla sindrome del vettore
di errore e che rappresenta la differenza tra y e una parola di codice.
Si può mostrare inoltre che la sindrome può essere espressa anche come segue:
s =
ν
j=1
eij
hij
con i = i1, ..., iν posizioni in cui si è verificato un errore. Nel caso binario l’espres-
sione si riduce a
s =
ν
j=1
hij
La sindrome della ennupla ricevuta rappresenta, proprio grazie a questa proprietà,
il punto di partenza per realizzare metodi di decodifica nei codici lineari.
2.5 Codici ciclici
I codici ciclici sono un sottoinsieme dei codici lineari. Sono costruiti imponendo
un’ulteriore proprietà ai codici lineari e sono inoltre molto legati alla struttura dei
campi di Galois, permettendo cos`ı tecniche di codifica e decodifica ancor più facili.
I codici ciclici vengono cos`ı definiti:
18

Definizione 2.13. Un codice lineare C è un codice ciclico se ogni permutazione
ciclica di una sua qualunque parola di codice è ancora una parola di codice.
(w0, w1, ..., wn−1) ∈ C =⇒ (wn−1, w0, ..., wn−2) ∈ C
Definiamo ora un’equivalenza tra l’insieme Fn
q , già visto per i codici lineari, e
Fq[x]/(xn
− 1), ovvero l’anello delle classi residue di Fq[x] modulo (xn
− 1). In
questo modo una generica ennupla rappresentata da (w0, w1, ..., wn−1) ∈ Fn
q verrà
ora rappresentata dal polinomio w(x) = w0 +w1x+...+wn−1xn−1
∈ Fq[x]/(xn
−1).
Denotiamo l’anello Fq[x]/(xn
− 1) con Rn. Usando questa notazione, una permu-
tazione ciclica di w corrisponde ad una moltiplicazione per x nell’anello Rn.
La matrice generatrice di un codice ciclico è direttamente identificata dal cosid-
detto polinomio generatore, l’unico polinomio monico di grado minimo f, denotato
g(x) ∈ Rn. Il polinomio generatore è tale che ogni parola di codice è individuata
tramite la moltiplicazione del polinomio a(x) che rappresenta il messaggio e g(x).
w(x) = a(x)g(x)
La matrice generatrice G è invece composta come segue:
G =





g(x)
xg(x)
...
xk−1
g(x)





=





g0 g1 . . . gn−k
g0 g1 . . . gn−k
... ...
g0 g1 . . . gn−k





2.5.1 Costruzione di un codice ciclico a partire dalle radici
Dato un campo finito GF(pm
), i suoi elementi rappresentano tutte e sole le radici
del polinomio xpm
− 1. In particolare se poniamo n = pm
− 1, il polinomio xn
− 1
si fattorizza come
xn
− 1 =
n−1
i=0
(x − αi
)
con α elemento primitivo, generatore del campo. Ogni divisore di xn
− 1 avrà
quindi come radici un sottoinsieme delle αi
, e possiamo usare questa proprietà
per progettare il codice: si può imporre che una serie di elementi β1, ..., βt siano
radici del polinomio generatore g(x), e di conseguenza di ogni parola di codice, che
ricordiamo sono date da w(x) = g(x)a(x). Cos`ı facendo si definisce la matrice di
19

controllo H del codice, costruita come segue:
H =





1 β1 β2
1 . . . βn−1
1
1 β2 β2
2 . . . βn−1
2
...
...
1 βt β2
t . . . βn−1
t





Si enuncia ora un’importante teorema riguardante i codici costruiti in questo modo:
Teorema 2.5.1. Sia C un codice ciclico costruito assegnando d − 1 potenze con-
secutive di una radice ennesima dell’unità α
αb
, αb+1
, . . . , αb+d−2
per un certo b ≥ 0, e abbiamo quindi che
g(αb
) = g(αb+1
) = . . . = g(αb+d−2
) = 0
Allora la distanza minima del codice è maggiore o uguale alla distanza di progetto
d.
Ricapitolando, per costruire un codice con distanza minima pari almeno a d
distanza di progetto, si eseguono i seguenti punti:
(i) Si sceglie β, una radice n-esima dell’unità, con β ∈ GF(pm
)
(ii) Si impone che il polinomio generatore g(x) sia costituito dai polinomi minimi
di β, β2
, . . . , βd−1
.
2.6 Codici di Hamming
I codici di Hamming sono un’importante famiglia di codici lineari, proposti da
Richard Hamming nel 1950 e capaci di correggere un singolo errore. Poiché sono
codici 1-correttori è necessario che la distanza minima del codice sia pari a 3. Si
può mostrare che per un codice q-ario, se la matrice H ha m righe, il numero di
vettori colonna necessari a garantire che non ci siano coppie di colonne linearmente
dipendenti è al massimo qm−1
q−1
. Pertanto è possibile realizzare un codice di Ham-
ming q-ario con dimensioni n = qm−1
q−1
e k = qm−1
q−1
− m. Nel caso binario questi
valori si riducono quindi a n = 2m
− 1 e k = 2m
− m − 1.
20

2.7 Codici BCH
I codici BCH sono una famiglia di codici nati come generalizzazione dei codici di
Hamming, e sono in grado di correggere fino a t errori, a seconda della distan-
za di progetto d = 2t + 1. Furono studiati e proposti indipendentemente da A.
Hocquenghem nel 1959 e da R. C. Bose e D. K. Ray-Chaudhuri nel 1960.
Definizione 2.14. I codici BCH sono codici ciclici binari t-correttori, con lun-
ghezza n e d = 2t + 1 distanza di progetto. Sono costruiti assegnando d − 1 = 2t
radici consecutive
αb
αb+1
. . . αb+d−2
con b ≥ 0 e α radice n-esima dell’unità.
Se b = 1 si parlerà di codice BCH in senso stretto. Se consideriamo i codici
BCH binari, in senso stretto e primitivi, abbiamo n = 2m
−1, e possiamo costruire
la matrice di controllo H nel seguente modo:
H =





1 α α2
. . . αn−1
1 α2
α4
. . . α2(n−1)
...
...
1 αd−1
α2(d−1)
. . . α(d−1)(n−1)





21

Capitolo 3
List decoding
3.1 Generalità
Negli anni cinquanta Elias e Wozencraft proposero un’alternativa al metodo classi-
co di decodifica univoca, presentando la tecnica di list decoding. Con questa tecnica
si cerca di risolvere i principali problemi individuati nelle decodifica classiche, pri-
mo fra tutti l’impossibilità di correggere un numero di errori maggiore di t. Come
visto nel precedente capitolo, un codice con distanza minima dmin può garantire
la decodifica corretta di un numero di errori al massimo pari a t = dmin−1
2
.
Un altro problema della decodifica classica è che per la grande maggioranza dei
codici non è garantito che l’unione delle regioni di decodifica sia uguale all’intero
spazio delle ennuple possibili. In questo caso esistono delle ennuple esterne alle
regioni di decodifica e per esse non sarà possibile produrre una decodifica che porti
a una stima del messaggio inviato. Con la decodifica classica, quindi, ogni parola
che subisca un numero di errori di trasmissione maggiore di t viene decodificata in
modo errato o porta ad un fallimento della decodifica.
Il list decoding punta a risolvere questo problema introducendo la possibilità di
restituire, come risultato della decodifica, una lista di parole di codice possibili al
posto dell’unica stima disponibile nel caso della decodifica univoca. In questo mo-
do le regioni di decodifica possono sovrapporsi, ed eventualmente estendersi, fino
ad avere raggio pari al raggio di copertura, garantendo cos`ı che qualsiasi ennupla
ricevuta possa essere decodificata.
Ottenuta la lista di possibili parole di codice, verrà successivamente attuata la
scelta della singola parola impiegata come stima della parola trasmessa. In genere
viene scelta la parola della lista più vicina alla ennupla ricevuta, utilizzando quindi
di nuovo il criterio a distanza minima; ma questa non è l’unica opzione. È impor-
23

tante quindi che le dimensioni della lista siano limitate al fine di rendere possibile
un’analisi computazionalmente vantaggiosa da parte dell’algoritmo di decodifica.
Dal punto di vista pratico bisogna stare attenti a non far esplodere combinato-
riamente la dimensione della lista, che deve essere sempre di tipo polinomiale, e
possibilmente lineare.
3.2 Formalizzazione del problema
Diamo ora una definizione più formale del problema del list decoding: dato un
codice C e una ennupla ricevuta y, il list decoding si realizza individuando tutte
le parole di codice distanti al massimo e da y, con e > t, poichè il caso in cui
e = t rappresenta la decodifica univoca. Si definisce quindi una nuova funzione di
decodifica, che restituirà più di una parola di codice come risultato:
Dlist : Σn
−→ Dvi
con vi dimensione della lista di parole restituita dall’algoritmo, che può variare a
seconda della ennupla presa in considerazione. Per garantire la possibilità di effet-
tuare un’analisi computazionalmente efficiente della lista per tutti i casi possibili,
è necessario che il massimo valore di vi sia limitato. Torna utile a questo proposito
introdurre la limitazione di Johnson.
3.3 Limitazione di Johnson
Fissata una qualsiasi parola di codice di partenza w, la limitazione di Johnson
identifica un limite al numero di parole di codice che possono trovarsi a distanza e
da w. In particolare, essa individua un limite che se non superato garantisce che
il numero di parole di codice presenti a questa distanza cresca al più linearmente
con n.
Indichiamo con la notazione Jq(n, d, e) il massimo numero di parole che si pos-
sono trovare all’interno di una sfera di Hamming di raggio e. Si ha ovviamente
che
Jq(n, d,
d − 1
2
) = 1
Definizione 3.1. Sia δ = d
n
la distanza minima relativa del codice e q la cardinalità
dell’alfabeto Σ. si definisce la quantità
Jq(δ) = 1 −
1
q
1 − 1 −
q
q − 1
δ
e chiamiamo eJ (n, d, q) = Jq(δ)n il raggio di Johnson.
24

Teorema 3.3.1. Se e < eJ (n, d, q) allora vale la limitazione di Johnson
Jq(n, d, e) ≤ qnd
Questo risultato è molto utile se si vuole creare un algoritmo che voglia analiz-
zare le parole di codice che si trovano a distanza e > t, poiché garantisce che sotto
l’ipotesi e < eJ (n, d, q), la lista di parole che si trovano a distanza e è limitata da
una funzione lineare. In questo modo si possono realizzare algoritmi efficienti di
list decoding, che possano restituire una stima della parola trasmessa anche se il
numero di errori verificati è superiore a quelli normalmente correggibili dal codice
mediante decodifica univoca.
3.4 Algoritmi per il list decoding
Nonostante l’idea del list decoding fosse stata concepita già negli anni ’50, per
diversi anni non si fu in grado di realizzare un algoritmo di decodifica efficiente.
L’algoritmo naive, che consiste nella ricerca sequenziale delle soluzioni nello spa-
zio delle ennuple, presenta infatti una complessità esponenziale che pregiudica il
suo utilizzo in casi pratici. Inoltre, un importante articolo del 1978 di Berlekamp,
McEliece e van Tilborg [1] dimostra come il problema generale della decodifica
di codici lineari sia NP-completo, introducendo ulteriori perplessità sulla effettiva
possibilità di realizzare algoritmi efficienti aldilà dei già noti algoritmi per delle
particolari istanze di codici lineari. Bisogna attendere fino al 1997, quando Madhu
Sudan del MIT realizza il primo algoritmo polinomiale di list decoding per una
classe di codici limitata, i codici Reed-Solomon con tasso minore di 1
3
. Successiva-
mente prima Guruswami e poi Wu daranno importanti contributi che estendono
i codici per i quali è possibile realizzare un algoritmo di complessità polinomiale,
migliorando anche la capacità di correzione. Nelle prossime sezioni vedremo un
po’ più nel dettaglio il funzionamento di questi algoritmi. Essi vengono descritti
in questa tesi per completezza, ma per comprenderne a fondo il funzionamento
sono necessari strumenti di algebra e geometria che non sono stati introdotti in
questo documento e nei corsi della nostra laurea magistrale. Non ci si aspetta
quindi dal lettore una piena comprensione del loro funzionamento; la descrizione
degli algoritmi è volta solo a far intuire la loro complessità e a mostrarne la natura
fortemente algebrico-geometrica.
3.4.1 Algoritmo di Sudan
Sudan propone un algoritmo per il list decoding per i codici Reed-Solomon che
riduce il problema dell’individuazione delle parole della lista ad un’operazione di
interpolazione e una di fattorizzazione di opportuni polinomi in due variabili [8].
25

Il problema è formalizzato nel seguente modo:
Sia assegnato un campo F e dati n punti {(xi, yi)}n
i=1, xi, yi ∈ F, e due parame-
tri k e t interi; poniamoci il problema di trovare tutti i polinomi p(x) in una varia-
bile e di massimo grado k tali che p(xi) = yi per almeno n−t valori di i ∈ {1, .., n}.
Per comprendere l’algoritmo in modo più intuitivo, si può immaginare la se-
guente analogia geometrica: si immagini di avere un insieme di punti e di dover
trovare tutte le rette passanti almeno per 5 punti:
Si può notare che esistono solo due linee f1(x) = x e f2(x) = −x che soddisfano
le proprietà richieste. Inoltre, se Q(x, y) è una curva di grado 4 che attraversa tutti
i punti, allora tale curva deve necessariamente contenere le rette f1 e f2. Questo
perché Q(x, fj(x)) risulta un polinomio di quarto grado avente più di quattro
radici, essendo Q(xi, fj(xi)) = 0 per un numero ≥ 5 di punti. In altri termini
Q(x, fj(x)) ≡ 0, e quindi y − fj(x)|Q(x, y).
Una possibile espressione per la curva interpolante è data da Q(x, y) = (x−y)(x+
y)(x2
+ y2
− 1), in cui le linee di interesse f1(x) e f2(x) compaiono come fattori,
oltre al restante polinomio di grado superiore x2
+ y2
− 1 indicato in blu.
26

Descriviamo ora l’algoritmo di list decoding di Sudan [8].
Algoritmo di Sudan
Input: n, k, D ∈ N, y = (y1, . . . , yn) ∈ Fn
q parola ricevuta, t parametro d’errore
Passo 1 : Interpolazione. Viene costruito su Fq un polinomio non nullo in due
variabili
Q(x, y) =
i,j
ai,jxi
yj
con le seguenti proprietà:
(i) Q(αi, yi) = 0 per ogni i = 1, . . . , n
(ii) Q(x, y) ha il minimo grado pesato, dove il peso vale w = (1, k) (tale
scelta sarà giustificata nel passo successivo).
In altri termini, deg(1,k)Q(x, y) ≤ D, per D opportuno.
Passo 2 : Fattorizzazione. Il polinomio Q(x, y) viene fattorizzato in fattori ir-
riducibili, e vengono selezionati tutti i fattori della forma (y − p(x)).
Output: p(x) ∈ Fq[x] tali che
(i) (y − p(x)) è un fattore di Q(x, y)
(ii) deg(p(x)) ≤ k
(iii) |{i : p(αi) = yi}| ≤ t
Osservazione 1. Il secondo punto individua tutti i polinomi p(x) di grado ≤ k tali
che Q(x, p(x)) ≡ 0. Ciò giustifica la scelta del peso k rispetto alla variabile y.
Osservazione 2. Definiamo
L = {p(x) ∈ Fq[x] : (y − p(x)) | Q(x, y)}
Si osservi che i polinomi (parole di codice) p(x) ∈ L possono essere di due tipi:
1. parole di codice con distanza di Hamming ≤ t da y, ovvero possibili candidati
ad essere l’effettiva parola di codice trasmessa
2. parole di codice con distanza > t da y
Dal passo 2 verranno quindi selezionati i polinomi p(x) ∈ L tali che |{i : p(αi) =
yi}| ≤ t. Si osservi che tale operazione può essere realizzata in maniera efficiente
facendo un semplice controllo sequenziale su tutti gli elementi di L, a patto che
la lista abbia dimensioni polinomiali. Una prima limitazione superiore per la lun-
ghezza della lista è data dal numero di fattori del tipo (y − p(x)) di Q(x, y). Il
numero di tali fattori sarà ≤ degyQ(x, y) ≤ D
k
.
27

L’algoritmo di Sudan tuttavia presenta un importante limite: esso è infatti
valido solamente per codici Reed-Solomon con tasso inferiore ad 1
3
.
3.4.2 Algoritmo Guruswami-Sudan
Due anni dopo il lavoro di Sudan, Venkatesan Guruswami, studente PhD di Sudan
al MIT, introduce il concetto di molteplicità di interpolazione, che permette un
miglioramento del precedente algoritmo: grazie al lavoro dei due l’algoritmo di
Sudan viene esteso a codici Reed-Solomon RS(n, k + 1, n − k) di tasso arbitrario
e con capacità correttiva pari al limite individuato dalla limitazione di Johnson.
L’algoritmo realizzato viene denominato algoritmo di Guruswami-Sudan [4].
Anche in questo caso un’analogia geometrica può aiutare a comprendere la
formulazione del problema. Consideriamo la configurazione di 10 punti mostrata
in figura 3.1, per la quale si vogliono determinare tutte le linee che attraversano
un numero di punti n − t = e >
√
kn.
Fig. 3.1: Configurazione formata da 10 punti
In questo caso n = 10, k = 1 e e ≥ 4. Fissato e = 4, esistono esattamente 5
linee che passano per almeno 4 punti.
28

Se vogliamo che queste 5 linee siano fattori di una curva Q(x, y), tale curva
dovrà avere grado D ≥ 5. Ma t = 4 è strettamente minore di D, per cui per
qualche linea y = f(x) si deve avere Q(x, f(x)) = 0, ovvero y − f(x) non compare
come fattore in Q(x, y).
Si noti, infine, che ogni punto è attraversato da due linee. Ciò significa che una
curva Q(x, y) che contiene tali linee come fattori dovrà attraversare ciascun punto
con molteplicità doppia.
Algoritmo di Guruswami-Sudan
Input: n, k, D ∈ N, y = (y1, . . . , yn) ∈ Fn
q parola ricevuta, m ∈ N molteplicità
di interpolazione, t capacità correttiva.
Step 1 : Interpolazione. Viene costruito su Fq un polinomio non nullo in due
variabili
Q(x, y) =
i,j
ai,jxi
yj
con le seguenti proprietà:
(i) ord(Q : αi, yi) = m per ogni i = 1, . . . , n
(ii) deg(1,k)Q(x, y) ≤ D
Step 2 : Fattorizzazione. Il polinomio Q(x, y) viene fattorizzato in fattori irri-
ducibili, e vengono selezionati tutti i fattori della forma (y − p(x)).
Output: p(x) ∈ Fq[x] tali che
(i) (y − p(x)) è un fattore di Q(x, y)
(ii) deg(p(x)) ≤ k
(iii) |{i : p(αi) = yi}| ≤ t
3.4.3 Algoritmo di Wu
Nel 2008, Wu [10] riformula il problema del list decoding per codici Reed-Solomon:
utilizzando polinomi costruiti mediante l’algoritmo di Berlekamp-Massey (BM)
[2, 6], riconduce il problema del list decoding ad un problema di rational curve
fitting. Formalmente il problema è cos`ı ridefinito: se Λ(x) e B(x) sono i polinomi
locatore e correttore di errore generati da BM, il list decoding determinerà le cop-
pie di polinomi λ(x) e b(x) tali che Λ∗
(x) = λ(x)Λ(x) + b(x)xB(x) rappresenta un
valido candidato ad essere l’effettivo polinomio locatore. Quest’ultimo indicherà
le posizioni da correggere nella ennupla ricevuta, individuando cos`ı la lista delle
parole di codice generate dalla proceduta di list decoding.
29

Algoritmo di Wu di list decoding per codici binari BCH
• Passo 0. Ricevuta una parola r(x) viene calcolata la relativa sindrome s(x).
• Passo 1: algoritmo di Berlekamp.
Input: s(x) sindrome
Output: Λ(x) e B(x)
Questi polinomi permettono di ricostruire l’effettivo polinomio locatore
di errori Λ∗
(x) mediante la relazione
Λ∗
(x) = Λ(x)λ∗
(x2
) + x2
B(x)b∗
(x2
) (3.1)
per certi polinomi λ∗
(x) e b∗
(x).
Obiettivo: determinare λ∗
(x) e b∗
(x)
Osservazione. La (3.1) si può riscrivere come
Λ∗
(x)
x2B(x)
=
Λ(x)
x2B(x)
λ∗
(x2
) + b∗
(x2
)
Se α−i
è una delle t radici di Λ∗
(x), allora
0 =
Λ(α−i
)
α−2iB(α−i)
λ∗
(α−2i
) + b∗
(α−2i
) (3.2)
Definiamo, per per ogni i = 0, . . . , n − 1,
yi =
− Λ(α−i)
α−2iB(α−i)
se B(α−i
) = 0
∞ se B(α−i
) = 0
(3.3)
In questo modo, se α−i
è una radice di Λ∗
(x), dalla (3.2) segue
0 = yiλ∗
(α−2i
) − b∗
(α−2i
)
Obiettivo: determinare funzioni del tipo yλ(x2
) − b(x2
) che si annullino
in (α−i
, yi) per al più t valori di i.
• Passo 2: interpolazione.
Viene costruito un polinomio interpolante Q(x, y) passante per tutti gli n
punti {(α−i
, yi)}n−1
i=0 , ciascuno con un certo valore di molteplicità m.
Scegliendo opportunamente i parametri, sarà possibile far in modo che Q(x2
, y)
contenga tutti i fattori della forma yλ(x2
)−b(x2
) che si annullano al massimo
in t degli n punti.
30

• Passo 3: fattorizzazione.
Vengono individuati tutti i fattori di Q(x, y) della forma y − b(x)
λ(x)
.
• Passo 4: correzione degli errori.
Per ogni fattore ottenuto al passo precedente, viene costruito il polinomio
Λ (x) = Λ(x)λ(x2
) + x2
B(x)b(x2
)
Le sue radici indicheranno le posizioni di errore in r(x) che andranno modifi-
cate: se la parola cos`ı ottenuta è una parola di codice, questa rappresenterà
un candidato ad essere l’effettiva parola trasmessa, e verrà inserita nella lista
in uscita.
L’uscita della procedura appena descritta sarà quindi una lista di parole di codice
che si trovano entro una certa distanza dall’n-upla ricevuta r(x).
Si può osservare inoltre che la cardinalità della lista di output sarà superiormente
limitata dal numero di fattori yλ(x) − b(x), limitato a sua volta dal grado in y di
Q(x, y).
Questo algoritmo rappresenta lo stato dell’arte come algoritmo di list deco-
ding: come l’algoritmo proposto da Sudan, esso si basa su i due processi di in-
terpolazione e fattorizzazione, ma la riformulazione dell’algoritmo di Berlekamp-
Massey attuata consente di implementare la decodifica anche per i codici BCH.
Inoltre, utilizzando valori di molteplicità di interpolazione inferiori rispetto al-
l’algoritmo di Guruswami-Sudan, permette di raggiungere una complessità pari a
O(n6
(1 −
√
1 − D)8
) con la stessa capacità correttiva τwu < n(1 −
√
1 − D).
Riassumiamo brevemente le differenze tra gli algoritmi visti: L’algoritmo di
Sudan (S) è un algoritmo polinomiale per codici Reed-Solomon con tasso minore a
1
3
. L’algoritmo Guruswami-Sudan (GS) raffina il precedente estendendolo a codici
di tasso arbitrario, e raggiungendo il limite teorico dettato dalla limitazione di
Johnson. L’algoritmo di Wu estende i concetti degli algoritmi S e GS anche ai
codici BCH, con tasso arbitrario e ne migliora la complessità computazionale.
3.5 Limiti
Nonostante i grossi progressi portati dai risultati di Sudan, Guruswami ed infine
Wu, l’intrinseca complessità delle operazioni algebriche che interessano gli algorit-
mi visti impedisce di implementarli con un’efficienza adeguata a molte applicazioni
pratiche. Infatti, nonostante la complessità computazionale degli algoritmi sia in
effetti polinomiale, è una complessità comunque piuttosto elevata: la complessità
31

dell’algoritmo di Wu `e ad esempio pari a O(n6
(1 −
√
1 − D)8
). Per questo mo-
tivo, ad oggi il list decoding non trova ancora posto nelle tecniche di decodiﬁca
maggiormente utilizzate.
32

Capitolo 4
Studio dello spazio delle parole di
codice
In questo capitolo prenderemo in considerazione alcune classi di codici BCH; ana-
lizzeremo lo spazio delle parole di codice al fine di caratterizzarlo meglio, nell’ottica
della realizzazione di un algoritmo probabilistico di list decoding per questo genere
di codici, obiettivo della nostra tesi.
4.1 Distanza minima, raggio di copertura e John-
son bound
Come abbiamo visto nel capitolo relativo alla codifica di canale, i codici sono ca-
ratterizzati da una distanza minima dmin, che è propria della struttura del codice
e che indica la minima distanza di Hamming tra due parole di codice, garantendo
cos`ı una capacità correttiva del codice pari a t = dmin−1
2
.
Abbiamo inoltre visto il concetto di raggio di copertura R, che è il minimo rag-
gio delle sfere di Hamming centrate nelle parole di codice tale che la loro unione
copra l’intero spazio delle ennuple possibili, che sono in numero di qn
. Questo
valore è importante perchè riuscire a raggiungere una capacità correttiva pari a
R permetterebbe di avere un algoritmo che fornisce risultati per qualsiasi ennupla
ricevuta, ovvero garantisce che il processo di decodifica non fallisca per alcuna
ennupla.
Un altro parametro che si rivela utile nel contesto di un algoritmo di list de-
coding è il raggio di Johnson J (o Johnson bound) del codice. Questo è il valore
che garantisce che il numero di parole di codice distante al massimo J da una
generica ennupla non sia esponenziale, consentendo un’analisi efficiente della lista.
33

Si intuisce quindi che un algoritmo di list decoding che punta ad essere computa-
zionalmente efficiente dovrebbe prendere in considerazione questo limite per non
produrre una lista di parole di dimensione computazionalmente intrattabile.
Prendiamo ora in considerazione una serie di codici BCH, caratterizzati dai
parametri dmin, t, R e J, indicati nelle tabelle 4.1 e 4.2; lo scopo è quello di
cominciare a farci un’idea dello spazio in cui opererà un eventuale algoritmo di list
decoding che interessi questi codici. Come si nota, solo pochi valori sono presenti
per quanto riguarda i raggi di copertura. Questo perchè in generale non è banale
calcolare il raggio di copertura di un codice, ma è necessario studiarne lo spazio
delle soluzioni in modo puntuale per trarre delle considerazioni sulla sua struttura.
34

n k d t J R
7 4 3 1 2 1
15 11 3 1 1 1
15 7 5 2 3 3
15 5 7 3 5 5
31 26 3 1 1 1
31 21 5 2 2 3
31 16 7 3 4 5
31 11 11 5 7 7
31 6 15 7 12 11
63 57 3 1 1 1
63 51 5 2 2 3
63 45 7 3 3 5
63 39 9 4 4 7
63 36 11 5 6 9
63 30 13 6 7
63 24 15 7 8
63 18 21 10 13
63 16 23 11 15
63 10 27 13 19
63 7 31 15 27
127 120 3 1 1
127 113 5 2 2
127 106 7 3 3
127 99 9 4 4
127 92 11 5 5
127 85 13 6 6
127 78 15 7 8
127 71 19 9 10
127 64 21 10 11
127 57 23 11 12
127 50 27 13 15
127 43 29 14 16
127 36 31 15 18
127 29 43 21 27
127 22 47 23 31
127 15 55 27 40
127 8 63 31 57
n k d t J R
255 247 3 1 1
255 239 5 2 2
255 231 7 3 3
255 223 9 4 4
255 215 11 5 5
255 207 13 6 6
255 199 15 7 7
255 191 17 8 8
255 187 19 9 9
255 179 21 10 10
255 171 23 11 12
255 163 25 12 13
255 155 27 13 14
255 147 29 14 15
255 139 31 15 16
255 131 37 18 20
255 123 39 19 21
255 115 43 21 23
255 107 45 22 24
255 99 47 23 26
255 91 51 25 28
255 87 53 26 30
255 79 55 27 31
255 71 59 29 34
255 63 61 30 35
255 55 63 31 36
255 47 85 42 53
255 45 87 43 55
255 37 91 45 59
255 29 95 47 63
255 21 111 55 81
255 13 119 59 94
255 9 127 63 119
511 502 3 1 1
511 493 5 2 2
511 484 7 3 3
511 475 9 4 4
Tabella 4.1: Caratterizzazione di alcuni codici BCH (1)
35

n k d t J R
511 466 11 5 5
511 457 13 6 6
511 448 15 7 7
511 439 17 8 8
511 430 19 9 9
511 421 21 10 10
511 412 23 11 11
511 403 25 12 12
511 394 27 13 13
511 385 29 14 14
511 376 31 15 16
511 367 33 16 17
511 358 37 18 19
511 349 39 19 20
511 340 41 20 21
511 331 43 21 22
511 322 45 22 23
511 313 47 23 24
511 304 51 25 26
511 295 53 26 28
511 286 55 27 29
511 277 57 28 30
511 268 59 29 31
511 259 61 30 32
511 250 63 31 33
511 241 73 36 39
511 238 75 37 40
n k d t J R
511 229 77 38 41
511 220 79 39 43
511 211 83 41 45
511 202 85 42 46
511 193 87 43 48
511 184 91 45 50
511 175 93 46 51
511 166 95 47 52
511 157 103 51 58
511 148 107 53 60
511 139 109 54 62
511 130 111 55 63
511 121 117 58 67
511 112 119 59 68
511 103 123 61 71
511 94 125 62 72
511 85 127 63 74
511 76 171 85 108
511 67 175 87 112
511 58 183 91 119
511 49 187 93 123
511 40 191 95 127
511 31 219 109 158
511 28 223 111 164
511 19 239 119 190
511 10 243 121 198
Tabella 4.2: Caratterizzazione di alcuni codici BCH (2)
36

4.2 Calcolo della percentuale di copertura
Mettiamoci ora nel caso binario e consideriamo un generico codice BCH con distan-
za minima dmin e di conseguenza con t = dmin−1
2
. Possiamo facilmente calcolare
la percentuale dello spazio 2n
coperto dalle regioni di decodifica. Sappiamo che
l’intero spazio delle ennuple è formato da 2n
ennuple. Il numero di ennuple ad una
certa distanza r da una generica ennupla è pari a n
r
. Il volume di ogni regione di
decodifica è quindi pari a:
V (Ri) =
t
i=0
n
i
Poiché ci sono k bit d’informazione sappiamo che ci sono 2k
regioni di decodifica
disgiunte. Possiamo allora calcolare la percentuale di spazio coperto:
C% =
2k
V (Ri)
2n
=
t
i=0
n
i
2n−k
Questa percentuale rappresenta la frazione di 2n
per la quale la decodifica BCH
fornisce una stima. Tentare di decodificare un’ennupla della frazione complemen-
tare pari a 1−C% porta a un fallimento della decodifica. Nella tabella 4.3 vediamo
alcuni valori di C% calcolati per alcuni valori di n e k.
37

n k n − k d t C%
31 26 5 3 1 1
31 21 10 5 2 0.485
31 16 15 7 3 0.152
31 11 20 11 5 0.197
31 6 25 15 7 0.106
63 57 6 3 1 1
63 51 12 5 2 0.492
63 45 18 7 3 0.159
63 39 24 9 4 0.038
63 36 27 11 5 0.057
127 120 7 3 1 1
127 106 21 5 2 0.004
127 78 49 15 7 1.68e-04
127 43 84 29 14 9.11e-08
127 15 112 55 27 7.75e-07
255 247 8 3 1 1
255 207 48 13 6 0.0013
255 123 132 39 19 4.37e-12
255 71 184 59 29 6.22e-18
255 21 234 111 55 1.66e-14
511 502 9 3 1 1
511 403 108 25 12 1.83e-09
511 295 216 53 26 3.42e-22
511 193 318 87 43 1.60e-33
511 85 426 127 63 2.68e-47
Tabella 4.3: Percentuale di copertura per alcuni codici BCH
38

Dalla tabella si osserva che all’aumentare della capacità correttiva del codice il
valore C% diminuisce sensibilmente; ciò è dovuto alla circostanza che le sfere cen-
trate nelle parole diventano sempre più grandi, le parole diminuiscono e aumenta
lo spazio vuoto lasciato negli interstizi delle sfere. In altre parole aumenta in modo
significativo la parte dello spazio delle 2n
ennuple che rimane fuori dalle regioni di
decodifica; la decodifica delle ennuple appartenenti a questa regione esterna porta
a un fallimento. Gli unici codici che presentano una percentuale di copertura del
100% sono i codici perfetti, che sono però molto rari: i codici perfetti che vediamo
nella tabella sono i codici di Hamming 1-correttori.
4.3 Copertura dello spazio vicino alle parole di
codice
Sebbene la percentuale di copertura totale teorica calcolata sia corretta, è bene
notare che non è detto che le parole di codice siano distribuite in modo omogeneo
nello spazio delle ennuple. Si può quindi caratterizzare ulteriormente lo spazio
cercando di capire quante parole si trovano vicino alle regioni di decodifica di
un’altra parola di codice. Sono state eseguite delle simulazioni per verificare, per
alcuni tipi di codici, quale percentuale delle ennuple possibili a distanza t + 1 e
t + 2 facesse parte di qualche regione di decodifica: in particolare, con riferimento
alla figura 4.1, fissato w, si cerca di capire quante delle ennuple che si trovano
nella fascia arancione (t + 1) e verde (t + 2) vengono decodificate correttamente in
una qualche parola di codice dall’algoritmo di decodifica BCH. Eventuali parole
a questa distanza saranno sicuramente diverse da w, poichè differiscono da w per
più bit di quanti il codice sia in grado di correggere, ovvero t. Nella tabella 4.4 si
vedono i risultati di queste simulazioni.
codice (n,k,t) t + 1 t + 2
(31,21,2) 0.614 0.4303
(31,16,3) 0.1595 0.1688
(31,11,5) 0.1043 0.097
(31,6,7) 0.0077 0.0059
(63,51,2) 0.488 0.4847
Tabella 4.4: Percentuale di copertura a distanza t + i dalle parole di codice
39

Fig. 4.1: Analisi dello spazio prossimo alla regione di decodifica delle parole di
codice
Si noti come ai codici correttori con capacità correttiva più alta corrispondano
valori percentuali molto bassi; in questi casi sarà probabilmente più facile ritrovare
la parola originale anche nell’eventualità di un numero di errori maggiore di t. Sarà
infatti più difficile imbattersi in un’altra regione di decodifica che risiede vicino a
quella obbiettivo.
40

Capitolo 5
Proposta di un algoritmo
probabilistico
5.1 Motivazioni
Come abbiamo visto nel capitolo relativo al list decoding, lo stato dell’arte per
quanto riguarda la decodifica list decoding è l’algoritmo di Wu, che presenta una
complessità computazionale pari a O(n6
(1−
√
1 − D)8
). Questa complessità, nono-
stante non sia esponenziale, è ancora proibitiva per consentire un impiego pratico
dell’algoritmo e delle tecniche di list decoding in generale. Per altro tale algoritmo
è basato su tecniche raffinate di geometria algebrica, e per sperare di migliorarlo
è verosimile si debba operare ancora in questo settore, per il quale non si hanno
competenze adeguate nei corsi di studio di Ingegneria. Un’alternativa possibile è
quella di individuare un algoritmo molto meno sofisticato dal punto di vista teori-
co, ma che funzioni solo con una certa probabilità, che si possa magari controllare.
Lo scopo di questa tesi è quindi lo studio e la realizzazione di un algoritmo al-
ternativo di tipo probabilistico per il problema del list decoding dei codici BCH.
Poiché nello spazio metrico di Hamming tutto cresce con velocità esponenziale,
ci si aspetta di poter usare questo algoritmo solo per un ristretto intervallo dei
parametri.
L’idea sulla quale si basa l’algoritmo probabilistico di list decoding è quella di
esplorare lo spazio delle soluzioni costruendo a caso un certo numero Ni di ennuple
che stanno a una certa distanza i dall’ennupla ricevuta; chiameremo i-perturbate
tali ennuple. Ciò significa che l’ennupla ricevuta sarà modificata in i posizioni
distribuite casualmente sugli n bit della parola. Questa operazione viene fatta a
partire da i = 0 (che corrisponde a non inserire errori e a preservare l’ennupla
ricevuta), incrementando via via il valore di i. Si procede poi a decodificare le
ennuple i-perturbate con l’algoritmo classico di decodifica BCH; la speranza è che
41

qualcuna di queste ennuple cada all’interno della regione di decodifica di qualche
parola di codice vicina all’ennupla ricevuta. Se ciò accade l’algoritmo restituisce,
per ciascun passo i dell’iterazione, una lista di parole di codice che derivano dalle
decodifiche delle ennuple i-perturbate che hanno avuto successo. L’insieme delle
parole di codice ottenute iterando i costituisce la lista finale ottenuta dalla decodifi-
ca di tipo list decoding. Per meglio comprendere l’idea, si veda la rappresentazione
di una iterazione in figura 5.1: y è la ennupla ricevuta, in verde e in rosso scuro si
vedono le Ni ennuple i-perturbate che sono state decodificate rispettivamente con
successo e senza successo. In verde chiaro vediamo le aree di decodifica delle parole
trovate, in ocra le aree di decodifica delle parole non trovate. Nel caso illustrato,
la lista risultante conterrà le parole w1 e w3.
Fig. 5.1: Rappresentazione di una generica i-esima iterazione dell’algoritmo
42

5.2 Probabilità di successo
5.2.1 Descrizione del modello di decodifica
Creiamo ora un modello che ci aiuti a calcolare la probabilità che il nostro proce-
dimento abbia successo, ovvero che trovi la parola originalmente trasmessa.
Sia C un codice BCH di lunghezza n, con k bit di informazione e con capacità
correttiva t. Supponiamo che in fase di codifica il messaggio c sia codificato con
la parola di codice w. Questa viene trasmessa e subisce un numero e di errori di
trasmissione, ovvero wt(e) = e, con e vettore di errore. Denotiamo con y l’ennupla
ricevuta; risulta quindi y = w + e.
L’algoritmo riceve la parola y e procede a una sua i-perturbazione, modificando
casualmente i posizioni tra le n disponibili; ciò significa che la parola perturbata è
a distanza i da y. Successivamente si prova la decodifica BCH, verificando se essa
porta o meno a una parola di codice.
Analizziamo ora nel dettaglio una generica iterazione i dell’algoritmo, che porta
alla generazione di ennuple i-perturbate ottenute modificando in i posizioni l’en-
nupla ricevuta y. L’algoritmo genera Ni ennuple i-perturbate yi(j), 1 ≤ j ≤ Ni
a distanza i da y; a seguito della decodifica si individua un certo numero D di
parole di codice, che chiamiamo wi(r) con r = 1..D e D ≤ Ni; infatti non è det-
to che per tutte le yi(j) esista una decodifica; oppure potrebbe succedere che ci
siano più ennuple i-perturbate yi(j) che portano alla stessa parola di codice wi(r).
Nel fare la simulazione dovremo allora procedere secondo il seguente schema:
1. si sceglie una parola di codice w lunga n bit;
2. si introducono e errori in w, ovvero si invertono i valori di e bit di w,
ottenendo y. Questa operazione simula il rumore del canale;
3. si generano Ni ennuple yi(j), 1 ≤ j ≤ Ni, distanti i da y, ognuna ottenuta
introducendo i errori in posizioni casuali di y;
4. si decodifica ciascuna delle yi(j); se la decodifica ha avuto successo per
D ennuple, si ottiene una lista di D parole di codice wi(m) decodificate
correttamente, con m = 1..D e D ≤ Ni;
5. se w ∈ Wi = {wi(m) | m = 1..D} la parola originale è stata trovata, e la
decodifica list decoding ha avuto successo.
Con queste premesse proveremo a calcolare la probabilità di trovare la parola
originale, distante e dalla parola y ricevuta.
43

5.2.2 Calcolo probabilità di successo
Sia t la capacità di correzione del codice BCH scelto, e il numero di errori intro-
dotti in fase di trasmissione, e sia i il numero di ulteriori errori introdotti nel passo
3.
Pensando ora alla ennupla y che contiene già e errori rispetto alla w originale, si
pensi all’introduzione dei nuovi i errori come un tentativo di correggere gli e errori
precedentemente causati dalla trasmissione. Proviamo quindi a calcolare la pro-
babilità che gli errori totali causati da queste due ’perturbazioni’ di w ci portino
all’interno della sfera di Hamming di w di raggio t, che è equivalente a dire che la
successiva decodifica porta nuovamente a w.
Definiamo ora p come il numero di errori, tra gli i errori introdotti al passo 3,
che hanno la stessa posizione di uno degli e errori di trasmissione, ovvero il nume-
ro di errori di trasmissione che siamo riusciti a correggere introducendo i nuovi i
errori. Ovviamente si ha che p ≤ i e p ≤ e, e i p errori sono l’intersezione tra quelli
di trasmissione e quelli aggiunti artificiosamente al passo 3. Inoltre osserviamo che
i restanti i−p errori finiranno per ’sporcare’ ulteriormente y, allontanandola ancor
di più da w.
Si ha quindi che il numero di errori residui r sarà dato dagli errori di trasmis-
sione non corretti sommati agli errori artificialmente introdotti che non hanno
corretto gli errori di trasmissione:
r = (e − p) + (i − p) = e + i − 2p
Se ora imponiamo che il numero di errori residui sia al più uguale a t, garantendoci
la corretta decodifica, abbiamo la condizione
e + i − 2p ≤ t
Affinché la decodifica abbia successo è allora necessario che
p ≥
e + i − t
2
che, essendo p intero, equivale a
p ≥
e + i − t
2
Ora, fissato p numero di errori ‘corretti’, abbiamo che gli i errori possono essere
distribuiti nel seguente modo: e
p
modi di scegliere gli errori da correggere tra
quelli di trasmissione e n−e
i−p
modi di scegliere in quali posizioni finiranno gli errori
44

non corretti.
Notiamo inoltre che tutti i modi possibili in cui si possono introdurre gli i er-
rori su n bit è ovviamente n
i
.
Alla luce di quanto esposto possiamo concludere con la formula che esprime la
probabilità che la parola generata da questo processo sia decodificata nuovamente
con w; chiamiamo psucc tale probabilità:
psucc =
min(i,e)
p= e+i−t
2
e
p
n−e
i−p
n
i
5.2.3 Condizioni di funzionamento dell’algoritmo
Analizzando le disequazioni presentate nella sezione appena vista, possiamo intuire
che ci sono due casi in cui la decodifica non avrà mai successo:
1. e > i + t
2. e < i − t
La 1. è ragionevole: ci sono stati troppi errori e nemmeno correggerli con
tutti gli i errori introdotti ci porta all’interno della sfera di Hamming di w. La
condizione 2. invece non è necessariamente ovvia: se ci sono stati troppi pochi
errori di trasmissione, e gli errori i introdotti sono molti, la grande maggioranza
di questi, anche nel caso migliore, ci allontana da w, portandoci fuori dalla sfera.
Tuttavia il problema relativo al punto 2 non dovrebbe mai presentarsi se abbiamo
eseguito iterativamente l’algoritmo partendo con i = 0, incrementando tale valore
a ogni iterazione.
5.3 Calcolo del numero di tentativi Ni
Denotiamo con psucc la probabilità di successo calcolata precedentemente, cioè la
probabilità che la parola venga trovata in un solo tentativo. Procediamo ora a cal-
colare il numero di tentativi Ni da fare per garantirci una probabilità prefissata pobj
di trovare la parola originalmente trasmessa. I tentativi sono tutti indipendenti
perchè la perturbazione di ogni ennupla è eseguita aleatoriamente e con una proba-
bilità uniforme. Possiamo quindi calcolare con la seguente formula la probabilità
di avere successo con n tentativi psucc(n), che equivale a 1 − pinsucc(n):
psucc(Ni) = 1 − (1 − psucc)Ni
45

da cui possiamo esplicitare il numero di tentativi Ni da fare per garantire una
probabilità fissata pobj:
psucc(Ni) = 1 − (1 − psucc)Ni
≥ pobj
1 − pobj ≥ (1 − psucc)Ni
passando ai logaritmi, e notando che 1 − psucc è sempre inferiore a 1, e quindi il
logaritmo in questione è una funzione decrescente, abbiamo
log1−psucc
(1 − pobj) ≤ Ni
infine cambiando base al logaritmo otteniamo
Ni ≥
log(1 − pobj)
log(1 − psucc)
o equivalentemente, essendo Ni intero:
Ni =
log(1 − pobj)
log(1 − psucc)
Utilizzando quindi questo valore di Ni, calcolato con la psucc vista in precedenza,
possiamo garantire che troveremo la parola originale con una probabilità maggiore
o uguale a pobj.
5.4 Algoritmo
L’algoritmo probabilistico sviluppato è quindi descritto nei seguenti passi. Nella
figura 5.2 si trova inoltre il diagramma di flusso dello stesso.
1. viene ricevuta una ennupla y;
2. si pone i = 0;
3. si calcola Ni come spiegato nella sezione precedente;
4. si generano Ni ennuple casuali yi(j), 1 ≤ j ≤ Ni, tali che dH(yi(j), y) = i;
5. si decodificano le yi(j) e si aggiungono alla lista le parole di codice wi(m)
trovate;
6. se la lista è vuota e i < J si incrementa i e si torna al punto 3;
7. si restituisce la lista come risultato dell’algoritmo.
46

Fig. 5.2: Flow chart dell’algoritmo proposto
47

5.5 Condizione di arresto dell’algoritmo
Riferendoci al punto 6 dell’algoritmo, si può notare che l’algoritmo si ferma quando
trova dei risultati a una certa distanza i, oppure se è stato raggiunta la limitazione
di Johnson. La scelta di fermarsi se la lista non è vuota è compatibile con il criterio
di decodifica a distanza minima. Difatti, se troviamo dei risultati a distanza i, essi
sono certamente (con probabilità pobj) più vicini di eventuali risultati che troveremo
a distanza i + 1. Se quindi il criterio che si vuole utilizzare per poi analizzare le
ennuple della lista è quello a distanza minima, non ha senso continuare a riempire
la lista con risultati più lontani. Se invece si volesse ottenere come risultato tutte
le parole fino al Johnson bound J, basterebbe eliminare dal punto 6 la condizione
che la lista sia vuota, continuando a iterare sempre fino alle soglie di J.
48

Capitolo 6
Implementazione
6.1 Libreria di codifica/decodifica BCH
Per l’esecuzione dell’algoritmo proposto è necessario poter eseguire la decodifica
delle ennuple generate con l’algoritmo di decodifica standard BCH. L’algoritmo
di decodifica BCH è un algoritmo che si basa fortemente sulla teoria dei campi
finiti e altri strumenti algebrici importanti quali il calcolo matriciale, ecc. Le
attuali implementazioni sono frutto di anni di ricerca e ottimizzazioni che esulano
dallo scopo di questa tesi. Di conseguenza si è scelto di affidarsi a librerie di
codifica/decodifica BCH preesistenti.
Per l’implementazione proposta sono state prese in considerazione due librerie,
per due ambienti di sviluppo molto diversi tra loro, C e MATLAB.
6.1.1 Libreria C
È stata utilizzata per i primi test una libreria C, bch.c, parte integrante del più
recente kernel di Linux. Questa è la libreria che viene utilizzata dal kernel per la
lettura e la scrittura su particolari device che utilizzano una gestione della codifica
software. Sfortunatamente, la struttura della libreria limitava il suo utilizzo a quei
particolari codici BCH che avessero un numero di bit d’informazione, precedente-
mente denotato con k, pari a un multiplo di 8. Questo fatto ha permesso di poter
utilizzare e testare la libreria soltanto con il codice BCH con n = 31, k = 16, t = 3.
Non è stato quindi possibile utilizzare questa libreria per l’implementazione
dell’algoritmo, ma il fatto che essa fosse utilizzabile per qualche codice ha dato la
possibilità di effettuare un confronto delle prestazioni tra questa libreria e la meno
efficiente libreria MATLAB, che descriviamo di seguito.
49

6.1.2 Libreria MATLAB
MATLAB è un ambiente di sviluppo che offre una varietà di strumenti matematici
molto numerosa, e che quindi favorisce la realizzazione di algoritmi che operano
con strutture matematiche complesse quali ad esempio i campi di Galois. MA-
TLAB include infatti anche le due funzioni bchdec() e bchenc(), che sono state
utilizzate nell’implementazione dell’algoritmo proposto e delle simulazioni trattate
in questa tesi. Ovviamente, l’implementazione in MATLAB presenta un overhead
maggiore rispetto a quella più di basso livello del C, e questo ha portato a tempi
di esecuzione maggiori, che non sono aderenti a quello che ci si può aspettare dallo
stesso algoritmo implementato più a basso livello.
6.1.3 Confronto tra prestazioni MATLAB e C
Per avere un’idea dell’ordine di grandezza che separa un’implementazione C da
quella in MATLAB, a scopo indicativo, sono state eseguite delle simulazioni di de-
codifica di ennuple casuali, valutandone il tempo di esecuzione. Per la simulazione
è stato utilizzato il codice BCH con n = 31, k = 16 e t = 3, che è uno dei codici
che si può utilizzare con la libreria C.
Sono state eseguite un elevato numero di operazioni in ognuno dei due linguaggi,
per ottenere un tempo medio più affidabile possibile. In particolare, nella tabella
6.1 vediamo il risultato della simulazione,
C MATLAB
N 1000000 10000
t 0,370897 13,707723
t
N 3, 709 ∗ 10−7
1, 371 ∗ 10−3
Tabella 6.1: Tempi di decodifica per il codice BCH n = 31, k = 16
50

Nella tabella N equivale al numero di iterazioni eseguite, t al tempo in secondi
che ha richiesto l’intera esecuzione. t
N
è invece il tempo medio in secondi richie-
sto da una singola decodifica. Come si può notare i tempi di esecuzione sono di
diversi ordini di grandezza superiori con MATLAB piuttosto che con una più effi-
ciente libreria C. In particolare, lo speedup che si ottiene lavorando in C rispetto a
MATLAB, per questa simulazione, è pari a circa 3696.
6.2 Implementazione dell’algoritmo in MATLAB
Di seguito si riporta il listato del codice MATLAB che esegue la decodifica di una
generica ennupla. In questa particolare versione dell’implementazione si include
anche il codice per la generazione dell’ennupla ricevuta. Questa viene infatti ge-
nerata come una parola di codice casuale che viene perturbata con un numero di
errori pari a ERR STARTING WORD, impostato ad un numero maggiore di t
capacità correttiva del codice.
1 %code structure
2 m = 5;
3 n = 2^m-1; % Codeword length
4 k = 11; % Message length
5 t = 5; % Correction capabilty
6
7
8 %algoritm parameters
9 ERR_STARTING_WORD = 6;
10 PERC = 0.9999; %imposed confidence
11
12
13 %random starting word
14 a = randi ([0 1],1,k);
15 msgTx = gf(a);
16 enc = bchenc(msgTx ,n,k);
17 %noising it
18 b = enc + randerr (1,n, ERR_STARTING_WORD : ERR_STARTING_WORD );
19
20
21 received_word = b;
22 unique_list = [];
23
24 for d = 0:10; %this should stop to the johnson bound , not 10
25 disp ([’Trying distance ’,num2str(d)]);
26 found = 0;
51

27 n_d = nchoosek(n,d);
28 %disp(n_d)
29
30 %we suppose the solution is distant t+d, which means n_e
= t+d, and n_d
31 %is d
32 n_e = t+d;
33 %calculate sum limits
34 s_start = ceil ((n_e+d-t)/2);
35 s_end = min([n_e ,d]);
36
37 sum = 0;
38 for n_x = s_start:s_end;
39 sum = sum + nchoosek(n_e ,n_x)*nchoosek(n-n_e ,d-n_x);
40 end
41
42 p = sum/nchoosek(n,d);
43
44 N2 = ceil(log(1-PERC)/log(1-p));
45
46 %testing N2 random words
47 for i = 1:N2
48 c = received_word + randerr (1,n,d:d);
49 [msgRx ,numerr] = bchdec(c,n,k);
50 if numerr ~= -1;
51 unique_list = [unique_list;msgRx ];
52 found = 1;
53 end
54 end
55
56 if found == 1;
57 disp ([’Stopped at d=’,num2str(d)]);
58 break;
59 end
60
61 end
62
63 %unique_list
64
65 unique_list = unique(unique_list.x,’rows ’);
66
67 found = 0;
68 if ~isempty(unique_list);
52

69 for i = 1: length(unique_list (:,1));
70 if unique_list(i,:) == enc (1:k);
71 found = found + 1;
72 else
73 end
74 end
75 disp(’found n of solutions:’)
76 disp(length(unique_list (:,1)))
77 disp(’original was found?’)
78 disp(found)
79 else
80 disp(’empty list of results ’);
81 end
6.3 Programma per la validazione dell’algoritmo
Riportiamo di seguito per completezza il listato del programma in MATLAB che
esegue la simulazione per verificare che la probabilità pobj sia rispettata: esso è so-
stanzialmente una versione modificata dell’algoritmo visto in precedenza. Quanto
ottenuto da queste simulazioni sarà poi presentato nel capitolo relativo ai risultati.
1 %code structure
2 m = 5;
3 n = 2^m-1; % Codeword length
4 k = 21; % Message length
5 t = 2;
6
7
8 %algoritm parameters
9 ERR_STARTING_WORD = 3;
10 PERC = 0.99; %imposed confidence
11
12 tot_found = 0;
13 TEST_COUNT = 1000;
14 for i=1: TEST_COUNT
15
16 %random starting word
17 a = randi ([0 1],1,k);
18 msgTx = gf(a);
19 enc = bchenc(msgTx ,n,k);
20 %noising it
53

21 b = enc + randerr (1,n, ERR_STARTING_WORD :
ERR_STARTING_WORD );
22
23
24 received_word = b;
25 unique_list = [];
26
27 %calculate binary johnson bound
28 J = floor(n/2*(1 - sqrt (1 -2*(2*t+1)/n)));
29
30 for d = 0: ERR_STARTING_WORD -t ;%J-t;
31 disp ([’Trying distance ’,num2str(d)]);
32 found = 0;
33 n_d = nchoosek(n,d);
34 %disp(n_d)
35
36 %we suppose the solution is distant t+d, which means
n_e = t+d, and n_d
37 %is d
38 n_e = t+d;
39 %calculate sum limits
40 s_start = ceil ((n_e+d-t)/2);
41 s_end = min([n_e ,d]);
42
43 sum = 0;
44 for n_x = s_start:s_end;
45 sum = sum + nchoosek(n_e ,n_x)*nchoosek(n-n_e ,d-
n_x);
46 end
47
48 p = sum/nchoosek(n,d);
49
50 N2 = ceil(log(1-PERC)/log(1-p));
51
52 %provo N2 tentativi casuali
53 for i = 1:N2
54 c = received_word + randerr (1,n,d:d);
55 [msgRx ,numerr] = bchdec(c,n,k);
56 if numerr ~= -1;
57 unique_list = [unique_list;msgRx ];
58 found = 1;
59 end
60 end
54

61
62 if found == 1;
63 continue; %not stopping when found a word , but
at the johnson bound
64 disp ([’Stopped at d=’,num2str(d)]);
65 break;
66 end
67
68 end
69
70
71
72 found = 0;
73 if ~isempty(unique_list);
74 %unique_list
75 unique_list = unique(unique_list.x,’rows ’);
76 for i = 1: length(unique_list (:,1));
77 if unique_list(i,:) == enc (1:k);
78 found = found + 1;
79 else
80 end
81 end
82 disp(’found num of solutions:’)
83 disp(length(unique_list (:,1)))
84 disp(’original found?’)
85 disp(found)
86
87 tot_found=tot_found+found;
88 else
89 disp(’empty list of results ’);
90 end
91 end
92
93 disp(’final rate of original found ’)
94 disp(tot_found/TEST_COUNT);
55

Capitolo 7
Risultati
7.1 Verifica probabilità di successo
L’algoritmo è stato validato tramite una serie di simulazioni per verificare che la
probabilità di successo pobj fosse rispettata. È stata quindi realizzato un algoritmo
che simulasse l’intero processo, come nei seguenti punti
1. si genera una parola di codice casuale
2. la si perturba con e ≥ t errori, simulando un canale rumoroso
3. si esegue l’algoritmo per l’i-esimo passo, con i pari a e − t, in modo da avere
certamente una possibilità di trovare la parola originale
4. si verifica se la parola originale è nella lista restituita
Iterando questo processo N volte, possiamo calcolare la frequenza con cui la parola
originale è effettivamente trovata, e possiamo confrontarla con la pobj obbiettivo.
Ricordiamo che pobj è la probabilità di trovare una parola che ha subito e > t errori
all’iterazione i-esima dell’algoritmo, con i pari a e − t. È questa la probabilità che
viene verificata in queste simulazioni.
Nella tabella 7.1 vediamo i risultati di queste simulazioni.
57

Codice (n, k, t) N e pobj freq
(31,21,2) 1000 3 0,99 0,989
(31,21,2) 1000 3 0,8 0,823
(31,11,5) 1000 6 0,99 0,995
(31,11,5) 1000 6 0,8 0,895
(31,11,5) 1000 7 0,99 0,991
(31,11,5) 1000 7 0,8 0,815
(63,7,15) 1000 16 0,99 0,986
(63,7,15) 1000 16 0,8 0,849
(63,7,15) 1000 18 0,99 0,99
(63,7,15) 1000 18 0,8 0,801
Tabella 7.1: Confronto tra frequenza e pobj nelle simulazioni per alcuni codici
Si può notare dalla tabella che la frequenza si avvicina notevolmente alla pro-
babilità teorica calcolata, anche per codici con alta capacità correttiva. In alcuni
casi i valori di freq sono abbastanza alti, ma ricordiamo che nel calcolo dei valori
di Ni prendiamo il primo intero tale che psucc(Ni) ≥ pobj, di conseguenza può essere
che in alcuni casi psucc(Ni) sia abbastanza maggiore di pobj, in particolare quando
la probabilità di successo in una singola iterazione psucc è molto alta.
7.2 Simulazioni dell’algoritmo completo
Sono state eseguite molte simulazioni per verificare il funzionamento dell’algoritmo.
Le simulazioni si sono svolte, utilizzando l’algoritmo proposto, nel seguente modo:
1. si esegue N volte il seguente processo
(a) si genera una parola di codice w casuale
(b) si perturba w con e > t errori, simulando gli errori di trasmissione
(c) si esegue l’algoritmo partendo dall’ennupla ottenuta
2. si misurano lunghezza della lista media e tempo medio di esecuzione dell’al-
goritmo
Nella tabella 7.2 vediamo i risultati di queste simulazioni per dei valori di e pari a
t + 1 e t + 2.
58

Codice (n,k,t) J N e pobj tavg [s] νavg
(31,11,5) 7 1000 6 0.99 0.0498 1.536
(31,11,5) 7 1000 7 0.99 0.0998 2.018
(63,7,15) 27 1000 16 0.99 0.0483 1.001
(63,7,15) 27 1000 17 0.99 0.1925 1.002
(127,50,13) 15 1000 14 0.99 0.1209 1
(127,50,13) 15 1000 15 0.99 1.147 0.987
(255,131,18) 20 1000 19 0.99 0.2675 1
(255,131,18) 20 1000 20 0.99 3.6669 0.992
Tabella 7.2: Analisi del tempo medio tavg e dimensione media della lista νavg per
alcuni tipi di codice BCH
Osservando i valori ottenuti, si possono fare alcune considerazioni:
• per e = t + 1 i tempi ottenuti sono abbastanza piccoli, considerando che,
come visto nel capitolo relativo all’implementazione, una realizzazione del-
l’algoritmo in un linguaggio più efficiente come il C può garantire uno speedup
di circa 3000.
• per e = t + 2 i tempi sono più alti, ma ancora accettabili nel caso di codici
con n piccolo
• le dimensioni della lista ottenuta decrescono con l’aumentare di n, poiché le
parole di codice sono in media più distanti fra loro
• nei casi in cui e < J, la probabilità di ottenere almeno qualche risultato
è molto più alta di pobj, questo perchè se la parola, distante e non fosse
trovata con probabilità pobj alla prima iterazione, l’algoritmo prosegue alla
iterazione successiva nella quale la probabilità di trovare la stessa parola è
ancora maggiore di pobj.
• la dimensione della lista restituita risulta essere pittosto piccola. Questo
è vero perchè l’algoritmo si ferma nonappena trova le prime parole, quindi
prima di raggiungere il limite posto dal Johnson bound. È utile comunque
ricordare che la limitazione di Johnson assicura un limite superiore alle parole
trovate e non implica quindi una dimensione minima della lista.
59

Capitolo 8
Conclusioni
8.1 Obbiettivi raggiunti
In questa tesi sono state esposte ed evidenziate le caratteristiche e i limiti degli
algoritmi di list decoding allo stato dell’arte. È stato quindi proposto un’algoritmo
di list decoding probabilistico che utilizza un approccio completamente diverso
dagli algoritmi visti. Si è poi caratterizzato l’algoritmo proposto effettuando uno
studio della probabilità di successo, potendo garantirne il funzionamento con una
fissata probabilità, imposta come parametro dell’algoritmo.
Si è infine verificata la correttezza dell’algoritmo simulando la situazione di
decodifica per casi in cui gli errori di trasmissione fossero maggiori di t, ottenendo
che la decodifica è correttamente eseguita con probabilità pari alla pobj imposta.
8.2 Sviluppi futuri
8.2.1 Confronto con lo stato dell’arte
Un’importante sviluppo che potrebbe essere interessante prendere in considerazio-
ne in un lavoro futuro è trovare una metrica per confrontare questo algoritmo con
lo stato dell’arte. Un’analisi dal punto di vista della complessità non è necessa-
riamente il miglior approccio, in quanto esso ha valenza asintotica, mentre i casi
pratici di utilizzo dei codici BCH hanno valori di n limitati, generalmente al massi-
mo n = 512. Il modo ideale per mettere a confronto lo stato dell’arte e l’algoritmo
proposto sarebbe quello di realizzare un’implementazione di entrambi gli algoritmi
in un linguaggio efficiente ed eseguire sullo stesso hardware varie simulazioni con
diversi tipi di codici confrontandone i tempi.
61

8.2.2 Analisi ulteriore della probabilità di successo
L’analisi della probabilità di successo condotta nel capitolo relativo all’algoritmo
rappresenta uno studio della probabilità di ottenere una parola distante e > t all’i-
terazione i-esima dell’algoritmo, con i = e − t. Sulla base di questo risultato viene
calcolato il numero di tentativi Ni che garantiscono che la probabilità di trovare
la parola in quell’iterazione sia maggiore o uguale ad una certa probabilità fissa-
ta pobj. Tuttavia, se l’algoritmo non dovesse trovare nessuna parola alla i-esima
iterazione, e se i + t < J, l’algoritmo proseguirebbe a questo punto all’iterazione
successiva. Una eventuale parola che non fosse stata trovata nell’iterazione pre-
cedente con probabilità 1 − pobj avrebbe nell’iterazione successiva una probabilità
ancora maggiore di essere trovata.
Si potrebbe considerare questo fatto per diminuire il numero di tentativi Ni quan-
do i < J −t, continuando a garantire una probabilità fissata che ogni parola venga
trovata nell’intera decodifica e non solo alla i-esima iterazione.
62

Bibliograﬁa
[1] Elwyn Berlekamp, Robert McEliece, and Henk Van Tilborg. On the inherent
intractability of certain coding problems (corresp.). IEEE Transactions on
Information Theory, 24(3):384–386, 1978.
[2] Elwyn R Berlekamp. Algebraic coding theory. 1968.
[3] Peter Elias. List decoding for noisy channels. 1957.
[4] V. Guruswami and M. Sudan. Improved decoding of Reed-Solomon and
algebraic-geometry codes. IEEE Trans. Inform. Theory, 45:1757–1767, 1999.
[5] Richard W Hamming. Error detecting and error correcting codes. Bell Labs
Technical Journal, 29(2):147–160, 1950.
[6] James Massey. Shift-register synthesis and bch decoding. IEEE transactions
on Information Theory, 15(1):122–127, 1969.
[7] Claude Elwood Shannon. A mathematical theory of communication. ACM
SIGMOBILE Mobile Computing and Communications Review, 5(1):3–55,
2001.
[8] Madhu Sudan. Decoding of Reed-Solomon Codes beyond the Error-Correction
Bound. J. Complexity, 13:180–193, 1997.
[9] John M Wozencraft. List decoding. Quarterly Progress Report, 48:90–95,
1958.
[10] Y. Wu. New list decoding algorithms for Reed-Solomon and BCH codes. IEEE
Trans. Inform. Theory, 54(8):2611–3630, 2008.
63

Ringraziamenti
Ringrazio i miei genitori per il supporto e la fiducia che hanno sempre riposto in
me, ovviamente indispensabili per la realizzazione e il completamento di questo
percorso.
Ringrazio il professor Francesco Fabris per la grande disponibilità dimostrata, si-
curamente superiore a quella prevista dal suo ruolo.
Ringrazio inoltre tutti gli amici, in particolare Davide, Domenico, Enrico e Marco
per avermi aiutato e spronato nei momenti di necessità.
Ringrazio Nicola e Piero, per il supporto dimostrato e per essere stati sempre
presenti soprattutto negli ultimi mesi.
Ringrazio di cuore tutti i coinquilini di Colonia Orsa per l’immenso regalo che
mi hanno fatto permettendomi di vivere una nuova esperienza e di condividere
molti momenti, senza mai pretendere nulla in cambio, ma proprio nulla.
Ringrazio infine Silvia per avermi lasciato, sicuramente a malincuore, più tem-
po libero del solito per permettermi la stesura di questo documento, e quindi la
conclusione del mio percorso.
Concludo con un augurio per il futuro della DMNK, che avrà sicuramente un
ruolo centrale nelle esperienze che seguiranno questo momento.
65

Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato

Recommended

Recommended

More Related Content

What's hot

What's hot (19)

Viewers also liked

Viewers also liked (20)

Similar to Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato

Similar to Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato (20)

Algoritmo probabilistico di tipo montecarlo per il list decoding elaborato