Progetto e sviluppo di un algoritmo di compressione per dati prodotti da tracker GPS

Introduzione Un nuovo approccio Test e validazione Conclusioni
Progetto e sviluppo di un algoritmo di
compressione lossy per dati prodotti da dispositivi
di posizionamento
Mariano Calandra
relatore
Chiar.mo Prof. Walter Balzano
Corso di Laurea in Informatica, Universit`a degli studi di Napoli Federico II
9 Maggio 2012
Mariano Calandra Progetto e sviluppo di un algoritmo di compressione lossy

Dispositivi di posizionamento
Cosa sono e a cosa servono
Cos’`e? – Un dispositivo di posizionamento `e un piccolo rilevatore
in grado di registrare istante per istante le proprie coordinate di
latitudine, longitudine e tempo grazie alla tecnologia GPS.
A cosa serve? – Le rilevazioni fornite sono memorizzate per
analisi future, o condivise in tempo reale.

Traiettorie e tracciati
L’insieme di tali rilevazioni `e detto traiettoria e ci permette di
sapere dov’era l’oggetto rilevato in un determinato istante
temporale.
La proiezione atemporale di tali rilevazioni `e detta tracciato.

Compressione di una traiettoria
Perch´e e come comprimere
Perch´e? – La memorizzazione, cos`ı come la condivisione, di un
numero elevato di traiettorie potrebbe essere computazionalmente
molto dispendiosa.
Come? – Eliminando dall’insieme di rilevazioni iniziali quelle
ridondanti o meno importanti.

Gli algoritmi di compressione
La scelta di quali punti eliminare dalla traiettoria `e aﬃdata ad un
algoritmo di compressione.
Esistono due tipi di algoritmi:
algoritmi lossless;
algoritmi lossy;

Tra gli algoritmi lossy pi`u conosciuti troviamo:
l’algoritmo di Douglas-Peucker;
l’algoritmo di Bellman;

L’algoritmo Douglas-Peucker
L’algoritmo Douglas-Peucker `e un algoritmo di compressione
appartenente alla famiglia degli algoritmi di line-simpliﬁcation.

L’algoritmo Douglas-Peucker
PRO:
render graﬁco molto preciso
richieste computazionali non elevate
CONTRO:
scarsa approssimazione spazio-temporale

L’algoritmo Bellman
L’algoritmo di Bellman considera le traiettorie come se fossero
delle funzioni matematiche univocamente deﬁnite.
PRO:
Algoritmo spazio-temporalmente ottimale
CONTRO:
Impossibile comprimere traiettorie con dei loop
Elevata complessit`a computazionale

Bellman e la problematica dei loop
Un loop si veriﬁca, quando in due istanti di tempo diversi il
dispositivo di rilevamento registra le stesse coordinate di latitudine
e longitudine.

Un nuovo approccio
Obiettivi
Sviluppare un nuovo algoritmo che consideri le traiettorie al pari
dell’algoritmo Bellman e che inoltre:
sia insensibile ai loop;
abbia una buona qualit`a spazio-temporale;
abbia una complessit`a computazionale non troppo alta;

La problematica dei loop
Come evitarli?
Esprimendo latitudini e longitudini come funzione del tempo
trascorso. Avremo dunque:
componente latitudinale;
componente longitudinale;

Componenti spazio-temporali
Le componenti spazio-temporali saranno delle coppie di valori
x, y .
x y
t1 lat1
t2 lat2
t3 lat3
t4 lat4
... ...
tn latn−1
tn latn
x y
t1 lon1
t2 lon2
t3 lon3
t4 lon4
... ...
tn lonn−1
tn lonn

Sintesi alle diﬀerenze
Comprendere il variare delle componenti
x y
t1 lat1
D2 = t2, lat1 − lat2
t2 lat2
t3 lat3
t4 lat4
... ...
Dn = tn, latn−1 − latn
tn−1 latn−1
tn latn
D1 avr`a come coordinate t1, 0 .

Grafico sintesi alle differenze
Come sfruttarlo
La proiezione di una generica sintesi alle differenze (latitudinale o
longitudinale) avrà un aspetto simile:
Il nostro algoritmo di compressione dovrà ricreare tale grafico, nel
modo più accurato possibile, usando un numero di punti inferiore.

Polilinea approssimante
La compressione meno precisa che possiamo ottenere è quella in
cui uniamo il primo e l’ultimo vertice.
L’intero grafico di sintesi (blu) è rappresentato con un solo
segmento (rosso). Rappresentare un grafico come quello di figura
con un segmento comporta un errore, tale errore è detto errore di
approssimazione.

Se l’errore di approssimazione `e pi`u piccolo della tolleranza decisa
dall’utente allora l’algoritmo si conclude. Altrimenti...

Se l’errore di approssimazione è più piccolo della tolleranza decisa
dall’utente allora l’algoritmo si conclude. Altrimenti...
...l’algoritmo spezza l’errore in due errori più piccoli, includendo un
terzo punto al centro del grafico di sintesi.

Adesso che l’errore di approssimazione è più di uno, si cerca qual è
quello più grande. Se questo viola la tolleranza, allora...

Adesso che l’errore di approssimazione è più di uno, si cerca qual è
quello più grande. Se questo viola la tolleranza, allora...
...l’algoritmo spezza l’errore in due errori più piccoli, come già
spiegato in precedenza.

Minima polilinea approssimante
Una volta che tutti gli errori di approssimazione saranno pi`u piccoli
della tolleranza l’algoritmo potr`a arrestare il processo di
minimizzazione dell’errore.

Minima polilinea approssimante
Una volta che tutti gli errori di approssimazione saranno più piccoli
della tolleranza l’algoritmo potrà arrestare il processo di
minimizzazione dell’errore.
La polilinea che otterremo prenderà il nome di minima polilinea
approssimante.

Pseudo-codice
1: procedure simplify(coords = {Tlat Tlon}, τ) return Plm
2: D = derive(coords);
3: s = 1
4: e = size(D)
5: Plm ← s, e
6: error ← MSE(D, s, e)
7: while error1.mse > τ do
8: s = error1.start
9: e = error1.end
10: vnew = round((s + e)/2)
11: Plm ← vnew
12: error ← MSE(D, s, vnew )
13: error ← MSE(D, vnew , e)
14: error1 → ∅
15: end while
16: end procedure Mariano Calandra Progetto e sviluppo di un algoritmo di compressione lossy

Diagramma di ﬂusso

Minima polilinea approssimante generale
Alla ﬁne dell’algoritmo avremo calcolato due polilinee:
una polilinea longitudinale
una polilinea latitudinale
Le due polilinee verranno fuse insieme e l’algoritmo si conclude.

Test e validazione
La distanza sincronizzata euclidea
La distanza sincronizzata euclidea (SED) è la distanza che si
crea, a parità di tempo, tra un punto sulla traiettoria compressa e
il rispettivo punto sulla traiettoria originaria.
La media di tali distanze ci fornirà l’errore di approssimazione
medio.

Misure SED
Tabella riepilogativa
SED
% compressione
MC DP
0.00016032 0.0001750267 10%
0.0004254233 0.0005225867 20%
0.0007182033 0.0010979333 30%
0.0011839333 0.0021174333 40%
0.0018201 0.0040697333 50%
0.0033408 0.0064422667 60%
0.0061559 0.0117570667 70%
0.0136053333 0.0241546667 80%
0.0547436667 0.0581126667 90%
0.0091281867 0.0120499311 SED Medio
0.08215368 0.10844938 SED Totale

Misure SED
Graﬁco riepilogativo

Conclusioni
PRO:
una buona compressione spazio-temporale
insensibilit`a ai loop
capacit`a computazionale quadratica
CONTRO:
scarsa compressione spaziale;

Punti deboli
Considerazioni
Come mitigare questo problema?
Scegliere il nostro algoritmo solo se per compressioni
semantiche;
Utilizzare il nostro algoritmo congiuntamente ad algoritmi di
line-ﬁtting;

Sviluppi futuri
Veriﬁcare il margine di vantaggio ottenibile parallelizzando
l’algoritmo;
Sviluppo di un metodo standard per la valutazione delle
traiettorie compresse;

Grazie per l’attenzione!

Progetto e sviluppo di un algoritmo di compressione per dati prodotti da tracker GPS

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (11)

Similar to Progetto e sviluppo di un algoritmo di compressione per dati prodotti da tracker GPS

Similar to Progetto e sviluppo di un algoritmo di compressione per dati prodotti da tracker GPS (20)

Progetto e sviluppo di un algoritmo di compressione per dati prodotti da tracker GPS