Implementazione di un vincolo table su un CSP solver GPU-based

Introduzione ai CSP Introduzione a CUDA Il solver iNVIDIOSO Il Table Constraint
Implementazione di un vincolo table su un CSP
solver GPU-based
Tesi di Laurea
Tommaso Campari
27 Ottobre 2016 - A.A. 2015-2016
Tommaso Campari
Implementazione di un vincolo table su un CSP solver GPU-based

Indice
Introduzione ai CSP
Introduzione a CUDA
Il solver iNVIDIOSO
Il Table Constraint
Tommaso Campari

I CSP: Constraint Satisfaction Problem
Constraint:
Sia X una sequenza finita di variabili X = {x1, ..., xn} con
n > 0 con i rispettivi domini D = {d1, ..., dn}. Un constraint c
su X definito come c ⊆ d1 × ... × dn è un sottoinsieme del
prodotto cartesiano dei domini.
CSP:
un CSP è una tripla P = X, D, C dove:
X: rappresenta l’insieme delle variabili {x1, ..., xn}
D: rappresenta l’insieme dei domini necessariamente non
vuoti {d1, ..., dn} associati univocamente alle variabili.
C: rappresenta l’insieme dei vincoli sulle variabili X.
Tommaso Campari

Risolvere un CSP
L’obbiettivo è trovare una o più soluzioni ammissibili.
Soluzione:
Una soluzione è un’assegnamento delle variabili che soddisfa tutti i
vincoli del CSP.
Tommaso Campari

Arc e Bound consistency
L’operazione di consistency rimuove dai domini delle variabili
associate ad un constraint valori che sicuramente non portano a
una soluzione.
Arc consistency
Analizza ogni valore del
dominio;
E’ pi`u costosa;
Elimina valori che non
portano a soluzione.
Bound consistency
Analizza solo i valori agli
estremi del dominio.
E’ meno costosa;
Elimina solo i valori agli
estremi del dominio che non
portano a soluzione.
Tommaso Campari

Introduzione a CUDA
CUDA:
Architettura general purpose per il
parallel computing;
Sfrutta il motore di calcolo delle
GPU per risolvere problemi;
Utilizza blocchi e thread per il
parallelismo;
Le funzioni parallele sono
denominate Kernel.
Figura:
Tommaso Campari

Parallelismo dinamico
Parallelismo dinamico:
Estensione al modello di
programmazione CUDA:
Permette ai Kernel di essere
invocati direttamente della GPU;
Minor comunicazione CPU → GPU
e viceversa;
Maggior efficienza e flessibilità.
Tommaso Campari

iNVIDIOSO
Si tratta di un CSP solver:
Sperimentale;
Ancora in fase di sviluppo;
Con supporto all’architettura CUDA.
Tommaso Campari

La rappresentazione dei domini in iNVIDIOSO
I domini sono rappresentati secondo due modalit`a:
Bound rapresentation: le variabili i cui domini hanno una
diﬀerenza tra il minimo e il massimo elemento di almeno 256
sono implementati come una coppia di valori denominati
Bound;
Bitmask rapresentation: altrimenti sono implementati
mediante una bitmask composta da 8 interi a 32 bit, dove
ognuno di questi se impostato a 1 rappresenta un elemento
presente nel dominio.
Tommaso Campari

Obiettivi della tesi
Ideare un algoritmo parallelo efficiente per il vincolo table;
Integrarlo sul solver;
Dimostrare l’effettiva possibilità di propagare i vincoli in
parallelo.
Tommaso Campari

Il Table Constraint
Si tratta di un constraint estensionale definito elencando
esplicitamente una lista di n tuple di valori permessi per le variabili
nel suo scope.
Esempio: table([X1, X2, X3], [ 1, 2, 3 , 4, 5, 6 , 7, 8, 9 ]) con
D1, D2 e D3 fissati a [1, ..., 10]. La tabella associata al vincolo
può quindi essere vista come:
X1 X2 X3
t1 1 2 3
t2 4 5 6
t3 7 8 9
Dopo il filtering: D1 = {1, 4, 7}, D2 = {2, 5, 8} e D3 = {3, 6, 9}
Tommaso Campari

L’algoritmo di consistenza sequenziale
L’algoritmo di consistenza `e stato innanzitutto pensato per
un’esecuzione sequenziale su CPU e in particolare vuole sfruttare la
rappresentazione dei domini fornita dal solver.
Tommaso Campari

Bound consistency sequenziale per una variabile
Nel caso di esecuzione su domini con rappresentazione tramite
coppia di bound viene eseguita la consistenza per la variabile dello
scope selezionata solo sul lower e sull’upper bound.
Tommaso Campari

Arc consistency sequenziale per una variabile
Nel caso di esecuzione su domini con rappresentazione tramite
bitmask viene eseguita la consistenza per la variabile dello scope
selezionata su ogni elemento del dominio.
Tommaso Campari

Schema di implementazione con multithreading su CUDA
La prima implementazione fa utilizzo di un solo blocco con 256
thread in esecuzione parallela.
Tommaso Campari

Bound consistency con multithreading
Tommaso Campari

Arc consistency con multithreading
Tommaso Campari

Risultati ottenuti con il multithreading su CUDA(I)
Tommaso Campari

Risultati ottenuti con il multithreading su CUDA(II)
L’andamento dovrebbe essere a tempo costante parallelo;
Non accade perchè un thread si occupa di un valore del
dominio, che può essere associato a molte tuple;
Nel test il numero di queste tuple però era lineare rispetto alla
dimensione della table.
Tommaso Campari

Schema dell’implementazione con il parallelismo dinamico
Tommaso Campari

Consistency con il parallelismo dinamico
Tommaso Campari

Confronto tra le due implementazioni parallele
Tommaso Campari

Lavori futuri
Integrazione dei vincoli estensionali sul parser di iNVIDIOSO;
Integrazione del parallelismo dinamico su iNVIDIOSO;
Modiﬁca dell’algoritmo di ordinamento con un mergesort
parallelo;
Bilanciamento del lavoro tra i thread in caso di distribuzione
non uniforme dei valori nelle tuple.
Tommaso Campari

Conclusioni
Gli obiettivi inizialmente proposti sono stati raggiunti ed in
particolare:
La propagazione dei vincoli su GPU è possibile;
L’algoritmo implementato(specie nel caso del parallelismo
dinamico) è efficiente e filtra correttamente le soluzioni.
Tommaso Campari

Grazie per l’attenzione!
Tommaso Campari

Implementazione di un vincolo table su un CSP solver GPU-based

Recommended

Recommended

More Related Content

Viewers also liked

Viewers also liked (9)

Implementazione di un vincolo table su un CSP solver GPU-based