1. LABINFO -
REALIZZAZIONE DI UN MODULO DI DRUPAL PER
LA CONDIVISIONE DI DATI GEOFISICI PER
APPLICAZIONI SCIENTIFICHE
Tesi di Laurea in Programmazione di Internet
Autore: Cristiano Colacillo
Relatore: Prof. Stefano Ferretti Correlatore: Dr. Stefano Cacciaguerra
Facoltà di Scienze Matematiche, Fisiche e Naturali
Corso di Laurea in Scienze di Internet
2. LABINFO -
Progetto Antartica
Il progetto Antartica si propone di:
Divulgare informazioni sul progetto del settore di ricerca
Geodesia ed Osservatori del
Programma Nazionale di Ricerche in Antartide
Condividere i dati sismologici conservati nella sezione di
Bologna dell'INGV con la comunità scientifica
Realizzare un sistema automatizzato general purpose
per l'accesso dinamico a questi dati
2
3. LABINFO -
Importanza dei dati
I dati sismologici provengono dalla stazione TNV collocata
nella base Mario Zucchelli, baia di Terra Nova, Antartide
Sulla stazione sono installati magnetometri e sismometri
(1985)
A causa della posizione geografica e delle estreme condizioni
ambientali, l'acquisizione di tali dati è difficoltosa ed onerosa
=> diviene fondamentale condividere tali dati con tutta la
comunità scientifica
3
4. LABINFO -
il formato SEED e PDCC
I dati sismologici sono forniti dalle stazioni come file in formato
SEED (Standard for Exchange of Earthquake Data):
Volumi Dataless SEED (Header)
Dati miniSEED (Data Only SEED)
I SEED sono elaborati da PDCC (Portable Data Collection
Center)
inserisce i volumi dateless SEED in un DB MySQL
ed indicizza i relativi dati miniSEED nello stesso DB
inserisce tali dati miniSEED in una repository
4
5. LABINFO -
Scenario
Il repository può contenere una grande mole di dati
in formato miniSEED (e.g. 10 anni di TNV ~ 80GB)
La quantità di dati è in continua crescita
(~ 8GB/anno x stazione)
In futuro saranno disponibili dati di altre stazioni
5
6. LABINFO -
Soluzione
È necessario realizzare un portale che si occupi di
fornire tali dati in formato miniSEED e le relative funzioni di
risposta on demand:
la soluzione a questi problemi deve essere separata
dal design del portale
la realizzazione di un modulo riutilizzabile per
accesso ai dati in continua crescita e di nuove stazioni
=> Configurare un CMS (Content Management System)
e realizzarne un modulo aggiuntivo
6
7. LABINFO -
PANDA - Portal for ANtarctic DAta
Un CMS è adatto allo scopo perché caratterizzato da
un'alta modularità:
Moduli core - facenti parte dell'installazione base
Moduli contributivi - scritti dalla comunità
Moduli personalizzati - creati dal singolo sviluppatore web
Il portale è stato realizzato:
installando Drupal core ed alcuni moduli contributivi
sviluppando il modulo personalizzato Geophysical Data
Downloader (GeoDD) in PHP per rendere fruibili dati
sismologici miniSEED alla comunità scientifica
7
8. LABINFO -
PANDA
è stata installata la versione 7 del core di Drupal come virtual
host su un server web Apache
è stato realizzato un DB su MySQL per la gestione dei dati di
Drupal
sono stati installati i seguenti moduli aggiuntivi:
Nice Menus – per la gestione dei menù
Form example – per la gestione delle form
Views – per la gestione della gallery
Contenuti personalizzati – per la creazione delle pagine
web
8
11. LABINFO -
Geophysical Data Downloader
Legge dal file di configurazione tutti i dati relativi alle
stazioni inserendoli dinamicamente sulla form di
interrogazione del modulo,
controlla la coerenza logica delle richieste dell'utente
sulla form di interrogazione e mostra eventuali
anomalie (errori dell'utente o mancanza di dati),
interroga il DB per reperire l'indicizzazione dei dati
richiesti nella repository,
realizza un archivio dei dati (tar) e lo invia al browser.
11
14. LABINFO -
Punti di forza
configurabile
inserendo una serie di dati si aggiunge una stazione di
rilevamento
separato dal design del portale: facilmente riutilizzabile
oltre ai SEED, con cambiamenti non radicali è
possibile gestire altri tipi di standard scientifici
14
18. LABINFO -
Conclusioni
È importante condividere i dati geofisici ottenuti dalle
stazioni antartiche con la comunità scientifica
È stato realizzato il portale PANDA per condividere tali
dati in formato miniSEED attraverso il modulo
personalizzato GeoDD
GeoDD è un modulo general purpose riutilizzabile in
un altro portale sviluppato con il CMS Drupal
18
19. LABINFO -
Sviluppi futuri
19
Sarà importante:
poter realizzare un'ulteriore interfaccia interrogabile da
un'altra applicazione automatizzabile
poter gestire in modalità differenti richieste provenienti
da diversi domini
Sarà possibile:
riadattare versioni del modulo per accedere a dati utili in
altri settori di ricerca delle scienze ambientali
(esempi: come la fisica dell'atmosfera e lo studio degli
effetti del Global Change)