I progetti PON ReCaS e
PRISMA: le possibili ricadute
sulla bioinformatica pugliese
Giacinto DONVITO
INFN-Bari
Outline
❖ INFN – who we are
❖ Descrizione del PON ReCaS
❖ Stato del PON ReCaS
❖ Descrizione del PON PRISMA
❖ Servizi e risultati del PON PRISMA
❖ Conclusioni
INFN: chi siamo
❖ Il gruppo INFN-Bari ha un focus specifico nel supporto alle attività di Data
Analysis in vari contesti scientifici
❖ esperimenti di LHC, Bioinformatica, Analisi immagini mediche, Chimica
computazionale, Cristallografia, analisi immagini da satellite, etc
❖ INFN gestisce una delle maggiori infrastrutture di calcolo a livello nazionale
basata su circa 50'000 cores e oltre 30Pbyte di spazio di archiviazione distribuiti
in circa 20 siti.
❖ La infrastruttura Grid viene utilizzata con straordinario successo da
esperimenti grandi e piccoli a cui INFN partecipa a livello nazionale e
internazionale
INFN e Cloud Computing
❖ INFN partecipa ad infrastrutture di calcolo di livello europeo e
mondiale come EGI e WLCG, sia nel campo del grid computing
che del Cloud Computing (EGI Federated Cloud Task Force)
❖ INFN utilizza l'enorme esperienza acquisita nel design,
sviluppo ed implementazione di infrastrutture di calcolo
distribuite, come quella necessaria all'analisi dell'enorme
quantità di dati prodotti da LHC, per la gestione delle
infrastrutture Cloud ed enormi quantità di dati (Big Data)
INFN involvement in the LHC project
Exploration of a new energy frontier
in p-p and Pb-Pb collisions
LHC ring:
27 km circumference
CMS
ALICE
LHCb
ATLAS
Bari Computer Centre for Science

Dipartimento di Fisica (UNIBA) & INFN
❖ Bc2S (Bari Computer Center for Science) è il Data Center di INFN-
Bari per il calcolo scientifico, che attualmente si compone di circa
4000 core e 2 PB di storage
❖ Rappresenta il punto di arrivo di una serie di progetti, sia europei
sia nazionali
❖ progetti EGEE ed EGI-INSPIRE attraverso cui è stata realizzata
l’Infrastruttura di GRID europea
❖ i progetti di collaborazione con la comunità di bioinformatica
barese, il progetto Bioinfogrid, LIBI (FIRB) e BioVeL
Il progetto PON- ReCaS
❖ ReCaS (Rete di Calcolo per SuperB e altre applicazioni) è un progetto PON Ricerca
e Competitività 2007-2013, finanziato complessivamente per 13.7 milioni di Euro
❖ "potenziamento infrastrutturale” - realizzazione di un'infrastruttura di calcolo
distribuita nelle quattro regioni della convergenza: Calabria, Campania, Puglia
e Sicilia.
❖ Infrastruttura realizzata in ottica Grid e Cloud computing che si distinguerà
per la potenza di calcolo e la capacità di memorizzazione di dati (capacità circa
raddoppiate)
❖ Supporto alle comunità degli esperimenti al Large Hadron Collider (LHC)
❖ Supporto a comunità diverse in settori strategici della scienza: la Fisica, la
Medicina, le Biotecnologie e l'Ambiente
❖ Infrastruttura per favorire la creazione di Distretti e Laboratori Pubblico Privati
e la collaborazione con PMI (sviluppo del territorio) e Pubblica
Amministrazione (Smart Cities & Urban App)
Il progetto PON- ReCaS
❖ Nuovo edificio su due piani con una superficie di 430
metri quadri per piano di cui 180 per ospitare i servizi e
270 per le risorse informatiche:
❖ a regime 4 isole da 20 Rack da 12,5 kW/rack
❖ Sistema UPS: 2 unità Trinergy (Emerson) da 800 kW (con
possibilità di espansione fino a 1200 kW)
❖ Gruppo elettrogeno da 1500 kVA
13’000
Cpu Core
5.6 PByte
Storage
2.5 PByte
Tape
800 Cpu Core
HPC
20 NVIDIA K40
Il progetto PON- ReCaS
3-SALA SERVER
1-ATRIO
268 m²
+0.00
36,30 m²
N
+0.20
+0.17
H 365
H 365
+0.12
+0.10
Edificio esistente
Orto botanico
+0.00
ACCESSO
PENDENZA
10%
RAMPA
DISABILE
8%
POSTO AUTO
+0.17
ACCESSO ESTERNO CARRABILE
ACCESSO
PRINCIPALE
+0.10+0.10
+0.17
+0.10+0.10+0.10
Deposito
ACCESSO
CABINA
200
245
200
245
PORTA GRIGLIATA
1 2 3 4
5 6 7 8
+0.00
+0.17
1.1A
1.2A
1.1B
1.2B
RIF. AUT.
QGBT
TR2 - 1600kVA
RIF. AUT.
QGBT
TR2 - 1600kVA
QMT
5-CABINA
74,75 m²
H 365
CDZ08+BP/UM
1.86 1.00 1.50 1.00 1.20 1.50 1.20 1.20 1.50 1.20 1.20 1.50 1.20
2.714.204.51
CDZ06
CDZ 01 CDZ 04+BP/UM
QGBT
Q.AUX.CAB
1.70 1.50 1.50 1.87
PORTA CON GRIGLIA
Smin Areazione: 30 cm²
1.3A
1.3B
1.4A
1.4B
1.5A
1.5B
1.6A
1.6B
1.7A
1.7B
1.8A
1.8B
2.1A
2.2A
2.1B
2.2B
2.3A
2.3B
2.4A
2.4B
2.5A
2.5B
2.6A
2.6B
2.7A
2.7B
2.8A
2.8B
3.1A
3.2A
3.1B
3.2B
3.3A
3.3B
3.4A
3.4B
3.5A
3.5B
3.6A
3.6B
3.7A
3.7B
3.8A
3.8B
3.9A
3.9B
3.10A
3.10B
4.1A
4.2A
4.1B
4.2B
4.3A
4.3B
4.4A
4.4B
4.5A
4.5B
4.6A
4.6B
4.7A
4.7B
4.8A
4.8B
4.9A
4.9B
4.10A
4.10B
5.1A
5.2A
5.1B
5.2B
5.3A
5.3B
5.4A
5.4B
5.5A
5.5B
5.6A
5.6B
5.7A
5.7B
5.8A
5.8B
5.9A
5.9B
5.10A
5.10B
6.1A
6.2A
6.1B
6.2B
6.3A
6.3B
6.4A
6.4B
6.5A
6.5B
6.6A
6.6B
6.7A
6.7B
6.8A
6.8B
6.9A
6.9B
6.10A
6.10B
7.1A
7.2A
7.1B
7.2B
7.3A
7.3B
7.4A
7.4B
8.1A
8.2A
8.1B
8.2B
508 3167
3675
8 495 5 43 65 954 65 954 65 954 65
1195
40675238
427112211370308308
783210126
200120
300 20 120 25 2356 25 425 13 329 23
45525 7 2362 25 767 231143
860132642323
1137
5173520634341
10675864
1019
2675 128 80 100 349 188 155
179 30
330173680
11838220
102
7520
13020130
220945
9619086
3675
3410191019582
8623889086013
Il progetto PON- ReCaS
❖ Cablaggio di tutto il campus universitario per collegare a
multipli di 1Gbit/s tutti i dipartimenti:
❖ In questo modo gli utenti potranno beneficiare in modo
immediato delle risorse di calcolo e storage messi a
disposizione di ReCaS.
Gli utenti, i progetti e le collaborazioni
PRISMA: PIATTAFORME CLOUD INTEROPERABILI
PER SMART-GOVERNMENT
❖ PON 2007-2013 - Avviso 84 Ric./2012
❖ SMART CITIES AND COMMUNITIES AND SOCIAL INNOVATION
❖ AMBITO: Cloud Computing per smart technologies
❖ Costo del Progetto: 27.5 M€ (termine maggio 2015)
❖ Il Progetto PRISMA sviluppa una piattaforma innovativa aperta e
interoperabile di Cloud Computing per i servizi di eGovernment della
Pubblica Amministrazione Locale.
❖ applicazioni:
❖ Sanità
❖ e-Government
❖ Rischio sismico
PRISMA: i servizi
❖ Macchine virtuali
❖ Tramite semplici interfacce grafiche
PRISMA: i servizi
❖ Desktop as a Service
PRISMA: i servizi
❖ RStudio server
PRISMA: i servizi
❖ IPython Notebook Server
PRISMA: i servizi
❖ ownCloud
PRISMA: i servizi
❖ Piattaforma Cloud Open Source per Code Collaboration
❖ Version control
❖ Repository Git Privati
❖ 1TB storage
PRISMA: i servizi
Archivio(
ARPA((
Pentaho(
BI(Server(
Pentaho(
Report(
Designer(
Data(sources(
Visualizzazione(
Report(
Creazione/
pubblicazione(
Report(
ReCaS & PRISMA: use-cases
❖ Analisi di neuroimmagini
❖ Master, Tutorial e corsi
❖ Data preservation
❖ Attività di ricerca dei Dipartimenti di Farmacia,
Informatica, Cristallografia.
❖ Bioinformatica in collaborazione con il dipartimento di
biologia e gli istituti IBBE ed ITB del CNR:
❖ Analisi da Next Generation Sequencing
❖ Studi di filogenetica su dati di biodiversità in
collaborazione con il dipartimento di biologia e gli
istituti IBBE ed ITB del CNR

BiPday 2014 -- Donvito Giacinto

  • 1.
    I progetti PONReCaS e PRISMA: le possibili ricadute sulla bioinformatica pugliese Giacinto DONVITO INFN-Bari
  • 2.
    Outline ❖ INFN –who we are ❖ Descrizione del PON ReCaS ❖ Stato del PON ReCaS ❖ Descrizione del PON PRISMA ❖ Servizi e risultati del PON PRISMA ❖ Conclusioni
  • 3.
    INFN: chi siamo ❖Il gruppo INFN-Bari ha un focus specifico nel supporto alle attività di Data Analysis in vari contesti scientifici ❖ esperimenti di LHC, Bioinformatica, Analisi immagini mediche, Chimica computazionale, Cristallografia, analisi immagini da satellite, etc ❖ INFN gestisce una delle maggiori infrastrutture di calcolo a livello nazionale basata su circa 50'000 cores e oltre 30Pbyte di spazio di archiviazione distribuiti in circa 20 siti. ❖ La infrastruttura Grid viene utilizzata con straordinario successo da esperimenti grandi e piccoli a cui INFN partecipa a livello nazionale e internazionale
  • 4.
    INFN e CloudComputing ❖ INFN partecipa ad infrastrutture di calcolo di livello europeo e mondiale come EGI e WLCG, sia nel campo del grid computing che del Cloud Computing (EGI Federated Cloud Task Force) ❖ INFN utilizza l'enorme esperienza acquisita nel design, sviluppo ed implementazione di infrastrutture di calcolo distribuite, come quella necessaria all'analisi dell'enorme quantità di dati prodotti da LHC, per la gestione delle infrastrutture Cloud ed enormi quantità di dati (Big Data) INFN involvement in the LHC project Exploration of a new energy frontier in p-p and Pb-Pb collisions LHC ring: 27 km circumference CMS ALICE LHCb ATLAS
  • 5.
    Bari Computer Centrefor Science
 Dipartimento di Fisica (UNIBA) & INFN ❖ Bc2S (Bari Computer Center for Science) è il Data Center di INFN- Bari per il calcolo scientifico, che attualmente si compone di circa 4000 core e 2 PB di storage ❖ Rappresenta il punto di arrivo di una serie di progetti, sia europei sia nazionali ❖ progetti EGEE ed EGI-INSPIRE attraverso cui è stata realizzata l’Infrastruttura di GRID europea ❖ i progetti di collaborazione con la comunità di bioinformatica barese, il progetto Bioinfogrid, LIBI (FIRB) e BioVeL
  • 6.
    Il progetto PON-ReCaS ❖ ReCaS (Rete di Calcolo per SuperB e altre applicazioni) è un progetto PON Ricerca e Competitività 2007-2013, finanziato complessivamente per 13.7 milioni di Euro ❖ "potenziamento infrastrutturale” - realizzazione di un'infrastruttura di calcolo distribuita nelle quattro regioni della convergenza: Calabria, Campania, Puglia e Sicilia. ❖ Infrastruttura realizzata in ottica Grid e Cloud computing che si distinguerà per la potenza di calcolo e la capacità di memorizzazione di dati (capacità circa raddoppiate) ❖ Supporto alle comunità degli esperimenti al Large Hadron Collider (LHC) ❖ Supporto a comunità diverse in settori strategici della scienza: la Fisica, la Medicina, le Biotecnologie e l'Ambiente ❖ Infrastruttura per favorire la creazione di Distretti e Laboratori Pubblico Privati e la collaborazione con PMI (sviluppo del territorio) e Pubblica Amministrazione (Smart Cities & Urban App)
  • 7.
    Il progetto PON-ReCaS ❖ Nuovo edificio su due piani con una superficie di 430 metri quadri per piano di cui 180 per ospitare i servizi e 270 per le risorse informatiche: ❖ a regime 4 isole da 20 Rack da 12,5 kW/rack ❖ Sistema UPS: 2 unità Trinergy (Emerson) da 800 kW (con possibilità di espansione fino a 1200 kW) ❖ Gruppo elettrogeno da 1500 kVA 13’000 Cpu Core 5.6 PByte Storage 2.5 PByte Tape 800 Cpu Core HPC 20 NVIDIA K40
  • 8.
    Il progetto PON-ReCaS 3-SALA SERVER 1-ATRIO 268 m² +0.00 36,30 m² N +0.20 +0.17 H 365 H 365 +0.12 +0.10 Edificio esistente Orto botanico +0.00 ACCESSO PENDENZA 10% RAMPA DISABILE 8% POSTO AUTO +0.17 ACCESSO ESTERNO CARRABILE ACCESSO PRINCIPALE +0.10+0.10 +0.17 +0.10+0.10+0.10 Deposito ACCESSO CABINA 200 245 200 245 PORTA GRIGLIATA 1 2 3 4 5 6 7 8 +0.00 +0.17 1.1A 1.2A 1.1B 1.2B RIF. AUT. QGBT TR2 - 1600kVA RIF. AUT. QGBT TR2 - 1600kVA QMT 5-CABINA 74,75 m² H 365 CDZ08+BP/UM 1.86 1.00 1.50 1.00 1.20 1.50 1.20 1.20 1.50 1.20 1.20 1.50 1.20 2.714.204.51 CDZ06 CDZ 01 CDZ 04+BP/UM QGBT Q.AUX.CAB 1.70 1.50 1.50 1.87 PORTA CON GRIGLIA Smin Areazione: 30 cm² 1.3A 1.3B 1.4A 1.4B 1.5A 1.5B 1.6A 1.6B 1.7A 1.7B 1.8A 1.8B 2.1A 2.2A 2.1B 2.2B 2.3A 2.3B 2.4A 2.4B 2.5A 2.5B 2.6A 2.6B 2.7A 2.7B 2.8A 2.8B 3.1A 3.2A 3.1B 3.2B 3.3A 3.3B 3.4A 3.4B 3.5A 3.5B 3.6A 3.6B 3.7A 3.7B 3.8A 3.8B 3.9A 3.9B 3.10A 3.10B 4.1A 4.2A 4.1B 4.2B 4.3A 4.3B 4.4A 4.4B 4.5A 4.5B 4.6A 4.6B 4.7A 4.7B 4.8A 4.8B 4.9A 4.9B 4.10A 4.10B 5.1A 5.2A 5.1B 5.2B 5.3A 5.3B 5.4A 5.4B 5.5A 5.5B 5.6A 5.6B 5.7A 5.7B 5.8A 5.8B 5.9A 5.9B 5.10A 5.10B 6.1A 6.2A 6.1B 6.2B 6.3A 6.3B 6.4A 6.4B 6.5A 6.5B 6.6A 6.6B 6.7A 6.7B 6.8A 6.8B 6.9A 6.9B 6.10A 6.10B 7.1A 7.2A 7.1B 7.2B 7.3A 7.3B 7.4A 7.4B 8.1A 8.2A 8.1B 8.2B 508 3167 3675 8 495 5 43 65 954 65 954 65 954 65 1195 40675238 427112211370308308 783210126 200120 300 20 120 25 2356 25 425 13 329 23 45525 7 2362 25 767 231143 860132642323 1137 5173520634341 10675864 1019 2675 128 80 100 349 188 155 179 30 330173680 11838220 102 7520 13020130 220945 9619086 3675 3410191019582 8623889086013
  • 9.
    Il progetto PON-ReCaS ❖ Cablaggio di tutto il campus universitario per collegare a multipli di 1Gbit/s tutti i dipartimenti: ❖ In questo modo gli utenti potranno beneficiare in modo immediato delle risorse di calcolo e storage messi a disposizione di ReCaS.
  • 10.
    Gli utenti, iprogetti e le collaborazioni
  • 11.
    PRISMA: PIATTAFORME CLOUDINTEROPERABILI PER SMART-GOVERNMENT ❖ PON 2007-2013 - Avviso 84 Ric./2012 ❖ SMART CITIES AND COMMUNITIES AND SOCIAL INNOVATION ❖ AMBITO: Cloud Computing per smart technologies ❖ Costo del Progetto: 27.5 M€ (termine maggio 2015) ❖ Il Progetto PRISMA sviluppa una piattaforma innovativa aperta e interoperabile di Cloud Computing per i servizi di eGovernment della Pubblica Amministrazione Locale. ❖ applicazioni: ❖ Sanità ❖ e-Government ❖ Rischio sismico
  • 12.
    PRISMA: i servizi ❖Macchine virtuali ❖ Tramite semplici interfacce grafiche
  • 13.
    PRISMA: i servizi ❖Desktop as a Service
  • 14.
    PRISMA: i servizi ❖RStudio server
  • 15.
    PRISMA: i servizi ❖IPython Notebook Server
  • 16.
  • 17.
    PRISMA: i servizi ❖Piattaforma Cloud Open Source per Code Collaboration ❖ Version control ❖ Repository Git Privati ❖ 1TB storage
  • 18.
  • 19.
    ReCaS & PRISMA:use-cases ❖ Analisi di neuroimmagini ❖ Master, Tutorial e corsi ❖ Data preservation ❖ Attività di ricerca dei Dipartimenti di Farmacia, Informatica, Cristallografia. ❖ Bioinformatica in collaborazione con il dipartimento di biologia e gli istituti IBBE ed ITB del CNR: ❖ Analisi da Next Generation Sequencing ❖ Studi di filogenetica su dati di biodiversità in collaborazione con il dipartimento di biologia e gli istituti IBBE ed ITB del CNR