Infrastru)ure	
  per	
  il	
  Calcolo	
  Scien3fico	
  
ad	
  Alte	
  Prestazioni	
  in	
  Puglia:	
  il	
  Proge)o	
  
ReCaS	
  
	
  
	
  
Roberto	
  Bello>	
  	
  

Dipar3mento	
  Interateneo	
  di	
  Fisica	
  “M.	
  Merlin”	
  -­‐	
  UNIBA	
  	
  
	
  Is3tuto	
  Nazionale	
  di	
  Fisica	
  Nucleare,	
  Sezione	
  di	
  Bari	
  	
  
1	
  
Sommario	
  
	
  
ü Dal	
  Bari	
  Computer	
  Center	
  for	
  Science	
  
(BC2S)	
  a	
  ReCaS	
  
ü Le	
  risorse	
  
ü I	
  Servizi	
  
ü Gli	
  uten3	
  e	
  le	
  a>vità	
  
ü Formazione	
  e	
  Disseminazione	
  
ü Conclusioni	
  e	
  Prospe>ve	
  
2	
  
Bari	
  Computer	
  Centre	
  for	
  Science	
  
Il	
  Bari	
  Computer	
  Center	
  for	
  Science	
  (Prof.	
  G.	
  Maggi	
  et	
  al.)	
  

• 

Punto	
  di	
  arrivo	
  mol>	
  proge?	
  europei	
  e	
  nazionali	
  di	
  calcolo	
  distribuito	
  

– 
• 
• 
• 
• 
• 

INFN-­‐GRID	
  (2000-­‐2012)	
  
EGEE	
  	
  	
  	
  	
  	
  	
  (1/4/2004-­‐31/3/2006)	
  
EGEE	
  II	
  	
  	
  (1/4/2006-­‐31/3/2008)	
  
EGEE	
  III	
  	
  (1/4/2008-­‐30/4/2010)	
  
EGI-­‐INSPIRE	
  (1/5/2010-­‐	
  in	
  corso)	
  

• 
• 

FIRB	
  LIBI	
  (12/9/2005	
  all’11/9/2011)	
  
Bioinfogrid	
  	
  (1/1/2006	
  al	
  31/12/2007)	
  	
  

–  e	
  dei	
  DATA	
  “challenges”	
  degli	
  esperimen>	
  ad	
  LHC	
  (CMS	
  ed	
  
ALICE)	
  

3	
  
4	
  
BC2S	
  &	
  ReCaS:	
  risorse	
  già	
  disponibili	
  
• 

• 
• 
• 

CPU:	
  
–  4.000	
  Core	
  
–  Circa	
  250	
  nodi	
  di	
  calcolo	
  
GPU:	
  
–  2	
  Tesla	
  C2070	
  
Storage:	
  
–  1.650	
  TB	
  di	
  spazio	
  disco	
  in	
  un	
  unico	
  file-­‐system	
  posix	
  condiviso	
  fra	
  tu?	
  i	
  nodi	
  
(Lustre)	
  
Rete:	
  

–  Ogni	
  nodo	
  di	
  calcolo	
  è	
  capace	
  di	
  sfru_are	
  circa	
  1Gb/s	
  di	
  banda	
  passante	
  sulla	
  rete	
  

• 

Testbed	
  ReCaS:	
  

–  Circa	
  1000	
  core	
  e	
  200	
  TB	
  di	
  spazio	
  disco	
  (distribuito)	
  

	
  
•  Il	
  BC2S	
  è	
  stato	
  inaugurato	
  l’11	
  novembre	
  2009	
  

–  All’epoca	
  disponeva	
  di	
  700	
  CPU	
  logiche,	
  350	
  TB	
  di	
  spazio	
  disco	
  	
  
–  corrispondente	
  ad	
  una	
  potenza	
  informa>ca	
  installata	
  di	
  circa	
  30	
  kW.	
  	
  
–  Oggi	
  la	
  la	
  potenza	
  informa>ca	
  installata	
  è	
  di	
  circa	
  100	
  kW	
  molto	
  vicino	
  al	
  
limite	
  teorico	
  di	
  proge_o	
  (120	
  kW)	
  
5	
  
Proge8o	
  ReCaS:	
  4	
  DATA	
  CENTER	
  nelle	
  sedi	
  
di	
  Bari,	
  Catania,	
  Cosenza	
  e	
  Napoli	
  

"  	
  	
  Finanziamento	
  totale	
  ReCaS:	
  13.7	
  MEuro	
  
(90%	
  Potenziamento,	
  10%	
  Formazione)	
  
	
  

"  	
  	
  INFN	
  (sedi	
  di	
  NA,	
  BA,	
  CT,	
  CS),	
  UNINA,	
  UNIBA	
  
(Budget:	
  6.9	
  INFN,	
  2.1	
  UNINA,	
  4.7	
  UNIBA	
  )	
  

	
  
"  	
  	
  Durata	
  del	
  Proge_o:	
  	
  	
  	
  1	
  o_obre	
  2011	
  –	
  30	
  se_embre	
  2014	
  
6	
  
6	
  
9.55

0.50

9.55

3.50

9.55

3.00

4.50

0.50 0.50

1.53

9.55

0.50

0.50
3.50

3.50

3.50

4.17

0.20
0.80

0.17

sezione longitudinale

Collocazione	
  Edificio	
  

ReCaS	
  sarà	
  circa	
  3	
  volte	
  più	
  grande	
  del	
  Data	
  Center	
  aTuale	
  
7	
  
I	
  Servizi	
  principali	
  offer>	
  
ü  L’accesso	
  all’Infrastru_ura	
  di	
  Grid	
  
Nazionale	
  (IGI)	
  ed	
  europea	
  (EGI)	
  e	
  alla	
  
infrastru_ura	
  WLCG	
  (Worldwide	
  LHC	
  
Compu>ng	
  GRID);	
  
ü  Accesso	
  Intera?vo	
  alle	
  risorse	
  della	
  
farm	
  e	
  la	
  fornitura	
  di	
  servizi	
  su	
  
macchine	
  virtuali	
  
ü  Esecuzione	
  di	
  job	
  paralleli	
  e	
  distribui>	
  
ü  Servizi	
  di	
  “Cloud	
  Storage”	
  
8	
  
Uten>	
  

–  È	
  TIER2	
  degli	
  esperimen>	
  ALICE	
  e	
  CMS	
  (LHC@CERN)	
  
–  È	
  un	
  nodo	
  WLCG	
  (World	
  LHC	
  compu>ng	
  Grid)	
  e	
  di	
  EGI	
  
(European	
  Grid	
  Infrastructure)	
  
–  È	
  fornitore	
  di	
  servizi	
  e	
  risorse	
  nel	
  proge_o	
  europeo	
  
BioVeL	
  (LifeWatch).	
  
–  Fornisce	
  potenza	
  computazionale	
  a	
  tu?	
  gli	
  
esperimen>	
  in	
  cui	
  è	
  implicata	
  la	
  Sezione	
  di	
  Bari	
  
dell’INFN:	
  
•  	
  T2K,	
  Fermi/GLAST	
  e	
  Pamela	
  e	
  per	
  ricerca	
  in	
  Fisica	
  Teorica	
  e	
  
di	
  Fisica	
  Medica.	
  

9	
  
Gli	
  Uten>	
  
Fornisce	
  la	
  potenza	
  computazionale	
  per	
  le	
  a?vità	
  di	
  ricerche	
  	
  
dell’Università	
  di	
  Bari	
  e	
  delle	
  comunità	
  scien>fiche	
  presen>	
  
sul	
  territorio.	
  In	
  par>colare:	
  

–  L’analisi	
  di	
  immagini	
  da	
  satellite	
  (Spin-­‐Off	
  GAP)	
  
–  L’analisi	
  di	
  neuroimmagini	
  	
  
–  Chimica	
  computazionale	
  
–  A?vità	
  di	
  ricerca	
  dei	
  Dipar>men>	
  di	
  Farmacia,	
  	
  	
  	
  
	
  	
  	
  	
  	
  Informa>ca,	
  di	
  Cristallografia.	
  
–  Studi	
  di	
  filogene>ca	
  su	
  da>	
  di	
  biodiversità	
  in	
  collaborazione	
  con	
  
il	
  dipar>mento	
  di	
  biologia	
  e	
  gli	
  is>tu>	
  IBBE	
  ed	
  ITB	
  del	
  CNR	
  
–  Studio	
  di	
  modelli	
  della	
  fisica	
  dell’atmosfera	
  per	
  la	
  generazione	
  
giornaliera	
  di	
  mappe	
  di	
  inquinan>	
  in	
  collaborazione	
  con	
  ARPA-­‐
PUGLIA	
  
10	
  
Coordinamento	
  con	
  altri	
  ProgeB	
  
ProgeTo	
  	
  PON	
  PRISMA	
  (27.5	
  Meuro,	
  Smart	
  Ci>es:	
  DD	
  n	
  84/RIC	
  del	
  2/3/2012	
  )	
  	
  
Obie?vi:	
  sviluppare	
  una	
  pia_aforma	
  "open"	
  interoperabile	
  di	
  cloud	
  compu>ng	
  per	
  i	
  
servizi	
  di	
  e-­‐government	
  	
  
Partner:	
  Reply,	
  Sielte,	
  InnovaPUGLIA,	
  EDP	
  LaTraccia,	
  UNIBA,	
  INFN,	
  UNICT,…	
  
	
  
ProgeTo	
  	
  PON	
  Smart	
  Health	
  (Smart	
  CiXes:	
  DD	
  n	
  84/RIC	
  	
  del	
  2/3/2012	
  )	
  
	
  
ProgeTo	
  	
  PON	
  OPLON	
  (OPportuni>es	
  for	
  ac>ve	
  and	
  healthy	
  LONgevity	
  	
  DD	
  n.	
  391/Ric	
  
del	
  05.07.2012)	
  
Smart	
  Health	
  e	
  OPLON	
  uXlizzeranno	
  la	
  Cloud	
  Open	
  Source	
  di	
  ReCas/PRISMA	
  
	
  
ProgeTo	
  PAC	
  GARR	
  X-­‐Progress	
  (46.5	
  Meuro)	
  	
  	
  
(Infrastru_ura	
  Digitale	
  per	
  promuovere	
  Ricerca,	
  Istruzione	
  e	
  Compe>>vità	
  nel	
  Sud,	
  
Avviso	
  n.	
  274	
  del	
  15/2/2013)	
  	
  
ü  UNIBA	
  è	
  sede	
  del	
  Proge_o	
  di	
  Formazione	
  
ü  ReCaS	
  ospiterà	
  CPU/Storage	
  GARR	
  
	
  
ProgeTo	
  	
  PON	
  OCP	
  (OPEN	
  CITY	
  PLATFORM)	
  (appena	
  approvato,	
  Smart	
  Ci>es:	
  DD	
  n.	
  
391/Ric	
  del	
  05.07.2012)	
  	
  
	
  
11
	
  
PRIN-­‐STOA	
  

CMSprod	
  

Bc2S	
  

	
  
	
  
	
  
	
  
	
  
	
  

Bioinforma>ca	
  
	
  
	
  
	
  
	
  
	
  

PON-­‐
RECAS	
  

PON-­‐OCP	
  

PON-­‐
PRISMA	
  

PON-­‐
SmartHealth	
  

?	
  
MIND	
  

Human	
  
Brain	
  
Project	
  

PON-­‐OPLON	
  

PON-­‐
AMIDHERA	
  

PON	
  GARR-­‐X-­‐
Progress	
  

12	
  
Disseminazione	
  e	
  Formazione	
  
	
  

–  Disseminazione	
  

–  Risorse	
  di	
  storage	
  e	
  di	
  calcolo	
  ai	
  do_orandi	
  di	
  UNIBA	
  

•  (Oggi	
  infa?	
  abbiamo	
  una	
  IaaS	
  cloud	
  sufficientemente	
  stabile)	
  

	
  	
  	
  	
  	
  	
  per	
  estenderlo	
  successivamente	
  ai	
  laureandi	
  e	
  agli	
  studen>.	
  
–  Formazione	
  

Due	
  edizioni	
  del	
  Master	
  “Sviluppo	
  e	
  Ges>one	
  di	
  Data	
  Center	
  per	
  il	
  
Calcolo	
  Scien>fico	
  ad	
  Alte	
  Prestazioni”:	
  la	
  prima	
  edizione	
  si	
  è	
  
conclusa	
  il	
  31	
  o_obre	
  2013	
  (18	
  borse	
  di	
  studio)	
  e	
  la	
  seconda,	
  con	
  
fondi	
  PON	
  PRISMA,	
  vedrà	
  la	
  selezione	
  dei	
  formandi	
  il	
  16	
  dicembre.	
  
Master	
  “Metodologie	
  e	
  tecnologie	
  per	
  lo	
  sviluppo	
  di	
  infrastru_ure	
  
digitali	
  ”	
  in	
  collaborazione	
  con	
  il	
  GARR	
  e	
  UNINA	
  Federico	
  II.	
  
(Formandi	
  in	
  aula	
  a	
  Febbraio	
  2014)	
  

13	
  
Conclusioni	
  e	
  ProspeBve	
  
•  L’Infrastru_ura	
  per	
  il	
  Calcolo	
  Scien>fico	
  ad	
  Alte	
  Prestazioni	
  
ReCaS	
  è	
  in	
  fase	
  di	
  sviluppo	
  e	
  verrà	
  completata	
  entro	
  
dicembre	
  2014.	
  
•  Già	
  allo	
  stato	
  a_uale	
  cos>tuisce	
  una	
  infrastru_ura	
  di	
  calcolo	
  
di	
  riferimento	
  a	
  livello	
  nazionale.	
  	
  
•  Oltre	
  all’u>lizzo	
  per	
  la	
  ricerca	
  fondamentale	
  (fisica	
  delle	
  alte	
  
energie,	
  astrofisica,	
  bioinforma>ca,	
  neuroscienze)	
  sarà	
  
aperta,	
  nei	
  limi>	
  delle	
  finalità	
  del	
  proge_o,	
  anche	
  alle	
  
imprese	
  e	
  alla	
  P.A.	
  	
  
•  I	
  proge?	
  PON	
  PRISMA,	
  SMART	
  HEALTH	
  ed	
  OPLON	
  	
  e	
  GARR-­‐X	
  
PROGRESS	
  –	
  già	
  ammessi	
  a	
  finanziamento	
  –	
  potranno	
  usare	
  
l’infrastru_ura	
  di	
  calcolo/storage	
  ReCaS.	
  
•  La	
  sfida	
  per	
  UNIBA,	
  INFN	
  e	
  per	
  il	
  territorio	
  sarà	
  assicurare	
  la	
  
sostenibilità	
  a	
  lungo	
  termine	
  della	
  InfrastruTura	
  di	
  Calcolo	
  

	
  

14	
  

Roberto Bellotti – Infrastrutture per il Calcolo Scientifico ad Alte Prestazioni in Puglia: il Progetto ReCaS

  • 1.
    Infrastru)ure  per  il  Calcolo  Scien3fico   ad  Alte  Prestazioni  in  Puglia:  il  Proge)o   ReCaS       Roberto  Bello>     Dipar3mento  Interateneo  di  Fisica  “M.  Merlin”  -­‐  UNIBA      Is3tuto  Nazionale  di  Fisica  Nucleare,  Sezione  di  Bari     1  
  • 2.
    Sommario     ü Dal  Bari  Computer  Center  for  Science   (BC2S)  a  ReCaS   ü Le  risorse   ü I  Servizi   ü Gli  uten3  e  le  a>vità   ü Formazione  e  Disseminazione   ü Conclusioni  e  Prospe>ve   2  
  • 3.
    Bari  Computer  Centre  for  Science   Il  Bari  Computer  Center  for  Science  (Prof.  G.  Maggi  et  al.)   •  Punto  di  arrivo  mol>  proge?  europei  e  nazionali  di  calcolo  distribuito   –  •  •  •  •  •  INFN-­‐GRID  (2000-­‐2012)   EGEE              (1/4/2004-­‐31/3/2006)   EGEE  II      (1/4/2006-­‐31/3/2008)   EGEE  III    (1/4/2008-­‐30/4/2010)   EGI-­‐INSPIRE  (1/5/2010-­‐  in  corso)   •  •  FIRB  LIBI  (12/9/2005  all’11/9/2011)   Bioinfogrid    (1/1/2006  al  31/12/2007)     –  e  dei  DATA  “challenges”  degli  esperimen>  ad  LHC  (CMS  ed   ALICE)   3  
  • 4.
  • 5.
    BC2S  &  ReCaS:  risorse  già  disponibili   •  •  •  •  CPU:   –  4.000  Core   –  Circa  250  nodi  di  calcolo   GPU:   –  2  Tesla  C2070   Storage:   –  1.650  TB  di  spazio  disco  in  un  unico  file-­‐system  posix  condiviso  fra  tu?  i  nodi   (Lustre)   Rete:   –  Ogni  nodo  di  calcolo  è  capace  di  sfru_are  circa  1Gb/s  di  banda  passante  sulla  rete   •  Testbed  ReCaS:   –  Circa  1000  core  e  200  TB  di  spazio  disco  (distribuito)     •  Il  BC2S  è  stato  inaugurato  l’11  novembre  2009   –  All’epoca  disponeva  di  700  CPU  logiche,  350  TB  di  spazio  disco     –  corrispondente  ad  una  potenza  informa>ca  installata  di  circa  30  kW.     –  Oggi  la  la  potenza  informa>ca  installata  è  di  circa  100  kW  molto  vicino  al   limite  teorico  di  proge_o  (120  kW)   5  
  • 6.
    Proge8o  ReCaS:  4  DATA  CENTER  nelle  sedi   di  Bari,  Catania,  Cosenza  e  Napoli   "      Finanziamento  totale  ReCaS:  13.7  MEuro   (90%  Potenziamento,  10%  Formazione)     "      INFN  (sedi  di  NA,  BA,  CT,  CS),  UNINA,  UNIBA   (Budget:  6.9  INFN,  2.1  UNINA,  4.7  UNIBA  )     "      Durata  del  Proge_o:        1  o_obre  2011  –  30  se_embre  2014   6   6  
  • 7.
    9.55 0.50 9.55 3.50 9.55 3.00 4.50 0.50 0.50 1.53 9.55 0.50 0.50 3.50 3.50 3.50 4.17 0.20 0.80 0.17 sezione longitudinale Collocazione  Edificio   ReCaS  sarà  circa  3  volte  più  grande  del  Data  Center  aTuale   7  
  • 8.
    I  Servizi  principali  offer>   ü  L’accesso  all’Infrastru_ura  di  Grid   Nazionale  (IGI)  ed  europea  (EGI)  e  alla   infrastru_ura  WLCG  (Worldwide  LHC   Compu>ng  GRID);   ü  Accesso  Intera?vo  alle  risorse  della   farm  e  la  fornitura  di  servizi  su   macchine  virtuali   ü  Esecuzione  di  job  paralleli  e  distribui>   ü  Servizi  di  “Cloud  Storage”   8  
  • 9.
    Uten>   –  È  TIER2  degli  esperimen>  ALICE  e  CMS  (LHC@CERN)   –  È  un  nodo  WLCG  (World  LHC  compu>ng  Grid)  e  di  EGI   (European  Grid  Infrastructure)   –  È  fornitore  di  servizi  e  risorse  nel  proge_o  europeo   BioVeL  (LifeWatch).   –  Fornisce  potenza  computazionale  a  tu?  gli   esperimen>  in  cui  è  implicata  la  Sezione  di  Bari   dell’INFN:   •   T2K,  Fermi/GLAST  e  Pamela  e  per  ricerca  in  Fisica  Teorica  e   di  Fisica  Medica.   9  
  • 10.
    Gli  Uten>   Fornisce  la  potenza  computazionale  per  le  a?vità  di  ricerche     dell’Università  di  Bari  e  delle  comunità  scien>fiche  presen>   sul  territorio.  In  par>colare:   –  L’analisi  di  immagini  da  satellite  (Spin-­‐Off  GAP)   –  L’analisi  di  neuroimmagini     –  Chimica  computazionale   –  A?vità  di  ricerca  dei  Dipar>men>  di  Farmacia,                  Informa>ca,  di  Cristallografia.   –  Studi  di  filogene>ca  su  da>  di  biodiversità  in  collaborazione  con   il  dipar>mento  di  biologia  e  gli  is>tu>  IBBE  ed  ITB  del  CNR   –  Studio  di  modelli  della  fisica  dell’atmosfera  per  la  generazione   giornaliera  di  mappe  di  inquinan>  in  collaborazione  con  ARPA-­‐ PUGLIA   10  
  • 11.
    Coordinamento  con  altri  ProgeB   ProgeTo    PON  PRISMA  (27.5  Meuro,  Smart  Ci>es:  DD  n  84/RIC  del  2/3/2012  )     Obie?vi:  sviluppare  una  pia_aforma  "open"  interoperabile  di  cloud  compu>ng  per  i   servizi  di  e-­‐government     Partner:  Reply,  Sielte,  InnovaPUGLIA,  EDP  LaTraccia,  UNIBA,  INFN,  UNICT,…     ProgeTo    PON  Smart  Health  (Smart  CiXes:  DD  n  84/RIC    del  2/3/2012  )     ProgeTo    PON  OPLON  (OPportuni>es  for  ac>ve  and  healthy  LONgevity    DD  n.  391/Ric   del  05.07.2012)   Smart  Health  e  OPLON  uXlizzeranno  la  Cloud  Open  Source  di  ReCas/PRISMA     ProgeTo  PAC  GARR  X-­‐Progress  (46.5  Meuro)       (Infrastru_ura  Digitale  per  promuovere  Ricerca,  Istruzione  e  Compe>>vità  nel  Sud,   Avviso  n.  274  del  15/2/2013)     ü  UNIBA  è  sede  del  Proge_o  di  Formazione   ü  ReCaS  ospiterà  CPU/Storage  GARR     ProgeTo    PON  OCP  (OPEN  CITY  PLATFORM)  (appena  approvato,  Smart  Ci>es:  DD  n.   391/Ric  del  05.07.2012)       11  
  • 12.
    PRIN-­‐STOA   CMSprod   Bc2S               Bioinforma>ca             PON-­‐ RECAS   PON-­‐OCP   PON-­‐ PRISMA   PON-­‐ SmartHealth   ?   MIND   Human   Brain   Project   PON-­‐OPLON   PON-­‐ AMIDHERA   PON  GARR-­‐X-­‐ Progress   12  
  • 13.
    Disseminazione  e  Formazione     –  Disseminazione   –  Risorse  di  storage  e  di  calcolo  ai  do_orandi  di  UNIBA   •  (Oggi  infa?  abbiamo  una  IaaS  cloud  sufficientemente  stabile)              per  estenderlo  successivamente  ai  laureandi  e  agli  studen>.   –  Formazione   Due  edizioni  del  Master  “Sviluppo  e  Ges>one  di  Data  Center  per  il   Calcolo  Scien>fico  ad  Alte  Prestazioni”:  la  prima  edizione  si  è   conclusa  il  31  o_obre  2013  (18  borse  di  studio)  e  la  seconda,  con   fondi  PON  PRISMA,  vedrà  la  selezione  dei  formandi  il  16  dicembre.   Master  “Metodologie  e  tecnologie  per  lo  sviluppo  di  infrastru_ure   digitali  ”  in  collaborazione  con  il  GARR  e  UNINA  Federico  II.   (Formandi  in  aula  a  Febbraio  2014)   13  
  • 14.
    Conclusioni  e  ProspeBve   •  L’Infrastru_ura  per  il  Calcolo  Scien>fico  ad  Alte  Prestazioni   ReCaS  è  in  fase  di  sviluppo  e  verrà  completata  entro   dicembre  2014.   •  Già  allo  stato  a_uale  cos>tuisce  una  infrastru_ura  di  calcolo   di  riferimento  a  livello  nazionale.     •  Oltre  all’u>lizzo  per  la  ricerca  fondamentale  (fisica  delle  alte   energie,  astrofisica,  bioinforma>ca,  neuroscienze)  sarà   aperta,  nei  limi>  delle  finalità  del  proge_o,  anche  alle   imprese  e  alla  P.A.     •  I  proge?  PON  PRISMA,  SMART  HEALTH  ed  OPLON    e  GARR-­‐X   PROGRESS  –  già  ammessi  a  finanziamento  –  potranno  usare   l’infrastru_ura  di  calcolo/storage  ReCaS.   •  La  sfida  per  UNIBA,  INFN  e  per  il  territorio  sarà  assicurare  la   sostenibilità  a  lungo  termine  della  InfrastruTura  di  Calcolo     14