Similar to Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identificazione di biomarcatori in ambito biomedico, agro-alimentare e ambientale
Similar to Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identificazione di biomarcatori in ambito biomedico, agro-alimentare e ambientale (20)
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identificazione di biomarcatori in ambito biomedico, agro-alimentare e ambientale
1. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Ricerca BIOINFORMATICA e sue
applicazioni per l’identificazione di
biomarcatori in ambito biomedico,
agro-alimentare ed ambientale
CNR – ITB, Bari
Flavio Licciulli
BiP-Day 2013
Bioinformatica in Puglia
Bari, 5 Dicembre 2013
2. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Tematiche di ricerca
Progettazione e sviluppo di strumenti bioinformatici orientati allo
studio della genomica funzionale, trascrittomica e biodiversità
molecolare in ambito biomedico, agro-alimentare e ambientale
Banche dati specializzate e sistemi avanzati per l’integrazione e annotazione
strutturale e funzionale di dati “omici”
Algoritmi e software per l’analisi di dati genomici, trascrittomici, metagenomici e meta-trascrittomici
Pipeline di analisi (workflow) e piattaforme bioinformatiche web-based
www.ba.itb.cnr.it
bioinformatics.ba.itb.cnr.it
Bari, 5 Dicembre 2013
BiP-Day 2013
2
3. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Ambiti applicativi: Linea 1
Studio del ruolo di non-coding RNAs (ncRNAs) nella regolazione dell’espressione
genica ed epigenetica, con particolare attenzione al ruolo dei miRNAs
Caratterizzazione del profilo di espressione di miRNAs nella risposta immunitaria indotta
dai vaccini anti rabbia in Mus musculus (Istituto Superiore di Sanità)
Studi dei profili di espressione di miRNAs/siRNAs e profili di metilazione in piante infette
da virus e viroidi, per lo studio dei meccanismi di protezione nelle piante (CNR-IVV)
Classificazione e identificazione di nuovi miRNAs nel pesco (CNR-IVV)
Studio di miRNAs coinvolti nella regolazione della attività di “multi drug resistance” in linee
cellulari di “cane” geneticamente modificate (UniBA-Dip.Farmacia)
Studio di interazione cross-kingdom tra miRNAs di piante e geni target umani (CNR-IBBR)
Analisi e individuazione di networks di co-regolazione genica mediata dai miRNAs
mediante applicazione di tecnologie di data-mining (UniBA-Dip.Informatica)
Bari, 5 Dicembre 2013
BiP-Day 2013
3
4. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Ambiti applicativi: Linea 2
Bio-medicina: caratterizzazione di profili molecolari
Identificazione di biomarcatori utili allo sviluppo di applicazioni biotecnologiche
mediante analisi del trascrittoma (sindrome di Majewski, malattia di Alzheimer,
sclerosi multipla, cancro del colon) (UniBA-Dip. Scienze Biomed. Oncologia Umana, CNR-IBBE)
Caratterizzazione di agenti microbici coinvolti nell'insorgenza di patologie
autoimmuni mediante analisi su larga scala del trascrittoma (CNR-IBBE)
Studio dell’implicazione del microbioma nell’insorgenza del cancro intestinale
(CNR-IBBE)
Studio di eventi di fusione e riarrangiamento intra-cromosoma in human breast
cancer mediante sequenziamento NGS paired-end (CNR-ITB)
Analisi di profili di espressione di Alternative Splicing in tessuti tumorali (IRCCS
Casa Sollievo della Sofferenza)
Bari, 5 Dicembre 2013
BiP-Day 2013
4
5. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Ambiti applicativi: Linea 3
Studio della biodiversità e sviluppo di applicazioni in ambito
agro-alimentare ed ambientale
Metodi per l’identificazione rapida di specie e studi statistici del
cambiamento della composizione di comunità microbiche e della
mesofauna, basati su approcci di metagenomica (UniMI-Bicocca, CNR-IBBE)
Strumenti bioinformatici per la raccolta, integrazione e analisi di dati di
biodiversità molecolare (Banca dati integrata delle Collezioni di risorse
genetiche) (CNR-DiSBA)
Bari, 5 Dicembre 2013
BiP-Day 2013
5
6. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
COST Action BM1006:
“Next Generation Sequencing Data Analysis Network”
Rete europea di centri esperti nella produzione e analisi di dati NGS
Scambio di dati, protocolli, software, esperienze e idee
‘Technology watch‘ per seguire gli sviluppi:
–
–
–
–
tecnologia NGS
software bioinformatici
archiviazione ed elaborazione dati
visualizzazione dei dati e risultati
Comunicazione, divulgazione, diffusione risultati ed educazione
www.seqahead.eu
www.nextgenerationsequencing.it
Bari, 5 Dicembre 2013
BiP-Day 2013
6
7. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Brevetto Internazionale
No. PCT/IB2011/052369
Metodo per la preparazione e amplificazione di librerie
rappresentative di cDNA per il sequenziamento massivo, loro
uso, kit e cartucce per kit di automazione
Inventori:
Tullo Apollonia (CNR-ITB)
Sbisà Elisabetta (CNR-ITB)
Mangiulli Marina (CNR-IBBE)
Pesole Graziano (CNR-IBBE)
Messa a punto di un PROTOCOLLO UNIVERSALE che permette di
preparare una libreria rappresentativa di cDNA, partendo da quantità
esigue di RNA totale, che può essere utilizzata con tutte le piattaforme di
sequenziamento di nuova generazione presenti sul mercato.
Bari, 5 Dicembre 2013
BiP-Day 2013
8. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Banche dati specializzate e
Sistemi per l’integrazione dati
Banche Dati Specializzate
Organizzazione di dati “proprietari” o sottoinsieme di dati pubblici inerenti a particolari
aspetti biologici
Sistemi per l’integrazione dati
Integrazione di dati pubblici (es. GenBank, GO, …) e sperimentali mediante tecnologie di
federazione/datawarehouse, per l’annotazione funzionale
Estrazione e popolamento mediante procedure ETL (Extraction, Trasformation and Load)
Visualizzazione (front-end) e diffusione web mediante CMS/framework
Banca dati
Gestione, mantenimento e integrazione
delle conoscenze acquisite a livello
globale al fine di rendere tali informazioni
accessibili a tutti!!!
Bari, 5 Dicembre 2013
BiP-Day 2013
8
9. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Banche dati specializzate (esempi)
Meeting Istituto di Tecnologie Biomediche
10. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Banche dati specializzate (esempi)
Bari, 5 Dicembre 2013
BiP-Day 2013
11. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Banche dati specializzate (esempi)
Bari, 5 Dicembre 2013
BiP-Day 2013
11
12. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Sistemi per l’Integrazione Dati (esempi)
MBLabDB: il SocialDB per la Biodiversità
Un “data-integration system” che mediante tecniche di federazione dinamica di dati e di
data-warehouse mette insieme dati e conoscenze provenienti da database pubblici
(GenBank, Sequence Ontology), collezioni/database privati (es. ITEM Collection) e
annotazioni utente.
Bari, 5 Dicembre 2013
BiP-Day 2013
12
13. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Algoritmi e software per l’analisi di dati “omics”
Algoritmi per l’annotazione genomica (CSTminer, GenoMiner)
Algoritmi di pattern matching e discovery (PatSearch, CleanUP, Wordup)
Algoritmo (data-mining) per l’analisi di network di interazione miRNAs-geni target
14. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Piattaforme Bioinformatiche per l’analisi di dati sperimentali
Gestione e integrazione di grandi quantità di dati provenienti da
esperimenti condotti con tecnologie NGS, microarray, …
database pubblici (Genbank, Refseq, Ensembl, …)
Sviluppo e implementazione di pipeline e software bioinformatici per l’analisi
Sviluppo di interfacce grafiche per la visualizzazione dei dati
Diffusione via Web applications e Web Services
Bari, 5 Dicembre 2013
BiP-Day 2013
14
15. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Esempio1: Piattaforma per l’analisi di dati sperimentali (exon array)
BEAT: Bioinformatic Exon Array Tool
Analisi dello Splicing Alternativo in tessuti tumorali
Analisi multivariata sfruttando i dati di cartella clinica
Rappresentazione dei risultati tramite tabelle e grafici interattivi
Gestione dati mediante datawarehouse
Dai dati sperimentali all’interpretazione dei risultati
Bari, 5 Dicembre 2013
BiP-Day 2013
http://beat.ba.itb.cnr.it
15
16. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Esempio2: Piattaforma per l’analisi di dati sperimentali (NGS)
Ribosomal
RNA
Classificazione e analisi di
ncRNAs generati da NGS
ncRNAs
Reads
Identificazione e
classificazione delle reads
representanti ncRNAs
Data
Warehouse
Expression profile analysis
Bari, 5 Dicembre 2013
BiP-Day 2013
16
17. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Esempio3: Pipeline per l’analisi di dati sperimentali (NGS)
Pipeline per la predizione di nuovi miRNAs usando dati di esperimenti small-RNA Seq
Bari, 5 Dicembre 2013
BiP-Day 2013
17
18. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Esempio4: Servizi e pipeline di analisi per la Biodiversità
• Phylogenetic services set in BioVeL FP7 project (www.biovel.eu)
• Service for Phylogenetic inference, model testing, phylogenetic partitioning
of environmental sequence accessible over a web Portal powered by web
services and orchestrated by a workflow engine (Taverna)
•
Partnership: INFN@bari, IBBE, Uni. of Cardiff, Manchester, Eastern Finland, Gothenburg, Berlin,
Amsterdam, and Max Planck @Bremen, NCB Naturalis, Hungarian Academy of Sciences, FRB,
Fraunhofer.
Play workflow over the web
Define evolutionary
model
Partition phylogenetic diversity
across sample localities
19. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
Infrastruttura Informatica
più di 100 CPU-core (GPU Tesla), server con 1TB RAM e circa 80TB di spazio disco
HPC Server “magilla”
- HP Proliant DL-560 Gen8, 4x CPU Intel® Xeon™ E5-4600 (8-core), 1 TB RAM
- DAS storage 40 TB
Development HPC Server “cerbero”
- HP Proliant DL-580, 4 CPU Quad-Core Xeon 2.4Ghz, 32 GB RAM
- NAS storage 6 TB
Roche GSFLX Titanium Cluster “flxitb”
- 1 Head node with 2 Intel Dual core 2.33GHz, 16GB RAM
- 4 Node slave with 2 Intel Dual core 2.33GHz, 4 GB RAM
- Local storage 6 TB
Production HTC CLUSTER Server “beagle” (ex EGEE-INFN Grid)
- Master node: HP Proliant DL-380, 2 CPU Quad-Core Xeon,
- 15 Slave nodes: HP Proliant DL-140 , 2 CPU Dual-Core
- NAS Storage 2 TB
TESLA/CUDA Development Server (HPC) “popeye”
Team:
Flavio Licciulli
Nicola Losito
Bari, 5 Dicembre 2013
- 2 CPU Quad-Core Xeon 2.26Ghz, 96 GB RAM
- TESLA hw: 1 PNY Quadro NVS290 + 2 Nvidia Tesla C1060
- Local storage 8 TB
Connettività Internet (GARR): 100Mb
BiP-Day 2013
20. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
LABORATORI E PIATTAFORMA NGS
Bari, 5 Dicembre 2013
BiP-Day 2013
20
21. Consiglio Nazionale delle Ricerche
Istituto di Tecnologie Biomediche, sede di Bari
ITB-BA Bioinformatics Team
La multidisciplinarietà della bioinformatica
Sabino Liuni
Flavio Licciulli
Andreas Gisel
Giorgio Grillo
Biologia
Informatica
Domenica D’Elia
Saverio Vicario
Lab people:
Sbisà Elisabetta
Perlino Elda
Giorgio De Caro
Bioinformatica
Matematica
Fisica
Arianna Consiglio
Nicola Losito
Angelica Tulipano
Tullo Apollonia
Liguori Maria
www.ba.itb.cnr.it
Caratozzolo Mariano
bioinformatics.ba.itb.cnr.it
Marzano Flaviana
Bari, 5 Dicembre 2013
BiP-Day 2013
21