SlideShare a Scribd company logo
CNR – Istituto di Tecnologie Biomediche di Bari
nc-aReNA: an integrated
resource for small non-coding
RNA functional annotation
Angelica Tulipano
Small non-coding RNAs
(sncRNAs) serve as
regulatory molecules in
a number of different
organisms
 MicroRNA (miRNA): post-transcriptional regulatory genes
 PIWI-interacting RNA (piRNA): germline transposon silencing
 Small interfering RNA (siRNA): active molecules in RNA interference
 Small nuclear RNA (snRNA): includes spliceosomal RNAs.
 Small nucleolar RNA (snoRNA): involved in rRNA modification
 Long non-coding RNA (lncRNA): little is known about them, involved
in mRNA regulation
The RNA World
BiP-Day, 19 Dicembre 2014
To address these questions, new systematic gene-discovery approaches need
to be developed that are specifically aiming at the ncRNA discovery
High-Throughput Sequencing technologies enable such a research
The new spectrum of NGS applications together with the massive amount of
data requires focused investments and development of bioinformatics tools
managing and analysing such complex and large datasets to infer biological
meaning.
Why non-coding RNA?
• How many ncRNA genes are there?
• How important are they?
• Which functions does a cell delegate to RNA
instead of protein and why?
BiP-Day, 19 Dicembre 2014
The RNA World
 Identification and classification of reads in known functional ncRNA classes
and dataset export
 Identification and filtering of reads mapping to ribosomal RNAs and mtDNA
transcripts
 Quantification of ncRNA expression and differential expression analysis
 Graphical visualization of sample expression profiles in different conditions
and at different time courses
 Creation of a collection of unclassified reads, useful for the prediction of
novel ncRNAs
A bioinformatics pipeline to classify and analyze
small non-coding RNAs (sncRNAs) in deep RNA sequencing
BiP-Day, 19 Dicembre 2014
The ITB nc-aReNA Platform
Differential
expression
Bioinformatics workflow for ncRNA analyses
BiP-Day, 19 Dicembre 2014
Raw Sequencing
Data
Adapter &
Barcode
identification
and removal
Size filtering &
General Statistics
Cleaned Sequence
Data (fastq, fasta)
Reads Mapping
data-warehouse
Quality control
check
isomiR
identification
Sequence Processing:
Adapter & Barcode identification and removal
 detect barcode sequence and separate multiplexed experiments
 trim barcode and 3’-adapter fragment
3’ adapter
~20 bases
barcode
(if multiplexed)
4-6 bases
small RNA
18-30 bases
5’ adapter
BiP-Day, 19 Dicembre 2014
Sequence Processing
BiP-Day, 19 Dicembre 2014
QC check and general statistics
FastQC: A Quality Control tool for High Throughput
Sequence Data
http://www.bioinformatics.babraham.ac.uk/projec
ts/fastqc/ by S. Andrews
Reads Mapping:
BiP-Day, 19 Dicembre 2014
Bowtie
Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient
alignment of short DNA sequences to the human genome. Genome Biol 10:R25.
Mapping on
ncRNADB
reference
Mapping on
reference genome
unmapped
mapped
annotated
not
annotated
unmappedmapped
classified
ncRNA
classified
ncRNA
Export
cleaned
sequences
data-warehouse
miRNA
precursors
isomiR
identification
Ribosomal RNAs
ncRNAs
Reference
database
redundancy
identification &
removal
GENCODE
Data Sources
The ncRNA Reference Database
BiP-Day, 19 Dicembre 2014
 Reference database contains several classes of ncRNAs
 Some reads map to more than one reference sequence in
different classes
 Software dealing with multiple mapping: RSEM
BiP-Day, 19 Dicembre 2014
Li and Dewey, RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome
BMC Bioinformatics 2011, 12:323
Multiple mapping: Multireads
Example of multimapping:
processed_transcript | miRNA_primary_transcript
lincRNA | miRNA_primary_transcript
antisense | miRNA_primary_transcript
lncRNA | miRNA_primary_transcript
rRNA | piRNA
rRNA | lincRNA
lincRNA | snoRNA
snoRNA | piRNA
IsomiRs
IsomiRs are defined as variations (isoforms) of a
mature microRNA
These variants were originally dismissed as
experimental artifacts
IsomiRs have demonstrated to be actively associated
with the RISC and the mRNA translation machinery
IsomiRs are real physiological miRNA variants
BiP-Day, 19 Dicembre 2014
IsomiR Variants
 “Incorrect” or alternative Dicer cleavage: length variations
 RNA editing: nucleotide additions, sequence variants
BiP-Day, 19 Dicembre 2014
AGCGACAGCUGGCUACUGGGU
AGCUACAUCUGGCUACUGGGU
GCGACAUCUGGCUACUGGGU
AAGCGACAUCUGGCUACUGGGU
GCAGCGACAUCUGGCUACUGGGU
AGCGACAUCUGGCUACUGGG
AGCGACAUCUGGCUACUGGGUU
AGCGACAUCUGGCUACUGGGUCU
AGCGACAUCUGGCUACUGGGU
Polymorphic
IsomiRs
AAUCAGCAGCGACAUCUGGCUACUGGGUCUCUGAU
3’ IsomiRs
5’ IsomiRs
Canonical miRNA
Pre-miR
sequence
Mature miRNA-sequence
IsomiR identification: isomiRID
de Oliveira LF, Christoff AP, Margis R. isomiRID: a framework to identify microRNA isoforms, Bioinformatics. 2013 Oct 15;29(20):2521-3
BiP-Day, 19 Dicembre 2014
Differential expression analysis
Comparison of ncRNA counts in different experimental
conditions:
- sample vs. control
- time course samples
Statistical test:
- Fisher test (no biological replicates)
- T-test or Wilcoxon test (with biological replicates)
BiP-Day, 19 Dicembre 2014
nc-aReNA pipeline design
BiP-Day, 19 Dicembre 2014
Test Case 1: ncRNA classification
BiP-Day, 19 Dicembre 2014
rRNA 47.1%
miRNA_primary_transcript
46.2%
piRNA 2.9%
tRNA 2.3%
snoRNA 0.7% lncRNA 0.2%
lincRNA 0.2%
ncRNA counts
categories
Test Case 2: DE analysis
BiP-Day, 19 Dicembre 2014
Characterization of miRNA expression profiles
in Mus musculus time course dataset
Test Case 2
BiP-Day, 19 Dicembre 2014
data-warehouse
Gene Ontology
ncRNA
expression
profile
BioinformaticsAnalyses
small
RNA-Seq
TarBase
Characterization of miRNAs expression
profiles in Mus musculus time course dataset
Metadata
•Mus musculus
•Muscle & Skin
•T0: Mock
•T1: 3 hrs
•T2: 24 hrs
ncRNA research activities
BiP-Day, 19 Dicembre 2014
 Immune response in mouse
 Plant – Viroid interactions in peach tree, grapevine
and tobacco
 Multidrug resistence in dog cell lines
 miRNA driven methylation profile in Arabidopsis
 miRNAs expression profile in Amyotrophic Lateral
Sclerosis and interaction with biomarkers of clinical
feature
Collaborations
CNR – IVV, Bari
• Francesco Di Serio
• Beatriz Navarro
• Livia Stavolone
• Fabrizio Cillo
University of Bari
Dept. of Pharmacy
• Nicola Colabufo
• Antonio Carrieri
CSIC – UPV, Valencia, Spain
• Ricardo Flores
Work in progress:
 Web portal
 Statistical analysis of isomiR variants
 Prediction of novel miRNA
The Team
BiP-Day, 19 Dicembre 2014
Consiglio Arianna
De Caro Giorgio
D’Elia Domenica
Gisel Andreas
Grillo Giorgio
Licciulli Flavio
Liuni Sabino
Losito Nicola
Tulipano Angelica
Thanks for your attention!
BiP-Day, 19 Dicembre 2014

More Related Content

What's hot

Analytical Study of Hexapod miRNAs using Phylogenetic Methods
Analytical Study of Hexapod miRNAs using Phylogenetic MethodsAnalytical Study of Hexapod miRNAs using Phylogenetic Methods
Analytical Study of Hexapod miRNAs using Phylogenetic Methods
cscpconf
 
5th RNA-Seq San Francisco Agenda
5th RNA-Seq San Francisco Agenda5th RNA-Seq San Francisco Agenda
5th RNA-Seq San Francisco Agenda
Diane McKenna
 
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Nathan Olson
 
Next Generation Sequencing application in virology
Next Generation Sequencing application in virologyNext Generation Sequencing application in virology
Next Generation Sequencing application in virology
Eben Titus
 
Next generation sequencing in pharmacogenomics
Next generation sequencing in pharmacogenomicsNext generation sequencing in pharmacogenomics
Next generation sequencing in pharmacogenomicsDr. Gerry Higgins
 
Genomics & Epigenomics
Genomics & EpigenomicsGenomics & Epigenomics
Genomics & Epigenomicsgumccomm
 
Improved Algorithm for Amplicon Sequencing Assay Designs
Improved Algorithm for Amplicon Sequencing Assay DesignsImproved Algorithm for Amplicon Sequencing Assay Designs
Improved Algorithm for Amplicon Sequencing Assay Designs
Thermo Fisher Scientific
 
11.06.13 - 2013 NIH Research Festival Poster
11.06.13 - 2013 NIH Research Festival Poster11.06.13 - 2013 NIH Research Festival Poster
11.06.13 - 2013 NIH Research Festival PosterFarhoud Faraji
 
Microbial sequencing
Microbial sequencingMicrobial sequencing
Microbial sequencing
Dynah Perry
 
International Journal of Engineering Research and Development
International Journal of Engineering Research and DevelopmentInternational Journal of Engineering Research and Development
International Journal of Engineering Research and Development
IJERD Editor
 
The Application of Next Generation Sequencing (NGS) in cancer treatment
The Application of Next Generation Sequencing (NGS) in cancer treatmentThe Application of Next Generation Sequencing (NGS) in cancer treatment
The Application of Next Generation Sequencing (NGS) in cancer treatment
Premadarshini Sai
 
Applications of microarray
Applications of microarrayApplications of microarray
Applications of microarray
sana shakeel
 
Bioinformatics and NGS for advancing in hearing loss research
Bioinformatics and NGS for advancing in hearing loss researchBioinformatics and NGS for advancing in hearing loss research
Bioinformatics and NGS for advancing in hearing loss research
Joaquin Dopazo
 
NetBioSIG2012 anyatsalenko-en-viz
NetBioSIG2012 anyatsalenko-en-vizNetBioSIG2012 anyatsalenko-en-viz
NetBioSIG2012 anyatsalenko-en-viz
Alexander Pico
 
Digging into thousands of variants to find disease genes in Mendelian and com...
Digging into thousands of variants to find disease genes in Mendelian and com...Digging into thousands of variants to find disease genes in Mendelian and com...
Digging into thousands of variants to find disease genes in Mendelian and com...
Joaquin Dopazo
 
Integrated genetic and transcriptional analysis at the single-cell level
Integrated genetic and transcriptional analysis at the single-cell levelIntegrated genetic and transcriptional analysis at the single-cell level
Integrated genetic and transcriptional analysis at the single-cell level
Jean Fan
 
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
Jean Fan
 
Platforms CIBERER and INB-ELIXIR-es
Platforms CIBERER and INB-ELIXIR-esPlatforms CIBERER and INB-ELIXIR-es
Platforms CIBERER and INB-ELIXIR-es
Joaquin Dopazo
 
IJSRED-V2I1P5
IJSRED-V2I1P5IJSRED-V2I1P5
IJSRED-V2I1P5
IJSRED
 
Wp mi script_preamp_0613_lr
Wp mi script_preamp_0613_lrWp mi script_preamp_0613_lr
Wp mi script_preamp_0613_lrElsa von Licy
 

What's hot (20)

Analytical Study of Hexapod miRNAs using Phylogenetic Methods
Analytical Study of Hexapod miRNAs using Phylogenetic MethodsAnalytical Study of Hexapod miRNAs using Phylogenetic Methods
Analytical Study of Hexapod miRNAs using Phylogenetic Methods
 
5th RNA-Seq San Francisco Agenda
5th RNA-Seq San Francisco Agenda5th RNA-Seq San Francisco Agenda
5th RNA-Seq San Francisco Agenda
 
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
Next Generation Sequencing for Identification and Subtyping of Foodborne Pat...
 
Next Generation Sequencing application in virology
Next Generation Sequencing application in virologyNext Generation Sequencing application in virology
Next Generation Sequencing application in virology
 
Next generation sequencing in pharmacogenomics
Next generation sequencing in pharmacogenomicsNext generation sequencing in pharmacogenomics
Next generation sequencing in pharmacogenomics
 
Genomics & Epigenomics
Genomics & EpigenomicsGenomics & Epigenomics
Genomics & Epigenomics
 
Improved Algorithm for Amplicon Sequencing Assay Designs
Improved Algorithm for Amplicon Sequencing Assay DesignsImproved Algorithm for Amplicon Sequencing Assay Designs
Improved Algorithm for Amplicon Sequencing Assay Designs
 
11.06.13 - 2013 NIH Research Festival Poster
11.06.13 - 2013 NIH Research Festival Poster11.06.13 - 2013 NIH Research Festival Poster
11.06.13 - 2013 NIH Research Festival Poster
 
Microbial sequencing
Microbial sequencingMicrobial sequencing
Microbial sequencing
 
International Journal of Engineering Research and Development
International Journal of Engineering Research and DevelopmentInternational Journal of Engineering Research and Development
International Journal of Engineering Research and Development
 
The Application of Next Generation Sequencing (NGS) in cancer treatment
The Application of Next Generation Sequencing (NGS) in cancer treatmentThe Application of Next Generation Sequencing (NGS) in cancer treatment
The Application of Next Generation Sequencing (NGS) in cancer treatment
 
Applications of microarray
Applications of microarrayApplications of microarray
Applications of microarray
 
Bioinformatics and NGS for advancing in hearing loss research
Bioinformatics and NGS for advancing in hearing loss researchBioinformatics and NGS for advancing in hearing loss research
Bioinformatics and NGS for advancing in hearing loss research
 
NetBioSIG2012 anyatsalenko-en-viz
NetBioSIG2012 anyatsalenko-en-vizNetBioSIG2012 anyatsalenko-en-viz
NetBioSIG2012 anyatsalenko-en-viz
 
Digging into thousands of variants to find disease genes in Mendelian and com...
Digging into thousands of variants to find disease genes in Mendelian and com...Digging into thousands of variants to find disease genes in Mendelian and com...
Digging into thousands of variants to find disease genes in Mendelian and com...
 
Integrated genetic and transcriptional analysis at the single-cell level
Integrated genetic and transcriptional analysis at the single-cell levelIntegrated genetic and transcriptional analysis at the single-cell level
Integrated genetic and transcriptional analysis at the single-cell level
 
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
Spatial transcriptome profiling by MERFISH reveals sub-cellular RNA compartme...
 
Platforms CIBERER and INB-ELIXIR-es
Platforms CIBERER and INB-ELIXIR-esPlatforms CIBERER and INB-ELIXIR-es
Platforms CIBERER and INB-ELIXIR-es
 
IJSRED-V2I1P5
IJSRED-V2I1P5IJSRED-V2I1P5
IJSRED-V2I1P5
 
Wp mi script_preamp_0613_lr
Wp mi script_preamp_0613_lrWp mi script_preamp_0613_lr
Wp mi script_preamp_0613_lr
 

Similar to BiPday 2014 -- Tulipano Angelica

Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
eventi-ITBbari
 
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
Thermo Fisher Scientific
 
Bro gef mi_rna_0212_lr
Bro gef mi_rna_0212_lrBro gef mi_rna_0212_lr
Bro gef mi_rna_0212_lrElsa von Licy
 
Emergingroleo fmi rnainmedicalsciences
Emergingroleo fmi rnainmedicalsciencesEmergingroleo fmi rnainmedicalsciences
Emergingroleo fmi rnainmedicalsciences
karenbbs
 
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
QIAGEN
 
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
QIAGEN
 
140127 abrf interlaboratory study proposal
140127 abrf interlaboratory study proposal140127 abrf interlaboratory study proposal
140127 abrf interlaboratory study proposalGenomeInABottle
 
Sample to Insight: RNA Samples Infographic
Sample to Insight: RNA Samples InfographicSample to Insight: RNA Samples Infographic
Sample to Insight: RNA Samples Infographic
QIAGEN
 
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
SSR Institute of International Journal of Life Sciences
 
Graziano Pesole - il progetto EPIGEN
Graziano Pesole - il progetto EPIGENGraziano Pesole - il progetto EPIGEN
Graziano Pesole - il progetto EPIGEN
eventi-ITBbari
 
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
QIAGEN
 
Analyzing Fusion Genes Using Next-Generation Sequencing
Analyzing Fusion Genes Using Next-Generation SequencingAnalyzing Fusion Genes Using Next-Generation Sequencing
Analyzing Fusion Genes Using Next-Generation Sequencing
QIAGEN
 
Transcriptomics approaches
Transcriptomics approachesTranscriptomics approaches
Transcriptomics approaches
CharupriyaChauhan1
 
3 - RT-qPCR.pdf
3 - RT-qPCR.pdf3 - RT-qPCR.pdf
3 - RT-qPCR.pdf
ssuser432659
 
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
QIAGEN
 

Similar to BiPday 2014 -- Tulipano Angelica (20)

Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
Ernesto Picardi – Bioinformatica e genomica comparata: nuove strategie sperim...
 
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
Massively Parallel Sequencing - integrating the Ion PGM™ sequencer into your ...
 
Bro gef mi_rna_0212_lr
Bro gef mi_rna_0212_lrBro gef mi_rna_0212_lr
Bro gef mi_rna_0212_lr
 
Emergingroleo fmi rnainmedicalsciences
Emergingroleo fmi rnainmedicalsciencesEmergingroleo fmi rnainmedicalsciences
Emergingroleo fmi rnainmedicalsciences
 
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
Targeted RNAseq for Gene Expression Using Unique Molecular Indexes (UMIs): In...
 
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
Meeting the challenges of miRNA research: miRNA and its Role in Human Disease...
 
Mi rna toss_set
Mi rna toss_setMi rna toss_set
Mi rna toss_set
 
Mi rna array 2013
Mi rna array 2013Mi rna array 2013
Mi rna array 2013
 
140127 abrf interlaboratory study proposal
140127 abrf interlaboratory study proposal140127 abrf interlaboratory study proposal
140127 abrf interlaboratory study proposal
 
Mi rna brochure_set
Mi rna brochure_setMi rna brochure_set
Mi rna brochure_set
 
Sample to Insight: RNA Samples Infographic
Sample to Insight: RNA Samples InfographicSample to Insight: RNA Samples Infographic
Sample to Insight: RNA Samples Infographic
 
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
Clinical Analysis of Long Non-coding RNA (LncRNA): Therapeutic Targeting of T...
 
Mi rna part ii_2013
Mi rna part ii_2013Mi rna part ii_2013
Mi rna part ii_2013
 
Graziano Pesole - il progetto EPIGEN
Graziano Pesole - il progetto EPIGENGraziano Pesole - il progetto EPIGEN
Graziano Pesole - il progetto EPIGEN
 
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
Extending miRQC’s dynamic range: amplifying the view of Limiting RNA samples ...
 
Analyzing Fusion Genes Using Next-Generation Sequencing
Analyzing Fusion Genes Using Next-Generation SequencingAnalyzing Fusion Genes Using Next-Generation Sequencing
Analyzing Fusion Genes Using Next-Generation Sequencing
 
Mirnapcrarray
MirnapcrarrayMirnapcrarray
Mirnapcrarray
 
Transcriptomics approaches
Transcriptomics approachesTranscriptomics approaches
Transcriptomics approaches
 
3 - RT-qPCR.pdf
3 - RT-qPCR.pdf3 - RT-qPCR.pdf
3 - RT-qPCR.pdf
 
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
Advanced Real-Time PCR Array Technology – Coding and Noncoding RNA Expression...
 

More from eventi-ITBbari

BiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario SaverioBiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario Saverioeventi-ITBbari
 
BiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole GrazianoBiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole Grazianoeventi-ITBbari
 
BiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola MariangelaBiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola Mariangelaeventi-ITBbari
 
BiPday 2014 -- Notarangelo Pasquale
BiPday 2014 -- Notarangelo PasqualeBiPday 2014 -- Notarangelo Pasquale
BiPday 2014 -- Notarangelo Pasqualeeventi-ITBbari
 
BiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito GiacintoBiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito Giacintoeventi-ITBbari
 
BiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta RitaBiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta Ritaeventi-ITBbari
 
BiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima RosannaBiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima Rosannaeventi-ITBbari
 
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della BioeconomyIBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
eventi-ITBbari
 
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
eventi-ITBbari
 
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
eventi-ITBbari
 
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
eventi-ITBbari
 
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems MedicineNicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
eventi-ITBbari
 
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
eventi-ITBbari
 
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
eventi-ITBbari
 
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
eventi-ITBbari
 
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
eventi-ITBbari
 
Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”
eventi-ITBbari
 
Eusoft scegliere un LIMS per la ricerca NGS
Eusoft scegliere un LIMS per la ricerca NGSEusoft scegliere un LIMS per la ricerca NGS
Eusoft scegliere un LIMS per la ricerca NGS
eventi-ITBbari
 
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
eventi-ITBbari
 
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
eventi-ITBbari
 

More from eventi-ITBbari (20)

BiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario SaverioBiPday 2014 -- Vicario Saverio
BiPday 2014 -- Vicario Saverio
 
BiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole GrazianoBiPday 2014 -- Pesole Graziano
BiPday 2014 -- Pesole Graziano
 
BiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola MariangelaBiPday 2014 -- Santorsola Mariangela
BiPday 2014 -- Santorsola Mariangela
 
BiPday 2014 -- Notarangelo Pasquale
BiPday 2014 -- Notarangelo PasqualeBiPday 2014 -- Notarangelo Pasquale
BiPday 2014 -- Notarangelo Pasquale
 
BiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito GiacintoBiPday 2014 -- Donvito Giacinto
BiPday 2014 -- Donvito Giacinto
 
BiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta RitaBiPday 2014 -- De Molfetta Rita
BiPday 2014 -- De Molfetta Rita
 
BiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima RosannaBiPday 2014 -- Clima Rosanna
BiPday 2014 -- Clima Rosanna
 
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della BioeconomyIBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
IBM Italia, Bari – La Bioinformatica nelle prospettive della Bioeconomy
 
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
Exprivia – Incorporazione ed utilizzo di dati genomici nella cartella clinica...
 
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
Maria A. Diroma – MEWAs: sviluppo di un sistema bioinformatico per studi di a...
 
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
Massimo Carella – Analisi delle varianti genomiche da metodiche high-throughp...
 
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems MedicineNicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
Nicola Ancona – Dall’Intelligenza Artificiale alla Systems Medicine
 
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
Maria Svelto – il Distretto H-BIO Puglia: sfide ed opportunità per la Bioinfo...
 
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
Elvira Tarsitano – Bioinformatica e scienze omiche, il ruolo della formazione...
 
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
Pasquale Saldarelli – La piattaforma genomica di sequenziamento massivo della...
 
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
Domenico Catalano – Bioinformatica applicata a dati di genomica e trascrittom...
 
Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”Piero Larizza – “La Robotica nella Bioinformatica”
Piero Larizza – “La Robotica nella Bioinformatica”
 
Eusoft scegliere un LIMS per la ricerca NGS
Eusoft scegliere un LIMS per la ricerca NGSEusoft scegliere un LIMS per la ricerca NGS
Eusoft scegliere un LIMS per la ricerca NGS
 
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
Michelangelo Ceci – Tecniche di data-mining per la caratterizzazione di entit...
 
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
Flavio Licciulli – Ricerca bioinformatica e sue applicazioni per l’identifica...
 

BiPday 2014 -- Tulipano Angelica

  • 1. CNR – Istituto di Tecnologie Biomediche di Bari nc-aReNA: an integrated resource for small non-coding RNA functional annotation Angelica Tulipano
  • 2. Small non-coding RNAs (sncRNAs) serve as regulatory molecules in a number of different organisms  MicroRNA (miRNA): post-transcriptional regulatory genes  PIWI-interacting RNA (piRNA): germline transposon silencing  Small interfering RNA (siRNA): active molecules in RNA interference  Small nuclear RNA (snRNA): includes spliceosomal RNAs.  Small nucleolar RNA (snoRNA): involved in rRNA modification  Long non-coding RNA (lncRNA): little is known about them, involved in mRNA regulation The RNA World BiP-Day, 19 Dicembre 2014
  • 3. To address these questions, new systematic gene-discovery approaches need to be developed that are specifically aiming at the ncRNA discovery High-Throughput Sequencing technologies enable such a research The new spectrum of NGS applications together with the massive amount of data requires focused investments and development of bioinformatics tools managing and analysing such complex and large datasets to infer biological meaning. Why non-coding RNA? • How many ncRNA genes are there? • How important are they? • Which functions does a cell delegate to RNA instead of protein and why? BiP-Day, 19 Dicembre 2014 The RNA World
  • 4.  Identification and classification of reads in known functional ncRNA classes and dataset export  Identification and filtering of reads mapping to ribosomal RNAs and mtDNA transcripts  Quantification of ncRNA expression and differential expression analysis  Graphical visualization of sample expression profiles in different conditions and at different time courses  Creation of a collection of unclassified reads, useful for the prediction of novel ncRNAs A bioinformatics pipeline to classify and analyze small non-coding RNAs (sncRNAs) in deep RNA sequencing BiP-Day, 19 Dicembre 2014 The ITB nc-aReNA Platform
  • 5. Differential expression Bioinformatics workflow for ncRNA analyses BiP-Day, 19 Dicembre 2014 Raw Sequencing Data Adapter & Barcode identification and removal Size filtering & General Statistics Cleaned Sequence Data (fastq, fasta) Reads Mapping data-warehouse Quality control check isomiR identification
  • 6. Sequence Processing: Adapter & Barcode identification and removal  detect barcode sequence and separate multiplexed experiments  trim barcode and 3’-adapter fragment 3’ adapter ~20 bases barcode (if multiplexed) 4-6 bases small RNA 18-30 bases 5’ adapter BiP-Day, 19 Dicembre 2014
  • 7. Sequence Processing BiP-Day, 19 Dicembre 2014 QC check and general statistics FastQC: A Quality Control tool for High Throughput Sequence Data http://www.bioinformatics.babraham.ac.uk/projec ts/fastqc/ by S. Andrews
  • 8. Reads Mapping: BiP-Day, 19 Dicembre 2014 Bowtie Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25. Mapping on ncRNADB reference Mapping on reference genome unmapped mapped annotated not annotated unmappedmapped classified ncRNA classified ncRNA Export cleaned sequences data-warehouse miRNA precursors isomiR identification
  • 9. Ribosomal RNAs ncRNAs Reference database redundancy identification & removal GENCODE Data Sources The ncRNA Reference Database BiP-Day, 19 Dicembre 2014
  • 10.  Reference database contains several classes of ncRNAs  Some reads map to more than one reference sequence in different classes  Software dealing with multiple mapping: RSEM BiP-Day, 19 Dicembre 2014 Li and Dewey, RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome BMC Bioinformatics 2011, 12:323 Multiple mapping: Multireads Example of multimapping: processed_transcript | miRNA_primary_transcript lincRNA | miRNA_primary_transcript antisense | miRNA_primary_transcript lncRNA | miRNA_primary_transcript rRNA | piRNA rRNA | lincRNA lincRNA | snoRNA snoRNA | piRNA
  • 11. IsomiRs IsomiRs are defined as variations (isoforms) of a mature microRNA These variants were originally dismissed as experimental artifacts IsomiRs have demonstrated to be actively associated with the RISC and the mRNA translation machinery IsomiRs are real physiological miRNA variants BiP-Day, 19 Dicembre 2014
  • 12. IsomiR Variants  “Incorrect” or alternative Dicer cleavage: length variations  RNA editing: nucleotide additions, sequence variants BiP-Day, 19 Dicembre 2014 AGCGACAGCUGGCUACUGGGU AGCUACAUCUGGCUACUGGGU GCGACAUCUGGCUACUGGGU AAGCGACAUCUGGCUACUGGGU GCAGCGACAUCUGGCUACUGGGU AGCGACAUCUGGCUACUGGG AGCGACAUCUGGCUACUGGGUU AGCGACAUCUGGCUACUGGGUCU AGCGACAUCUGGCUACUGGGU Polymorphic IsomiRs AAUCAGCAGCGACAUCUGGCUACUGGGUCUCUGAU 3’ IsomiRs 5’ IsomiRs Canonical miRNA Pre-miR sequence Mature miRNA-sequence
  • 13. IsomiR identification: isomiRID de Oliveira LF, Christoff AP, Margis R. isomiRID: a framework to identify microRNA isoforms, Bioinformatics. 2013 Oct 15;29(20):2521-3 BiP-Day, 19 Dicembre 2014
  • 14. Differential expression analysis Comparison of ncRNA counts in different experimental conditions: - sample vs. control - time course samples Statistical test: - Fisher test (no biological replicates) - T-test or Wilcoxon test (with biological replicates) BiP-Day, 19 Dicembre 2014
  • 16. Test Case 1: ncRNA classification BiP-Day, 19 Dicembre 2014 rRNA 47.1% miRNA_primary_transcript 46.2% piRNA 2.9% tRNA 2.3% snoRNA 0.7% lncRNA 0.2% lincRNA 0.2% ncRNA counts categories
  • 17. Test Case 2: DE analysis BiP-Day, 19 Dicembre 2014 Characterization of miRNA expression profiles in Mus musculus time course dataset
  • 18. Test Case 2 BiP-Day, 19 Dicembre 2014 data-warehouse Gene Ontology ncRNA expression profile BioinformaticsAnalyses small RNA-Seq TarBase Characterization of miRNAs expression profiles in Mus musculus time course dataset Metadata •Mus musculus •Muscle & Skin •T0: Mock •T1: 3 hrs •T2: 24 hrs
  • 19. ncRNA research activities BiP-Day, 19 Dicembre 2014  Immune response in mouse  Plant – Viroid interactions in peach tree, grapevine and tobacco  Multidrug resistence in dog cell lines  miRNA driven methylation profile in Arabidopsis  miRNAs expression profile in Amyotrophic Lateral Sclerosis and interaction with biomarkers of clinical feature Collaborations CNR – IVV, Bari • Francesco Di Serio • Beatriz Navarro • Livia Stavolone • Fabrizio Cillo University of Bari Dept. of Pharmacy • Nicola Colabufo • Antonio Carrieri CSIC – UPV, Valencia, Spain • Ricardo Flores Work in progress:  Web portal  Statistical analysis of isomiR variants  Prediction of novel miRNA
  • 20. The Team BiP-Day, 19 Dicembre 2014 Consiglio Arianna De Caro Giorgio D’Elia Domenica Gisel Andreas Grillo Giorgio Licciulli Flavio Liuni Sabino Losito Nicola Tulipano Angelica
  • 21. Thanks for your attention! BiP-Day, 19 Dicembre 2014

Editor's Notes

  1. Abbiamo sviluppato nc-arena, una piattaforma integrata per l’analisi e l’annotazione funzionale di small-ncRNA provenienti da dati di sequenziamento NGS
  2. E’ ormai noto come la complessità biologica sia correlata con la percentuale di genoma che non è protein-coding: nel caso dei mammiferi solo il 2% del genoma codifica per RNA messaggero, la maggior parte è trascritta come long e short non coding RNA, molecole funzionali che risultano regolatori chiave in numerosi processi cellulari. I ncRNA sono classificati in molte differenti categorie a seconda della loro attività funzionale, ad esempio silenziamento genico trascrizionale e post-trascrizionale, disgenesi degli ibridi, inattivazione del cromosoma X.
  3. Tuttavia sono molte le questioni ancora aperte sul mondo ncRNA: Quanti tipi di ncRNA ci sono? Che importanza hanno? Quali funzioni vengono delegate a loro da una cellula, anzichè ad una proteina? Per dare delle risposte adeguate a queste domande è necessario sviluppare approcci di gene discovery finalizzati alla scoperta e allo studio del ncRNA. Le tecnologie NGS rendono possibile una tale ricerca. L’ampio spettro di applicazioni che esse hanno, insieme all’enorme quantità di dati che producono, rendono necessari sforzi e investimenti per lo sviluppo di tools bionformatici per la gestione e l’analisi di tali dataset per ottenerne nuova conoscenza biologica. (In the figure: X-chromosome inactivation (XCI) in mammals relies on XIST, a long noncoding transcript that coats and silences the X chromosome in cis)
  4. ncaReNA è una piattaforma bioinformatica che include una serie di pipeline e strumenti per la: Identificazione e classificazione di reads in classi funzionali di ncRNA, con la possibilità di esportare i dati L’individuazione di reads che mappano su RNA ribosomiale e trascritti di DNA mitocondriale La quantificazione dell’espressione del ncRNA e l’analisi di espressione differenziale La visualizzazione grafica dei profili di espressioni dei vari campioni in differenti condizioni o a differenti tempi La creazione del set di reads nn classificate che possono essere utilizzate per la predizione di nuovi ncRNA
  5. Questo è lo schema generale del workflow di ncaReNA: i dati grezzi di sequenziamento passano attraverso un primo step di processing delle sequenze, un secondo step di mappaggio e annotazione funzionale delle sequenze e poi altre funzionalità come l’analisi di espressione differenziale e l’identificazione di isomir. Tutti i dataset risultanti da tali passi sono raccolti in un datawarehouse locale da cui possono essere esportati dall’utente
  6. La prima fase di reads processing prevede la ricerca e la rimozione del frammento di adattatore 3’ nelle reads; in caso di sequenziamento di esperimenti multipli, essi si differenziano per il frammento di barcode nella read: in tal caso si cercano i diversi barcode per separare gli esperimenti e viene fatto il trimming del frammento
  7. Le reads così processate vengono analizzate da un tool per il controllo di qualità, FASTQC. Con esso l’utente ottiene grafici relativi alla qualità delle sequenze (come la distribuzione dl quality score per base) e a utili statistiche, come la distribuzione delle lunghezze delle reads
  8. La seconda fase di mapping consiste nel mapping tramite l’algoritmo bowtie. Dapprima le reads sono mappate su un reference database di ncRNA. Le sequenze che mappano danno quindi la classificazione nelle diverse categorie di ncRNA. Tra queste vengono selezionate in particolare I precursori di miRNA per l’identificazione di isomer. Le reads che non mappano sulla reference nc vengono mappate sul genoma di riferimento dell’organism.. Le reads che mappano sul genoma sono divise in reads annotate, che quindi vanno ad aggiungersi ai ncRNA individuate nella prima fase,, e in reads non annotate. Queste possono rappresentare potenziali nuovi ncRNA da ricercare mediante algoritmi di predizione come mirdeep. Le reads che non mappano neanche sul genoma possono rappresentare artefatti o contaminazioni e con un assembly potrebbero dare infomazioni in merito. Tutti I risultati del mapping sono raccolti nel dw e possono essere esportati dlal’utente per ulteriori analisi. Al momento sono inclusi genomi di uomo, mouse e arabidopsis., mentre nel reference non coding db vi sono anche altre specie, dato che I due processi di mapping sono indipendenti
  9. Il database di riferimento dei ncRNA creato appositamente per la piattaforma raccoglie tutte le informazioni dai maggiori database per il mappaggio e l’annotazione dei ncRNA, assicurando così una completezza di informazioni. La ridondanza dei dati relativi alla stessa classe provenienti da differenti sorgenti è eliminata utilizzando cross-link e identità di sequenza
  10. Il database di riferimento nncoding contine diverse classi di ncRNA e si osserva che frequentemente una stessa reads può mappare su diverse classi e quindi essere classificata in maniera nn univoca. Il problema del multimapping in letteratura viene spesso non considerato, scartando a priori tali reads. Noi abbiamo implementato nella piattaforma RSEM, un software adatto a trattare il multiple mapping: utilizzando l’output del mapping corregge il conteggio degli allineamenti con un metodo probabilistico probabilistico, usando metodi bayesiani
  11. Sulla piattaforma ncarena è stata aggiunta inoltre la possibilità per l’utente di individuare e annotare gli isomir. Queste sono variazioni (isoforme) di un maturo miRNA.
  12. Vi sono due tipi principali di varianti isomir, dovute a un errato o alternativo taglio da parte del Dicer o d RNA editing. La classificazione degli isomir si basa su tre principali categorie: 5′, 3′ e polymorphic isomiRs
  13. Il software che abbiamo implementato nella piattaforma per la ricerca delle isoforme è isomiRID. Esso prende come input le reads annotate come precursori di miRNA e ne fornisce gli eventuali isomir trovati con le relative frequenze.
  14. Se l’utente ha differenti dataset la piattaforma dà la possibilità di effettuare l’analisi di espressione differenziale confrontando i conteggi dei ncRNA nelle differenti condizioni sperimentali: campione vs controllo, differenti tempi. l’utente può scegliere tra due tipi di test statistici, a seconda che vi siano o meno repliche biologiche.
  15. Questo è il design del processing della pipeline. Il processo è stato disegnato e implementato utilizzando pentaho data integration tool (pdi), che ha la caratteristica di essere modulare e quindi facilemente modificabile.
  16. Abbiamo testato la pattaforma su dataset disponibili su banche dati pubbliche. Questo ad esempio è il risultato della classificazione dei ncrna nelle diverse categorie con relativi grafici.
  17. Abbiamo anche testato la piattaforma su dei dati di Mus Musculus da piattaforma Illumina per la caratterizzazione dei profile di espressione di miRNA a 3 differenti tempi. Questa è la visualizzaizone grafica dei risultati dell’analisi di espressione differenziale. Attraverso questa interfaccia grafica l’utente può navigare attraverso risultati e l’annotazione degli smallRNA.
  18. L’annotazione funzionale dei risultati di espressione differenziale è stata ottenuta attraverso l’integrazione nel datawerhouse di GO, Sequence Ontology e Pathway database e microRna target interaction databases
  19. Stiamo lavorando allo siluppo del portale web per rendere accessibile pubblicamente il sistema. http://ncarena.ba.itb.cnr.it Inoltre stiamo implementando anche la possibilità di effettuare l’analisi statistica degli isomir e vogliamo implementare mirdeep come algoritmo per la predizione dei novel miRNA. Con la piattaforma abbiamo già analizzato dati di sequenziamento nell’ambito di alcune collaborazioni, su umano, topo e anche piante, ottimizzandone in questa maniera funzionalità e caratteristiche.
  20. La realizzazione della piattaforma è frutto del lavoro di tutto il gruppo di biornformatica dell’itb.