FROM ZERO TO NEXTFLOW
Luca Cozzuto
Bioinformatics Core Facility
Bioinformatics Unit@CRG
• Julia Ponomarenko
• Luca Cozzuto
• Toni Hermoso
• Sarah Bonnin
Core facility typical workflow
User
Standardised
analysis
Non standard
analysis
Building a database
Reproducing an analysis…
Chipseq
RNAseq
SNP calling …
Core facility typical workflow
User
Standardised
analysis
Non standard
analysis
Semi-automatic
pipelines
Chipseq
RNAseq
SNP calling …
Building a database
Reproducing an analysis…
Core facility typical workflow
User
Standardised
analysis
Non standard
analysis
Bunch of tools,
custom scripts, R
magics etc..
Semi-automatic
pipelines
Chipseq
RNAseq
SNP calling …
Building a database
Reproducing an analysis…
Core facility typical workflow
User
Standardised
analysis
Non standard
analysis
Bunch of tools,
custom scripts, R
magics etc..
Semi-automatic
pipelines
50%50%
Core facility typical workflow
Genomics
39%
Database
15%
Microbiome
12%
RNA-seq
18%
ChIP-seq
13%
Microarray &
HTqPCR
3%
Hours by type of projects (2015 & 2016 )
Core facility typical workflow
Genomics
39%
Database
15%
Microbiome
12%
RNA-seq
18%
ChIP-seq
13%
Microarray &
HTqPCR
3%
Hours by type of projects (2015 & 2016 )
Why nextflow?
• Standard analysis:
• Automation, parallelization, portability, reproducibility
(together with containers).
• NF allows adding new steps without pain (thanks to isolation
of processes) in a collaborative way
[After 2 years] Can you redo the SAME analysis with new samples?
Why nextflow?
• Standard analysis:
• Automation, parallelization, portability, reproducibility
(together with containers)
• NF allows adding new steps without pain (thanks to isolation
of processes) in a collaborative way
• Non standard analysis can benefit too:
• NF code is easy to reuse / modify. It is polyglot!
• Using containers prevent several problems like portability, OS
upgrade, libraries / version mismatch, etc.
Our experience
First day with NextFlow
Our experience
Progressionincoding
Time
Documentation / examples
Our experience
Progressionincoding
Time
Our experience
Progressionincoding
Time
Invite Paolo for a coffee
Our experience
Progressionincoding
Time
Our experience
Progressionincoding
Time
Second coffee
Our experience
Progressionincoding
Time
Start using the Gitter Chat
Our experience
Progressionincoding
Time
Asking to the Singularity Google Group
RNAseq pipeline ver 0.1
RNAseq pipeline ver 0.2
Our experience
Now we are developing / developed:
• ChIPseq pipeline
• RNAseq pipeline
• small RNAseq pipeline
• SNP calling procedures (based on GATK)
Standard analysis
Our experience
Now we are developing / developed:
• ChIPseq pipeline
• RNAseq pipeline
• small RNAseq pipeline
• SNP calling procedures (based on GATK)
• Pipeline for analysis or single cell transcriptome
• Detection of plant resistant genes …
NON standard
Standard analysis
Future ideas
• Semi-automatic reports
• A CMS able to mine the NextFlow logfile and store both
metadata and logs
• Maybe a simple graphical interface to compete / complement
with Galaxy?
Thanks!
Bioinformatics Unit@CRG
• Julia Ponomarenko
• Luca Cozzuto
• Toni Hermoso
• Sarah Bonnin
Our experience
We started developing a pipeline for single cell sequencing.
Analysis of single cell sequencing
A concrete case: analysis of single cell sequencing
Pair 1 (cell)
Chunks
Chunks
Chunks
Split
Filtering
/alignment
Parallel
Mapped tags
Mapped tags
Mapped tags
Joining the
results
Genome file
Indexing
Index
Pair 2 (gene)
Expression
per cell

From Zero to Nextflow 2017

Editor's Notes

  • #4 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #5 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #6 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #7 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #8 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #9 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #10 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #11 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #12 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #13 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #14 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #15 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #16 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #17 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #18 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #19 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #20 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #21 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #22 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #23 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #24 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #26 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.
  • #27 Si nosotros queremos hacer un resumen de todo el proyecto podría ser esto.