The document discusses DNA microarrays, including their applications, history, major steps, methods of construction, and technical issues. DNA microarrays allow analysis of gene expression across thousands of genes simultaneously. They have been used since the 1990s and are constructed by attaching DNA probes to a solid surface in a high-density array. Two main types are cDNA-based microarrays using amplified cDNA and oligonucleotide-based arrays like Affymetrix GeneChips containing short DNA sequences.
Genome sequencing involves obtaining blocks of DNA sequences and assembling them into contiguous stretches of sequence and ultimately the whole genome. This provides a starting point for research into thousands of diseases with a genetic basis. Automated DNA sequencing still uses Sanger's chain termination method but is now more accurate and faster. Emerging methods include sequencing by hybridization, mass spectrophotometry, and single molecule techniques. Future applications include individual genome sequencing using nanotechnology to study gene expression and interactions on a large scale.
This document provides an overview of next generation sequencing (NGS) technologies. It discusses the history and evolution of DNA sequencing, from early manual methods developed by Sanger to modern high-throughput NGS approaches. Key NGS methods described include Illumina sequencing by synthesis, Ion Torrent semiconductor sequencing, 454 pyrosequencing, and SOLiD ligation sequencing. Compared to Sanger, NGS allows massively parallel sequencing of many samples at lower cost and higher throughput. While NGS has advanced biological research, each method still has advantages and limitations related to read length, accuracy, and cost.
This document discusses several methods for gene sequencing, including Sanger sequencing, 454 technology, and sequence assembly. Sanger sequencing uses DNA polymerase and chain terminating nucleotides to synthesize labeled DNA strands of varying lengths that can then be separated by electrophoresis to determine the sequence. 454 technology attaches DNA fragments to beads and performs emulsion PCR to generate millions of copies for pyrosequencing. Sequence assembly involves combining overlapping sequences from fragmented DNA reads to reconstruct the full genome sequence, as individual reads are usually only 500-1000 base pairs long.
This document discusses single nucleotide polymorphisms (SNPs). It defines SNPs as variations in DNA sequences that occur when a single nucleotide differs between members of a species. SNPs are the most common type of genetic variation. The document outlines the characteristics of SNPs, how they are used as genetic markers, and various methods for SNP genotyping, including direct sequencing, TaqMan assays, and microchips. It also discusses the advantages and applications of SNPs in areas like gene discovery, disease risk profiling, and genetic variation studies.
This document summarizes a presentation given by Luke Hickey of Pacific Biosciences on human genome sequencing using PacBio systems. It discusses PacBio sequencing technology developments, sequencing and assembly of the NA12878 genome, and the role of the NIST Genome in a Bottle (GIAB) reference materials. Specifically, it notes that PacBio sequenced the GIAB Ashkenazim trio genomes to high coverage and made the data publicly available. The sequencing and assembly of these genomes helps validate and improve PacBio sequencing technologies and supports the development and release of the trio as new NIST reference materials.
Molecular bioimaging allows visualization of biological processes in vivo through techniques like fluorescence imaging. It has four broad categories including molecular bioimaging, biomedical imaging, drug discovery applications, and computational bioimaging. Some key methods discussed are green fluorescent protein labeling, fluorescence in situ hybridization for detecting DNA sequences, the GUS reporter system for visualizing gene expression, and fluorescence resonance energy transfer for measuring molecular interactions. Bioimaging provides precise tracking of disease biomarkers but current limitations include inability to quantify tumor response to drugs or distinguish benign from malignant tumors.
The document discusses DNA microarrays, including their applications, history, major steps, methods of construction, and technical issues. DNA microarrays allow analysis of gene expression across thousands of genes simultaneously. They have been used since the 1990s and are constructed by attaching DNA probes to a solid surface in a high-density array. Two main types are cDNA-based microarrays using amplified cDNA and oligonucleotide-based arrays like Affymetrix GeneChips containing short DNA sequences.
Genome sequencing involves obtaining blocks of DNA sequences and assembling them into contiguous stretches of sequence and ultimately the whole genome. This provides a starting point for research into thousands of diseases with a genetic basis. Automated DNA sequencing still uses Sanger's chain termination method but is now more accurate and faster. Emerging methods include sequencing by hybridization, mass spectrophotometry, and single molecule techniques. Future applications include individual genome sequencing using nanotechnology to study gene expression and interactions on a large scale.
This document provides an overview of next generation sequencing (NGS) technologies. It discusses the history and evolution of DNA sequencing, from early manual methods developed by Sanger to modern high-throughput NGS approaches. Key NGS methods described include Illumina sequencing by synthesis, Ion Torrent semiconductor sequencing, 454 pyrosequencing, and SOLiD ligation sequencing. Compared to Sanger, NGS allows massively parallel sequencing of many samples at lower cost and higher throughput. While NGS has advanced biological research, each method still has advantages and limitations related to read length, accuracy, and cost.
This document discusses several methods for gene sequencing, including Sanger sequencing, 454 technology, and sequence assembly. Sanger sequencing uses DNA polymerase and chain terminating nucleotides to synthesize labeled DNA strands of varying lengths that can then be separated by electrophoresis to determine the sequence. 454 technology attaches DNA fragments to beads and performs emulsion PCR to generate millions of copies for pyrosequencing. Sequence assembly involves combining overlapping sequences from fragmented DNA reads to reconstruct the full genome sequence, as individual reads are usually only 500-1000 base pairs long.
This document discusses single nucleotide polymorphisms (SNPs). It defines SNPs as variations in DNA sequences that occur when a single nucleotide differs between members of a species. SNPs are the most common type of genetic variation. The document outlines the characteristics of SNPs, how they are used as genetic markers, and various methods for SNP genotyping, including direct sequencing, TaqMan assays, and microchips. It also discusses the advantages and applications of SNPs in areas like gene discovery, disease risk profiling, and genetic variation studies.
This document summarizes a presentation given by Luke Hickey of Pacific Biosciences on human genome sequencing using PacBio systems. It discusses PacBio sequencing technology developments, sequencing and assembly of the NA12878 genome, and the role of the NIST Genome in a Bottle (GIAB) reference materials. Specifically, it notes that PacBio sequenced the GIAB Ashkenazim trio genomes to high coverage and made the data publicly available. The sequencing and assembly of these genomes helps validate and improve PacBio sequencing technologies and supports the development and release of the trio as new NIST reference materials.
Molecular bioimaging allows visualization of biological processes in vivo through techniques like fluorescence imaging. It has four broad categories including molecular bioimaging, biomedical imaging, drug discovery applications, and computational bioimaging. Some key methods discussed are green fluorescent protein labeling, fluorescence in situ hybridization for detecting DNA sequences, the GUS reporter system for visualizing gene expression, and fluorescence resonance energy transfer for measuring molecular interactions. Bioimaging provides precise tracking of disease biomarkers but current limitations include inability to quantify tumor response to drugs or distinguish benign from malignant tumors.
Next Generation Sequencing and its Applications in Medical Research - Frances...Sri Ambati
The so-called “next-generation” sequencing (NGS) technologies allows us, in a short time and in parallel, to sequence massive amounts of DNA, overcoming the limitations of the original Sanger sequencing methods used to sequence the first human genome. NGS technologies have had an enormous impact on biomedical research within a short time frame. This talk will give an overview of these applications with specific examples from Mendelian genomics and cancer research. #h2ony
The document summarizes research on the magnetic properties and magnetocaloric effect of two materials: La2NiMnO6 nanocrystals and a single crystal of La1.2Sr1.8Mn2O7. For both materials, the document examines structural properties, magnetic phase transitions, critical behavior near the Curie temperature, and magnetocaloric effects. Key results include determining the materials undergo second-order phase transitions and exhibit short-range ferromagnetic order. The magnetocaloric effect is also investigated through measurements of magnetic entropy change and development of universal curves for both materials.
Handout available at
https://drive.google.com/open?id=0B52D4j3rC4WDN2hRV25CaW9kb0E
Define DNA sequencing.
Describe the history of DNA sequencing.
Describe the steps of Sanger sequencing.
Define next generation sequencing.
Describe the steps of next generation DNA sequencing.
Describe use of DNA sequencing.
Abstract: The focus in this session will be put on the differences between standard DNA mapping and RNAseq-specific transcript mapping: identifying splice variants and isoforms. The issue of transcript quantification and genomic variants that can be identified from RNAseq data will be discussed.
MicroRNA and thier role in gene regulationIbad khan
MicroRNAs are small non-coding RNAs that regulate gene expression post-transcriptionally. They were first discovered in 1993 and their biogenesis involves two key steps - processing in the nucleus by the Drosha-DGCR8 complex into pre-miRNAs, followed by export to the cytoplasm and further processing by the Dicer enzyme into mature miRNA. The miRNA is then loaded into the RISC complex containing Argonaute proteins and guides it to target mRNAs to repress translation or promote degradation. MicroRNAs play important roles in various cellular functions and diseases by mediating gene silencing through nine different mechanisms.
RNA-directed DNA methylation (RdDM) is an epigenetic pathway in plants and fungi where small RNAs direct DNA methylation and transcriptional gene silencing. The process involves RNA polymerase IV transcribing RNA from the locus to be silenced. This RNA is then copied to double stranded RNA by RNA-dependent RNA polymerase 2 and processed into 24 nucleotide small interfering RNAs by Dicer-like 3. Argonaute 4 incorporates these siRNAs and guides DNA methyltransferases like Domains Rearranged Methyltransferase 2 to introduce methyl groups at cytosines in DNA, leading to transcriptional gene silencing of the locus. RdDM is an important genome defense mechanism in plants against viruses.
This document discusses the history and evolution of DNA sequencing technologies. It begins with early manual sequencing methods developed in the 1970s by Sanger and others. Automated Sanger sequencing and the sequencing of larger genomes followed in the 1980s-1990s. Next generation sequencing (NGS) methods were developed starting in 1996 and became commercially available in 2005, enabling massively parallel sequencing. NGS platforms such as 454, Illumina, and SOLiD are discussed. Third generation real-time sequencing methods such as PacBio and nanopore sequencing are also introduced, providing longer read lengths. The document compares key parameters of different sequencing methods such as read length, accuracy, throughput, cost and advantages/disadvantages.
This document provides an overview of biological mass spectrometry techniques. It discusses matrix assisted laser desorption/ionization (MALDI) and electrospray ionization (ESI) as two common ionization sources. It also describes different mass analyzer types including time-of-flight (TOF), quadrupoles, and Fourier transform ion cyclotron resonance (FT-ICR). Additionally, it covers fragmentation methods and applications of mass spectrometry in protein identification, modification analysis, and bacteria identification.
The document describes an RNA-seq analysis workflow that includes:
1. Preprocessing raw reads including quality control, filtering, and alignment to a reference genome using tools like FastQC, Bowtie2, and TopHat.
2. Assembling transcripts and estimating abundance using Cufflinks and HTseq-count.
3. Identifying differentially expressed genes between samples using DESeq and Cuffdiff.
4. Providing gene annotations and visualizing results using tools like GO, KEGG, and CummeRbund.
The workflow follows a typical reference-based analysis approach and uses various open source tools for read mapping, assembly, quantification, and differential expression.
The document summarizes Ion Torrent sequencing technology. It detects hydrogen ions released during DNA polymerization rather than using optics. The sequencing occurs on semiconductor chips patterned through photolithography into wells, each sequencing a different template. As nucleotides are incorporated, hydrogen ions change the pH detected by ion sensors below each well. This allows massively parallel sequencing that is faster, cheaper and simpler than previous technologies.
The study of the complete set of RNAs (transcriptome) encoded by the genome of a specific cell or organism at a specific time or under a specific set of conditions is called Transcriptomics.
Transcriptomics aims:
I. To catalogue all species of transcripts, including mRNAs, noncoding RNAs and small RNAs.
II. To determine the transcriptional structure of genes, in terms of their start sites, 5′ and 3′ ends, splicing patterns and other post-transcriptional modifications.
III. To quantify the changing expression levels of each transcript during development and under different conditions.
This document discusses various methods for single nucleotide polymorphism (SNP) analysis, including their principles, advantages, and disadvantages. It describes SNP genotyping techniques like RFLP-PCR, TaqMan assays, microarrays, Sanger sequencing, SNaPshot, and next-generation sequencing. The key aspects are accuracy, throughput, cost, and ability to detect both known and unknown SNPs. The document emphasizes choosing methods based on required information extraction and cost effectiveness.
Next-generation sequencing (NGS) has various applications in livestock genetics and breeding including:
1. Whole genome sequencing to identify genetic variations within and between species and quantify introgression.
2. RNA sequencing to detect differentially expressed genes between control and infected/challenged animals and identify genes related to disease resistance.
3. Genome-wide association studies using SNPs identified through NGS to map quantitative trait loci and guide marker-assisted selection for improved traits.
NMR Spectroscopy is a powerful technique that can provide detailed information on the topology, dynamics and three-dimensional structure of molecules in solution and the solid state
Original Next Gen Seq Methods set of slides prepared for Technorazz Vibes 2016. There is also a shorter version.
This starts with an introduction to qPCR followed by an introduction to Library Complexity. Microarrays are discussed as well along with a very short introduction to FISH. Finally discussion of Next gen seq methods is done where generation of sequencers are discussed and a short discussion of the ILLUMINA protocol. Finally comparison of ILLUMINA amongst other 3rd gen sequencer, description of the standard pipeline and the omics technologies that have risen from this seq data.
Gene regulation is the process by which genes are turned on and off, ensuring that the appropriate genes are expressed at the proper times. It involves two main stages: transcription, where RNA polymerase produces messenger RNA (mRNA) from DNA, and translation, where the mRNA directs protein synthesis. Key gene control regions include promoters near the start of genes, which help control transcription, and enhancers or silencers that increase or decrease transcription by binding transcription factors. Gene regulation can be positive, through activator proteins initiating transcription, or negative, via repressor proteins terminating transcription. This process is necessary for unicellular organisms to adapt to their environment and for multicellular organisms to differentiate cells and perform specialized functions.
This document discusses next generation sequencing technologies. It provides details on several massively parallel sequencing platforms and describes their advantages over traditional Sanger sequencing such as higher throughput, lower costs, and ability to process millions of reads in parallel. It then outlines several applications of next generation sequencing like mutation discovery, transcriptome analysis, metagenomics, epigenetics research and discovery of non-coding RNAs.
This document provides an overview of genomics and related fields. It discusses the historical discoveries that laid the foundations of genomics. It then defines key genomics terms and describes different areas of genomics research like comparative genomics, metagenomics, structural genomics, functional genomics, transcriptomics, proteomics and metabolomics. The document also discusses genome sequencing techniques, genome organization of different organisms like bacteria, plants and humans. It concludes with an overview of genome mapping methods.
Birefringence and Bragg grating control in femtosecond laser written optical ...Luís André Fernandes
This document summarizes research on controlling birefringence and Bragg gratings using femtosecond laser writing in optical circuits. It describes using this technique to fabricate integrated wave plates with polarization contrast up to 35 dB and polarization beam splitters with extinction ratios from 19-24 dB. The research demonstrates controlling birefringence from 10-6 to 10-4 by manipulating laser stress fields and polarization during writing. Future work aims to reduce device sizes and losses for applications in quantum photonics and sensing.
PCR-OLA is a technique that combines polymerase chain reaction with oligonucleotide ligation assay to detect single nucleotide polymorphisms by distinguishing between ligation and non-ligation of oligonucleotides. It involves two phases - a multiplex PCR amplification to amplify the target DNA, followed by a multiplex oligonucleotide ligation assay where detection probes hybridize adjacent to each other and are ligated if complementary, which can identify normal vs. mutant genotypes. Ligation is regulated by the specificity of oligonucleotide hybridization, the need for adjacent hybridization of probes, and perfect complementarity of two bases.
Nuovi strumenti e strategie di analisi della ricerca genetica.
Speaker
Andrea Angius (CNR)
Feb 16 2011 - Collana di seminari per la valorizzazione dei risultati della ricerca al CRS4
Abstract
Vengono illustrati gli strumenti per l’identificazione, l’isolamento e la caratterizzazione delle varianti genetiche, dei geni e pathway metabolici, focalizzando l’attenzione su quelle patologie che presentano una forte componente genetica e un’elevata incidenza nella popolazione sarda.
Next Generation Sequencing and its Applications in Medical Research - Frances...Sri Ambati
The so-called “next-generation” sequencing (NGS) technologies allows us, in a short time and in parallel, to sequence massive amounts of DNA, overcoming the limitations of the original Sanger sequencing methods used to sequence the first human genome. NGS technologies have had an enormous impact on biomedical research within a short time frame. This talk will give an overview of these applications with specific examples from Mendelian genomics and cancer research. #h2ony
The document summarizes research on the magnetic properties and magnetocaloric effect of two materials: La2NiMnO6 nanocrystals and a single crystal of La1.2Sr1.8Mn2O7. For both materials, the document examines structural properties, magnetic phase transitions, critical behavior near the Curie temperature, and magnetocaloric effects. Key results include determining the materials undergo second-order phase transitions and exhibit short-range ferromagnetic order. The magnetocaloric effect is also investigated through measurements of magnetic entropy change and development of universal curves for both materials.
Handout available at
https://drive.google.com/open?id=0B52D4j3rC4WDN2hRV25CaW9kb0E
Define DNA sequencing.
Describe the history of DNA sequencing.
Describe the steps of Sanger sequencing.
Define next generation sequencing.
Describe the steps of next generation DNA sequencing.
Describe use of DNA sequencing.
Abstract: The focus in this session will be put on the differences between standard DNA mapping and RNAseq-specific transcript mapping: identifying splice variants and isoforms. The issue of transcript quantification and genomic variants that can be identified from RNAseq data will be discussed.
MicroRNA and thier role in gene regulationIbad khan
MicroRNAs are small non-coding RNAs that regulate gene expression post-transcriptionally. They were first discovered in 1993 and their biogenesis involves two key steps - processing in the nucleus by the Drosha-DGCR8 complex into pre-miRNAs, followed by export to the cytoplasm and further processing by the Dicer enzyme into mature miRNA. The miRNA is then loaded into the RISC complex containing Argonaute proteins and guides it to target mRNAs to repress translation or promote degradation. MicroRNAs play important roles in various cellular functions and diseases by mediating gene silencing through nine different mechanisms.
RNA-directed DNA methylation (RdDM) is an epigenetic pathway in plants and fungi where small RNAs direct DNA methylation and transcriptional gene silencing. The process involves RNA polymerase IV transcribing RNA from the locus to be silenced. This RNA is then copied to double stranded RNA by RNA-dependent RNA polymerase 2 and processed into 24 nucleotide small interfering RNAs by Dicer-like 3. Argonaute 4 incorporates these siRNAs and guides DNA methyltransferases like Domains Rearranged Methyltransferase 2 to introduce methyl groups at cytosines in DNA, leading to transcriptional gene silencing of the locus. RdDM is an important genome defense mechanism in plants against viruses.
This document discusses the history and evolution of DNA sequencing technologies. It begins with early manual sequencing methods developed in the 1970s by Sanger and others. Automated Sanger sequencing and the sequencing of larger genomes followed in the 1980s-1990s. Next generation sequencing (NGS) methods were developed starting in 1996 and became commercially available in 2005, enabling massively parallel sequencing. NGS platforms such as 454, Illumina, and SOLiD are discussed. Third generation real-time sequencing methods such as PacBio and nanopore sequencing are also introduced, providing longer read lengths. The document compares key parameters of different sequencing methods such as read length, accuracy, throughput, cost and advantages/disadvantages.
This document provides an overview of biological mass spectrometry techniques. It discusses matrix assisted laser desorption/ionization (MALDI) and electrospray ionization (ESI) as two common ionization sources. It also describes different mass analyzer types including time-of-flight (TOF), quadrupoles, and Fourier transform ion cyclotron resonance (FT-ICR). Additionally, it covers fragmentation methods and applications of mass spectrometry in protein identification, modification analysis, and bacteria identification.
The document describes an RNA-seq analysis workflow that includes:
1. Preprocessing raw reads including quality control, filtering, and alignment to a reference genome using tools like FastQC, Bowtie2, and TopHat.
2. Assembling transcripts and estimating abundance using Cufflinks and HTseq-count.
3. Identifying differentially expressed genes between samples using DESeq and Cuffdiff.
4. Providing gene annotations and visualizing results using tools like GO, KEGG, and CummeRbund.
The workflow follows a typical reference-based analysis approach and uses various open source tools for read mapping, assembly, quantification, and differential expression.
The document summarizes Ion Torrent sequencing technology. It detects hydrogen ions released during DNA polymerization rather than using optics. The sequencing occurs on semiconductor chips patterned through photolithography into wells, each sequencing a different template. As nucleotides are incorporated, hydrogen ions change the pH detected by ion sensors below each well. This allows massively parallel sequencing that is faster, cheaper and simpler than previous technologies.
The study of the complete set of RNAs (transcriptome) encoded by the genome of a specific cell or organism at a specific time or under a specific set of conditions is called Transcriptomics.
Transcriptomics aims:
I. To catalogue all species of transcripts, including mRNAs, noncoding RNAs and small RNAs.
II. To determine the transcriptional structure of genes, in terms of their start sites, 5′ and 3′ ends, splicing patterns and other post-transcriptional modifications.
III. To quantify the changing expression levels of each transcript during development and under different conditions.
This document discusses various methods for single nucleotide polymorphism (SNP) analysis, including their principles, advantages, and disadvantages. It describes SNP genotyping techniques like RFLP-PCR, TaqMan assays, microarrays, Sanger sequencing, SNaPshot, and next-generation sequencing. The key aspects are accuracy, throughput, cost, and ability to detect both known and unknown SNPs. The document emphasizes choosing methods based on required information extraction and cost effectiveness.
Next-generation sequencing (NGS) has various applications in livestock genetics and breeding including:
1. Whole genome sequencing to identify genetic variations within and between species and quantify introgression.
2. RNA sequencing to detect differentially expressed genes between control and infected/challenged animals and identify genes related to disease resistance.
3. Genome-wide association studies using SNPs identified through NGS to map quantitative trait loci and guide marker-assisted selection for improved traits.
NMR Spectroscopy is a powerful technique that can provide detailed information on the topology, dynamics and three-dimensional structure of molecules in solution and the solid state
Original Next Gen Seq Methods set of slides prepared for Technorazz Vibes 2016. There is also a shorter version.
This starts with an introduction to qPCR followed by an introduction to Library Complexity. Microarrays are discussed as well along with a very short introduction to FISH. Finally discussion of Next gen seq methods is done where generation of sequencers are discussed and a short discussion of the ILLUMINA protocol. Finally comparison of ILLUMINA amongst other 3rd gen sequencer, description of the standard pipeline and the omics technologies that have risen from this seq data.
Gene regulation is the process by which genes are turned on and off, ensuring that the appropriate genes are expressed at the proper times. It involves two main stages: transcription, where RNA polymerase produces messenger RNA (mRNA) from DNA, and translation, where the mRNA directs protein synthesis. Key gene control regions include promoters near the start of genes, which help control transcription, and enhancers or silencers that increase or decrease transcription by binding transcription factors. Gene regulation can be positive, through activator proteins initiating transcription, or negative, via repressor proteins terminating transcription. This process is necessary for unicellular organisms to adapt to their environment and for multicellular organisms to differentiate cells and perform specialized functions.
This document discusses next generation sequencing technologies. It provides details on several massively parallel sequencing platforms and describes their advantages over traditional Sanger sequencing such as higher throughput, lower costs, and ability to process millions of reads in parallel. It then outlines several applications of next generation sequencing like mutation discovery, transcriptome analysis, metagenomics, epigenetics research and discovery of non-coding RNAs.
This document provides an overview of genomics and related fields. It discusses the historical discoveries that laid the foundations of genomics. It then defines key genomics terms and describes different areas of genomics research like comparative genomics, metagenomics, structural genomics, functional genomics, transcriptomics, proteomics and metabolomics. The document also discusses genome sequencing techniques, genome organization of different organisms like bacteria, plants and humans. It concludes with an overview of genome mapping methods.
Birefringence and Bragg grating control in femtosecond laser written optical ...Luís André Fernandes
This document summarizes research on controlling birefringence and Bragg gratings using femtosecond laser writing in optical circuits. It describes using this technique to fabricate integrated wave plates with polarization contrast up to 35 dB and polarization beam splitters with extinction ratios from 19-24 dB. The research demonstrates controlling birefringence from 10-6 to 10-4 by manipulating laser stress fields and polarization during writing. Future work aims to reduce device sizes and losses for applications in quantum photonics and sensing.
PCR-OLA is a technique that combines polymerase chain reaction with oligonucleotide ligation assay to detect single nucleotide polymorphisms by distinguishing between ligation and non-ligation of oligonucleotides. It involves two phases - a multiplex PCR amplification to amplify the target DNA, followed by a multiplex oligonucleotide ligation assay where detection probes hybridize adjacent to each other and are ligated if complementary, which can identify normal vs. mutant genotypes. Ligation is regulated by the specificity of oligonucleotide hybridization, the need for adjacent hybridization of probes, and perfect complementarity of two bases.
Nuovi strumenti e strategie di analisi della ricerca genetica.
Speaker
Andrea Angius (CNR)
Feb 16 2011 - Collana di seminari per la valorizzazione dei risultati della ricerca al CRS4
Abstract
Vengono illustrati gli strumenti per l’identificazione, l’isolamento e la caratterizzazione delle varianti genetiche, dei geni e pathway metabolici, focalizzando l’attenzione su quelle patologie che presentano una forte componente genetica e un’elevata incidenza nella popolazione sarda.
I progressi tecnologici raggiunti nel campo delle strategie di sequenziamento degli acidi nucleici ("Next Generation Sequencing", NGS) permettono oramai di ottenere con facilità le informazioni contenute all’interno dell’intero genoma umano. Ma solo una piccola percentuale (stimata a 1,6%) del genoma umano viene tradotto nelle proteine che fanno funzionare il corpo umano. Il sequenziamento esomico ("Whole exome sequencing") si concentra proprio sulle parti del genoma che codificano le proteine ("i geni") perché la ricerca di varianti in tali regioni permette di trovare le modificazioni funzionali delle proteine che sono associate a malattie. Dovendo sequenziare solo circa 1/60 dell’intero genoma si ha la possibilità di avere una migliore accuratezza e di ridurre tempi e costi del sequenziamento. Per questo motivo il sequenziamento esomico è diventato uno dei metodi di diagnosi genetica più utilizzato dai medici (sopratutto nel caso in cui non ci siano ipotesi sui geni coinvolti nella malattia).
The document appears to be a list of numbers paired with "30° CRS4" repeated many times. It includes the phrases "Enjoy the reading!" and names Christian Solinas as the President of the Autonomous Region of Sardinia.
Tutti a Iscol@ 2017, presentazione della Linea B2: Laboratori Extracurriculari Didattici Tecnologici.
L'iniziativa è promossa da: Regione Autonoma della Sardegna (Assessorato della Pubblica Istruzione);
Agenzia Regionale Sardegna Ricerche;
CRS4.
Ulteriori informazioni: http://iscola-lineab2.crs4.it/
Sardegna Ricerche
CRS4
Presentazione del progetto "Iscol@ Linea B": laboratori didattici innovativi finalizzati all’apertura al territorio delle Istituzioni scolastiche. Regione Autonoma della Sardegna, Agenzia Sardegna Ricerche, CRS4
1) The document presents a method for spatial velocity analysis of near-surface seismic data using a global simultaneous multi-parameter optimization approach.
2) It compares different implementations of spatial velocity analysis, including using common reflection surface (CRS) operators with 1x3, 3x1, and 1x2 parameter searches, and finds that using a 1x2 parameter diffraction operator for the global search followed by local 1x3 reflection optimization provides accurate results with less computational cost than other methods.
3) The method is demonstrated on an example of ultra-shallow seismic data from a field survey, and velocity models derived from the analysis are used for stacking, tomography, and migration, improving the quality and interpretability of
Valentina Spanu: esempi di applicazioni di GIS Partecipativo; gestione delle riserve idriche, energia solare, ristrutturazione di un edificio scolastico in Marocco; riduzione del rischio di disastro naturale in Georgia.
Alfonso Damiano (Università di Cagliari) Tecnologie ICT per le reti intelligenti di energia - evoluzione dei sistemi di distribuzione elettrica, anche con riferimento alla situazione della Regione; smart grid, micro grid e virtual power plant; stato della ricerca nel settore; potenzialità offerte dall'integrazione tra sistema elettrico e sistema della mobilità; reti intelligenti in una visione di smart city.
Workshop organizzato dal CRS4 nell'ambito della Collana di seminari per la valorizzazione e trasferimento dei risultati della Ricerca.
Viene illustrato il problema della raccolta efficiente e scalabile dei dati da potenziali sorgenti di Big Data. Inoltre verrà fatta una carrellata su alcuni tra i più popolari software utilizzabili in una pipeline di data streaming in realtime e/o batch analysis.
La caratterizzazione chimico-analitica del profilo metabolico di una serie di pazienti di sindrome fiobromialgica e di controlli, è stata integrata con un approccio modellistico per validare l'ipotesi che i lipidi sovra-rappresentati nei pazienti fossero in grado di interagire, attivandolo, con il recettore deputato alla modulazione dei meccanismi biologici del dolore, il PAFR, in maniera simile a quanto fatto dal ligando endogeno PAF. Al momento attuale non esistono test di laboratorio o marcatori biologici che possano confermare lo stato di malattia, per cui questo approccio rappresenta un primo passo verso la definizione di biomarcatori per la diagnosi e per il monitoraggio.
Innovazione e infrastrutture cloud per lo sviluppo di applicativi web e mobile orientato alla geomatica in contesto Smart City. Roberto Demontis (CRS4)
Questo corso riguarda gli aspetti teorici della propagazione delle onde sismiche e i principali legami tra caratteristiche di propagazione (velocità, attenuazione) e caratteristiche geometriche e fisico-meccaniche dei materiali del sottosuolo. Successivamente, saranno illustrati gli aspetti pratici dell'utilizzo dei metodi sismici a riflessione per la caratterizzazione dei suoli e delle rocce, delineando gli aspetti essenziali delle fasi di acquisizione, elaborazione ed interpretazione dei dati e le loro applicazioni in campo ingegneristico. Infine verranno dati alcuni cenni sul principio di funzionamento del GPR e sulle sue applicazioni pratiche.
Viene presentato e discusso (in inglese) in dettaglio l'utilizzo della piattaforma EIAGRID/SmartGEO in due casi studio significativi per le applicazioni geotecniche e ambientali. Al termine, l'utente interessato dovrebbe essere in grado di utilizzare in modo autonomo la piattaforma attraverso il portale SmartGEO.
Viene descritta la piattaforma EiAGRID/SmartGeo, un portale di calcolo e analisi dati per sismica a riflessione e acquisizioni GPR multioffset, che mette a disposizione dell'utente una serie di servizi di calcolo e di processing accessibili attraverso un'interfaccia Web basata su un'infrastruttura Grid. La piattaforma consente all'utente in campo, tramite un dispositivo client (laptop, PC, tablet, etc.), di usufruire di una serie di servizi computazionali che risiedono e girano su server remoti, secondo il paradigma SaaS (Software as a Service). Verranno illustrate le soluzioni modellistiche e tecnologiche adottate e alcuni risultati ottenuti su dati reali.
This document summarizes trends in mobile graphics presented by Marco Agus and Marcos Balsa at the Visual Computing conference at UniCa in June 2015. It discusses how mobile devices are using techniques like remote rendering, mixed mobile/remote rendering, image-based and model-based methods to render 3D graphics. It also explores hardware acceleration methods for mobile like parallel pipelines, real-time ray tracing, and multi-rate approaches to improve frame rates and rendering quality on mobile. The document focuses on visualization techniques for large meshes, complex lighting, and volume rendering on mobile devices.
This document provides an overview of mobile graphics and development. It discusses the evolution of mobile devices and graphics through movies and games. It outlines the increasing capabilities of mobile devices including processing power, memory, and connectivity. It covers operating systems, programming languages, CPU architectures including ARM and graphics processing unit architectures used in mobile devices. It provides details on graphics development for mobile systems.
The document provides an overview of the Visual Computing group at CRS4. It summarizes that the group conducts research in visual computing, with a focus on acquiring, processing, distributing, rendering and exploring massive 3D models. Some of the key areas of research mentioned include effective acquisition of color and geometry from 3D scans, scalable surface processing techniques, and novel methods for rendering and streaming massive models.
Studi di associazione genetica e disegno sperimantale caso- controllo
1. Studi di associazione genetica e
disegno sperimantale caso-
controllo
Applicazioni allo studio del Diabete di Tipo1 e della
Sclerosi Multipla nella popolazione sarda
Ilenia Zara
ilenia.zara@crs4.it
Aula Magna Dipartimento di Fisica
Cittadella Universitaria di Monserrato
30 Marzo 2011
Wednesday, March 30, 2011
2. BIOMEDICINA ENERGIA
E AMBIENTE
DATA FUSION Collana di Seminari per la Valorizzazione dei Risultati della Ricerca al CRS4
30.03.2011
Seminario 16:00 -18:00 P.M.
AULA MAGNA DIP. FISICA
Cittadella Universitaria - Monserrato
I recenti sviluppi delle nuove piattaforme sperimentali
consentono di studiare le caratteristiche genetiche di intere
popolazioni utilizzando volumi di dati sempre crescenti con
costi sempre minori. Questo tipo di studi rende necessaria
l’interazione tra persone con una formazione medico/
biologica e persone con competenze nei campi della statistica
Studi di associazione genetica e e dell’informatica.
disegno sperimentale “caso controllo”:
applicazioni a diabete di tipo 1 e sclerosi multipla nella popolazione Sarda
Durante il seminario saranno illustrati i concetti genetico-
statistici che stanno alla base degli studi GWAS e i risultati di
ricerca ottenuti con tale approccio per identi care varianti
genetiche predisponenti al diabete di tipo 1, alla sclerosi
multipla e alle malattie autoimmuni in generale, nella
popolazione Sarda.
Relatore: Ileniasviluppi delle nuove piattaforme sperimentali consentono
Relatore I recenti Zara
Ilenia Zara di studiare le caratteristiche genetiche di intere popolazioni utlizzando
CRS4 volumi di dati sempre crescenti con costi sempre minori.
Questo tipo di studi rende necessaria l’interazione tra persone con una
formazione medico/biologica e persone con competenze nei campi
della statistica e dell’informatica.
Wednesday, March 30, 2011
3. Indice degli argomenti
• Background
• Studi di associazione
• Perchè questo studio sulla popolazione sarda?
• Workflow dello studio
• Risultati ottenuti
• Lavori in corso
Wednesday, March 30, 2011
4. Variabilità genetica
• Le variazioni genetiche
spiegano la maggior
parte della variabilità
osservata tra individui
della stessa specie
• Il crossing-over è un
meccanismo di
ricombinazione del
materiale genetico
proveniente dai due
genitori.
Wednesday, March 30, 2011
5. Studi di associazione
• Studio caso-controllo
An epidemiological study design in which cases with a
defined condition and controls without this condition are
sampled from the same population. Risk-factor
information is compared between two groups to
investigate the potential role of these in the etiology of the
condition.
Krina T. Zondervan and Lon R. Cardon “The complex interplay among factors that
influence allelic association” - Nature Genetics Reviews - 2004
Wednesday, March 30, 2011
6. Studi di associazione
• Studio caso-controllo:
Variante genetica
Controlli: individui non affetti Casi: individui affetti
Wednesday, March 30, 2011
7. Studi di associazione
• Studio caso-controllo: caso ideale
• Malattie monogeniche, penetranza completa
Variante genetica causale
Variante genetica protettiva
Controlli: individui non affetti Casi: individui affetti
Wednesday, March 30, 2011
8. Studi di associazione
• Studio caso-controllo: malattie multifattoriali
Variante genetica causale
Variante genetica protettiva
Controlli: individui non affetti Casi: individui affetti
Wednesday, March 30, 2011
9. Studi di associazione
• Studio caso-controllo: malattie multifattoriali
• p-value: probabilità che la variante considerata NON sia associata alla malattia
Variante genetica causativa
Variante genetica protettiva
Controlli: individui non affetti Casi: individui affetti
No Associazione 1 > p-value > 0 Associazione
Wednesday, March 30, 2011
10. Studio caso-controllo
• Obiettivo: identificare varianti genetiche con frequenze
diverse in casi e controlli, che possano rappresentare un
fattore di rischio o protettivo verso l’insorgenza di una
patologia.
• Assunzione: casi e controlli provengono da una
popolazione omogenea e possono essere utilizzati per
stimare le distribuzioni dei marcatori genetici nella
popolazione sottostante.
Wednesday, March 30, 2011
11. • Studio di associazione per tratti quantitativi
• Correlazione tra variabilità genetica e fenotipica
Wednesday, March 30, 2011
12. • Studio di associazione per tratti quantitativi
• Es. altezza
Wednesday, March 30, 2011
13. • Studio di associazione per tratti quantitativi
• Es. altezza
Wednesday, March 30, 2011
14. Tipi di studi
• Genome-wide
– Studio in cui si cerca di identificare le varianti causali lungo
tutto il genoma
• Candidate marker
– Studio di un marcatore che si ritiene essere implicato nel
meccanismo di insorgenza di una patologia
• Candidate gene
– Studio dei marcatori che cadono nella regione di un gene
• Fine mapping
– Studio ad alta risoluzione di marcatori che cadono in un’intera
che può contenere uno o più geni
Wednesday, March 30, 2011
15. Marcatori genetici
un marcatore genetico è costituito da una differenza nel
DNA tra due o più individui
• Marcatori multiallelici o multiforme
– microsatelliti, inserzioni, delezioni
– Copy Number Variations, Copy Number
Polymorphism
– Riarrangiamenti su larga scala (duplicazioni,
traslocazioni, inversioni, etc.)
• SNPs (Polimorfismi a Singolo Nucleotide)
Wednesday, March 30, 2011
16. Single Nucleotide Polymorphism (SNP)
• Marcatore biallelico
• Variazione di un singolo
nucleotide in un altro
• Il polimorfismo è
considerato stabile se
osservato in almeno l’1%
della popolazione
• ∼2001: prime applicazioni
in laboratorio
Wednesday, March 30, 2011
17. Single Nucleotide Polimorphism (SNP)
• Si stima che ci siano circa
30,000,000 SNPs nel
genoma umano
• Nascono come mutazioni
(MAF<1%)
• La maggior parte
scompare ma alcuni si
stabilizzano
• caso
• selezione naturale
Wednesday, March 30, 2011
18. Progressi nelle tecnologie di genotipizzazione
2001
2002
2003
2004 10 3
2005
2006
2007
2008 Next Generation
Sequencing
2009
1 10 100 1,000 10,000 100,000 1,000,000
Wednesday, March 30, 2011
19. Due case produttrici di microarrays utilizzati in studi GWAS
Affymetrix Genome-Wide
Human SNP 6.0
www.affymetrix.com
Illumina 1M Duo beadchip
www.illumina.com
Wednesday, March 30, 2011
20. • Che cosa c’è in una probe?
www.affymetrix.com
Wednesday, March 30, 2011
21. • Concetti base
–Ibridazione
–Lettura con scanner
ad alta risoluzione
–Immagine
Wednesday, March 30, 2011
23. Progetto HapMap
• Database pubblico dei pattern comuni di variazione
genetica nel genoma umano
• Scopo: fornire ai ricercatori una mappa aplotipica del
genoma umano
Wednesday, March 30, 2011
24. Linkage Disequilibrium
• fenomeno per cui due o più alleli non segregano in
maniera indipendente
• Gran parte del genoma cade
in segmenti di forte LD detti
blocchi di aplotipi, separati da
segmenti di basso LD
• All’interno di ciascun blocco le
varianti presenti sono tra loro
fortemente correlate e un
piccolo numero di
combinazioni di alleli distinti
(aplotipi) rappresentano la
maggior parte delle variazioni
genetiche nella popolazione
considerata
Wednesday, March 30, 2011
25. Non è necessario studiare tutti gli SNPs del genoma!
Associazione diretta Associazione indiretta
• Gli SNPs vengono testati • Gli SNPs vengono
in base alle conoscenze a genotipizzati in base al
priori sulla loro funzione Linkage Disequilibrium
• L’individuazione della
variane causale dipende
dalla sua correlazione con
la variante genotipizzata
Wednesday, March 30, 2011
26. Workflow
• Studi di associazione Genome-Wide
– Definizione casi e controlli
– Raccolta campioni biologici e dati clinici
– Genotipizzazione
– Controlli di qualità su individui e marcatori
– Analisi della struttura della popolazione
– Test di associazione
– Inferenza di marcatori non genotipizzati
– Annotazione dei risultati e selezione marcatori candidati
e regioni corrispondenti
Wednesday, March 30, 2011
27. Selezione casi e controlli
• Perchè la popolazione sarda?
• Perchè le malattie autoimmuni?
Wednesday, March 30, 2011
28. • Perchè la popolazione sarda?
– Dimensione del campione adeguata al tipo di studio
• Dimensione della popolazione abbastanza elevata da consentire
di mantenere una elevata variabilità tra gli individui
– Popolazione Isolata
• Assenza sostanziale di sottostruttura di popolazione (basso tasso
di immigrazione)
• Presenza di varianti comuni nei sardi e rare o assenti in altre
popolazioni
• Nonostante sia una popolazione europea, si comporta come un
outlier rispetto alla gamma di variabilità europea
Wednesday, March 30, 2011
29. • Perchè la popolazione sarda?
Wednesday, March 30, 2011
30. • Perchè le malattie autoimmuni?
– Alta incidenza di malattie autoimmuni in Sardegna
• Es.: l’incidenza del Diabete di Tipo 1 è 5 volte maggiore che nel
resto d’Italia e pari all’incidenza osservata in Finlandia
– Altre ipotesi
• Gli stessi fattori genetici che predispongono alle malattie
autoimmuni potrebbero in passato aver protetto la popolazione
da alcune infezioni batteriche
• Protezione nei confronti di alcune forme di tumore (modelli
murini)
• Longevità (ipotesi)
Wednesday, March 30, 2011
31. • Perchè le malattie autoimmuni?
Wednesday, March 30, 2011
32. • Perchè le malattie autoimmuni?
Wednesday, March 30, 2011
33. • Perchè le malattie autoimmuni?
Wednesday, March 30, 2011
34. Raccolta campioni biologici e dati clinici
• Raccolta iniziata circa 20 anni fa
• Gran numero di persone e
istituzioni coinvolte
• ∼2500 volontari sani provenienti
da vari centri trasfusionali e
ospedali dell’isola
• ∼2500 pazienti affetti da
Sclerosi Multipla
• ∼1500 pazienti affetti da
Diabete di Tipo 1
• La raccolta dei campioni
continua!
Wednesday, March 30, 2011
35. Raccolta campioni biologici e dati clinici
• Accurata definizione dei
fenotipi clinici
• Accurata selezione dei controlli
rispetto al fenotipo da testare
• Età
• Sesso
• Appartenenza effettiva alla
popolazione sarda
• Altri fenotipi presenti solo nei
casi o solo nei controlli
Wednesday, March 30, 2011
36. Database dati clinici (beta)
-> Seminario Gianmauro Cuccuru - “Approccio integrato alla gestione
dati in ambito clinico e genetico” - 25 Maggio 2011
Wednesday, March 30, 2011
37. Genotipizzazione
• ∼6700 individui già
genotipizzati
• ∼840 individui
• Non imparentati
• Trios
• Famiglie
multigenerazionali con
più affetti per famiglia
Esempio: plot di calling per SNP Affymetrix
J. M. Korn, et al.: Integrated genotype calling and association analysis of SNPs, common copy number
polymorphisms and rare CNVs. Nat. Genet. Technical Reports, ng237 (October 2008)
Wednesday, March 30, 2011
38. LIMS (beta)
-> Seminario Gian Franco Frau - “Laboratory Information Management
System - Perchè e per cosa?” - 7 Settembre 2011
Wednesday, March 30, 2011
39. Workflow
• Studi di associazione Genome-Wide
– Definizione casi e controlli
– Raccolta campioni biologici e dati clinici
– Genotipizzazione
– Controlli di qualità su individui e marcatori
– Analisi della struttura della popolazione
– Test di associazione
– Inferenza di marcatori non genotipizzati
– Annotazione dei risultati e selezione marcatori candidati
e regioni corrispondenti
Wednesday, March 30, 2011
40. Controlli di qualità sugli individui
• Callrate >90%, 95%, 98%
– % genotipi chiamati per individuo rispetto al totale
• Corrispondenza tra sesso annotato e sesso inferito
– Sesso inferito in base all’eterozigosità del cromosoma X
• Verifica delle relazioni di parentela annotate
– Mediante test di verosimiglianza tra genotipi reali e genotipi
attesi in base alla relazione di parentela dichiarata
– Test effettuato su oltre 5000 varianti di buona qualità
altamente polimorfiche
Wednesday, March 30, 2011
41. Controlli di qualità sugli SNPs
• Callrate > 95% o > 98%
– % genotipi chiamati per un dato SNP sul totale degli
individui
• Assenza di deviazioni dall’equilibrio di Hardy-
Weinberg nei controlli
p frequenza allele 1
q frequenza allele 2
Wednesday, March 30, 2011
42. Controlli di qualità sugli SNPs
• Equilibrio di Hardy-Weinberg. Ipotesi:
– Popolazione infinita
– Assenza di flussi migratori
– Non selezione
– Non mutazione
• Eliminazione SNPs con HWEp<0.000001
• Un discostamento dall’equilibrio di Hardy-Weinberg
nei casi può essere indice di associazione
Wednesday, March 30, 2011
43. Controlli di qualità sugli SNPs
• Minor Allele Frequency
– Alleli con frequenza < 1% sono varianti rare
– Diminuisce il potere di identificazione delle deviazioni
dall’HWE
– Possono nascondere errori di genotipizzazione
– Possono generare associazioni spurie, perchè possono
comparire in individui con fenotipi estremi
• Eliminazione marcatori con MAF<1% o MAF<5%
Wednesday, March 30, 2011
44. Controlli di qualità sugli SNPs
• Eliminazione SNPs con eccesso di errori mendeliani
• Eliminazione SNPs con eccesso di maschi eterozigoti
sul cromosoma X
• Eliminazione SNPs con eccessivo tasso d’errore su
dupliche
Cut-off definiti in base ai dati disponibili
Wednesday, March 30, 2011
45. Passi successivi
–Selezione individui non imparentati per test di
associazione
• Verifica dell’assenza di parenti
–Controlli su SNPs testati comunque
• Controllo callrate nei soli casi e nei soli controlli
• Differenza tra callrate nei casi e callrate nei controlli non eccessiva
• Controllo MAF nei soli casi e nei soli controlli
• HWEp nei casi
Wednesday, March 30, 2011
46. Analisi della sottostruttura di popolazione
• Stratificazione genetica:
–fattore di confounding dovuto alla presenza di
differenze di frequenze alleliche tra casi e controlli
non correlate al fenotipo di interesse
• Può portare all’identificazione di falsi positivi
Wednesday, March 30, 2011
47. Analisi della sottostruttura di popolazione
• Principal Component Analysis (PCA)
– Software Eigenstrat (http://genepath.med.harvard.edu/
~reich/EIGENSTRAT.htm)
– Mediante analisi di matrici di covarianza riduce lo spazio dei
dati identificando gli assi di maggior variazione delle
frequenze alleliche
– Consente di identificare outliers
– Consente di effettuare un test di associazione corretto per
sottostruttura di popolazione
– Analisi effettuata su 100,000 SNPs di buona qualità,
altamente polimorfici
Wednesday, March 30, 2011
48. Test di associazione
• Errore per test multipli
• Accettare un errore del 5% e testare 600,000 SNPs significa
accettare un errore pari a
0.05 * 600,000 = 30,000 associazioni false
• Correzione di Bonferroni
• Assumendo un errore del 5% e testando 600,000 SNPs la soglia di
significatività per il mio test è
0.05 / 600,000 = 8.3 * 10-8
• La correzione di Bonferroni assume però indipendenza tra i test e
si rivela eccessivamente conservativa in presenza di LD
Wednesday, March 30, 2011
50. Possibili svantaggi
• I patterns di LD nelle popolazioni HapMap possono
non riflettere i patterns di LD nella popolazione
oggetto dello studio
• Anche se gli SNPs selezionati per la creazione dei
chips non sono random, ma sono stati scelti per
essere rappresentativi (tag SNPs), HapMap non è un
database esaustivo
Wednesday, March 30, 2011
51. Possibili svantaggi
• Abbiamo visto che il numero di casi e controlli
necessario per trovare un’associazione dipende
anche dal LD con la variante causale. In che modo?
Wednesday, March 30, 2011
52. Inferenza
• I metodi di inferenza sviluppati da statistici e
informatici consentono di incrementare il numero di
marcatori testati, a costi molto bassi rispetto a quelli
degli esperimenti
• Nuovi genotipi possono essere inferiti a partire da
diversi pannelli di referenza
– HapMap ∼3 milioni di SNPs
– 1000 Genomes Project ∼13 milioni di SNPs
– Sequenze di individui Sardi ∼10 milioni di SNPs
Wednesday, March 30, 2011
54. 1000 Genomes Project
• Scopo
• fornire un catalogo completo di
• varianti genetiche umane (freq.>=1%)
• varianti con frequenza <1% nelle regioni dei geni
• dati di sequenza di alta qualità per l’85% del genoma
• 629 individui
• varie popolazioni Africa, Asia, Europa e America
• Il catalogo include SNPs, CNV, inserzioni e delezioni
• Il catalogo è fruibile gratuitamente
Wednesday, March 30, 2011
55. Pannello sequenze sarde
• 508 individui sequenziati
• 13,313,964 SNPs identificati
• ∼45% presenti in dbSNP
• http://www.ncbi.nlm.nih.gov/projects/SNP/
• ∼55% SNPs non descritti
-> Seminario Frederic Reinier - “Sequenziamento e analisi
bioinformatica del genoma umano” - 11 Maggio 2011
Wednesday, March 30, 2011
59. Inferenza di marcatori non genotipizzati
-> Seminario Serena Sanna “L’inferenza statistica e la lettura dei dati”
Wednesday, March 30, 2011
60. Annotazione Risultati
• Quali informazioni per ogni SNP?
• Risultati test di associazione
• Risultati controlli di qualità
• Gene in cui cade lo SNP o gene più vicino
• Posizione e distanza dello SNP rispetto al gene
• Tipologia dell SNP
• Funzione del gene, quando nota
Wednesday, March 30, 2011
61. Ispezione visiva plot di calling
• casi e controlli
• casi
• controlli
Wednesday, March 30, 2011
62. Ispezione visiva plot di calling
• casi e controlli
• casi
• controlli
SNP da scartare!
Wednesday, March 30, 2011
63. Cosa succede dopo l’associazione?
• Selezione marcatori candidati
• Replica associazione su un dataset indipendente
• Analisi aplotipiche nelle regioni selezionate
• Interpretazione biologica dei risultati
• Studi funzionali
• Studi su modelli animali
Wednesday, March 30, 2011
64. • Replica e estensione Risultati
– Genotipizzazione con un’altra tecnologia dei marcatori
selezionati negli stessi individui e calcolo del tasso di
concordanza
– Genotipizzazione con un’altra tecnologia dei marcatori
selezionati in un set di individui indipendente
http://www.appliedbiosystems.com/absite/us/en/home.html
Wednesday, March 30, 2011
65. • Analisi condizionale
– Valutazione della presenza di varianti associate indipendenti
nello stesso aplotipo
– Valutazione dell’associazione dei marcatori rispetto
all’associazione degli aplotipi di cui fanno parte
• Studi funzionali
– Studi dell’espressione dei geni in cui cadono gli SNPs
associati o dei gene vicini
– Studi dei prodotti proteici dei geni in cui cadono gli SNPs
associati o dei gene vicini
• Studi su modelli animali
– Studi funzionali su modelli animali delle patologie
Wednesday, March 30, 2011
69. Primi risultati
• top SNP
• genotipizzato, non presente in HapMap II
• presente solo nel chip Affymetrix
• p-value su dati genotipizzati 7.9*10^-5
• p-value dopo inferenza su HapMap III e 1000
Genomes ∼3*10^-6
• p-value su 1775 casi e 2005 controlli 9.34*10^-6
Wednesday, March 30, 2011
70. Primi risultati
• Il top SNP identificato spiega tutta
l’associazione al locus in cui si trova
• Le analisi condizionali non hanno mostrato segnali
indipendenti
• Anche l’associazione degli aplotipi è meno
significativa di quella del marcatore singolo
Wednesday, March 30, 2011
71. Ipotesi di interpretazione biologica
• Topi con deficit nell’ortologo di CBLB presentano alta
suscettibilità allo sviluppo dell’encefalomielite
autoimmune
Chiang, Y.J. et al., Nature 403, 216-20 (2000)
• Il gene potrebbe avere un ruolo più generale nelle
malattie autoimmuni è infatti un gene di suscettibilità
per diverse malattie autoimmuni, tra cui il T1D, in diversi
modelli murini
Yokoi N. et al., Nat Genet 31(4), 391-4 (2002)
Mordes J.P., et al. ILAR J 45(3), 278-91 (2004)
Wednesday, March 30, 2011
72. Ipotesi di interpretazione biologica
• Il processo infiammatorio nella MS è causato
dall’attività dei linfociti T, che riconoscono la mielina
come estranea e la attaccano
• Studi su modelli animali mettono in evidenza anche
un ruolo dei linfociti B nello sviluppo della malattia
Wednesday, March 30, 2011
73. Ipotesi di interpretazione biologica
• CBLB regola negativamente l’attività di TCR (T-cell
receptors) e BCR (B-cell receptors)
Wednesday, March 30, 2011
74. Ipotesi di interpretazione biologica
• CBLB regola negativamente l’attività di TCR (T-cell
receptors) e BCR (B-cell receptors)
Wednesday, March 30, 2011
75. Ipotesi aggiuntive
• Inoltre, altri studi hanno dimostrato che topi con
deficit nel CBLB non sviluppano alcuni tipi di tumore
Loser, S. & Penninger, J.M. Semin. Immunol. 19, 206-214 (2007)
• Le variazioni nel gene CBLB sembrano essere critiche
nel mantenimento del delicato equilibrio tra
l’attivazione e la tolleranza immunologica con effetti
opposti nell’autoimmunità e nel cancro
Wednesday, March 30, 2011
76. Lavori in corso
• Estensione casistica (∼7000)
–GWAS Sclerosi Multipla
• 1922 controlli
• 2280 casi
–GWAS Diabete di Tipo 1
• 1917 controlli
• 1377 casi
–GWAS Autoimmunità (MS+T1D)
• 1915 controlli
• 3595 casi
Wednesday, March 30, 2011
77. Lavori in corso
• Nuove genotipizzazioni
– Affymetrix 6.0
– Illumina 1M
• Nuove sequenze
– Illumina HiSeq
• Nuova imputazione
– 1000 Genomes
– Sequenze Sarde
• Studi funzionali per capire meglio il ruolo di CBLB
nella predisporre alla MS
Wednesday, March 30, 2011
78. Ringraziamenti
Serena Sanna Sandra Lai Andrea Angius
Maristella Pitzalis Antonella Mulas Maurizio Melis
Magdalena Zoledziewska Gianmauro Cuccuru Giulio Rosati
Carlo Sidore Eleonora Porcu Gonçalo R Abecasis
Raffaele Murru Liming Liang Manuela Uda
Michael B Whalen Patrizia Zavattari Maria Giovanna Marrosu
Fabio Busonero Loredana Moi David Schlessinger
Andrea Maschio Elisa Deriu Francesco Cucca
Gianna Costa M Francesca Urru
Maria Cristina Melis Michele Bajorek
Francesca Deidda Maria Anna Satta
Fausto Poddie Eleonora Cocco
Laura Morelli Paola Ferrigno
Gabriele Farina Stefano Sotgiu
Yun Li Maura Pugliatti
Mariano Dei Sebastiano Traccis
Wednesday, March 30, 2011
79. Ringraziamenti
Francesco Cucca Lidia Leoni Giuditta Lecca
Chris Jones Muriel Cabianca Fabrizio Murgia
Luca Carta Carole Salis
Serena Sanna Antonio Concas
Eleonora Porcu Carlo Impagliazzo Andrea Mameli
Carlo Sidore Sergio Mallus Massimo Mancini
Maria Valentini Marco Moro Loredana Lai
Michele Muggiri Fabio Bandel
Rossano Atzeni Marco Pinna
Riccardo Berutti Luca Pinna Tutti i volontari!
Frederic Reinier Franco Piroddi
Carlo Podda
Andrea Angius Matteo Vocale
Roberto Cusano
Marco Marcelli
Manuela Oppo
Rosella Pilu
Maria Francesca Urru
Wednesday, March 30, 2011
80. Riferimenti
• Sanna S. et al. A GWAS in Sardinians reveals a novel gene associated with multiple sclerosis - European
Society Of Human Genetics (ESHG) 2010
• Sanna S. et al. Variants within immunoregulatory CBLB gene are associated with multiple sclerosis Nat
Genet 42(6):495-7 (2010)
• Sanna S. Genome-wide association studies: past, present future - Seminar (2009)
• Finny Kuruvilla, Broad Institute of Harvard and MIT Massachussetts General Hospital - Genotyping on
the Affymetrix platform using Birdseed (2077)
• Krina T. Zondervan and Lon R. Cardon The complex interplay among factors that influence allelic
association Nat Genet Reviews (2004)
• Lampis et al. Human Molecular Genetics. 2000, 9, 2959-2965
• Pugliatti et al. (EBC), Eur J Neurol (2006)
• J. M. Korn, et al.: Integrated genotype calling and association analysis of SNPs, common copy number
polymorphisms and rare CNVs. Nat. Genet. Technical Reports, ng237 (2008)
• Chiang, Y.J. et al., Nature 403, 216-20 (2000)
• Yokoi N. et al., Nat Genet 31(4), 391-4 (2002)
• Mordes J.P., et al. ILAR J 45(3), 278-91 (2004)
• Loser, S. & Penninger, J.M. Semin. Immunol. 19, 206-214 (2007)
Wednesday, March 30, 2011
83. BIOMEDICINA ENERGIA
E AMBIENTE
DATA FUSION Collana di Seminari per la Valorizzazione dei Risultati della Ricerca al CRS4
20.04.2011
prossimo appuntamento...
SALA AUDITORIUM
via Roma, 253 - Cagliari
Seminario 11:00 -12:30 A.M.
20 aprile 2011
La “rivoluzione digitale”, in atto da anni in tutti i settori della vita
quotidiana, sta investendo in modo sempre più intensivo la
Medicine goes digital
medicina in generale e la pratica clinica: la tecnologia è ormai
diventata un fattore pervasivo ed importante nell’ambito dei processi
di cura, contribuendo a migliorare l’assistenza ai pazienti.
Durante il seminario, partendo dall’esperienza più che decennale del
CRS4 in ricerca e sviluppo per l’impiego di informatica e tecnologia in
campo medico, verranno presentate le attività di ricerca del
gruppo Healthcare Flows nell’ambito delle applicazioni
biomediche, dell’informatica clinica e della sanità elettronica,
anche in stretta collaborazione con istituzioni sanitarie di eccellenza.
In particolare si parlerà di integrazione di sistemi clinici, sicurezza e
tracciabilità nei processi sanitari, gestione semantica e computazionale
di dati biomedici eterogenei, medicina distribuita e telemedicina.
Relatore: Riccardo Triunfo
Relatore
Riccardo Triunfo
La “rivoluzione digitale”, in atto da anni in tutti i settori della vita quotidiana,
sta investendo in modo sempre più intensivo la medicina in generale e la pratica
CRS4 clinica: la tecnologia è ormai diventata un fattore pervasivo ed importante
nell’ambito dei processi di cura, contribuendo a migliorare l’assistenza ai pazienti.
Durante il seminario, partendo dall’esperienza più che decennale del CRS4 in
Wednesday, March 30, 2011
84. Info e iscrizione: www.crs4.it
Risorse online
facebook.com/crs4fb
twitter.com/crs4research
youtube.com/CRS4video
slideshare.net/CRS4 contatti: calis@crs4.it
Wednesday, March 30, 2011