SlideShare a Scribd company logo
Genetik Hastalıkların 
Karakterizasyonunda Yüksek Ölçekli 
Dizileme ve Biyoenformatik 
Can Alkan 
Bilgisayar Mühendisliği Bölümü, 
Bilkent Üniversitesi, Ankara
Genom nedir? 
 Bir canlının tüm DNA’sındaki kalıtımsal 
şifrelerin tamamı 
 İnsan genomu 6 milyar baz çiftinden oluşur, anne 
ve babadan 3’er milyar baz çifti gelir 
 4 çeşit baz: adenin (A), sitozin (C), guanin (G), 
timin (T)
Referans genomu 
 Uluslararası İnsan Genomu Projesi (ABD, İngiltere, Çin, Japonya, 
Almanya, Fransa) 
 8 bireyden oluşturulan 3 milyar baz çiftlik “referans genomu”
İnsan genom çeşitliliği 
Sıklık 
Genetik farklılık türleri 
Tek Nükleotid Polimorfizm (TNP [SNP]) 
Kopya Sayısı Varyasyonu (KSV [CNV]) 
ve Yapısal Varyasyon (YV [SV]) 
Kromozomal 
(trizomi/monozomi) 
1 bp 1 kbp 1 Mbp 
1 kromozom 
Değişken büyüklüğü 
Nasıl bulunur? 
SNP genotipleme/Sanger dizileme 
Array-CGH 
Karyotipleme 
Yeni nesil dizileme 
Verimlilik 
1 bp 
1 kbp 1 Mbp 
1 kromozom 
Değişken büyüklüğü
Tek nükleotidlik ve kısa değişimler 
TNP: İnsanlar arasında tek nükleotidin değişimi ile oluşan farklar 
Kısa indel: 1-50 baz uzunluğunda silinme ve eklenmeler 
referans: C A C A G T G C G C - T 
birey: C A C C G T G - G C A T 
substitüsyon silinme eklenme 
(TNP / SNP) (indel) 
 Kişi başına 3-4.5 milyon arası TNP, yaklaşık 500 bin kısa indel 
 Birçoğu etkisizdir, bazıları genlerin ifade ettiği proteinleri etkiler 
 Nonsense mutasyon: Genin ifadesini durdurur (örn: Akdeniz anemisi) 
 Missense mutasyon: İfade edilen proteini değiştirir (örn: ALS) 
 Frameshift (indel): DNA kodunda kaymaya neden olup proteini değiştirir (örn: 
hiperkolesterol)
Kısa tekrar (mikrosatelit) polimorfizmi 
Tekrar eden ardışık tekrarlardaki değişim 
referans: C A G C A G C A G C A G 
birey: C A G C A G C A G C A G C A G 
 Adli tıpta ve babalık testlerinde kullanılır 
 Bazı hastalıklara yol açabilir: 
 Kırılgan X Sendromu (Fragile X Syndrome) 
 Huntington hastalığı
Yapısal ve Kopya Sayısı Varyasyonu 
SİLİNME YENİ DİZİ EKLEME TRANSPOZON EKLEME 
(deletion) (novel sequence ins.) (transposon insertion) 
Alu/L1/SVA 
ARDARDA KOPYA AYRIŞIK KOPYA 
(tandem duplication) (interspersed duplication) 
İNVERSİYON TAŞINMA 
(inversion) (translocation) 
Kopya Sayısı 
Varyasyonu - KSV 
(copy number 
variation) 
Dengeli 
Varyasyon 
(balanced 
rearrangement)
Yapısal ve Kopya Sayısı Çeşitlilikleri 
Eklenme 
Silinme 
Çevrilme (inversion) 
 ‘Bireysel olarak ender, toplu 
olarak yaygın’ 
 Kişi başına yaklaşık 15-20 
milyon baz çiftini etkiler 
 Çoğunun etkisi yok ya da 
azdır, genlerin silinmesi ya da 
kesintiye uğraması 
durumunda hastalığa yol 
açabilir: 
 Silinme: otizm, zeka geriliği, 
Crohn hastalığı 
 Kopyalanma: şizofreni, sedef 
hastalığı 
 Taşınma: CLL (lösemi) 
 Transpozon: hemofili 
Kidd et al., Nature, 2008
Genomik farklılık keşif projeleri 
 Uluslararası HapMap Projesi 
 4 toplumdan 270 birey 
 İnsan Genomu Çeşitlilik Projesi (HGDP) 
 52 toplumdan 1050 birey 
 Dizileme projeleri: 
 1000 Genom Projesi 
 26 toplumdan 2500 birey (planlanan) 
 İngiltere: 
 UK100K (kontrol + nadir hastalık +yaygın hastalık) 
 Diğer bağımsız projeler: 
 Güney Afrika, Kore, Hindistan, Japonya, İrlanda, Hollanda, 
vb.
Genom dizileme 
Örneklenen 
genom Rastgele parçalama 
Eşli dizileme (paired-end seq.) 
Referans Dizi okuma (read) yerleştirme 
Genomu 
(İGP) Biyoenformatik analiz 
Bulunan farklılıklar 
Sonuçlar 
Deneysel doğrulama 
Baz başına 
10-100 
molekül
Ekzom ya da tüm genom 
 Ekzom dizileme sadece protein kodlayan kısımları 
inceler 
 Genomun %1.5’u 
 Tek gen hastalıkları ve Mendel kalıtımına uyan hastalıklar için 
genelde iyi sonuç verir 
 > 80X kapsama gerekir (~40 milyon “read”) 
 Tüm genom dizileme ile intronlar, UTR’lar, 
promotörlerdeki hastalık nedeni mutasyonlar da 
bulunabilir 
 Crohn hastalığı: McCarroll 2008, Bekpen 2009 
 ALS-FTD: Renton, 2011 
 > 30X kapsama gerekir (~1 milyar “read”)
Biyoenformatik analizler 
 Tekrar dizileme (resequencing): elde bir referans 
genomu varsa karşılaştırılma yapılır (örn. insan, 
fare, şempanze, vs.) 
 Parçacık yerleştirme (read mapping): Her parçacığın 
referans genomuna mümkün olan en az değişiklik ile 
eşleştirilmesi 
 Yeni dizileme (de novo sequencing): referans 
genomu olmayan türlerin referans genomunun 
oluşturulmasında (örn: inci kefali, gibbon, pirinç, 
vb.)
Tekrar dizileme analizi 
Dizileme 
parçacıklar 
BWA, Bowtie, mrFAST, vb. 
parçacık yerleştirme 
(read mapping) 
TNP/indel keşfi Yapısal farklılık keşfi 
GATK, samtools, 
vb. 
VariationHunter, 
GenomeSTRiP, Delly, vb. 
Annovar, snpEff, SIFT, vb. Ingenuity, DADA, vb. 
Yorumlama, veritabanı karşılaştırma, gen 
önceliklendirme 
Protein etkileşimi ve yolak analizi
TNP VE KISA INDELLER
Amaç 
 Referans genomuna hizalanmış kısa parçacıklar 
incelendiğinde görülen farklılıklardan gerçek 
TNP ve dizileme hatalarının ayırılması 
TCTCCTCTTCCAGTGGCGACGGAAC 
CTCCTCTTCCAGTGGCGACAGAACG 
CTCTTCCAGTGGCGACGGAACGACC 
CTTCCAGTGGCGACGGAACGACCC 
TNP? 
CCAGTGGCGACTGAACGACCCTGGA 
CAGTGGCGACAGAACGACCCTGGAG 
Dizileme 
hatası 
Referans TCTCCTCTTCCAGTGGCGACGGAACGACCCTGGAGCCAAGT
Zorluklar 
 Dizileme hataları 
 Tekrar ve duplikasyonlardaki paralog dizi 
varyanları 
 Hizalama hataları 
 TNP ve indellerin yanlış hizalanması 
 Kısa ardışık tekrarlar 
 Düzeltmek için Çoklu Dizi Hizalaması (ÇDH) 
gerekir
Başlıca TNP/indel tahmin programları 
 Genome Analysis Tool Kit (GATK; Broad 
Inst.) 
 Samtools (Sanger Centre) 
 PolyBayes (Boston College) 
 SOAPsnp (BGI) 
 VARiD (U. Toronto)
TNP tahmin hataları ve filtreleme 
 TNP tahminlerinde çok sayıda hata bulunur 
 Sistematik okuma hataları, parçacık yerleştirme ve hizalama 
hataları 
 Ham TNP tahminlerinde %5‐%20 arası yanlış bulgu olabilir 
 “Sert” filtreler: 
 Okuma derinliği (çok az ve çok fazla derinlik) 
 Alel dengesi 
 Baz okuma kalitesi 
 İplik meyli (strand bias) 
 Kısa bölgelerde TNP sayısının fazlalığı 
 İstatistiksel filtreler: 
 dbSNP, HapMap, mikrodizin verileri ile istatiksel skorlama 
 VQSR: Variant Quality Score Recalibration (GATK programında)
YAPISAL VE KOPYA SAYISI 
VARYASYONU
Yapısal ve Kopya Sayısı Varyasyonu 
SİLİNME YENİ DİZİ EKLEME TRANSPOZON EKLEME 
(deletion) (novel sequence ins.) (transposon insertion) 
Alu/L1/SVA 
ARDARDA KOPYA AYRIŞIK KOPYA 
(tandem duplication) (interspersed duplication) 
İNVERSİYON TAŞINMA 
(inversion) (translocation) 
Kopya sayısı 
Varyasyonu 
(copy number 
variation) 
Dengeli 
Varyasyon 
(balanced 
rearrangement) 
Otizm, Crohn’s 
Hemofili 
Şizofreni, sedef 
Lösemi (CLL)
Keşifteki zorluklar 
Silinme ve duplikasyonlar > 5 Kbp; aynı 5 kişinin genonumda 
790 
283 
128 
5 
634 
278 
132 84 
25 
76 
130 
5 
Fosmid klonu 
eşli dizileme 
End-sequence pair 
(N = 1,206) 
42 milyon oligolu 
arrayCGH 
Conrad et al., 2010 
(N = 1,128) 
Affymetrix 6.0 TNP microdizin 
McCarroll et al., 2008 (N = 236)
YV için dizi sinyalleri 
 Eşli dizi analizi (read pair – RP) 
 Tüm YV türleri 
 Bulunan YV’lerin büyüklüğü ve yerlerinin kesinliği 
eşler arasındaki mesafeye bağlı 
 Dizileme derinliği analizi (read depth – RD) 
 Sadece silinme ve duplikasyonlar (KSV) 
 Bulunan KSV’lerin başlangıç/bitiş yerleri yaklaşık 
bulunur 
 Ayrık dizi analizi (split read – SR) 
 Tekrarsız genomik bölgelerdeki tüm YV türleri 
 Bulunan YV’lerin yerleri kesindir 
 Yerel ve genel de novo birleştirme 
 Tekrarsız genomik bölgelerdeki tüm YV türleri 
 Bulunan YV’lerin yerleri kesindir
Bazı YV algoritmaları 
Silinme Eklenme İnversiyon Transpozon Duplikasyon Mikrosatelit 
RP 
VariationHunter X Kısa X X X 
BreakDancer X Kısa 
HYDRA X Kısa X X 
Tangram X 
RD 
WSSD X X 
CNVnator X X 
RDXplorer X X 
SR 
Pindel X Kısa 
SPLITREAD X Kısa X X X X 
lobSTR X 
RP+SR 
Delly X Kısa 
Invy X 
GenomeSTRiP X Kısa X 
AS 
Cortex X X 
NovelSeq X
1000 Genomes Projesinde YV 
Approach Algorithm name Platform Genomes 
SV types discovered (size-range of 
validated SVs in basepairs) 
SV 
calls 
valid 
ated 
FDR 
(PCR) 
FDR 
(array) 
FDR 
(hierar 
ch.) 
Event-wise testing Illumina 6 DEL (200 - 221,800); DUP (200 - 415,700) 5,762 1,952 0 0.230 0.230 
CNVnator Illumina 6 DEL (100 - 412,475) 17,036 2,361 - 0.142 0.142 
AB large indel tool SOLiD 1 DEL (67 - 83,391) 1,138 480 0.188 0.084 0.143 
AB large indel tool SOLiD 1 INS (448 - 2,213) 632 42 0.176 - 0.176 
Spanner Illumina 6 TEINS (51 - 6,012) 2,013 179 0.022 - 0.022 
Spanner Illumina 6 DEL (50-192,167) 4,718 3,619 0.100 0.033 0.087 
PEMer 454 1 DEL (941 - 960,004) 1,062 483 0.095 0.363 0.363 
VariationHunter Illumina 6 DEL (52 - 498,738) 11,028 4,231 0.103 0.419 0.190 
BreakDancer Illumina 6 DEL (51 - 1,035,808) 5,973 3,587 0.115 0.145 0.121 
N/A Illumina 6 DEL (276 - 959,518) 3,419 2,584 0.136 0.085 0.121 
Mosaik 454 2 TEINS (300 - 6,000) 1,463 172 0.055 - 0.055 
Pindel Illumina 6 DEL (51 - 46,384) 3,879 2,960 0.201 0.127 0.189 
N/A 454 1 DEL (51 - 703,404); INS (52 - 295) 32,187 3,845 0.545 0.519 0.543 
SOAPdenovo Illumina 6 DEL (64 - 3,907) 160 55 0.531 0.531 0.497 
SOAPdenovo Illumina 6 INS (55 – 4,116) 3,894 22 0.810 - 0.810 
Cortex Illumina 1 DEL(52-39,512);DUP(83-2,090) 2,787 896 0.415 0.415 0.410 
Cortex Illumina 1 INS(50-828) 389 84 0.398 - 0.398 
NovelSeq Illumina 6 INS (200 - 8,224) 657 30 0.791 - 0.791 
IN 
Spanner Illumina 6 TANDUP (55-64,230) 256 88 0.049 - 0.049 
AS SR PE RD 
1000 Genomes Consortium, Nature, 2010
Kapsamlı bir metot yok 
486 
4 
3250 
303 
6855 (63%) 
3223 (80%) 
1772 (33%) 
RP 
N=6 
RD 
N=4 
SR 
N=4 
1000 Genomes Projesi’ndeki 
doğrulanmış silinmeler 
Kidd et al., Cell, 2010
Varyasyon keşfi – özet 
 Parçaçık hizalama: BWA, mrFAST, Bowtie 
 TNP ve indel: GATK, samtools, SOAPsnp 
 Yapısal: 
 Silinme, eklenme: VariationHunter, Delly, 
BreakDancer, GenomeSTRiP, Pindel, HYDRA... 
 İnversiyon: VariationHunter, Invy 
 Transpozon: VariationHunter, Tangram 
 Mikrosatelit: lobSTR, SPLITREAD, Pindel 
http://seqanswers.com/wiki/SEQanswers
Analiz yükü 
 Tüm genom: 
 100 GB ham (sıkışmış), 150 GB işlenmiş veri 
 BWA hizalama: 30 CPU günü 
 GATK ile SNP/indel (çok aşamalı): 10 CPU günü 
 Yapısal varyasyon: 1 – 20 CPU günü 
 Ekzom: 
 50 GB ham (sıkışmış), 15 GB işlenmiş veri 
 BWA hizalama: 1 CPU günü 
 GATK ile SNP/indel (çok aşamalı): 15 CPU saati 
 Yapısal varyasyon: 1-2 CPU günü
Keşif sonrası 
 Yorumlama ve etkiler 
 snpEff 
 VAAST & pVAAST 
 PolyPhen2 
 Annovar 
 SIFT 
 SNAP 
 MutationTaster 
 Evrimsel korunum 
 GERP 
 phastCons 
 Protein etkileşimi ve 
yolaklar 
 DADA, VAVIEN, vb. 
 Protein yolakları 
 Ingeniuty, vb. 
Cooper & Shendure, Nature Reviews Genetics, 12(9):628-40, 2011
“İsviçre çakısı”: GEMINI
Özet 
 DNA dizileme ucuzlamakta: tüm genom ($1,500-$5,000), 
tüm ekzom ($800-$900). 
 Analiz için güçlü ve pahalı bilgisayar sistemleri gerekli 
 Örn: 32 çekirdekli sistem ~$25,000; 90 TB depolama sistemi ~$25,000 
 Hemen her tür genetik varyasyon bulunabilir: 
 Translokasyon ve inversiyon en zorları 
 KSV tüm genom ile nispeten kolay, ekzom ile sınırlı 
 Varyant etkisi, haplotipleme (fazlama), akraba 
evliliklerinde homozigosite haritalama gibi ek analizler 
yapılabilir 
 Hastalık için nedensel varyantların bulunması “bilimden 
çok sanat”

More Related Content

What's hot

Mutasyonlar ve Tamir Mekanizmları.pptx
Mutasyonlar ve Tamir Mekanizmları.pptxMutasyonlar ve Tamir Mekanizmları.pptx
Mutasyonlar ve Tamir Mekanizmları.pptx
BehcetNAL
 
Fetal Nedenlerle Gebelik Sonlandırılması
Fetal Nedenlerle Gebelik  SonlandırılmasıFetal Nedenlerle Gebelik  Sonlandırılması
Fetal Nedenlerle Gebelik Sonlandırılması
www.tipfakultesi. org
 
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )www.tipfakultesi. org
 
Mikrodelesyon sendromları
Mikrodelesyon sendromlarıMikrodelesyon sendromları
Mikrodelesyon sendromları
06AYDIN
 
2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi
2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi
2013 3 4 genetik bilgi- dna yapısı ve i̇şleviMuhammed Arvasi
 
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
www.tipfakultesi. org
 
İntrauterin Enfeksiyonlara Genel Yaklaşım
İntrauterin Enfeksiyonlara Genel Yaklaşımİntrauterin Enfeksiyonlara Genel Yaklaşım
İntrauterin Enfeksiyonlara Genel Yaklaşım
www.tipfakultesi. org
 
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Telomeraz ve Kanser
Telomeraz ve KanserTelomeraz ve Kanser
Telomeraz ve Kanser
Burak Küçük
 
KİSTİK FİBROZİSİN PRENATAL TANISI
KİSTİK FİBROZİSİN PRENATAL TANISI KİSTİK FİBROZİSİN PRENATAL TANISI
KİSTİK FİBROZİSİN PRENATAL TANISI
www.tipfakultesi. org
 
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )Puberte fizyolojisi (fazlası için www.tipfakultesi.org )
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )www.tipfakultesi. org
 
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )www.tipfakultesi. org
 
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl? Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
www.tipfakultesi. org
 
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
www.tipfakultesi. org
 

What's hot (20)

Mutasyonlar ve Tamir Mekanizmları.pptx
Mutasyonlar ve Tamir Mekanizmları.pptxMutasyonlar ve Tamir Mekanizmları.pptx
Mutasyonlar ve Tamir Mekanizmları.pptx
 
Fetal Nedenlerle Gebelik Sonlandırılması
Fetal Nedenlerle Gebelik  SonlandırılmasıFetal Nedenlerle Gebelik  Sonlandırılması
Fetal Nedenlerle Gebelik Sonlandırılması
 
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )
Mutasyonlar ve mutajenler (fazlası için www.tipfakultesi.org )
 
1.sınıf2h nukleus
1.sınıf2h nukleus1.sınıf2h nukleus
1.sınıf2h nukleus
 
Mikrodelesyon sendromları
Mikrodelesyon sendromlarıMikrodelesyon sendromları
Mikrodelesyon sendromları
 
Mendel Genetiği
Mendel GenetiğiMendel Genetiği
Mendel Genetiği
 
Epigenetik
EpigenetikEpigenetik
Epigenetik
 
2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi
2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi
2013 3 4 genetik bilgi- dna yapısı ve i̇şlevi
 
Sitogenetik
SitogenetikSitogenetik
Sitogenetik
 
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
ERKEN MEMRAN RÜPTÜRÜ YÖNETİM VE TEDAVİ
 
İntrauterin Enfeksiyonlara Genel Yaklaşım
İntrauterin Enfeksiyonlara Genel Yaklaşımİntrauterin Enfeksiyonlara Genel Yaklaşım
İntrauterin Enfeksiyonlara Genel Yaklaşım
 
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)
Cinsiyeti belirleyen genler(fazlası için www.tipfakultesi.org)
 
Dna dizi analizi ve klonlama
Dna dizi analizi ve klonlamaDna dizi analizi ve klonlama
Dna dizi analizi ve klonlama
 
Telomeraz ve Kanser
Telomeraz ve KanserTelomeraz ve Kanser
Telomeraz ve Kanser
 
KİSTİK FİBROZİSİN PRENATAL TANISI
KİSTİK FİBROZİSİN PRENATAL TANISI KİSTİK FİBROZİSİN PRENATAL TANISI
KİSTİK FİBROZİSİN PRENATAL TANISI
 
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )Puberte fizyolojisi (fazlası için www.tipfakultesi.org )
Puberte fizyolojisi (fazlası için www.tipfakultesi.org )
 
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )
Rna yapisi ve özellikleri (fazlası için www.tipfakultesi.org )
 
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl? Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
Antepartum Fetal Değerlendirme,Ne zaman Ve Nasıl?
 
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
MOLEKÜLER DİZİLEME TEKNOLOJİLERİ
 
Transkripsiyon
TranskripsiyonTranskripsiyon
Transkripsiyon
 

Similar to Genetik Hastalıkların Karakterizasyonunda Yüksek Ölçekli Dizileme ve Biyoenformatik

Calkan tubitak-yazokulu
Calkan tubitak-yazokuluCalkan tubitak-yazokulu
Calkan tubitak-yazokulu
Can Alkan
 
PRENATAL TANIDA ARRAY -CGH
PRENATAL TANIDA ARRAY -CGHPRENATAL TANIDA ARRAY -CGH
PRENATAL TANIDA ARRAY -CGH
www.tipfakultesi. org
 
Bioinformatics-4-yildiz_teknik_universitesi
Bioinformatics-4-yildiz_teknik_universitesiBioinformatics-4-yildiz_teknik_universitesi
Bioinformatics-4-yildiz_teknik_universitesi
BkesNar
 
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik TedavilerNonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
Berna Kömürcüoğlu
 
DNA Microarray
DNA MicroarrayDNA Microarray
DNA Microarray
Bardia Farivar
 
Prostat ca ders 2013-2014
Prostat ca ders 2013-2014Prostat ca ders 2013-2014
Prostat ca ders 2013-2014Adnan Dizboyu
 
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğanDuktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
ankaramhd
 
Hapmap veritabanı
Hapmap veritabanıHapmap veritabanı
Hapmap veritabanı
Recep Turan
 
Geneti̇k algori̇tma
Geneti̇k algori̇tmaGeneti̇k algori̇tma
Geneti̇k algori̇tma
Osman Inan
 
Çocukluk Çağı Böbrek Tümörleri
Çocukluk Çağı Böbrek TümörleriÇocukluk Çağı Böbrek Tümörleri
Çocukluk Çağı Böbrek Tümörleri
Barış Yılmaz
 
GIS hastalıklarında Genetik Test
GIS hastalıklarında Genetik TestGIS hastalıklarında Genetik Test
GIS hastalıklarında Genetik Test
Düzen Sağlık Grubu
 
beyin metastazlarında sistemik tedavi
beyin metastazlarında sistemik tedavibeyin metastazlarında sistemik tedavi
beyin metastazlarında sistemik tedaviankaramhd
 
1. GENOM ORGANİZASYONU revised.ppt version
1. GENOM ORGANİZASYONU revised.ppt version1. GENOM ORGANİZASYONU revised.ppt version
1. GENOM ORGANİZASYONU revised.ppt version
aytagl3
 
Maternal Kanda Serbest fetal DNA
Maternal Kanda Serbest fetal DNAMaternal Kanda Serbest fetal DNA
Maternal Kanda Serbest fetal DNA
www.tipfakultesi. org
 
Prof Dr Mehmet Ali GÜLÇELİK- Neoadjuvan Tedavi
Prof Dr Mehmet Ali GÜLÇELİK-   Neoadjuvan TedaviProf Dr Mehmet Ali GÜLÇELİK-   Neoadjuvan Tedavi
Prof Dr Mehmet Ali GÜLÇELİK- Neoadjuvan Tedavi
Mehmet Ali GÜLÇELİK
 
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 

Similar to Genetik Hastalıkların Karakterizasyonunda Yüksek Ölçekli Dizileme ve Biyoenformatik (20)

Calkan tubitak-yazokulu
Calkan tubitak-yazokuluCalkan tubitak-yazokulu
Calkan tubitak-yazokulu
 
PRENATAL TANIDA ARRAY -CGH
PRENATAL TANIDA ARRAY -CGHPRENATAL TANIDA ARRAY -CGH
PRENATAL TANIDA ARRAY -CGH
 
Bioinformatics-4-yildiz_teknik_universitesi
Bioinformatics-4-yildiz_teknik_universitesiBioinformatics-4-yildiz_teknik_universitesi
Bioinformatics-4-yildiz_teknik_universitesi
 
Genetik sözlük
Genetik sözlükGenetik sözlük
Genetik sözlük
 
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik TedavilerNonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
Nonsmallcell Akciğer Kanserinde Hedefe Yönelik Tedaviler
 
Recep has (1)
Recep has (1)Recep has (1)
Recep has (1)
 
DNA Microarray
DNA MicroarrayDNA Microarray
DNA Microarray
 
Prostat ca ders 2013-2014
Prostat ca ders 2013-2014Prostat ca ders 2013-2014
Prostat ca ders 2013-2014
 
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğanDuktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
Duktal-lobüler dışı kanserler ve sarkomlarda adjuvan tedavi - mutlu doğan
 
Serdar ceylaner
Serdar ceylanerSerdar ceylaner
Serdar ceylaner
 
Hapmap veritabanı
Hapmap veritabanıHapmap veritabanı
Hapmap veritabanı
 
Seher başaran (2)
Seher başaran (2)Seher başaran (2)
Seher başaran (2)
 
Geneti̇k algori̇tma
Geneti̇k algori̇tmaGeneti̇k algori̇tma
Geneti̇k algori̇tma
 
Çocukluk Çağı Böbrek Tümörleri
Çocukluk Çağı Böbrek TümörleriÇocukluk Çağı Böbrek Tümörleri
Çocukluk Çağı Böbrek Tümörleri
 
GIS hastalıklarında Genetik Test
GIS hastalıklarında Genetik TestGIS hastalıklarında Genetik Test
GIS hastalıklarında Genetik Test
 
beyin metastazlarında sistemik tedavi
beyin metastazlarında sistemik tedavibeyin metastazlarında sistemik tedavi
beyin metastazlarında sistemik tedavi
 
1. GENOM ORGANİZASYONU revised.ppt version
1. GENOM ORGANİZASYONU revised.ppt version1. GENOM ORGANİZASYONU revised.ppt version
1. GENOM ORGANİZASYONU revised.ppt version
 
Maternal Kanda Serbest fetal DNA
Maternal Kanda Serbest fetal DNAMaternal Kanda Serbest fetal DNA
Maternal Kanda Serbest fetal DNA
 
Prof Dr Mehmet Ali GÜLÇELİK- Neoadjuvan Tedavi
Prof Dr Mehmet Ali GÜLÇELİK-   Neoadjuvan TedaviProf Dr Mehmet Ali GÜLÇELİK-   Neoadjuvan Tedavi
Prof Dr Mehmet Ali GÜLÇELİK- Neoadjuvan Tedavi
 
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)
Böbrek transplantasyonu(fazlası için www.tipfakultesi.org)
 

Genetik Hastalıkların Karakterizasyonunda Yüksek Ölçekli Dizileme ve Biyoenformatik

  • 1. Genetik Hastalıkların Karakterizasyonunda Yüksek Ölçekli Dizileme ve Biyoenformatik Can Alkan Bilgisayar Mühendisliği Bölümü, Bilkent Üniversitesi, Ankara
  • 2. Genom nedir?  Bir canlının tüm DNA’sındaki kalıtımsal şifrelerin tamamı  İnsan genomu 6 milyar baz çiftinden oluşur, anne ve babadan 3’er milyar baz çifti gelir  4 çeşit baz: adenin (A), sitozin (C), guanin (G), timin (T)
  • 3. Referans genomu  Uluslararası İnsan Genomu Projesi (ABD, İngiltere, Çin, Japonya, Almanya, Fransa)  8 bireyden oluşturulan 3 milyar baz çiftlik “referans genomu”
  • 4. İnsan genom çeşitliliği Sıklık Genetik farklılık türleri Tek Nükleotid Polimorfizm (TNP [SNP]) Kopya Sayısı Varyasyonu (KSV [CNV]) ve Yapısal Varyasyon (YV [SV]) Kromozomal (trizomi/monozomi) 1 bp 1 kbp 1 Mbp 1 kromozom Değişken büyüklüğü Nasıl bulunur? SNP genotipleme/Sanger dizileme Array-CGH Karyotipleme Yeni nesil dizileme Verimlilik 1 bp 1 kbp 1 Mbp 1 kromozom Değişken büyüklüğü
  • 5. Tek nükleotidlik ve kısa değişimler TNP: İnsanlar arasında tek nükleotidin değişimi ile oluşan farklar Kısa indel: 1-50 baz uzunluğunda silinme ve eklenmeler referans: C A C A G T G C G C - T birey: C A C C G T G - G C A T substitüsyon silinme eklenme (TNP / SNP) (indel)  Kişi başına 3-4.5 milyon arası TNP, yaklaşık 500 bin kısa indel  Birçoğu etkisizdir, bazıları genlerin ifade ettiği proteinleri etkiler  Nonsense mutasyon: Genin ifadesini durdurur (örn: Akdeniz anemisi)  Missense mutasyon: İfade edilen proteini değiştirir (örn: ALS)  Frameshift (indel): DNA kodunda kaymaya neden olup proteini değiştirir (örn: hiperkolesterol)
  • 6. Kısa tekrar (mikrosatelit) polimorfizmi Tekrar eden ardışık tekrarlardaki değişim referans: C A G C A G C A G C A G birey: C A G C A G C A G C A G C A G  Adli tıpta ve babalık testlerinde kullanılır  Bazı hastalıklara yol açabilir:  Kırılgan X Sendromu (Fragile X Syndrome)  Huntington hastalığı
  • 7. Yapısal ve Kopya Sayısı Varyasyonu SİLİNME YENİ DİZİ EKLEME TRANSPOZON EKLEME (deletion) (novel sequence ins.) (transposon insertion) Alu/L1/SVA ARDARDA KOPYA AYRIŞIK KOPYA (tandem duplication) (interspersed duplication) İNVERSİYON TAŞINMA (inversion) (translocation) Kopya Sayısı Varyasyonu - KSV (copy number variation) Dengeli Varyasyon (balanced rearrangement)
  • 8. Yapısal ve Kopya Sayısı Çeşitlilikleri Eklenme Silinme Çevrilme (inversion)  ‘Bireysel olarak ender, toplu olarak yaygın’  Kişi başına yaklaşık 15-20 milyon baz çiftini etkiler  Çoğunun etkisi yok ya da azdır, genlerin silinmesi ya da kesintiye uğraması durumunda hastalığa yol açabilir:  Silinme: otizm, zeka geriliği, Crohn hastalığı  Kopyalanma: şizofreni, sedef hastalığı  Taşınma: CLL (lösemi)  Transpozon: hemofili Kidd et al., Nature, 2008
  • 9. Genomik farklılık keşif projeleri  Uluslararası HapMap Projesi  4 toplumdan 270 birey  İnsan Genomu Çeşitlilik Projesi (HGDP)  52 toplumdan 1050 birey  Dizileme projeleri:  1000 Genom Projesi  26 toplumdan 2500 birey (planlanan)  İngiltere:  UK100K (kontrol + nadir hastalık +yaygın hastalık)  Diğer bağımsız projeler:  Güney Afrika, Kore, Hindistan, Japonya, İrlanda, Hollanda, vb.
  • 10. Genom dizileme Örneklenen genom Rastgele parçalama Eşli dizileme (paired-end seq.) Referans Dizi okuma (read) yerleştirme Genomu (İGP) Biyoenformatik analiz Bulunan farklılıklar Sonuçlar Deneysel doğrulama Baz başına 10-100 molekül
  • 11. Ekzom ya da tüm genom  Ekzom dizileme sadece protein kodlayan kısımları inceler  Genomun %1.5’u  Tek gen hastalıkları ve Mendel kalıtımına uyan hastalıklar için genelde iyi sonuç verir  > 80X kapsama gerekir (~40 milyon “read”)  Tüm genom dizileme ile intronlar, UTR’lar, promotörlerdeki hastalık nedeni mutasyonlar da bulunabilir  Crohn hastalığı: McCarroll 2008, Bekpen 2009  ALS-FTD: Renton, 2011  > 30X kapsama gerekir (~1 milyar “read”)
  • 12. Biyoenformatik analizler  Tekrar dizileme (resequencing): elde bir referans genomu varsa karşılaştırılma yapılır (örn. insan, fare, şempanze, vs.)  Parçacık yerleştirme (read mapping): Her parçacığın referans genomuna mümkün olan en az değişiklik ile eşleştirilmesi  Yeni dizileme (de novo sequencing): referans genomu olmayan türlerin referans genomunun oluşturulmasında (örn: inci kefali, gibbon, pirinç, vb.)
  • 13. Tekrar dizileme analizi Dizileme parçacıklar BWA, Bowtie, mrFAST, vb. parçacık yerleştirme (read mapping) TNP/indel keşfi Yapısal farklılık keşfi GATK, samtools, vb. VariationHunter, GenomeSTRiP, Delly, vb. Annovar, snpEff, SIFT, vb. Ingenuity, DADA, vb. Yorumlama, veritabanı karşılaştırma, gen önceliklendirme Protein etkileşimi ve yolak analizi
  • 14. TNP VE KISA INDELLER
  • 15. Amaç  Referans genomuna hizalanmış kısa parçacıklar incelendiğinde görülen farklılıklardan gerçek TNP ve dizileme hatalarının ayırılması TCTCCTCTTCCAGTGGCGACGGAAC CTCCTCTTCCAGTGGCGACAGAACG CTCTTCCAGTGGCGACGGAACGACC CTTCCAGTGGCGACGGAACGACCC TNP? CCAGTGGCGACTGAACGACCCTGGA CAGTGGCGACAGAACGACCCTGGAG Dizileme hatası Referans TCTCCTCTTCCAGTGGCGACGGAACGACCCTGGAGCCAAGT
  • 16. Zorluklar  Dizileme hataları  Tekrar ve duplikasyonlardaki paralog dizi varyanları  Hizalama hataları  TNP ve indellerin yanlış hizalanması  Kısa ardışık tekrarlar  Düzeltmek için Çoklu Dizi Hizalaması (ÇDH) gerekir
  • 17. Başlıca TNP/indel tahmin programları  Genome Analysis Tool Kit (GATK; Broad Inst.)  Samtools (Sanger Centre)  PolyBayes (Boston College)  SOAPsnp (BGI)  VARiD (U. Toronto)
  • 18. TNP tahmin hataları ve filtreleme  TNP tahminlerinde çok sayıda hata bulunur  Sistematik okuma hataları, parçacık yerleştirme ve hizalama hataları  Ham TNP tahminlerinde %5‐%20 arası yanlış bulgu olabilir  “Sert” filtreler:  Okuma derinliği (çok az ve çok fazla derinlik)  Alel dengesi  Baz okuma kalitesi  İplik meyli (strand bias)  Kısa bölgelerde TNP sayısının fazlalığı  İstatistiksel filtreler:  dbSNP, HapMap, mikrodizin verileri ile istatiksel skorlama  VQSR: Variant Quality Score Recalibration (GATK programında)
  • 19. YAPISAL VE KOPYA SAYISI VARYASYONU
  • 20. Yapısal ve Kopya Sayısı Varyasyonu SİLİNME YENİ DİZİ EKLEME TRANSPOZON EKLEME (deletion) (novel sequence ins.) (transposon insertion) Alu/L1/SVA ARDARDA KOPYA AYRIŞIK KOPYA (tandem duplication) (interspersed duplication) İNVERSİYON TAŞINMA (inversion) (translocation) Kopya sayısı Varyasyonu (copy number variation) Dengeli Varyasyon (balanced rearrangement) Otizm, Crohn’s Hemofili Şizofreni, sedef Lösemi (CLL)
  • 21. Keşifteki zorluklar Silinme ve duplikasyonlar > 5 Kbp; aynı 5 kişinin genonumda 790 283 128 5 634 278 132 84 25 76 130 5 Fosmid klonu eşli dizileme End-sequence pair (N = 1,206) 42 milyon oligolu arrayCGH Conrad et al., 2010 (N = 1,128) Affymetrix 6.0 TNP microdizin McCarroll et al., 2008 (N = 236)
  • 22. YV için dizi sinyalleri  Eşli dizi analizi (read pair – RP)  Tüm YV türleri  Bulunan YV’lerin büyüklüğü ve yerlerinin kesinliği eşler arasındaki mesafeye bağlı  Dizileme derinliği analizi (read depth – RD)  Sadece silinme ve duplikasyonlar (KSV)  Bulunan KSV’lerin başlangıç/bitiş yerleri yaklaşık bulunur  Ayrık dizi analizi (split read – SR)  Tekrarsız genomik bölgelerdeki tüm YV türleri  Bulunan YV’lerin yerleri kesindir  Yerel ve genel de novo birleştirme  Tekrarsız genomik bölgelerdeki tüm YV türleri  Bulunan YV’lerin yerleri kesindir
  • 23. Bazı YV algoritmaları Silinme Eklenme İnversiyon Transpozon Duplikasyon Mikrosatelit RP VariationHunter X Kısa X X X BreakDancer X Kısa HYDRA X Kısa X X Tangram X RD WSSD X X CNVnator X X RDXplorer X X SR Pindel X Kısa SPLITREAD X Kısa X X X X lobSTR X RP+SR Delly X Kısa Invy X GenomeSTRiP X Kısa X AS Cortex X X NovelSeq X
  • 24. 1000 Genomes Projesinde YV Approach Algorithm name Platform Genomes SV types discovered (size-range of validated SVs in basepairs) SV calls valid ated FDR (PCR) FDR (array) FDR (hierar ch.) Event-wise testing Illumina 6 DEL (200 - 221,800); DUP (200 - 415,700) 5,762 1,952 0 0.230 0.230 CNVnator Illumina 6 DEL (100 - 412,475) 17,036 2,361 - 0.142 0.142 AB large indel tool SOLiD 1 DEL (67 - 83,391) 1,138 480 0.188 0.084 0.143 AB large indel tool SOLiD 1 INS (448 - 2,213) 632 42 0.176 - 0.176 Spanner Illumina 6 TEINS (51 - 6,012) 2,013 179 0.022 - 0.022 Spanner Illumina 6 DEL (50-192,167) 4,718 3,619 0.100 0.033 0.087 PEMer 454 1 DEL (941 - 960,004) 1,062 483 0.095 0.363 0.363 VariationHunter Illumina 6 DEL (52 - 498,738) 11,028 4,231 0.103 0.419 0.190 BreakDancer Illumina 6 DEL (51 - 1,035,808) 5,973 3,587 0.115 0.145 0.121 N/A Illumina 6 DEL (276 - 959,518) 3,419 2,584 0.136 0.085 0.121 Mosaik 454 2 TEINS (300 - 6,000) 1,463 172 0.055 - 0.055 Pindel Illumina 6 DEL (51 - 46,384) 3,879 2,960 0.201 0.127 0.189 N/A 454 1 DEL (51 - 703,404); INS (52 - 295) 32,187 3,845 0.545 0.519 0.543 SOAPdenovo Illumina 6 DEL (64 - 3,907) 160 55 0.531 0.531 0.497 SOAPdenovo Illumina 6 INS (55 – 4,116) 3,894 22 0.810 - 0.810 Cortex Illumina 1 DEL(52-39,512);DUP(83-2,090) 2,787 896 0.415 0.415 0.410 Cortex Illumina 1 INS(50-828) 389 84 0.398 - 0.398 NovelSeq Illumina 6 INS (200 - 8,224) 657 30 0.791 - 0.791 IN Spanner Illumina 6 TANDUP (55-64,230) 256 88 0.049 - 0.049 AS SR PE RD 1000 Genomes Consortium, Nature, 2010
  • 25. Kapsamlı bir metot yok 486 4 3250 303 6855 (63%) 3223 (80%) 1772 (33%) RP N=6 RD N=4 SR N=4 1000 Genomes Projesi’ndeki doğrulanmış silinmeler Kidd et al., Cell, 2010
  • 26. Varyasyon keşfi – özet  Parçaçık hizalama: BWA, mrFAST, Bowtie  TNP ve indel: GATK, samtools, SOAPsnp  Yapısal:  Silinme, eklenme: VariationHunter, Delly, BreakDancer, GenomeSTRiP, Pindel, HYDRA...  İnversiyon: VariationHunter, Invy  Transpozon: VariationHunter, Tangram  Mikrosatelit: lobSTR, SPLITREAD, Pindel http://seqanswers.com/wiki/SEQanswers
  • 27. Analiz yükü  Tüm genom:  100 GB ham (sıkışmış), 150 GB işlenmiş veri  BWA hizalama: 30 CPU günü  GATK ile SNP/indel (çok aşamalı): 10 CPU günü  Yapısal varyasyon: 1 – 20 CPU günü  Ekzom:  50 GB ham (sıkışmış), 15 GB işlenmiş veri  BWA hizalama: 1 CPU günü  GATK ile SNP/indel (çok aşamalı): 15 CPU saati  Yapısal varyasyon: 1-2 CPU günü
  • 28. Keşif sonrası  Yorumlama ve etkiler  snpEff  VAAST & pVAAST  PolyPhen2  Annovar  SIFT  SNAP  MutationTaster  Evrimsel korunum  GERP  phastCons  Protein etkileşimi ve yolaklar  DADA, VAVIEN, vb.  Protein yolakları  Ingeniuty, vb. Cooper & Shendure, Nature Reviews Genetics, 12(9):628-40, 2011
  • 30. Özet  DNA dizileme ucuzlamakta: tüm genom ($1,500-$5,000), tüm ekzom ($800-$900).  Analiz için güçlü ve pahalı bilgisayar sistemleri gerekli  Örn: 32 çekirdekli sistem ~$25,000; 90 TB depolama sistemi ~$25,000  Hemen her tür genetik varyasyon bulunabilir:  Translokasyon ve inversiyon en zorları  KSV tüm genom ile nispeten kolay, ekzom ile sınırlı  Varyant etkisi, haplotipleme (fazlama), akraba evliliklerinde homozigosite haritalama gibi ek analizler yapılabilir  Hastalık için nedensel varyantların bulunması “bilimden çok sanat”

Editor's Notes

  1. Four main signatures in sequencing data to discover SVs.
  2. Just to reiterate I want to emphasize, even in the 1000 genomes project with 19 algorithms, nothing is comprehensive