Open problems in
                          association mapping
                                                  Thomas Mailund




&

!"
                         Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
                         Research
Stuff about
                           Open problems in
                          association mapping
                                                  Thomas Mailund




&

!"
                         Bioinformatics
!!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre
                         Research
Overview

• Tutorial
• Multi-marker methods - rare(er) variants
• Multi-loci methods - epistasis
Tutorial
Gunshot wounds
Car accidents
Smoking induced
lung cancer       “Genetic” diseases
Cardiovascular
disease
Obesity
Diabetes 2
Alzheimer
Schizophrenia
BRCA1
breast cancer
Cystic fibrosis
Haemophilia
Disease mapping...
Locate disease-affecting polymorphisms

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Disease mapping...
Locate phenotype-affecting polymorphisms


                   --A--------C--------A----G---X----T---C---A----
                   --T--------G--------A----G---X----C---C---A----
                   --A--------G--------G----G---X----C---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --T--------C--------A----G---X----T---C---A----
                   --T--------C--------A----T---X----T---A---A----

                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------A----G---X----T---C---G----
                   --T--------C--------A----T---X----T---C---A----
                   --A--------C--------A----G---X----T---C---A----
                   --A--------C--------G----T---X----C---A---A----
                   --A--------C--------A----G---X----C---C---G----
Disease mapping...
Markers are locally correlated

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Marker Relatedness
                  Linkage disequilibrium (LD)

 Empirical Results                              Theoretical Results




                                      LD (r2)




                                                     Recombination rate

Clark et al. 2003, AJHG 73:285-300.                  Hein et al. 2005
Disease mapping...
Search for indirect signals

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association
               “Tag” markers                    Unobserved marker

   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
GWA


Type 500k - 1m and get 3b
GWA


Type 500k - 1m and get 3b
                The common
                  variants
Multiple test issues


5% significance threshold
means 5% false positives...
Null distribution
Alternative distribution
Null distribution
Alternative distribution
Null distribution
Alternative distribution
Null distribution
"Real" null distribution
Alternative distribution
WTCCC results
GWA a successful
  approach

~500 validated findings
for ~100 different traits
GWA a successful
  approach

~500 validated findings
for ~100 different traits
...but much genetic risk
remains unexplained!
Why?
Why?

• Rare variants?
 • We only tag common variants...
• Gene-gene interaction?
 • Marginal effects vs interactions...
Multi-marker methods
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect Association


   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Indirect
          Multi-Marker
           Association
   Cases (affected)
                        --A--------C--------A----G---X----T---C---A----
                        --T--------G--------A----G---X----C---C---A----
                        --A--------G--------G----G---X----C---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --T--------C--------A----G---X----T---C---A----
                        --T--------C--------A----T---X----T---A---A----

                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------A----G---X----T---C---G----
                        --T--------C--------A----T---X----T---C---A----
                        --A--------C--------A----G---X----T---C---A----
                        --A--------C--------G----T---X----C---A---A----
                        --A--------C--------A----G---X----C---C---G----

Controls (unaffected)
Local trees along the
       genome
Local trees along the
       genome
Local trees along the
       genome
Local trees along the
       genome
Trees and LD
Tree similarity




                                       LD r2




                  Recombination rate           Recombination rate
Clustering on a tree
           Disease affecting mutation
Clustering on a tree
  Complete penetrance


          Incomplete penetrance



  Spurious disease
Clustering on a tree

  25%
              Case/control clustering
              is not random on the tree...
        75%




                             40%
                    60%
Scoring the clustering

                   Red=cases
                   Green=controls



Are the case chromosomes significantly
over-represented in some clusters?
Besenbacher et al. 2009
Multi-loci methods
A
A
A
G
G
          A       3       2



A
A         G       3       2
A
G
G
     3

    1.5

     0
              A       G
T
T
A
A
A
          T       2       3



A
A         A       2       3
A
T
T
     3

    1.5

     0
              T       A
A   T
A   T
A   A       AT        2        0
G   A
G   A
            AA        1        1

            GA        2        0
A   A
A   A
A   A       GT        0        2
G   T
G   T
        2

        1

        0
            AT   AA       GA   GT
Explosion in complexity


   500k markers gives us
     ~125 billion pairs!
Explosion in complexity


   500k markers gives us
     ~2·10 16 triplets
• Using protein interaction networks we
 • Reduced ~125 billion tests to ~3-4 million
 • Reduced corrected significance threshold
                                -8
    from   ~4·10-13   to   ~9·10
Perspectives...
• Complete genome sequencing
 • No need for tagging
 • Rare variants
 • Structural variation
• Pathway analysis
 • Analysis of pathways as a whole
 • Constructing tests from known pathways
Ku 05 08 2009

Ku 05 08 2009

  • 1.
    Open problems in association mapping Thomas Mailund & !" Bioinformatics !!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre Research
  • 2.
    Stuff about Open problems in association mapping Thomas Mailund & !" Bioinformatics !!"#$%&$'()*"%(+,&&&&&&&&&&&&&&&&&&&&&&& Centre Research
  • 3.
    Overview • Tutorial • Multi-markermethods - rare(er) variants • Multi-loci methods - epistasis
  • 4.
  • 5.
    Gunshot wounds Car accidents Smokinginduced lung cancer “Genetic” diseases Cardiovascular disease Obesity Diabetes 2 Alzheimer Schizophrenia BRCA1 breast cancer Cystic fibrosis Haemophilia
  • 6.
    Disease mapping... Locate disease-affectingpolymorphisms Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 7.
    Disease mapping... Locate phenotype-affectingpolymorphisms --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G----
  • 8.
    Disease mapping... Markers arelocally correlated Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 9.
    Marker Relatedness Linkage disequilibrium (LD) Empirical Results Theoretical Results LD (r2) Recombination rate Clark et al. 2003, AJHG 73:285-300. Hein et al. 2005
  • 10.
    Disease mapping... Search forindirect signals Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 11.
    Indirect Association “Tag” markers Unobserved marker Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 12.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 13.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 14.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 15.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 16.
    GWA Type 500k -1m and get 3b
  • 17.
    GWA Type 500k -1m and get 3b The common variants
  • 18.
    Multiple test issues 5%significance threshold means 5% false positives...
  • 20.
  • 21.
  • 22.
  • 23.
    Null distribution "Real" nulldistribution Alternative distribution
  • 24.
  • 25.
    GWA a successful approach ~500 validated findings for ~100 different traits
  • 26.
    GWA a successful approach ~500 validated findings for ~100 different traits ...but much genetic risk remains unexplained!
  • 27.
  • 28.
    Why? • Rare variants? • We only tag common variants... • Gene-gene interaction? • Marginal effects vs interactions...
  • 29.
  • 30.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 31.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 32.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 33.
    Indirect Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 34.
    Indirect Multi-Marker Association Cases (affected) --A--------C--------A----G---X----T---C---A---- --T--------G--------A----G---X----C---C---A---- --A--------G--------G----G---X----C---C---A---- --A--------C--------A----G---X----T---C---A---- --T--------C--------A----G---X----T---C---A---- --T--------C--------A----T---X----T---A---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------A----G---X----T---C---G---- --T--------C--------A----T---X----T---C---A---- --A--------C--------A----G---X----T---C---A---- --A--------C--------G----T---X----C---A---A---- --A--------C--------A----G---X----C---C---G---- Controls (unaffected)
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
    Trees and LD Treesimilarity LD r2 Recombination rate Recombination rate
  • 40.
    Clustering on atree Disease affecting mutation
  • 41.
    Clustering on atree Complete penetrance Incomplete penetrance Spurious disease
  • 42.
    Clustering on atree 25% Case/control clustering is not random on the tree... 75% 40% 60%
  • 43.
    Scoring the clustering Red=cases Green=controls Are the case chromosomes significantly over-represented in some clusters?
  • 47.
  • 48.
  • 49.
    A A A G G A 3 2 A A G 3 2 A G G 3 1.5 0 A G
  • 50.
    T T A A A T 2 3 A A A 2 3 A T T 3 1.5 0 T A
  • 51.
    A T A T A A AT 2 0 G A G A AA 1 1 GA 2 0 A A A A A A GT 0 2 G T G T 2 1 0 AT AA GA GT
  • 52.
    Explosion in complexity 500k markers gives us ~125 billion pairs!
  • 53.
    Explosion in complexity 500k markers gives us ~2·10 16 triplets
  • 59.
    • Using proteininteraction networks we • Reduced ~125 billion tests to ~3-4 million • Reduced corrected significance threshold -8 from ~4·10-13 to ~9·10
  • 62.
    Perspectives... • Complete genomesequencing • No need for tagging • Rare variants • Structural variation • Pathway analysis • Analysis of pathways as a whole • Constructing tests from known pathways