Joining the Dots: Integra0ng High 
 Throughput Small Molecule and 
          RNAi Screens   
            Rajarshi Guha 
  ...
Background 
•  Primarily cheminforma0cs 
  –  Data mining, algorithm development, soHware 
  –  QSAR, diversity analysis, ...
NIH Chemical Genomics Center
                                   
Assay development                                        ...
Outline 
•    Small molecule screening at NCGC 
•    The NCGC RNAi infrastructure 
•    Making connec0ons 
•    RNAi chall...
Small Molecules
               
Hun0ng for Leads
                                   

           Target              Lead             Lead               C...
The qHTS Paradigm 


   •  Tradi0onal single 
      point screens 
      can miss useful hits 
   •  qHTS involves concent...
Conc. Response Curves 




                                                  Inac1ve 
•  Heuris0c assessment of the signifi...
Annota0ons
                            
•  NCGC employs a variety of screening libraries 
  –  MLSMR (~ 300K) 
  –  LOPAC ...
RNAi
    
Trans‐NIH RNAi Ini0a0ve ‐ Mission 
To establish a state of the art RNAi screening facility to perform
genome-wide RNAi scr...
Current Status
                              
•  Using Qiagen libraries (Kinome & HDG) 
  –  Performing comparisons with o...
RNAi Informa0cs Infrastructure 
RNAi Analysis Workflow 
                                  Raw and              GO 
                                 Process...
RNAi Informa0cs Toolset 

• Local databases (screen data, pathways, 
  interac0ons, etc). 
• Commercial pathway tools.  
•...
Back End Services
                                

•  Currently all computa0onal analysis performed 
   on the backend 
•...
User Accessible Tools 
User Accessible Tools 
Deploying Data 
•  Small molecule HTS results are available via 
   PubChem 
  –  RNAi data is also showing up in PubChem ...
Challenge ‐ RNAi & Small 
                                            Molecule Screens 

                                 ...
HTS for NF‐κB Antagonists
                                                 
  •  NF‐κB controls DNA 
     transcrip0on  
 ...
HTS for NF‐κB Antagonists
                               
•  ME‐180 cell line 
•  S0mulate cells using TNF, leading to NF‐...
Small Molecule HTS Summary 
                                                                                  Most Potent ...
RNAi HTS Summary 
•  Qiagen HDG library – 6886 genes, 4 siRNA’s 
   per gene 
•  A total of 567 genes were knocked 
   dow...
The Obvious Conclusion 
•  The ac0ve compounds target the 16 hits (at 
   least) from the RNAi screen 
  –  Useful if the ...
Small Molecule Targets
                                                                            
                      ...
Small Molecule Targets
                                                                                 
                 ...
Compound Networks ‐ Similarity 
•  Evaluate fingerprint‐based similarity matrix for 
   the 55 ac0ves 
•  Connect pairs tha...
A “Dic0onary” Based Approach 
•  Create a small‐ish annotated library 
  –  “Seed” compounds 
•  Use it in parallel small ...
Compound Networks ‐ Targets
                                                
         •  Predict targets for the ac0ves us...
Gene Networks ‐ Pathways
                                                   
        •  Nodes are 1374 HDG 
           gen...
(Reduced) Gene Networks – Pathways
                                  
•  Nodes are 526 genes 
   with >= 1 siRNA 
   showi...
Pathway Based Integra0on 
•  Direct matching of targets is not very useful 
•  Try and map compounds to siRNA targets if 
...
Pathway Based Integra0on 
•  S0ll not completely useful, as it only handled 
   18 compounds 
•  Depending on target predi...
Integra0on Caveats
                              
•  Biggest bonleneck is lack of resolu0on 
•  Currently, both small mole...
Integra0on Caveats
                                                          
        •  Compound annota0ons are key 
    ...
CPT Sensi0za0on & “Central” Genes
                                 




                      Yves Pommier, Nat. Rev. Canc...
Screening Protocol
                                     




Screen conducted in the human breast cancer cell line MDA-MB-...
Hit Selection
                                                  Follow-Up Dose Response Analysis

                        ...
Are These Genes Relevant? 
•  Some are well known to be CPT‐sensi0zers 
•  Consider a HPRD PPI sub‐network 
   correspondi...
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens
Upcoming SlideShare
Loading in...5
×

Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens

1,171

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,171
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
18
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Joining the Dots: Integrating High Throughput Small Molecule and RNAi Screens

  1. 1. Joining the Dots: Integra0ng High  Throughput Small Molecule and  RNAi Screens   Rajarshi Guha  NIH Chemical Genomics Center   January 24, 2010  CCMB Seminar Series  
  2. 2. Background  •  Primarily cheminforma0cs  –  Data mining, algorithm development, soHware  –  QSAR, diversity analysis, virtual screening,  fragments, polypharmacology, networks  –  Work on a variety of Open Source projects  •  Recently started moving into bioinforma0cs  –  Suppor0ng RNAi screens  •  Integrate small molecule informa1on &  biosystems – systems chemical biology 
  3. 3. NIH Chemical Genomics Center   Assay development  Compound  and op1miza1on  Op1miza1on  Small Molecules  Biology  Chemistry  NCGC  Informa0cs  ACOM  Genome wide RNAi  SAR analysis, method &  Automa1on, Compound  tool development  management 
  4. 4. Outline  •  Small molecule screening at NCGC  •  The NCGC RNAi infrastructure  •  Making connec0ons  •  RNAi challenges 
  5. 5. Small Molecules  
  6. 6. Hun0ng for Leads   Target  Lead  Lead  Clinical  Iden0fica0on  Discovery  Op0miza0on  Development  HTS  Primary  Confirma0on  •  Sensi0vity  Screening  •  Select subset  •  Scaling  •  Fluorescence  to follow up  •  Counter  •  High Content  •  Diversity  screen  •  Explore SAR  Assay  Cherry Picking  Op0miza0on 
  7. 7. The qHTS Paradigm  •  Tradi0onal single  point screens  can miss useful hits  •  qHTS involves concentra0on response assays  on a high‐throughput scale  •  The CRC allows us to   categorize hits in a more  fine‐grained manner  Inglese, J et al, Proc. Natl. Acad. Sci., 2006, 103, 11473‐11478 
  8. 8. Conc. Response Curves  Inac1ve  •  Heuris0c assessment of the significance of a  concentra0on response curve  •  We aggregate certain curve classes into  “ac0ve”, “inconclusive” and “inac0ve”  categories  •  Inconclusive is a “catch all”   Inconclusive  category (i.e., if it not clearly   ‘ac0ve’ or ‘inac0ve’)  Ac1ve  8 
  9. 9. Annota0ons   •  NCGC employs a variety of screening libraries  –  MLSMR (~ 300K)  –  LOPAC (~ 1300)  –  Prestwick, Sytravon, …  –  Beyond structures and vendor ID’s, not a whole lot  of annota0on  –  This is a required step for integra0on with RNAi  –  Obviously not possible for large diverse libraries  •  Use target predicBon models? 
  10. 10. RNAi  
  11. 11. Trans‐NIH RNAi Ini0a0ve ‐ Mission  To establish a state of the art RNAi screening facility to perform genome-wide RNAi screens with investigators in the intramural NIH community. •  Gene func0on  •  Pathway analysis  •  Target ID  •  Compound MoA  •  Drug antagonist/ agonist 
  12. 12. Current Status   •  Using Qiagen libraries (Kinome & HDG)  –  Performing comparisons with other vendors  •  Pilot phase, run 38 screens so far, ranging from  3 plates to 100 plates  •  All screens are currently reporter  0 20 40 60 80 100 indeno!998!40 indeno!998!80 indeno!vo ! ! 0.8 ! ! ! ! ! ! ! ! !! ! ! ! ! ! !! 0.6 ! ! ! ! based  ! 0.4 0.2 cpt!mirna!5nm cpt!mirna!vo indeno!776!10 indeno!776!20 ! ! ! ! 0.8 ! ! ! ! ! •  Will start up phenotypic screens  0.6 ! !! !!! !! ! ! ! ! 0.4 0.2 cpt!hdg!redo!5nm cpt!hdg!redo!vo cpt!hdg!vo cpt!mirna!20nm Z this summer, with new robo0cs  ! ! ! ! ! ! ! ! ! ! ! ! !! ! !! ! ! ! ! !! !! !! ! ! ! !! ! ! !!! ! ! !! ! !!!!! !! !!!! ! !!!! !!! ! ! ! ! ! ! ! !!! ! ! !!!! ! ! ! ! !!! ! ! ! ! ! ! !! ! ! !! ! !! ! ! !! !! !! ! !! !!! ! !! ! ! !! !! ! ! ! !! !!! !! ! ! !! !!! ! ! ! !! ! !! !! ! ! ! 0.8 ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !! ! !! ! ! ! !! ! !! ! !! ! ! !! !! ! ! !! ! ! ! !! ! ! ! ! ! ! ! ! !! !! ! ! !! ! ! ! ! ! ! !! !! ! !! ! !! ! !! ! ! !! ! ! !! ! ! ! !! ! !! !! !! ! ! ! ! ! ! ! ! ! ! ! ! ! !! ! ! ! ! ! !! ! ! ! ! ! ! ! ! 0.6 ! ! ! ! ! ! ! 0.4 ! 0.2 cpt!hdg!20nm cpt!hdg!5nm cpt!hdg!followup cpt!hdg!redo!20nm ! !! ! !!! !! ! ! ! !! ! !!!! ! 0.8 ! ! ! ! !! ! ! ! !! ! !! ! !!! ! ! ! ! !! ! ! ! ! ! !! ! ! !! ! ! ! ! !!! ! ! !! ! ! ! ! ! !! ! ! ! !! ! ! ! ! ! !!! ! ! ! ! !!! ! ! !!! ! ! !! ! ! !! ! ! !! ! ! ! ! !! ! ! ! ! !! ! ! ! !! ! ! ! !! ! ! ! !! ! !! ! ! !! ! ! ! ! ! ! ! !! ! ! ! ! !! !!!! ! ! ! !! ! ! ! !! !! ! ! ! ! ! !! ! !!! ! ! ! !! ! !! ! !! ! !! ! ! ! !!! ! ! ! ! !!! !!! ! ! ! ! !! ! ! ! ! ! ! !! ! ! !!! ! !! !! ! !! ! ! ! ! ! 0.6 ! ! ! ! ! !! ! ! ! ! ! ! ! !! ! !! ! !! ! !! ! ! ! ! ! !! ! ! !! ! !! ! ! !! ! ! ! ! ! ! ! ! ! ! 0.4 ! ! ! ! ! 0.2 ! 0 20 40 60 80 100 0 20 40 60 80 100 Plate Index
  13. 13. RNAi Informa0cs Infrastructure 
  14. 14. RNAi Analysis Workflow  Raw and  GO  Processed  annota0ons  Pathways  Data  Interac0ons  • Summary  Normaliza0on  • Thresholding  Hit Triage  sta0s0cs  • Median  • Hypothesis  • GO seman0c  • Correc0ons  • Quar0le  tes0ng  similarity  • Background  • Sum of ranks  • Pathways  • Interac0ons  QC  Hit Selec0on  Follow‐up  Hit List 
  15. 15. RNAi Informa0cs Toolset  • Local databases (screen data, pathways,  interac0ons, etc).  • Commercial pathway tools.   • Custom soHware for loading, analysis and  visualiza0on. 
  16. 16. Back End Services   •  Currently all computa0onal analysis performed  on the backend  •  R & Bioconductor code  •  Custom R package (ncgcrnai) to support NCGC  infrastructure  –  Partly derived from cellHTS2  –  Supports QC metrics, normaliza0on, adjustments,  selec0ons, triage, (sta0c) visualiza0on, reports  •  Some Java tools for  –  Data loading  –  Library and plate registra0on 
  17. 17. User Accessible Tools 
  18. 18. User Accessible Tools 
  19. 19. Deploying Data  •  Small molecule HTS results are available via  PubChem  –  RNAi data is also showing up in PubChem  •  But what do we want to make available?  •  How do we make it available?  –  Standardized format (MIARE)  –  cellHTS2 “format”  –  Custom viewers  –  Raw data? Calls? 
  20. 20. Challenge ‐ RNAi & Small  Molecule Screens  What targets mediate activity of siRNA and compound Pathway elucidation, •  Reuse pre-existing MLI data identification of interactions •  Develop new annotated libraries CAGCATGAGTACTACAGGCCA  TACGGGAACTACCATAATTTA  Target ID and validation Link RNAi generated pathway peturbations to small molecule activities. Could provide insight into polypharmacology •  Run parallel RNAi screen Goal: Develop systems level view of small molecule activity
  21. 21. HTS for NF‐κB Antagonists   •  NF‐κB controls DNA  transcrip0on   •  Involved in cellular  responses to  s0muli  –  Immune response,  memory forma0on  –  Inflamma0on,  cancer, auto‐ immune diseases  hnp://www.genego.com 
  22. 22. HTS for NF‐κB Antagonists   •  ME‐180 cell line  •  S0mulate cells using TNF, leading to NF‐κB  ac0va0on, readout via a β‐lactamase reporter  •  Iden0fy small molecules and siRNA’s that  block the resultant ac0va0on 
  23. 23. Small Molecule HTS Summary  Most Potent Actives •  2,899 FDA‐approved  ! ! ! ! Proscillaridin A 0 compounds screened  ! ! !20 Activity ! !40 ! •  55 compounds retested ac0ve  ! ! ! ! ! ! !60 ! !9 !8 !7 !6 !5 log Concentration (uM) Trabectidin •  Which components of the NF‐ ! ! 0 ! ! ! !20 ! Activity κB pathway do they hit?  !60 ! !100 ! ! ! ! ! ! ! ! –  17 molecules have target/ !9 !8 !7 !6 !5 log Concentration (uM) ! ! ! Digoxin 0 ! pathway informa0on in GeneGO  ! ! !20 Activity –  Literature searches list a few  !40 ! ! ! ! ! ! !60 ! ! ! more  !9 !8 !7 !6 !5 log Concentration (uM) Miller, S.C. et al, Biochem. Pharmacol., 2010, ASAP 
  24. 24. RNAi HTS Summary  •  Qiagen HDG library – 6886 genes, 4 siRNA’s  per gene  •  A total of 567 genes were knocked  down by 1 or more siRNA’s  –  We consider >= 2 as a “reliable” hit  –  16 reliable hits  –  Added in 66 genes for   follow up via triage procedure 
  25. 25. The Obvious Conclusion  •  The ac0ve compounds target the 16 hits (at  least) from the RNAi screen  –  Useful if the RNAi screen was small & focused  •  But what if we’re inves0ga0ng a larger system?  –  Is there a way to get more specific?  –  Can compound data suggest RNAi non‐hits? 
  26. 26. Small Molecule Targets   Bortezomib (proteosome inhibitor) ! 0 ! ! ! ! ! !20 ! ! !40 Activity ! !60 ! ! ! !80 ! ! ! !100 !9 !8 !7 !6 !5 log Concentration (uM) •  Some small molecules  interact with core  components  ! ! 0 ! ! ! ! ! ! ! ! ! ! !20 ! !40 Activity !60 !80 ! ! !120 !9 !8 !7 !6 !5 Daunorubicin (IκBα inhibitor) log Concentration (uM)
  27. 27. Small Molecule Targets   ! Montelukast (LDT4 antagonist) 0 ! ! ! ! ! ! ! ! ! ! ! !20 ! !40 Activity ! !60 !80 ! !100 !9 !8 !7 !6 !5 log Concentration (uM) •  Others are ac0ve against  upstream targets  •  We also get an idea of off ‐ target effects 
  28. 28. Compound Networks ‐ Similarity  •  Evaluate fingerprint‐based similarity matrix for  the 55 ac0ves  •  Connect pairs that   exhibit Tc> 0.7   •  Edges are weighted  by the Tc value   •  Most groupings are  obvious 
  29. 29. A “Dic0onary” Based Approach  •  Create a small‐ish annotated library  –  “Seed” compounds  •  Use it in parallel small molecule/RNAi screens  •  Use a similarity based approach to priori0ze  larger collec0ons, in terms of an0cipated  targets  –  Currently, we’d use structural similarity  –  Diversity of priori0zed structures is dependent on  the diversity of the annotated library 
  30. 30. Compound Networks ‐ Targets   •  Predict targets for the ac0ves using SEA  •  Target based compound network maps nearly  iden0cally to the   similarity based network   •  But depending on the   predicted target quality  we get poor (or no)   mappings to the   RNAi targeted genes  Keiser, M.J. et al, Nat. Biotech., 2007, 25, 197‐206 
  31. 31. Gene Networks ‐ Pathways   •  Nodes are 1374 HDG  genes contained in the  NCI PID   •  Edge indicates two  genes/proteins are  involved in the same  pathway  •  “Good” hits tend to be  very highly connected  Wang, L. et al, BMC Genomics, 2009, 10, 220 
  32. 32. (Reduced) Gene Networks – Pathways   •  Nodes are 526 genes  with >= 1 siRNA  showing knockdown   •  Edge indicates two  genes/proteins are  involved in the same  pathway 
  33. 33. Pathway Based Integra0on  •  Direct matching of targets is not very useful  •  Try and map compounds to siRNA targets if  the compounds’ predicted target(s) and siRNA  targets are in the same pathway  –  Considering 16 reliable hits, we cover 26 pathways  –  Predicted compound targets cover 131 pathways  •  For 18 out of 41 compounds  –  3 RNAi‐derived pathways not covered by  compound‐derived pathways   •  Rhodopsin, alterna0ve NFkB, FAS 
  34. 34. Pathway Based Integra0on  •  S0ll not completely useful, as it only handled  18 compounds  •  Depending on target predic0ons is probably  not a great idea 
  35. 35. Integra0on Caveats   •  Biggest bonleneck is lack of resolu0on  •  Currently, both small molecule and RNAi data  are 1‐D  –  Ac0ve or inac0ve, high/low signal  –  CRC’s for small molecules alleviate this a bit  •  High content screens can provide significantly  more informa0on and so bener resolu0on  –  Data size & feature selec0on are of concern 
  36. 36. Integra0on Caveats   •  Compound annota0ons are key  •  More comprehensive pathway data will be  required  •  RNAi and small molecule inhibi0on do not  always lead to the same phenotype  –  Could be indica0ve of promiscuity  –  Could indicate true biological differences  Weiss, W.A. et al, Nat. Chem. Biol., 2007, 12, 739-744
  37. 37. CPT Sensi0za0on & “Central” Genes   Yves Pommier, Nat. Rev. Cancer, 2006. TOP1 poisons prevent DNA religation resulting in replication-dependent double strand breaks. Cell activates DNA damage response (e.g. ATR).
  38. 38. Screening Protocol Screen conducted in the human breast cancer cell line MDA-MB-231. Many variables to optimize including transfection conditions, cell seeding density, assay conditions, and the selection of positive and negative controls.
  39. 39. Hit Selection Follow-Up Dose Response Analysis ATR Screen #1 siNeg siATR-A Viability (%) siATR-B siATR-C Sensitization Ranked by Log2 Fold Change CPT (Log M) Screen #2 MAP3K7IP2 siNeg siMAP3K7IP2-A Viability (%) siMAP3K7IP2-B siMAP3K7IP2-C siMAP3K7IP2-D Sensitization Ranked by Log2 Fold Change CPT (Log M) Multiple active siRNAs for ATR, MAP3K7IP2, and BCL2L1.
  40. 40. Are These Genes Relevant?  •  Some are well known to be CPT‐sensi0zers  •  Consider a HPRD PPI sub‐network  corresponding to the Qiagen HDG gene set  •  How “central” are these selected genes?  –  Larger values of betweenness  3.0 indicate that the node lies on  2.5 many shortest paths  2.0 log Frequency –  Makes sense ‐ a number of   1.5 them are stress‐related  1.0 –  But some of them have very low  0.5 betweenness values  0.0 0 2 4 6 log Betweenness
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×