SlideShare a Scribd company logo
1 of 22
Improved Medical Education in Basic
Sciences
for Better Medical Practicing
ImproveMEd
Sustavi biologije za medicinu
IIja, Kako analizirati velike skupove podataka?
Sustavi biologije studije često
započinju ekspresije profila
(lijekom tretiranih vs.
neobrađene stanice, normalne
stanice raka, u odnosu na
stanice u različitim razvojnom
stadiju) ... pomoću mikročipa ili
RNAseq... mikropostrojima je
isplativ pristup ...
I dobili smo ovo ...
Mikročipa može stati 10 000 mjesta. Let-a pretpostaviti da
je svaka točka je gen - kako ćemo organizirati mrlje / gene
kako bi izvukli rezultat?
Laserski skener mjeri jednu fluorescentnu naljepnicu od
drugog i položimo jedan preko drugog ... svaka točka je
mjernoged dva puta!
intenzitet fluorescentnog signala = količina vezanog DNA
Svaka točka se može zamijeniti s brojem koji predstavlja
relativnu promjenu od „normalne” razine.
N = R / G ... ..1 znači jednak ekspresiju u oba uzorka
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
Boje se pretvaraju u brojeve, jer brojevi su lakše organizirati!
Svaka točka se može zamijeniti s brojem koji predstavlja relativnu
promjenu od „normalne” razine.
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
N = R / G
N = 1 jednaki ekspresija u oba uzorka
N> 1 indukcija
N ‹1 suzbijanje
http://www.hhmi.org/biointeractive/how-analyze-dna-microarray-
data
http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes-
proteins-and-small-molecules
Možemo usporediti s više uzoraka ...
.ili možemo slijediti jedan tijekom
vremena - ljudska fibroblastst
stimulirane serumom i zatim 24 sata
(Iyeret al. 1999)
I organizirati gene, tako da
inducirani jednom su grupirani
u jednom krajnje suprotno od
potisnute jednom ...
Takvo iskazivanje podataka naziva toplina karta
Za vađenje znanja iz velikog podataka
nam je potrebno statističke metode!
Obično koriste - R statistički paket
LIMMA
Identificirati klastera smo limenka
koristiti - klaster analiza!
Originalni brojevi logaritmized (Po bazi
2 ili 10) i nego što nastavite
izračunavanjem sličnost rezultata -
pomoću računalnog programa koji prati
microarray platformu.
Za vizualni prikaz podataka skrećemo
brojeve opet u bojama, ali ovaj put
zelena znači represiju i crvena znači da
indukciju.
Drugi način prikazivanja
podataka vulkan zemljište
(Uobičajeno GWS studija).
Podaci su prikazani u „rasuli
okućnica” kako bi brzo pronašli
najzanimljiviji kandidat npr gena
u nekoj bolesti.
Kombinira dva statističkih
testova: primjerice, A p
vrijednost od ANOVA modela s
veličinom promjene.
Brzo vizualna identifikacija
podataka (gena, itd) koji
prikazuju velike promjene
magnitude koje su također
Statistički značajno,
Granica
između p
<0,05 i p
<0,05
Razlika između istih parametara u dva uzorka prikazana kao
„Puta promjene”
U sivoj su promjene manje onda 2x.
http://genomicsclass.github.io/book/pages/using_limma.html
statistička značajnost
zanimljiva podataka
Oboje, Toplina karta i vulkan Zemljište (i statistička analiza iza
njih), prvi su korak prema identificiranju i rangiranje gena /
proteina iza primijetio fenotip. Generiranopopisi
genaOdgovoran za promatrane mehanizama ili potencijalne
mete terapije, i dalje se obrađuju različitim bioinformatika
alata.
Popis gena mogu se pohraniti u: Gen Ontologija Gene Set
Obogaćivanje analiza, Transkripcija faktorske analize...
Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se
međusobno usporedivi.
Gene Ontologija - http://geneontology.org/
Bioinformatika alat korisna za dodjeljivanje pravo ime
u nizu i povezivanje molekularnih promjena na
stanične procese
Geni i proteini su konzervirani u većinu živih
organizama i imaju zajednički funkcije. Pronalaženje
ulogu gena u jednom organizmu može pomoći
osvjetljava njezinu ulogu u drugu.Gene Ontologija
konzorcij bavi gena nomenklaturi.
Setovi su organizirani prema:
-biološki proces
-molekularna funkcija
-Cellular pretinac
Gen Ontologija konzorcij, Priroda, 2000.
Biološki proces kao što su: rast stanica,
proliferacijom, prijevoda ili kamp sinteza…
Cellular pretinac
Roditeljski
čvorovi
djeca čvorovi
Sustavno ime ORF
Standardna
ime gena
GO biološki proces
molekularna funkcija
stanična komponenta
Gene set za obogaćivanje analize - GSEA
Analitička metoda namijenjena pronalaženje i tumačenje
skupove gena.
U potrazi za genima koji mijenjaju zajedno
- određivanje razine proteina koji sudjeluju u istom
signalnog puta
- u potrazi za molekule koje sudjeluju u istom biološkom
procesu
Slobodni softver paket s početnom bazom podataka od
1.325 biološki određeni skupovi gena.
http://software.broadinstitute.org/gsea/index.jsp
Subramanian et al. (2005) PNAS 102: 15.545
1. Sortiranje geni prema kriterij npr razine ekspresije
2. Usporedite popis nekih već postojećih popisa i dodijeliti
pojedinačne gene za 'erichrichment postići'- pretjerano
predstavljene ili prekomjerno smanjenje gena prema
KolmogorovStatistika -Smirnov tipa
3. Max Obogaćivanje rezultat (MES) je pokazatelj
relevantnosti postojeći set gena za novi podaci postavljena
upravo pod istragom
transkripcijski faktor Analiza
Geni koji su promijenili razinu izražavanja može biti
regulirana na isti faktor transkripcije.
Geni su identificirani kombinacijom omics Podaci
prije i znanje.
Chea baza podataka Trenutno povezuje 159
transkripcijski faktori u više od 30.000 gena - ukupno
361 299 interakcije - izvađeni iz 157 publikacije.
TRANSFAC, PAINT, JASPAR - ostale baze podataka za
Čip
kinaza Analiza obogaćenje (KEA)
Web-baze command- linija softver koji povezuje
popis proteina sisavaca s proteinima kinaze koji je
vjerojatno fosforilaciju ih. The baza podataka
containes 436 kinaze i 14 374 interakcije iz 3469
publikacije,
http://amp.pharm.mssm.edu/Enrichr/
https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2944209/
Broj transkripcijskih faktora djeluje u isto vrijeme
na istom promotora ...
kromatina
imunoprecipitaciju je
metoda izbora za
pronalaženje svih
sekvenci komuniciraju
proteini. Podaci iz
sveChip-dalje Ispitivanja
se mogu davati u istoj
bazi podataka (Chea)...
https://galaxyproject.org/tutorials/chip/
Expression2Kinases -X2K
Softver koji kombinira različite baze podataka i
alata.
ULAZ: popis različito izraženim genima
OUTPUT: proteina kinaze, Transkripcijski čimbenici i
proteinski kompleksi koji su mogući sljedeći
regulatori unesenih gena.
Koristeći takav sotwere možemo konstruirati
hipotetske regulatorne puteve i izgradnju proteina
interakcije mreže.
rezultati trebaju eksperimentalni dokaz o pojmu!
Rad-tok X2K
Chen i sur. (2012) 28 Bioinformatics: 105
Ono što smo stvarno željeti je da se transformirati
popis u mreža - često se koristi za sadašnje interakcija
između staničnih komponenti
Euler, 1700, Sedam Mostovi Konigsberga
Čvor
molekula
Rub
interakcija
Vrste mreža koje su relevantne za biološke sustave
1. ćelija Signalizacija mreže
- Rak signalizacija mreža
Doi: 10,1038 / psp.2013.38
2. Interakcija mreže proteinima
- distrofin protein-protein intersctions
http: //parendogen677s10.weebly.com/protein-protein-interactions.html
3. Gene Regulatorne mreže
- Razvoj OD Drosophila oka
http: //dev.biologists.org/content/140/1/82
Genes2Networks
Lists2Networks
kombinira eksperimentalan podataka
(mRNA izraz mikropostrojima, Genoma
širom CHI-X, RNAi ekrani, proteomika &
phosphoproteomics) s bacground
mreža od svi znan interakcije (prije
biološki knowladge)
http://www.lists2networks.org
dodatni sofwers postoje za vizualizacija i analiza mreža:
Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija
Ljubljana)
http://vlado.fmf.uni-
lj.si/pub/networks/doc/gd.01/Pajek2.png
http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf
Cytoscape (Trey IdekerShannon et al., 2003).)
http: //www.cytoscape.org/
SNAVI (Ma'ayanet al. 2009)
yEd... ..
Identifikacija putova, podmreže, klasteri, posebne
značajke mreže...
Molekularni podaci mogu biti
dodatno integrirana sa
strukturnim podacima kako bi se
proizvesti 3D modela
(makromolekularni kompleksi,
virtualne stanice) ....
Patwardhanet al. 2017. godine,
DOI: 10,7554 / eLife.25835
(erytrocytes zaražena
Plasmodium)
1. Statistička analiza je kritična u vađenje knowladgeo sustavu iz
velike skupove podataka. Statističkialysis generira popis gena /
proteina / RNA relevantnih za studij.
2. Popis gena može se pohraniti u softveru (Alati Bioinformatika) te
u kombinaciji s prethodnim znanjem kako bi se pronašli teorijske
novih putova, podmreže, Regulatorni mehanizam ...
3. Integracija eksperimentalnog velikog podataka i prije znanja o
protoeDGE (Više baza podataka) omogućuje višeskalne
razumijevanje fizioloških funkcija, patofiziologija ili
farmakokinetika,
4. Računalno generirani predviđanja moraju biti eksperimentalno
dokazano,

More Related Content

Similar to 23hr (8)

Primjeri upotrebe
Primjeri upotrebePrimjeri upotrebe
Primjeri upotrebe
 
21hr
21hr21hr
21hr
 
Genetski algoritmi antonio bukvic
Genetski algoritmi   antonio bukvicGenetski algoritmi   antonio bukvic
Genetski algoritmi antonio bukvic
 
93hr
93hr93hr
93hr
 
Primjeri korištenja
Primjeri korištenjaPrimjeri korištenja
Primjeri korištenja
 
Osnovni tečaj računalnih metoda
Osnovni tečaj računalnih metodaOsnovni tečaj računalnih metoda
Osnovni tečaj računalnih metoda
 
Osnovni tečaj računalnih metoda
Osnovni tečaj računalnih metoda  Osnovni tečaj računalnih metoda
Osnovni tečaj računalnih metoda
 
92hr
92hr92hr
92hr
 

More from improvemed

More from improvemed (20)

2019 2020 predavanje letenje, ronjenje drenjancevic
2019 2020 predavanje letenje, ronjenje drenjancevic2019 2020 predavanje letenje, ronjenje drenjancevic
2019 2020 predavanje letenje, ronjenje drenjancevic
 
In vitro models of hepatotoxicity
In vitro models of hepatotoxicityIn vitro models of hepatotoxicity
In vitro models of hepatotoxicity
 
Etiology of liver diseases
Etiology of liver diseasesEtiology of liver diseases
Etiology of liver diseases
 
An introduction to experimental epidemiology
An introduction to experimental epidemiology An introduction to experimental epidemiology
An introduction to experimental epidemiology
 
Genotyping methods of nosocomial infections pathogen
Genotyping methods of nosocomial infections pathogenGenotyping methods of nosocomial infections pathogen
Genotyping methods of nosocomial infections pathogen
 
Use of MALDI-TOF in the diagnosis of infectious diseases
Use of MALDI-TOF in the diagnosis of infectious diseasesUse of MALDI-TOF in the diagnosis of infectious diseases
Use of MALDI-TOF in the diagnosis of infectious diseases
 
Molecular microbiology methods
Molecular microbiology methodsMolecular microbiology methods
Molecular microbiology methods
 
Isolated vascular rings
Isolated vascular ringsIsolated vascular rings
Isolated vascular rings
 
Isolated blood vessels
Isolated blood vesselsIsolated blood vessels
Isolated blood vessels
 
Notes for Measuring blood flow and reactivity of the blood vessels in the ski...
Notes for Measuring blood flow and reactivity of the blood vessels in the ski...Notes for Measuring blood flow and reactivity of the blood vessels in the ski...
Notes for Measuring blood flow and reactivity of the blood vessels in the ski...
 
Notes for STAINING AND ANALYSIS of HISTOLOGICAL PREPARATIONS
Notes for STAINING AND ANALYSIS of HISTOLOGICAL PREPARATIONSNotes for STAINING AND ANALYSIS of HISTOLOGICAL PREPARATIONS
Notes for STAINING AND ANALYSIS of HISTOLOGICAL PREPARATIONS
 
Notes for Fixation of tissues and organs for educational and scientific purposes
Notes for Fixation of tissues and organs for educational and scientific purposesNotes for Fixation of tissues and organs for educational and scientific purposes
Notes for Fixation of tissues and organs for educational and scientific purposes
 
Notes for
Notes for Notes for
Notes for
 
Notes for The principle and performance of capillary electrophoresis
Notes for The principle and performance of capillary electrophoresisNotes for The principle and performance of capillary electrophoresis
Notes for The principle and performance of capillary electrophoresis
 
Notes for The principle and performance of liquid chromatography–mass spectro...
Notes for The principle and performance of liquid chromatography–mass spectro...Notes for The principle and performance of liquid chromatography–mass spectro...
Notes for The principle and performance of liquid chromatography–mass spectro...
 
Notes for Cell Culture Basic Techniques
Notes for Cell Culture Basic TechniquesNotes for Cell Culture Basic Techniques
Notes for Cell Culture Basic Techniques
 
Big datasets
Big datasetsBig datasets
Big datasets
 
Systems biology for Medicine' is 'Experimental methods and the big datasets
Systems biology for Medicine' is 'Experimental methods and the big datasetsSystems biology for Medicine' is 'Experimental methods and the big datasets
Systems biology for Medicine' is 'Experimental methods and the big datasets
 
Systems biology for medical students/Systems medicine
Systems biology for medical students/Systems medicineSystems biology for medical students/Systems medicine
Systems biology for medical students/Systems medicine
 
Use cases
Use casesUse cases
Use cases
 

23hr

  • 1. Improved Medical Education in Basic Sciences for Better Medical Practicing ImproveMEd Sustavi biologije za medicinu IIja, Kako analizirati velike skupove podataka?
  • 2. Sustavi biologije studije često započinju ekspresije profila (lijekom tretiranih vs. neobrađene stanice, normalne stanice raka, u odnosu na stanice u različitim razvojnom stadiju) ... pomoću mikročipa ili RNAseq... mikropostrojima je isplativ pristup ... I dobili smo ovo ...
  • 3. Mikročipa može stati 10 000 mjesta. Let-a pretpostaviti da je svaka točka je gen - kako ćemo organizirati mrlje / gene kako bi izvukli rezultat? Laserski skener mjeri jednu fluorescentnu naljepnicu od drugog i položimo jedan preko drugog ... svaka točka je mjernoged dva puta! intenzitet fluorescentnog signala = količina vezanog DNA Svaka točka se može zamijeniti s brojem koji predstavlja relativnu promjenu od „normalne” razine. N = R / G ... ..1 znači jednak ekspresiju u oba uzorka R = crvena fluorescencija (tumora) G = zeleni fluorescentni (normalnih stanica)
  • 4. Boje se pretvaraju u brojeve, jer brojevi su lakše organizirati! Svaka točka se može zamijeniti s brojem koji predstavlja relativnu promjenu od „normalne” razine. R = crvena fluorescencija (tumora) G = zeleni fluorescentni (normalnih stanica) N = R / G N = 1 jednaki ekspresija u oba uzorka N> 1 indukcija N ‹1 suzbijanje http://www.hhmi.org/biointeractive/how-analyze-dna-microarray- data http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes- proteins-and-small-molecules Možemo usporediti s više uzoraka ... .ili možemo slijediti jedan tijekom vremena - ljudska fibroblastst stimulirane serumom i zatim 24 sata (Iyeret al. 1999) I organizirati gene, tako da inducirani jednom su grupirani u jednom krajnje suprotno od potisnute jednom ... Takvo iskazivanje podataka naziva toplina karta
  • 5. Za vađenje znanja iz velikog podataka nam je potrebno statističke metode! Obično koriste - R statistički paket LIMMA Identificirati klastera smo limenka koristiti - klaster analiza! Originalni brojevi logaritmized (Po bazi 2 ili 10) i nego što nastavite izračunavanjem sličnost rezultata - pomoću računalnog programa koji prati microarray platformu. Za vizualni prikaz podataka skrećemo brojeve opet u bojama, ali ovaj put zelena znači represiju i crvena znači da indukciju.
  • 6. Drugi način prikazivanja podataka vulkan zemljište (Uobičajeno GWS studija). Podaci su prikazani u „rasuli okućnica” kako bi brzo pronašli najzanimljiviji kandidat npr gena u nekoj bolesti. Kombinira dva statističkih testova: primjerice, A p vrijednost od ANOVA modela s veličinom promjene. Brzo vizualna identifikacija podataka (gena, itd) koji prikazuju velike promjene magnitude koje su također Statistički značajno, Granica između p <0,05 i p <0,05 Razlika između istih parametara u dva uzorka prikazana kao „Puta promjene” U sivoj su promjene manje onda 2x. http://genomicsclass.github.io/book/pages/using_limma.html statistička značajnost zanimljiva podataka
  • 7. Oboje, Toplina karta i vulkan Zemljište (i statistička analiza iza njih), prvi su korak prema identificiranju i rangiranje gena / proteina iza primijetio fenotip. Generiranopopisi genaOdgovoran za promatrane mehanizama ili potencijalne mete terapije, i dalje se obrađuju različitim bioinformatika alata. Popis gena mogu se pohraniti u: Gen Ontologija Gene Set Obogaćivanje analiza, Transkripcija faktorske analize... Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se međusobno usporedivi.
  • 8. Gene Ontologija - http://geneontology.org/ Bioinformatika alat korisna za dodjeljivanje pravo ime u nizu i povezivanje molekularnih promjena na stanične procese Geni i proteini su konzervirani u većinu živih organizama i imaju zajednički funkcije. Pronalaženje ulogu gena u jednom organizmu može pomoći osvjetljava njezinu ulogu u drugu.Gene Ontologija konzorcij bavi gena nomenklaturi. Setovi su organizirani prema: -biološki proces -molekularna funkcija -Cellular pretinac Gen Ontologija konzorcij, Priroda, 2000. Biološki proces kao što su: rast stanica, proliferacijom, prijevoda ili kamp sinteza…
  • 10. Sustavno ime ORF Standardna ime gena GO biološki proces molekularna funkcija stanična komponenta
  • 11. Gene set za obogaćivanje analize - GSEA Analitička metoda namijenjena pronalaženje i tumačenje skupove gena. U potrazi za genima koji mijenjaju zajedno - određivanje razine proteina koji sudjeluju u istom signalnog puta - u potrazi za molekule koje sudjeluju u istom biološkom procesu Slobodni softver paket s početnom bazom podataka od 1.325 biološki određeni skupovi gena. http://software.broadinstitute.org/gsea/index.jsp Subramanian et al. (2005) PNAS 102: 15.545 1. Sortiranje geni prema kriterij npr razine ekspresije 2. Usporedite popis nekih već postojećih popisa i dodijeliti pojedinačne gene za 'erichrichment postići'- pretjerano predstavljene ili prekomjerno smanjenje gena prema KolmogorovStatistika -Smirnov tipa 3. Max Obogaćivanje rezultat (MES) je pokazatelj relevantnosti postojeći set gena za novi podaci postavljena upravo pod istragom
  • 12. transkripcijski faktor Analiza Geni koji su promijenili razinu izražavanja može biti regulirana na isti faktor transkripcije. Geni su identificirani kombinacijom omics Podaci prije i znanje. Chea baza podataka Trenutno povezuje 159 transkripcijski faktori u više od 30.000 gena - ukupno 361 299 interakcije - izvađeni iz 157 publikacije. TRANSFAC, PAINT, JASPAR - ostale baze podataka za Čip kinaza Analiza obogaćenje (KEA) Web-baze command- linija softver koji povezuje popis proteina sisavaca s proteinima kinaze koji je vjerojatno fosforilaciju ih. The baza podataka containes 436 kinaze i 14 374 interakcije iz 3469 publikacije, http://amp.pharm.mssm.edu/Enrichr/ https://www.ncbi.nlm.nih.gov/pmc/articl es/PMC2944209/
  • 13. Broj transkripcijskih faktora djeluje u isto vrijeme na istom promotora ...
  • 14. kromatina imunoprecipitaciju je metoda izbora za pronalaženje svih sekvenci komuniciraju proteini. Podaci iz sveChip-dalje Ispitivanja se mogu davati u istoj bazi podataka (Chea)... https://galaxyproject.org/tutorials/chip/
  • 15. Expression2Kinases -X2K Softver koji kombinira različite baze podataka i alata. ULAZ: popis različito izraženim genima OUTPUT: proteina kinaze, Transkripcijski čimbenici i proteinski kompleksi koji su mogući sljedeći regulatori unesenih gena. Koristeći takav sotwere možemo konstruirati hipotetske regulatorne puteve i izgradnju proteina interakcije mreže. rezultati trebaju eksperimentalni dokaz o pojmu! Rad-tok X2K Chen i sur. (2012) 28 Bioinformatics: 105
  • 16. Ono što smo stvarno željeti je da se transformirati popis u mreža - često se koristi za sadašnje interakcija između staničnih komponenti Euler, 1700, Sedam Mostovi Konigsberga Čvor molekula Rub interakcija
  • 17. Vrste mreža koje su relevantne za biološke sustave 1. ćelija Signalizacija mreže - Rak signalizacija mreža Doi: 10,1038 / psp.2013.38 2. Interakcija mreže proteinima - distrofin protein-protein intersctions http: //parendogen677s10.weebly.com/protein-protein-interactions.html 3. Gene Regulatorne mreže - Razvoj OD Drosophila oka http: //dev.biologists.org/content/140/1/82
  • 18. Genes2Networks Lists2Networks kombinira eksperimentalan podataka (mRNA izraz mikropostrojima, Genoma širom CHI-X, RNAi ekrani, proteomika & phosphoproteomics) s bacground mreža od svi znan interakcije (prije biološki knowladge) http://www.lists2networks.org
  • 19.
  • 20. dodatni sofwers postoje za vizualizacija i analiza mreža: Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija Ljubljana) http://vlado.fmf.uni- lj.si/pub/networks/doc/gd.01/Pajek2.png http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf Cytoscape (Trey IdekerShannon et al., 2003).) http: //www.cytoscape.org/ SNAVI (Ma'ayanet al. 2009) yEd... .. Identifikacija putova, podmreže, klasteri, posebne značajke mreže...
  • 21. Molekularni podaci mogu biti dodatno integrirana sa strukturnim podacima kako bi se proizvesti 3D modela (makromolekularni kompleksi, virtualne stanice) .... Patwardhanet al. 2017. godine, DOI: 10,7554 / eLife.25835 (erytrocytes zaražena Plasmodium)
  • 22. 1. Statistička analiza je kritična u vađenje knowladgeo sustavu iz velike skupove podataka. Statističkialysis generira popis gena / proteina / RNA relevantnih za studij. 2. Popis gena može se pohraniti u softveru (Alati Bioinformatika) te u kombinaciji s prethodnim znanjem kako bi se pronašli teorijske novih putova, podmreže, Regulatorni mehanizam ... 3. Integracija eksperimentalnog velikog podataka i prije znanja o protoeDGE (Više baza podataka) omogućuje višeskalne razumijevanje fizioloških funkcija, patofiziologija ili farmakokinetika, 4. Računalno generirani predviđanja moraju biti eksperimentalno dokazano,