1. Improved Medical Education in Basic
Sciences
for Better Medical Practicing
ImproveMEd
Sustavi biologije za medicinu
IIja, Kako analizirati velike skupove podataka?
2. Sustavi biologije studije često
započinju ekspresije profila
(lijekom tretiranih vs.
neobrađene stanice, normalne
stanice raka, u odnosu na
stanice u različitim razvojnom
stadiju) ... pomoću mikročipa ili
RNAseq... mikropostrojima je
isplativ pristup ...
I dobili smo ovo ...
3. Mikročipa može stati 10 000 mjesta. Let-a pretpostaviti da
je svaka točka je gen - kako ćemo organizirati mrlje / gene
kako bi izvukli rezultat?
Laserski skener mjeri jednu fluorescentnu naljepnicu od
drugog i položimo jedan preko drugog ... svaka točka je
mjernoged dva puta!
intenzitet fluorescentnog signala = količina vezanog DNA
Svaka točka se može zamijeniti s brojem koji predstavlja
relativnu promjenu od „normalne” razine.
N = R / G ... ..1 znači jednak ekspresiju u oba uzorka
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
4. Boje se pretvaraju u brojeve, jer brojevi su lakše organizirati!
Svaka točka se može zamijeniti s brojem koji predstavlja relativnu
promjenu od „normalne” razine.
R = crvena fluorescencija (tumora)
G = zeleni fluorescentni (normalnih stanica)
N = R / G
N = 1 jednaki ekspresija u oba uzorka
N> 1 indukcija
N ‹1 suzbijanje
http://www.hhmi.org/biointeractive/how-analyze-dna-microarray-
data
http://www.hhmi.org/biointeractive/scanning-lifes-matrix-genes-
proteins-and-small-molecules
Možemo usporediti s više uzoraka ...
.ili možemo slijediti jedan tijekom
vremena - ljudska fibroblastst
stimulirane serumom i zatim 24 sata
(Iyeret al. 1999)
I organizirati gene, tako da
inducirani jednom su grupirani
u jednom krajnje suprotno od
potisnute jednom ...
Takvo iskazivanje podataka naziva toplina karta
5. Za vađenje znanja iz velikog podataka
nam je potrebno statističke metode!
Obično koriste - R statistički paket
LIMMA
Identificirati klastera smo limenka
koristiti - klaster analiza!
Originalni brojevi logaritmized (Po bazi
2 ili 10) i nego što nastavite
izračunavanjem sličnost rezultata -
pomoću računalnog programa koji prati
microarray platformu.
Za vizualni prikaz podataka skrećemo
brojeve opet u bojama, ali ovaj put
zelena znači represiju i crvena znači da
indukciju.
6. Drugi način prikazivanja
podataka vulkan zemljište
(Uobičajeno GWS studija).
Podaci su prikazani u „rasuli
okućnica” kako bi brzo pronašli
najzanimljiviji kandidat npr gena
u nekoj bolesti.
Kombinira dva statističkih
testova: primjerice, A p
vrijednost od ANOVA modela s
veličinom promjene.
Brzo vizualna identifikacija
podataka (gena, itd) koji
prikazuju velike promjene
magnitude koje su također
Statistički značajno,
Granica
između p
<0,05 i p
<0,05
Razlika između istih parametara u dva uzorka prikazana kao
„Puta promjene”
U sivoj su promjene manje onda 2x.
http://genomicsclass.github.io/book/pages/using_limma.html
statistička značajnost
zanimljiva podataka
7. Oboje, Toplina karta i vulkan Zemljište (i statistička analiza iza
njih), prvi su korak prema identificiranju i rangiranje gena /
proteina iza primijetio fenotip. Generiranopopisi
genaOdgovoran za promatrane mehanizama ili potencijalne
mete terapije, i dalje se obrađuju različitim bioinformatika
alata.
Popis gena mogu se pohraniti u: Gen Ontologija Gene Set
Obogaćivanje analiza, Transkripcija faktorske analize...
Generirano popisi moraju koristiti jedinstvena nomenklatura kako bi se
međusobno usporedivi.
8. Gene Ontologija - http://geneontology.org/
Bioinformatika alat korisna za dodjeljivanje pravo ime
u nizu i povezivanje molekularnih promjena na
stanične procese
Geni i proteini su konzervirani u većinu živih
organizama i imaju zajednički funkcije. Pronalaženje
ulogu gena u jednom organizmu može pomoći
osvjetljava njezinu ulogu u drugu.Gene Ontologija
konzorcij bavi gena nomenklaturi.
Setovi su organizirani prema:
-biološki proces
-molekularna funkcija
-Cellular pretinac
Gen Ontologija konzorcij, Priroda, 2000.
Biološki proces kao što su: rast stanica,
proliferacijom, prijevoda ili kamp sinteza…
11. Gene set za obogaćivanje analize - GSEA
Analitička metoda namijenjena pronalaženje i tumačenje
skupove gena.
U potrazi za genima koji mijenjaju zajedno
- određivanje razine proteina koji sudjeluju u istom
signalnog puta
- u potrazi za molekule koje sudjeluju u istom biološkom
procesu
Slobodni softver paket s početnom bazom podataka od
1.325 biološki određeni skupovi gena.
http://software.broadinstitute.org/gsea/index.jsp
Subramanian et al. (2005) PNAS 102: 15.545
1. Sortiranje geni prema kriterij npr razine ekspresije
2. Usporedite popis nekih već postojećih popisa i dodijeliti
pojedinačne gene za 'erichrichment postići'- pretjerano
predstavljene ili prekomjerno smanjenje gena prema
KolmogorovStatistika -Smirnov tipa
3. Max Obogaćivanje rezultat (MES) je pokazatelj
relevantnosti postojeći set gena za novi podaci postavljena
upravo pod istragom
12. transkripcijski faktor Analiza
Geni koji su promijenili razinu izražavanja može biti
regulirana na isti faktor transkripcije.
Geni su identificirani kombinacijom omics Podaci
prije i znanje.
Chea baza podataka Trenutno povezuje 159
transkripcijski faktori u više od 30.000 gena - ukupno
361 299 interakcije - izvađeni iz 157 publikacije.
TRANSFAC, PAINT, JASPAR - ostale baze podataka za
Čip
kinaza Analiza obogaćenje (KEA)
Web-baze command- linija softver koji povezuje
popis proteina sisavaca s proteinima kinaze koji je
vjerojatno fosforilaciju ih. The baza podataka
containes 436 kinaze i 14 374 interakcije iz 3469
publikacije,
http://amp.pharm.mssm.edu/Enrichr/
https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2944209/
14. kromatina
imunoprecipitaciju je
metoda izbora za
pronalaženje svih
sekvenci komuniciraju
proteini. Podaci iz
sveChip-dalje Ispitivanja
se mogu davati u istoj
bazi podataka (Chea)...
https://galaxyproject.org/tutorials/chip/
15. Expression2Kinases -X2K
Softver koji kombinira različite baze podataka i
alata.
ULAZ: popis različito izraženim genima
OUTPUT: proteina kinaze, Transkripcijski čimbenici i
proteinski kompleksi koji su mogući sljedeći
regulatori unesenih gena.
Koristeći takav sotwere možemo konstruirati
hipotetske regulatorne puteve i izgradnju proteina
interakcije mreže.
rezultati trebaju eksperimentalni dokaz o pojmu!
Rad-tok X2K
Chen i sur. (2012) 28 Bioinformatics: 105
16. Ono što smo stvarno željeti je da se transformirati
popis u mreža - često se koristi za sadašnje interakcija
između staničnih komponenti
Euler, 1700, Sedam Mostovi Konigsberga
Čvor
molekula
Rub
interakcija
17. Vrste mreža koje su relevantne za biološke sustave
1. ćelija Signalizacija mreže
- Rak signalizacija mreža
Doi: 10,1038 / psp.2013.38
2. Interakcija mreže proteinima
- distrofin protein-protein intersctions
http: //parendogen677s10.weebly.com/protein-protein-interactions.html
3. Gene Regulatorne mreže
- Razvoj OD Drosophila oka
http: //dev.biologists.org/content/140/1/82
20. dodatni sofwers postoje za vizualizacija i analiza mreža:
Pajek (Vladimir Batagelj i Andrej Mrvar,, Slovenija
Ljubljana)
http://vlado.fmf.uni-
lj.si/pub/networks/doc/gd.01/Pajek2.png
http://vlado.fmf.uni-lj.si/pub/networks/doc/pajek.pdf
Cytoscape (Trey IdekerShannon et al., 2003).)
http: //www.cytoscape.org/
SNAVI (Ma'ayanet al. 2009)
yEd... ..
Identifikacija putova, podmreže, klasteri, posebne
značajke mreže...
21. Molekularni podaci mogu biti
dodatno integrirana sa
strukturnim podacima kako bi se
proizvesti 3D modela
(makromolekularni kompleksi,
virtualne stanice) ....
Patwardhanet al. 2017. godine,
DOI: 10,7554 / eLife.25835
(erytrocytes zaražena
Plasmodium)
22. 1. Statistička analiza je kritična u vađenje knowladgeo sustavu iz
velike skupove podataka. Statističkialysis generira popis gena /
proteina / RNA relevantnih za studij.
2. Popis gena može se pohraniti u softveru (Alati Bioinformatika) te
u kombinaciji s prethodnim znanjem kako bi se pronašli teorijske
novih putova, podmreže, Regulatorni mehanizam ...
3. Integracija eksperimentalnog velikog podataka i prije znanja o
protoeDGE (Više baza podataka) omogućuje višeskalne
razumijevanje fizioloških funkcija, patofiziologija ili
farmakokinetika,
4. Računalno generirani predviđanja moraju biti eksperimentalno
dokazano,