Biometria madártávlatból

1,057 views
984 views

Published on

Rövid és érthető, helyenként szórakoztató bevezetés az orvosi statisztikába.

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,057
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
21
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Biometria madártávlatból

  1. 1. Koncsag ElődBiometria madártávlatból
  2. 2. „A statisztikus gondolkodásmód egyszer majd ugyanolyan létszükséglet lesz, mint az, hogy valaki írni és olvasni tud.” (H. G. Wells)Kutatómunkájához ajánlja aStudium Alapítvány
  3. 3. Koncsag Előd Biometria ól madár távlatb Studium KiadóMarosvásárhely, 2006
  4. 4. C�tre Biometria madártávlatból Szerző EDITURA STUDIUM KIADÓ Koncsag Előd, Marosvásárhelyi Orvosi és Gyógyszerészeti Egyetem, ÁOK 6 Szaklektor Dr. Veres Valér, : V� trimitem egyetemi adjunktus, Babeş-Bolyai Tudomány Egyetem, Szociológia Tanszék Diáklektrok: Kedves Judit, Péterfi István Descrierea CIP a Bibliotecii Na�ionale a României KONCSAG EL�D Biometria madártávlatból / Koncsag El�d. - Târgu Mure� : Studium Kiadó, 2006 Bibliogr. ISBN (10) 973-86108-6-9 ; ISBN (13) 978-973-86108-6-6 519.22:3© Studium Alapítvány Kiadó, 2006Minden jog fenntartva. A mű egészének, vagy részleteinek fordítása,utánnyomása, ábráinak vagy táblázatainak átvétele, elektronikus Birou CIP,adathordozón való feldolgozása, vagy bármilyen más módon történő Adriana Vasilesokszorosítása csak a kiadó engedélyével lehetséges. Not� :ISBN (10) 973-86108-6-9ISBN (13) 978-973-86108-6-6 Caseta con�inând descrierea CIP a Bibliotecii Na�ionale a RomâniA reprodus� conform originalului pe kiadójának ügyvezető igazgatója kiadásért felel a Studium Alapítvány verso paginii de titlu a c�r�ii respective.és a Studium Alapítvány Kuratóriumának afara Bibliotecii Na�ionale a României i Redactarea descrierii CIP în elnöke. inciden�a Legii dreptului de autorA könyv kiadását támogatta: Studium AlapítványKönyvterv, műszaki szerkesztő: Mezei Tibor László, Kraft HunorStudium Alapítvány KiadóÜgyvezető igazgató: Dr. Mezei Tibor LászlóMarosvásárhelyRigó (Avramescu) utca 11.Tel/fax: 0265-250773www.studium.ro
  5. 5. TartalomAjánlás. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Előszó helyett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9I. Alapfogalmak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11II. Leíró statisztikai mérőszámok . . . . . . . . . . . . . . . . . . . . . 15 A. Elhelyezkedési paraméterek. . . . . . . . . . . . . . . . . . 16 B. Szóródási paraméterek . . . . . . . . . . . . . . . . . . . . . . 18 C. Kapcsolati paraméterek . . . . . . . . . . . . . . . . . . . . . 27III. Hipotézisek vizsgálata . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Bevezetés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 A standard normális eloszlás . . . . . . . . . . . . . . . . . . . 38 Paraméteres és nemparaméteres tesztek . . . . . . . . . . 41Utószó helyett . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60Felhasznált irodalom. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5
  6. 6. AjánlásA marosvásárhelyi orvostanhallgató és gyógyszerészjelölt szá-mára, akárcsak más egyetemek számos hallgatója esetében,megkerülhetetlen kérdés az államvizsga megvédésekor, vagyakár az azt megelőző TDK során: tartalmaz-e megfelelő sta-tisztikai számításokat a dolgozata, vagy sem. Írott vagy íratlanszabály szerint, a bíráló bizottság tagjainak erre a kérdéskörreis oda kell figyelniük, és a kimerítő statisztikai számításokattartalmazó dolgozatokat pozitívan, míg az e téren hiányossá-gokkal küszködőket negatívan kell értékelniük – legalábbis afenti szempontból. Bár lépések történtek az irányba, hogy a diák elsajátítsaa számára hasznos biometriai fogalmakat, és azokat alkal-mazhatóvá tegye a tudományos kutatása során, talán nemelég teljes és gyakorlatias ez a tevékenység. Emiatt alanyunksokszor értetlenül áll a valószínűségek és korrelációk világá-ban, és számtalan esetben fennhangon hirdeti a szignifikánskülönbségeket anélkül, hogy bármely számítással rendelkeznee „felelőtlen kijelentés” alátámasztására. Pedig a számokkalvaló brillírozás helyett csupán egyetlen dolgot kell megérteniés alaposan megértetni: még a legszembetűnőbb eredmények,a legalapvetőbb különbözőségek is nélkülözik a tudományosjelleget, hogyha alátámasztásukra semmilyen statisztikai ada-tot sem tudunk felsorakoztatni. Mi hát a teendő? Egyszerűen annyi, hogy a megírt dolgozattudományos színvonalát azáltal kell biztosítani, hogy legalábbegyszerű, hozzáférhető számítások elvégzésére kerüljön sor. Hogy mi szükséges ehhez? Elsősorban alapismeretek elsa-játítása a diák részéről és egy számítógép, amely rengetegadathalmaz felsorakoztatására képes ugyan, de arra már nem, 7
  7. 7. hogy magától eldöntse: mit számítson ki az adott helyzetben,és hogyan értelmezze az eredményt. Ezért nála mindig fon-tosabb marad az alkalmazó, aki lehet alapvető ismeretekkelfelvértezett diák, statisztikában jártas barát vagy szakemberegyaránt. Koncsag Előd tömör, ám lényegre törő jegyzete hiánypótló-nak tekinthető. Ahhoz segíti hozzá a diáktársat, saját tapasz-talatából kiindulva, hogy a számítások labirintusában valótévelygés helyett inkább az egyszerű megértés útját válassza. Ilymódon lehetővé válhat, hogy saját maga elvégezhet egyszerűszámításokat az államvizsga dolgozatához, és nem kell másokkegyeiért esedeznie. Ráadásul a tudást nem veheti el senki semtőle, mindenképpen jó befektetésnek bizonyul. Dr. Ábrám Zoltán, egyetemi előadótanár Marosvásárhely, 2006. februárjában8
  8. 8. Előszó helyettMegfigyeltem, hogy az élettudományok különböző területe-in tanuló diákok többsége „humán beállítottságú”-nak tartjamagát, és általában óvakodik a matematika ködös területéretévedni. Márpedig vannak helyzetek, rendszerint tudományosdolgozat készítésénél, amikor elkerülhetetlenül szembesülünkbizonyos számításokat igénylő bonyodalmakkal. Azt gondo-lom, hogy aki – úgymond – nem kedveli a matematikát, azmég egy államvizsga dolgozat miatt sem fog biometria szak-könyveket tanulmányozni. Manapság, amikor számítógépesprogramoknak köszönhetően nem kényszerülünk papír-ceru-zás számolgatásokra, a felhasználók többségét nem érdekliigazán a statisztikai eljárások mögötti magyarázat. Ma máralapszintű statisztikai ismeretek mellett is képesek vagyunkviszonylag bonyolult biometriai kérdések megválaszolására.Ezek a megfontolások bátorítottak arra, hogy a biometria alap-fogalmait „madártávlatból” bemutassam. Az imént mondotta-kat leszámítva, szándékosan kerültem a hűvösen tudományoselőadásmódot. Ígérem, hogy nem foglak mindenféle leveze-tésekkel untatni, elég ha tudod, hogy mi mire való, és kész.Ne tévesszen meg, hogy meglehetősen könnyen emészthető,olvasmányos a szöveg – ajánlom figyelmedbe Fichte szavait:„Olvassatok lassan! És még lassabban olvassatok újra valamit!”.Amúgy, ne stresszeld magad, teljesen benignus szöveg, a bará-taimnak írtam. A szerző 9
  9. 9. I. AlapfogalmakNa, lássunk hozzá. Mondjuk, hogy kíváncsiak vagyunk arra,hogy a patagóniai skizofrén férfiaknak mennyi az átlagélet-kora. Nem tudunk minden egyes patagóniai skizofrén férfitmegkérdezni, tehát marad az, hogy néhányat (minél többet)megkérdezünk (27-et találtunk), és azt mondjuk, hogy a többiis kb. ilyen életkorú lehet. Alapsokaság, populáció (population): olyan dolgok ösz-szessége, amelyeknek közös megfigyelhető jellemzőik van-nak [7]. Esetünkben alapsokaságnak nevezzük az összespatagóniai skizofrén férfit, bennük az a közös, hogy mindpatagóniaiak, mind skizofrének, és mind férfiak. A kísérlete-inkben legtöbbször nem ismerjük az alapsokaság elemszámát(N), sőt, előfordulhat, hogy az végtelen. Mérőskálák: az alapsokaság minden vizsgálandó tulajdon-ságáról előre meg kell mondani, hogy milyen skálán méred.Lehet, hogy neked magától értetődő ez a bekezdés, de hidd el,nagyon el lehet szúrni a számításokat, ha a statisztika-prog-ramnál ezt már az elején nem állítod be. 1. Nominális (nominal) skála: kettő vagy több kategória(osztály) van, és csak az a fontos, hogy minden adat kizáró-lag csak egy adott osztályba tartozhasson. Pl. szeme színe,vallási hovatartozása, indián-e, stb. Nyilván, nem lehet valakiegyszerre indián is és nem-indián is. 2. Ordinális, rendezett, sorrendi (ordinal) skála: annyi-ban különbözik a nominális skálától, hogy itt sorrendje vanaz osztályoknak. Ilyen az iskolai osztályozás. De talán jobbpélda a betegségek stadializálása. Azt kell itt megérteni, hogyaz ordinális skála „lépcsőfokai” közötti távolság nem állandó,nem mondhatjuk például azt, hogy az emlőrák I. és II. stádiu- 11
  10. 10. ma között annyi a távolság, mint a II. és III. stádiuma között.Vagy: ha az egyik diák négyest kapott, a másik pedig hatost,attól még ketten együtt nem tudnak tízesre. Ha dönthetsz,hogy milyen skálán mérj, a sorrendit válaszd, ez informatí-vabb, mint a nominális skála. 3. Intervallum (interval) skála: annyival több a rendezettskálánál, hogy itt az egymás utáni értékek között a távolságazonos. Ezen a skálán mérjük az időt vagy a hőmérsékletet ºC-ban. Fontos tulajdonsága, hogy nincsen abszolút kitüntetettnulla érték. Igaz, hogy 30 és 40 ºC között annyi a különbségmint 20 és 30 ºC között, de azt már nem mondhatjuk, hogya 20 ºC-nál kétszer olyan meleg van, mint 10 ºC esetén. AkikFahrenheit-ban mérik a hőmérsékletet, azok máshová teszika nulla fokot, és ők is ugyanolyan elégedettek a hőmérőikkel,mint mi. 4. Arányskála (ratio): jól meghatározott nulla érték van,ezért itt már van értelme valaminek a kétszereséről beszélni,itt nyugodtan lehet mindenféle műveleteket végezni. Ilyen atesttömeg, a magasság, de a hőmérséklet is – ha Kelvin fokbanmérjük! Mondanom sem kell, ez a skála a leginformatívabb. Változó, paraméter (parameter): a populáció valamelyjellemzője, egy bennünket érdeklő tulajdonság [5]. Például amagasság, testsúly, a nem, a hajszín, indián vagy nem, skizof-rén vagy nem, stb. A változó lehet: I. Minőségi (kvalitatív, kategórikus): minden olyan változó,amit nominális vagy sorrendi skálán mérünk [9]. Egyszerűencsoportosítgatsz, mindenféle osztályokba sorolod az adatokat.Itt nem lehet számszerű kapcsolatokról beszélni, maximumsorrendbe tudod rakni az osztályokat. Pl. nem, hajszín, telepü-léstípusok, nemzetiség, igen/nem válaszok, stb.12
  11. 11. II. Mennyiségi (kvantitatív): olyan számlálható vagy mér-hető adatokról van szó, amelyeket intervallum vagy arányská-lán mérünk [9]. Két fajtája van: a) diszkrét: csak bizonyos értékeket vehet fel, pl. feleségeid,gyerekeid száma nyilván csak egész szám lehet b) folytonos: adott terjedelemben akármilyen értéket felve-het. Pl. testsúly. A továbbiakban gyakran esik majd szó független változókról.Két értelemben is használjuk ezt a kifejezést: • Ha egy kísérlet során egy változó (X) tetszőleges értékei mellett mérjük egy másik változó (Y) értékeit, akkor azt mondjuk, hogy az előbbi (X) a független (befolyásoló) változó, az utóbbi (Y) pedig a függő változó (ez lesz az eredmény). Általában sok független változó befolyásolja az egy szál függő változónkat. • Ha két változó nem függ egymástól, akkor azok függetle- nek, (egymástól) független változók. Minta (sample): a populáció relatíve kis méretű kiragadottrésze, valamilyen előírás (mintavételi eljárás) szerint válogat-va [7]. 30 elemszám felett nagy, 30 alatt pedig kis mintárólbeszélünk. A mi mintánk 27 emberből áll (n=27), és ha ügye-sen választottuk ki (azaz reprezentatív és az elemek függetlenekegymástól), akkor ők statisztikailag korrekt módon képviselikaz összes skizofrén patagóniai férfit. Ha a mintavételezést nemmegfelelően végezzük, nem fogja híven tükrözni az alapsoka-ság tulajdonságait, és akkor nem ér semmit az egész. Valószínűségi mintavétel alaptörvénye: ha egy alapsokaságminden egyes elemének egyforma az esélye, hogy bekerüljön amintába, akkor ez a minta reprezentatív lesz erre a populációranézve [5]. Egyenlő kiválasztási valószínűségű módszerek [9]: 13
  12. 12. • egyszerű véletlen mintavétel: a mintabeli egyedeket a sokaságból egyszerre és véletlenszerűen választjuk ki, ügyelve arra, hogy a sokaság minden eleme számára egyenlő esélyt biztosítsunk a mintába kerülésre. Sorsolás, véletlenszám-generálás, listáról minden valahányadik elem kiválasztása stb. • rétegzett mintavétel: ha a Patagóniai Központi Statisztikai Hivatalnak (PKSH) köszönhetően ismerjük az iskolázott- sági adatokat, akkor megtehetjük például, hogy iskolai végzettség szerinti rétegezést végzünk: ha Patagónia lakosságának egyharmada végzett egyetemet, akkor kere- sünk kilenc (27/3=9) egyetemi végzettséggel rendelkező beteget, vagyis az iskolai végzettség ismert arányszámait igyekszünk biztosítani a mintánkon belül is. Csak akkor érdemes rétegzett mintavétellel dolgozni, ha a tényező, ami szerint rétegezni akarunk, feltehetően befolyásolhatja az eredményt [13]. Ha azt gondoljuk, hogy az iskolázott- ság nem befolyásolja a skizofrénia lefolyását, akkor nincs értelme eszerint rétegezni. Természetesen, többszörösen rétegzett mintavételezés is végezhető (terület, nem, isko- lai végzettség, életkor-csoportok, stb.), csak legyen elég nagy az elemszám, hogy minden csoportban lehessen számításokat végezni. • lépcsőzetes mintavétel: a minta kiválasztása több fokozat- ban történik, például először kisorsolunk néhány megyét, aztán ezekből a megyékből néhány települést (városok, falvak aránya a rétegzés szabályai szerint!), ezekből a te- lepülésekből pedig néhány házszámot (egyszerű véletlen mintavétellel). A mintavételezés nagyon sunyi dolog, nagyon oda kellfigyelni rá!14
  13. 13. II. Leíró statisztikai mérőszámokSokkal szemléletesebb egy adathalmaz néhány jellemző tulaj-donságát megadni, mint az elemeit egyenként felsorolni. Azadatokból viszonylag könnyen kiszámítható paramétereketleíró statisztikai mérőszámoknak nevezzük. Sok ilyen van,három legfontosabb csoportjuk [7]: A. elhelyezkedési paraméterek (measures of centraltendency): azt az értéket igyekeznek megadni, ami körül amintánk elemei csoportosulnak. Vagyis keressük a mintaközepét. Ide tartoznak: átlag, medián, módusz. B. szóródási paraméterek (measures of spread): arróltájékoztatnak, hogy értékeink mennyire szorosan vagy lazánhelyezkednek el az átlag körül: ferdeség, hegyesség, terjede-lem, szórás, variancia, kvantilisek. C. kapcsolati paraméterek (measures of correlation):előfordul, hogy a minta elemeiről nem csak egyfajta adattalrendelkezünk, így az összetartozó érték-párok között ösz-szefüggést mérhetünk (pl. emberek mintájában a testsúly éstestmagasság): korrelációs együttható, rangkorreláció. Mielőtt elkezdünk számolgatni, ide írom, hogy a 27patagóniai skizofrén férfi esetében milyen életkorokat mér-tünk: 1. táblázat. Életkorok (év) 22,9; 23,3; 20,6; 22,3; 22,6; 25,1; 47,8; 32,8; 37,4; 20,8; 43,0; 23,1; 32,3; 36,0; 26,7; 28,1; 42,9; 54,5; 63,2; 8,9; 29,2; 43,7; 47,2; 36,2; 31,9; 33,6; 26,1 15
  14. 14. � ��������������� � � � � � � � � ���� ���� ���� ���� ���� ���� ���� ���� ���� ���� ���� ���� ������������ 1. ábra. Hisztogram: életkorok megoszlásaA. Elhelyezkedési paraméterek1. Átlag (mean): Most vagy soha, össze kell haverkodni a ∑[szumma] jellel. Ez a jel arra jó, hogy ne kelljen leírni, hogy(x1+ x2+ x3+ x4+ x5+ x6+ x7+ x8+ x9)/n, hanem elég, ha azt írom,hogy: a minta számtani átlaga:ahol összesen n darab (nálunk 27) elem van, ennyi számot kellátlagolni. A mi mintánkban az átlagéletkor: 32,67 év. (Általá-nos szabály, hogy az átlagot eggyel több tizedesig adjuk meg,mint az adatainkat.) Az alapsokaság számtani átlaga:16
  15. 15. ahol N az alapsokaság elemszáma. (Szimbólumok jegyzéke a60 oldalon!) A példánknál maradva N értékéről fogalmam sincs, illet-ve csak halvány fogalmam van, mert nem tudom, hogypatagóniában hány skizofrén férfi van összesen és legtöbbjükéletkorát nem ismerem. Épp ezért soha nem fogom a µ értékétpontosan tudni (vagyis, hogy mennyi azok átlagéletkora), de amintám méretétől függően egész jól megsaccolhatom, későbbmeglátjuk hogyan. A számtani átlagnak csak mennyiségi vál-tozók esetén van értelme (három katolikus és öt ortodox átlagamennyi lenne?). Van egy másik szépséghiba is, mégpedig az,hogy ha bekerül egy-két extrém érték, úgy el tudják húzni aminta átlagát, hogy nem sok köze lesz az alapsokaság átlagá-hoz. Na, ezért találták ki a mediánt. 2. Medián (median): a gyakorisági eloszlás középső értéke[2]. Ez magyarul azt jelenti, hogy pl. ha a tornasorban valakineka jobbján ugyanannyian állnak, mint a bal oldalán, azaz pontközépen van, akkor bizony ő a medián. Ha libasorba áll 17 tanu-ló, akkor a 9. tanuló lesz a medián. Ugye nem téveszted össze amediánt az átlaggal. A mintánkban az életkor átlaga 32,7 év volt,de a medián 31,9 év. Nyugodtan ellenőrizd az eredményt, teddnövekvő sorrendbe az életkorokat, és nézd meg a 14.-et. Ha azelemek száma páros, és nincs akire rámutatni, hogy te állsz pontközépen, akkor a két középső értéket átlagoljuk. Nagyon hasznostalálmány a medián, mert az extrém értékekre (pl. Patagóniábólegy 99 éves skizofrén férfi) nem érzékeny, ráadásul lehet használ-ni ordinális (!) skálán mért adatokra is [1] (és nyilván, bármelymennyiségi változó esetén). 17
  16. 16. 3. Módusz (mode): az az érték, amelyik a legtöbbszörfordul elő a mintában. Nominális skálán sem átlagot, semmediánt nem tudunk mérni, csak móduszt. A mintánknaknincs módusza, minden érték csak egyszer fordul elő. De haátalakítanánk intervallum skálává, mondjuk tízévenként cso-portosítva (tizenévesek, huszonévesek, harmincasok, stb.),akkor biztosan kiderülne, hogy a huszonöt év körüliek vannaka legtöbben. Tulajdonképpen így lehet folytonos változóbólhisztogramot csinálni. Hogy mi a hisztogram? Az 1. ábra,amelyet fennebb láttál. A mérési adatok áttekinthetőségénsokat segít, ha az adatokon csoportosításokat hajtunk végreúgy, hogy egy folytonos és egymást át nem fedő intervallumsorozatot alkotunk, tehát minden mérési adat egy és csakis egyintervallumba fog kerülni. Hogy hány intervallumot használ-junk? Mondok két egyszerű képletet [2], vannak cifrábbak is,de azok bennünket nem érdekelnek: ha van n darab adatod,akkor a szükséges intervallumok száma (k) az a legkisebbegész szám, amelyre 2k > n . Nekünk van 27 adatunk, 25, tehátelég lett volna 12 helyett 5 intervallum is. Talán könnyebbenmegy a másik képlet, ahol csak be kell helyettesíteni a mintádelemszámát:B. Szóródási paraméterek 4. Ferdeség (skewness, S): az eloszlás aszimmetriájának egymérőszáma [2], az átlag körüli szimmetriától való eltérés mér-tékét mondja meg. Az 1. ábrán, a hisztogramra rátettem azta harang alakú burkoló görbét is, amely az eloszlást mutatja.Ha ez a görbe teljesen szimmetrikus lenne, akkor a ferdeség18
  17. 17. egyenlő lenne nullával. Ha a nagy értékek felé (jobbra) nyújtó-zik a görbe, akkor pozitív, ha a kis értékek felé, akkor negatívferdeségről van szó (2. ábra). A patagóniai példánknál a fer-deség +0,636. ��������������� � � ������� 2. ábra. Pozitív és negatív ferdeség Nagyon szigorú képlete van, nem rontom el a kedvedet vele.Csak jegyezd meg azt, hogy bizonyos statisztikai technikák meg-követelik, hogy az adatok normális eloszlásúak legyenek, és anormális eloszlásnak egyik fontosa tulajdonsága, hogy szimmet-rikus. Ha az átlag, a medián és a módusz nagyon közel vannakegymáshoz, akkor a ferdeség nullához közeli szám. 5. Kurtozis (hegyesség, kurtosis, K): az eloszlás csúcsosságáthasonlítja a normális eloszláshoz, melynek a hegyessége nulla.Ha az 1. ábránkon az eloszlási görbe nagyon lapos hátú lenne,akkor K-ra pozitív, ha hegyes lenne, K-ra negatív számot kap-nánk. Ennek magunkfajta halandók számára nem sok hasznavan, de tudjál róla. 19
  18. 18. Mielőtt továbbmennénk, tegyünk egy nagyobbacska kitérőta normális eloszlás fogalomhoz. Tudd meg, hogy ez a természetegyik csodája. Ha egy folytonos változó esetében hisztogramotkészítünk úgy, hogy a hisztogram intervallumainak szélességétnullához közelítjük (nagyon keskenyek lesznek), akkor meg-kapjuk az adott folytonos változó sűrűségfüggvényét. Ezt papí-ron úgy lehet megrajzolni, hogy jó sok intervallummal készí-ted el a hisztogramot, és aztán az oszlopok tetejére burkológörbét illesztesz. Láthatod, a mi 1. ábránkon kevés intervallumvan, rosszul illeszkedik a görbe. Nagyobb elemszámnál, és sokintervallummal szebben kijön. Ha az emberek magasságánaksűrűségfüggvényét nézzük, akkor azt tapasztaljuk, hogy harangalakú a görbe, tehát van egy középérték, amely köré tömörül azadatok nagy része, a két véglet felé pedig szimmetrikusan lejta vonal. Ugyanilyen görbét kapunk a testtömegekre, az intel-ligenciákra, a pulzusokra, a csirkék távolságára a tyúkanyótól,a hollandok napi sajtfogyasztására, a levelenkénti levéltetvekszámából, a marosvásárhelyi orvostanhallgatók birtokábanlévő A4-es papírlapok számából, és még sorolhatnám. Az adatoknak ezt a jellegzetes megoszlását normál eloszlás-nak (Gauss-görbe) hívják. Hogy miért normál? Egész egysze-rűen azért, mert akármerre nézel, a fizikai és a biológiai para-méterek ilyen módon oszlanak el (igazad van, akad kivétel is).A biometria (= az amit most tanulsz) javarészt erről szól. Halátod, hogy egy jelenséget sok, egymástól független, kis hatá-sú tényező összegződése határoz meg, akkor tudjad, hogy aznormál eloszlású (központi határeloszlás tétel) [5]. Persze,léteznek más jól ismert eloszlások is, de azokat ebből szár-maztatták (t, χ2, F). Sok statisztikai teszt megköveteli, hogy azadatok eloszlása normális legyen, ezért most nem szabad nemmegjegyezni, hogy minden korrekt statisztika-programban20
  19. 19. van olyan parancs, hogy normal plot, vagy test of normality,vagy valami ilyesmi. Például az 1. táblázat adatai alapján ilyenábrát dob ki: �������������������������� � ��������������� � � �� �� �� �� �� �� �� �� �� �������������� 3. ábra. Normál eloszlás vizsgálata A vízszintes tengelyen vannak a mi adataink, a függőlegesena tökéletes normális eloszlás. Azt kell látni ezen az ábrán, hogyaz adatok szépen egy vonal mentén sorakoznak. Igaz, hogy akét végen vannak elkószáló skizofrének, de az összkép kitűnő.Ha a pontok rendezetlenül állnának, akkor azt mondanánk,hogy nem normális eloszlású. Vannak statisztikai tesztek,amelyek számszerűen jellemzik a normális eloszláshoz valóhasonlóságot. Az egyik ilyen teszt (Shapiro, 27 adat) kiírta,hogy p=0,398 (később meglátjuk, ez mit jelent) – ami megerő-sít abban, hogy tényleg normál eloszlásról van szó. Ha 50-nélkevesebb adatod van, akkor a Shapiro-Wilk-tesztet ajánlom, ha 21
  20. 20. több adat van, akkor mehet a Kolmogorov-Smirnov-teszt. Hanincsenek kéznél ilyen internacionális szakemberek, akkorcsinálj egy hisztogramot, látni fogod, hogy kb. olyan-e mintegy Gauss-görbe, plusz nézd meg, hogy a módusz, a mediánés a számtani átlag nagyjából egyenlők-e. Minden statisztika-program, sőt, még az Excel is tud hisztogramot készíteni. 6. Terjedelem (range): ha van könnyen érthető dolog a vilá-gon, hát ez biztosan az. A terjedelem azt jelenti, hogy mekkoratávolság van a legkisebb adattól a legnagyobbig. Csak a mintá-nak van terjedelme, az alapsokaság terjedelméről nem beszél-hetünk, mert... te is ki tudod találni, hogy miért. Na, miért? Már jó ideje a szóródási paraméterekről beszélgetünk, ugyemég képben vagy!? Nos, a szóródást legkönnyebb a terjede-lemmel mérni. Csak éppenséggel van két bökkenő: nagyonfügg az extrém értékektől (abból van), és függ a minta elemszá-mától (egyenes arányossággal nő vele). Kis elemszámú min-táknál (<10) egy s másra jó. 7. Szórás, standard deviáció (standard deviation, SD): aszóródás leggyakrabban használt mértéke. Épp ideje, hogyemlékeztesselek, hogy a szóródási paraméterek azt mérik,hogy az adataink mennyire szorosan helyezkednek el az átlagkörül. A szórás nem függ az elemek számától. Az alapsokaságszórását σ-val jelöljük, a minta szórását s-sel. Nézd meg a kép-letüket, nem vészes. Az alapsokaság szórása: és ugyanígy a mintára:22
  21. 21. Ha szükséges, ismételd át az átlagok jelöléseit. Nézzük azelső képletet. A zárójelben az átlagtól való eltérés található. Ezlehet pozitív vagy negatív szám, ha egyszerűen összegeznénkaz átlagtól való eltéréseket, mindig nulla jönne ki, ezért kellnégyzetre emelni (mind pozitív lesz). Az átlagolás (osztunkN-el) után gyököt kell vonni, hogy „semlegesítsük” a négy-zetre emelést. A második képlet a mintára vonatkoztatvaugyanezt csinálja, csak éppen alul van egy mínusz egy. Ha amintád elemszáma 100-nál nagyobb, akkor elhagyhatod azt anyavalyás egyest, különben nem szabad. Gondolj arra, hogylényegében az adatok egymáshoz viszonyított elhelyezkedésétmérjük és n darab adat n-1 darab távolságot fog közre. Ehheza bekezdéshez tartozó matematikai magyarázatokat vedd úgy,mint azt a közmondást, hogy „Aki korán kel, aranyat lel”. Igaz-nak igaz, de egész másképp. A példánkról se feledkezzünk meg, s=12,0 év jött ki szórás-nak, tehát szó sincs róla, hogy a skizofrének mind egyidőseklennének. Azt írják a könyvek, hogy az átlagtól plusz-mínuszegy szórásnyi távolságra található az adatok 68%-a (normáleloszlás esetén!). Ez konkrétan azt jelenti, hogy az embereinkkétharmadának életkora 32,7±12 év (21 és 45 év közötti). Agyakorlatban viszont inkább olyan számra van szükség, amelya minta nagy részét felöleli, ezért a kétszeres szórástávolságotszokás figyelembe venni. A mintánkból kiszámolva 8 és 56 évtalálható az átlagtól kétszeres szórástávolságra ( x  2  s ). Ezta két számot hívjuk hibakorlátnak [4]. A kétszeres szórástávol-ságon (hibakorlát) belül található az adatok 95%-a. Bizonyos 23
  22. 22. esetekben még szigorúbbak is lehetünk, számolhatunkháromszoros szórással (biztos hibakorlát) [4], amelyen belültalálható az adatok 99,8%-a. Ez utóbbi összefüggést a háromszigma szabálynak [4] is szokták nevezni, ami azt jelenti, hogyaz adataink gyakorlatilag 6s hosszúságú intervallumba esnek,és ha egy adat ezen kívül van, akkor megfelelő mérlegelés utánkizárható a többi eredmény közül. (Lapozz előre a 9. ábrához,talán úgy könnyebben megérted.) Amit majdnem elfelejtettem: • nominális és ordinális skála adatainál nem lehet szórást számolni, de ezt már te is kitaláltad • a standard deviáció mértékegysége megegyezik az adatok mértékegységével • amikor egy tudományos dolgozatban közöljük a minta számtani átlagát, akkor fontos, hogy a szórását is írjuk mellé. Gyakori hiba, hogy 32,7±12 formában adják meg. Helyesen: 32,7 év (SD 11,9). A ± jelet majd meglátjuk, hogy mikor használjuk. 8. Variancia, szórásnégyzet (variance): az adatoknak azátlagtól való négyzetes eltéréseinek átlaga [4]. Az elméletistatisztikában nagyon el vannak vele, nekünk egyelőre nemannyira fontos, mint a SD. A minta varianciája: Micsoda meglepetés! A standard deviáció (szórás) nem másmint a variancia négyzetgyöke. A varianciát σ2-el is szoktákjelölni. 9. Kvantilisek (Quantile): a legfontosabb kvantilisek akvartilisek (quartiles). Tudom, startból kínaiul van, de meglá-24
  23. 23. tod, egyszerű. (Ismerős az a szó, hogy medián? Ha nem, akkorismételd át, a kettes pontnál beszélgettünk róla.) Három darabkvartilist különböztetünk meg, arról a három adatról vanszó, amelyek a gyakorisági eloszlást négy (lehetőleg) egyenlőelemszámú részre osztják. Ebből következik, hogy a középső kvartilis, a Q2 éppen amedián. A példánkban Q2=31,9 év, vagyis ő az, akinél ugyan-annyian öregebbek, mint ahányan fiatalabbak (13-13). Az alsókvartilis (Q1) nem más, mint a medián alatti adatok mediánja(a mintánkban Q1=23,1; ő az, akinél kb. háromszor annyi öre-gebb, mint fiatalabb van, 6-20). A felső kvartilis (Q3) a mediánfeletti értékek mediánja (Q3=42,9, háromszor annyian fiata-labbak, mint öregebbek, stb.). Arra is jó ez a sok Q betű, hogyki tudjuk számolni az interkvartilis tartományt (Q3–Q1), amiegy újabb hasznos szóródási paraméter. Q3–Q1=19,8 év; ha aztlátjuk, hogy az adatoknak az átlaghoz (32,7) közelebbi fele ismajdnem 20 év szélességben található szétszórva, akkor nyil-vánvaló, hogy meglehetősen nagy a szórás. Az interkvartilistartományt nagyon könnyű kiszámolni, nem érzékeny azextrém értékekre, csak arra vigyázz, hogy 10 alatti elemszámúmintánál ne használd. Ha az eloszlást ábrázolni akarjuk, a legkényelmesebb amediánt, az alsó és felső kvartiliseket, illetve a legnagyobb éslegkisebb adatot együtt ábrázolni. Ezt nem is olyan nagyonrégen, 1977-ben vezették be, ma „box and whisker plot” vagy„boxplot” néven ismerhetsz rá [5]. A 27 skizofrénünk életko-rát így ábrázolja: 25
  24. 24. �� ������������ �� �� �� �� �� �� � 5. ábra. Boxplot: életkorok megoszlása Ha egy érték nagyon messze esik a többitől, azt nemlegnagyobb vagy legkisebb adatként fogjuk számon tarta-ni, hanem extrém értéknek hívjuk, és a boxplot-on (valaholfent vagy lent a középvonalban) csillaggal jelöljük (vö. háromszigma szabály). A második legfontosabb kvantilis családot a decilisek adják.Ezt inkább a szociológusok és közgazdászok használják. Adecilisek az eloszlást 10 egyenlő részbe vágják (ezekben a cso-portokban az elemek száma egyenlő). Ha sok az adatunk, akkorfelőlem százba is vághatjuk, ezek a percentilisek (percentiles).Az 50%-os percentilis éppen a medián. A 25%-os percentilisaz alsó kvartilis. Elég gyakran használjuk azt a kifejezést, hogy normális,még gyakrabban azt, hogy nem normális, és eddig nem istudtuk, hogy az élettudományokban a normális kifejezés aztjelenti, hogy az egyed adott paramétere az alapsokaság 5%-26
  25. 25. os és a 95%-os percentilise között található. Ez nem vicc, egykisgyerekről akkor mondják, hogy elmaradt a fejlődésben, hasúlya és/vagy magassága nem éri el a vele egykorú gyerekekrevonatkozó 5%-os percentilis értéket.C. Kapcsolati paraméterekMár nagyon régen megbeszéltük, hogy a kapcsolati paraméte-rek érték-párok közötti összefüggés erősségét mérik. 10. Korrelációs együttható (correlation coefficient, r): ezegy olyan szám, amely két paraméter közötti kapcsolat szoros-ságát, erősségét méri [7]. Nincs mértékegysége. Ha r=0 vagy ahhoz közeli, az azt jelenti, hogy nincs össze-függés az adatok között. r=+1 azt jelenti, hogy függvénysze-rűen egyenes arányosság (lineáris összefüggés) van, vagyisha ismerem az egyik paramétert, akkor ki tudom számítani amásikat (7. ábra). Az előjelből tudom, hogy egyenes (+) vagyfordított (–) arányosság van. A 27 patagóniai betegünknek adtunk egy feladatsort,amelyet különböző eredményességgel oldottak meg. A maxi-mális pontszám 100 volt. Íme az eredményeik, rendre: 2. Táblázat. Teszteredmények 69,3; 70,1; 70; 66; 72; 64; 35; 47; 45; 76; 39; 55; 41; 46; 59; 55; 38; 25; 19; 63; 56,5; 41; 32; 40; 46,1; 40; 53 Ha meg akarjuk nézni, hogy van-e összefüggés az életkorés az eredményesség között, akkor először is készítsünk egykoordinátarendszert, amelyben az egyik tengelyen az életkort,a másikon pedig a pontszámokat lehet felvenni. Minden sze-mélyt egy pont (pöttyöcske, hogy jobban lehessen látni) fog 27
  26. 26. jelképezni, amelynek x és y tengely szerinti koordinátái jelen-tik az életkort illetve az elért pontszámot. Nos, ez lett belőle: ���������������� �� �� �� �� �� �� �� �� � �� �� �� �� �� �� �� ������������ 6. ábra. Sztochasztikus kapcsolat és regressziós egyenes Látható, hogy a pontok nem teljesen össze-vissza vannak,nagyjából egy egyenes mentén helyezkednek el, de az is igaz,hogy kell a jóindulatunk, hogy az egyenest beleképzeljük.Oda is rajzoltam. Tehát szóródás ide vagy oda, valami ösz-szefüggés itt van! Erre mondják, hogy stochasztikus kapcsolatvan az adott paraméterek (életkor, teszteredmény) között. Astochasztikus kapcsolat lehet erősebb-gyengébb, attól függő-en, hogy a pontok mennyire állnak egy vonalba. Ha senki nemlóg ki a tornasorból még egy hajszálnyit sem, akkor mondjuk,hogy függvényszerű kapcsolattal állunk szemben. Ha a pontokteljesen szétszórtak, akkor független változók esete forog fenn(a két változónak semmi köze egymáshoz). Azért, hogy ne kelljen órákig hunyorogni egy stochasztikuskapcsolatot megjelenítő ábra előtt, és ne kelljen mindenféle28
  27. 27. egyenesekről fantáziálni, ezért találták ki a korrelációs együtt-hatót (r). � ����� � � ����� � � ������ � 7. ábra. Korrelációk sajátos esetei A 6. ábra mellé odaírhatjuk, hogy r=–0,909 (és p<0,001,erről később). Ez azt jelenti, hogy erős negatív korrelációvan, vagyis minél öregebb a patagóniai bácsi, annál rosszabberedményt produkál. Pearson-teszt feliratot keresd, ha hasonlószámításokat végeznél. 29
  28. 28. Még annyit kell tudni, hogy könnyen félrevezet ez a teszt, hanem figyelsz. Mert: a) például tudni kell, hogy csak lineáris, vagy majdnem line-áris stochasztikus kapcsolat esetén működik. Ha az adataid,mondjuk, egy hullámos vagy nem hullámos görbe mentén állnakakármilyen szép rendes sorban, mégis a Pearson-teszt nulláhozközeli számot fog eredményül kidobni, és aki figyelmetlen, azmindjárt ki is jelenti, hogy a vizsgált paraméterek függetlenek. b) alapkövetelmény, hogy mindkét változó folytonos legyen c) az extrém értékek torzítják az eredményt, ebben az eset-ben a Spearman-féle rangkorrelációt kell használni. Ugyancsakrangkorrelációval kell dolgozni, ha a változók nem folytono-sak (gyerekeid, fogaid száma ugye csak egész számértékeklehetnek). d) ha bármelyik változót te határozod meg, nem használha-tó ez a teszt. Például gyógyszerek dózis-hatás görbéje eseténNEM használhatod, ha a gyógyszeradagok rögzítettek (pl.csak 100, 200 és 500 mg-os tabletták alkalmazása) e) a korreláció szignifikanciája (p): a korrelációs együtthatómellé mindig oda kell írni a p értéket, ez mutatja meg, hogymennyire bízhatunk egy mintából számolt korrelációs együtt-hatóban. Ne feledjük el, hogy az alapsokaságból számolhatókorreláció (jelölése ρ) nem teljesen ugyanaz, mint a mi mintá-ból számolt r-ünk. Ha keresnénk másik 27 patagóniai skizof-rén férfit, és megíratnánk a tesztet, és kiszámolnánk az életkor-pontszám korrelációt, nem biztos, hogy pontosan –0,909-etkapnánk, csak kb. ennyit. Minél nagyobb a mintánk, annáljobban meg tudjuk becsülni a ρ értékét, de mindig marad egykis bizonytalanság. Ráadásul r értéke minél távolabb esik 1-től,annál inkább kételkedünk, hogy bármiféle összefüggés lenne aparaméterek között.30
  29. 29. A korreláció szignifikanciája azt mondja meg, hogy egyolyan alapsokaságban, amelyben függetlenek a változók (=semmi közük egymáshoz), a nem szerencsés mintavétel miattmekkora valószínűséggel kapunk ekkora elemszám mellett(n=27) ilyen mértékű korrelációt (r=–0,909). Más szóval:mekkora a valószínűsége, hogy az eredmény a véletlen műve.Ha p értéke kisebb mint az egyezményes küszöbérték α=0,05,az azt jelenti, hogy 5%-nál kisebb a valószínűsége, hogy vélet-lenül jött ki korreláció, tehát elfogadjuk. Ha mondjuk 0,13 jöttvolna ki, azt mondanánk, hogy úgy tűnik, a véletlen kavart be,tovább kell növelni az elemszámot, hogy megtudjunk valamibiztosat. De nekünk szerencsénk van, az jött ki, hogy p=0,000,vagyis gyakorlatilag 0 a valószínűsége, hogy véletlenül ilyeniszonyú erős korrelációt kapjunk ott, ahol nincs. Tudjad, hogynagyon kis r érték mellett is előfordul p<0,001, ezt úgy kellkiolvasni, hogy holtbiztos, hogy van egy nagyon gyenge ösz-szefüggés. f) Gyakori és súlyos hiba, hogy a két változó közötti korre-lációból ok-okozati összefüggésre következtetnek [5]. A kor-reláció mögött lehet ok-okozati viszony, de az is lehet, hogya két korrelált változó nincs egymással ok-okozati kapcso-latban, hanem mindkettő egy harmadik, közös októl függ. Aleggyakoribb ilyen jellegű csapda az, amikor mind a két válto-zó az idővel korrelál, amúgy semmi közük egymáshoz. Tudjad,hogy az ok-okozati összefüggést logikai vagy kísérleti úton kellbizonyítani. g) Be kell vallanom, hogy a 6. ábrán azt a vonalat nem szem-mérték szerint rajzoltam, sőt, nem is én rajzoltam, hanem astatisztika-program. Azt a vonalat úgy hívják, hogy regresszi-ós egyenes. Láttuk, hogy az adataink elég jól vonalba állnak,ezért nem alaptalan azt kérdezni, hogy egy 46 éves patagóniai 31
  30. 30. skizofrén fiatalember vajon hány pontra számíthat a tesztben.Ennek a megválaszolására berajzoltatjuk a regressziós egye-nest, ami úgy készül, hogy a program megkeresi azt az egye-nest, amelytől az adatpontok távolsága a lehető legkisebb (leg-kisebb négyzetek módszere) [2]. Minden egyenes egyenlete:Y = a + b × X, ahol X és Y a két változó, b az egyenes meredek-sége, a pedig a tengelymetszet. Ha számítógéppel regressziótszámolsz, ezt a két értéket (a és b) fogod eredményül kapni. Apéldánknál maradva Y=69,04–0,721X lesz a vonal egyenlete.Behelyettesítve a 46 évet, kiderül, hogy kb. 36 pontnál jobbatne várjunk. Ilyen jellegű lekérdezéseket csak a minta terjedel-mén belül (a mintánkban 20 évtől 60 évig) szabad végezni.Például nem helyettesíthetjük be az iménti képletbe a 99 évespatagóniai skizofrén bácsit, mert a mintánk csak 20 és 60 évközöttiekre reprezentatív. Aki nagyon otthon van a témában,az bizonyos esetekben végezhet ilyen becsléseket, „jóslásokat”,de ezt már állítólag extrapolációnak hívják, és nagyon ingo-ványos terület. 11. Rangkorreláció (rank correlation): ha a változók közülvalamelyik nem folytonos (kérdőívben a helyes válaszokszáma, fogaid száma), ha extrém értékek vannak, és azokat nemlehet kigyomlálni, ha nem normál eloszlásúak az adataid, vagyegyszerűen meg akarsz győződni róla, hogy a Pearson-teszt jóhelyen keresi az eredményt, akkor dobd be a Spearman-tesz-tet, a rangkorrelációt [11]. Hátránya, hogy bizonyos mértékűinformációvesztés van, kicsit gyengébb teszt, de ugyanúgymegkapod az r értékét. Még egy régi adósságomat kiegyenlítem, aztán vághatunka sűrűjébe.32
  31. 31. Átlag standard hibája (Standard error of mean, SEM) Amikor a minta átlagát számoltuk, megígértem, hogy majdmegsaccoljuk a populáció átlagát (µ). A mi mintánkban azátlagéletkor 32,7-nek jött ki, de egyáltalán nem lennék meg-lepve, ha egy indonéziai kutatócsoportnak hasonló kísérletben33,1 jönne ki. De nagyon meg lennék lepve, ha 40-es átlag-életkorról számolnának be. Hogy mikor kell meglepődni, ésmikor nem – erről szól ez a két bekezdés. Ha ismerjük egyminta elemszámát, átlagát és a szórását, akkor ki tudjuk szá-mítani, hogy a populáció (alapsokaság) átlaga milyen értékekközött mozoghat. Persze, minél nagyobb a mintám, annálpontosabban meg tudom mondani, hogy kb. hol van az igaz-ság. A képlet nagyon egyszerű, az átlag standard hibája: A betegeink életkorát tekintve, ez az érték 1,615 év. De ezzelmég nincs vége a számolásnak. Konfidenciaa intervallum Már többször is beszéltünk a hibakorlátról (minta-átlagplusz-mínusz kétszeres szórás). Ha azt értetted, akkor teljesenvilágos lesz, hogy a populáció átlagának becslésekor is elvé-gezhetjük ugyanezt a számolást. Itt nem hibakorlátról, hanemkonfidencia határokról, és az általuk közrezárt konfidenciaintervallumról beszélünk, és szórás helyett az átlag standardhibájával számolunk: 33
  32. 32. Ha egy dolgozatban egy populáció átlagáról beszélsz,amelyet minta alapján számoltál ki, akkor mindig ilyen for-mában közöld: a patagóniai szkizofrén férfiak átlagéletkora µ= 32,7 ± 2,3 év ( ). Ez azt jelenti, hogy bármelyikkutatócsoport gyűjt mintát, 95%-os biztos, hogy a kapott átlagvalahol 30 és 35 év között lesz; így hiába jön az indonéz kutató,hogy nekik 40 év jött ki, erősen kételkedni fogok.34
  33. 33. III. Hipotézisek vizsgálataBevezetésMost már nagyvonalakban ismerjük azokat a módszereket,amelyek adatok rendszerezésére és leírására vonatkoznak, ígynekivághatunk egy újabb izgalmas fejezetnek. A hipotézisvizs-gálatokról lesz szó. A tudományos konferenciákon már-már varázsszó-számbamegy a szignifikáns kifejezés. Ha ez nem hangzik el, a hallga-tók gyakran csak a fejüket csóválják, és fenntartásaik vannak,hiszik is, nem is. De ha azt mondod, hogy pl. a különbségszignifikáns, akkor mindenki bólogat. Figyeld meg, hogy adiákköri konferenciákon ilyen vagy olyan statisztikai teszttel,mindenki mindent szignifikánsra hoz ki, a lelkes ifjú kutatókmindent be tudnak bizonyítani. Ez gyanús, nem? A legtöbbstatisztikai próba bizonyos előfeltételezéseken alapul, amelyekha nem teljesülnek, a próba eredménye megkérdőjelezhető,sőt, ami még rosszabb, félrevezető lehet. Azt mondom, néz-zünk szét a témában. Kezdjük egy példával. A 27 skizofrén betegünket hat hóna-pig kezeljük, majd ismét íratunk velük egy tesztet, amely azelőzőhöz hasonló, de azzal nem azonos, mert nem a betegekmemóriáját, hanem a terápia hatását akarjuk vizsgálni. Néz-zük az eredményeket (rendre): 3. Táblázat. Kezelés utáni teszteredmények93,5; 92,1; 89,3; 86,0; 93,5; 83,5; 55,7; 66,6; 65,0; 96,3; 58,4;75,8; 60,0; 67,1; 80,0; 73,7; 58,0; 46,0; 37,8; 86,1; 76,0; 60,5;52,5; 56,9; 69,5; 57,0; 76,2. 35
  34. 34. Ha a leíró statisztika szerint összehasonlítjuk az első tesz-tet a másodikkal, nyilvánvaló lesz, hogy most jobb az ered-mény: x1=50,5 míg x2=70,9. Tehát 20 ponttal jobban sikerülta második teszt. Vajon, ez a véletlen műve? Nem hiszem, húszpont – az túl sok, hogy véletlenül ennyivel jobbat írjanak. Ha50,1 lenne, azt mondhatnánk, hogy belefér a véletlenbe. Még55 pont is. A 60 az már nehezen. A következő oldalakon meg-próbálunk ebből a spekulációból tudományt csinálni. Két átlag különbsége (eltérése) két összetevőből származik [2]: 1. véletlen összetevő (hiba): véletlen hatások eredménye, általunk nem befolyásolható, megmagyarázhatatlan, ész- revehetetlen tényezők okozzák; a mintavétel során pl. sor- solásnál épp ezek és nem azok kerültek a mintába, régiek és pontatlanok a műszerek, az emberek nem egyformák, ugyanaz a személy is változó eredményeket produkál, nem tudsz elég pontosan titrálni, háttérzaj, stb. A véletlen összetevő megoszlása jellegzetes, a helyes értéktől mind- két irányba kb. egyforma kilengést okoz. 2. szisztematikus összetevő: valamilyen lényegi különbség van, ami nem magyarázható a véletlennel A matematika nem tud mit kezdeni a szisztematikus ösz-szetevővel, csak a véletlen összetevő szerepéről tud nagyon jóbecslést mondani. Épp ezért a statisztika eredménye nem több,mint hasznos információ, amely hozzásegíti a kísérletezőt,hogy megbízható döntést hozzon orvosi, biológiai, szocioló-giai, stb. kérdésben. Figyelted az alanyt? Végső soron nem astatisztika, hanem te döntesz. Erről szól a hipotézis-vizsgálat.A véletlen minden kísérletben bezavar, és neked az a felada-tod, hogy e mögött mutasd ki a lényegi különbséget – ha van.Az is fontos, hogy ne mutass ki különbséget ott, ahol nincs, nehagyd, hogy átverjen a véletlen.36
  35. 35. Kivétel nélkül minden hipotézisvizsgálat azzal kezdődik,hogy felállítjuk a nullhipotézist. Azt mondjuk, hogy az átlagokközötti eltérés teljes egészében a VÉLETLEN miatt van. Ha igaza nullhipotézis, akkor az átlagok különbsége normális eloszlá-sú véletlen változó (nincs szisztematikus összetevő), melynekvárható értéke nulla (nem vagy alig különböznek az átlagok).Ha a számítások során kiderülne, hogy a nullhipotézis nemtartható, akkor elővesszük az alternatív hipotézist, és belátjuk,hogy véletlen hatásokkal nem magyarázható meg a tapasztaltkülönbség. Nullhipotézis: a patagóniai skizofrén férfiak egyhónaposgyógykezelése nem befolyásolta az eredményességüket afeladatmegoldásban; ha az átlagok kissé eltérnek, az csakis avéletlen miatt van. Alternatív hipotézis: a patagóniai skizofrén férfiak egyhó-napos gyógykezelése befolyásolta az eredményességüket afeladatmegoldásban; az átlagok között olyan nagy az eltérés,hogy ez már nem magyarázható a véletlennel. Nézzük a két teszt eredményeinek megoszlását (8. ábra): � ������ ��������������� � ������ � � � � � � � � � �� �� �� �� �� �� �� ��� ������������ 8. ábra. A teszteredmények összehasonlító hisztogramja 37
  36. 36. A két harang alakú eloszlási görbe elég nagy területen fediegymást, és elég nagy területen nem fedi egymást. Nehéz ráné-zésre megmondani, hogy vajon a véletlen miatt van-e jobbratolódva a második görbe. Ennek a problémának a megoldásá-hoz még néhány dolgot meg kell értenünk.A standard normális eloszlásA normális eloszlásról már megbeszéltünk néhány dolgot, deazt még nem mondtam el, hogy ha minden adatból kivonod amintád átlagát, és elosztod a szórással:akkor a standard normális eloszlást kapod [5]. ��� ��� �� � �� ��� ��� 9. ábra. A standard normális eloszlás sűrűségfüggvénye A 9. ábra nem egy kalapot, és nem is óriáskígyót ábrázol(a hasában egy elefánttal), hanem éppen a standard normáliseloszlást. Láthatod, az átlag egyenlő nullával, a szórás (SD)pedig éppen eggyel egyenlő. Annyira híres és számunkraannyira hasznos ez a Gauss-görbe, hogy azt javaslom, hogyegy másodperc erejéig győzzük le a bonyolult dolgok iránti38
  37. 37. ellenszenvünket, és vessünk egy tiszteletteljes pillantást a nor-mális eloszlás valószínűségi sűrűségfüggvényét leíró képletre: A sűrűségfüggvény és a valószínűség fogalmak követke-zőképpen kapcsolódnak egymáshoz: a görbe alatti területvalószínűséget jelent. A teljes terület 100%. Nincs értelme aztkérdezni, hogy mennyi annak valószínűsége, hogy a változónkpontosan egy adott értéket (pl. 47,6985625585445254524552..) fog felvenni, mert ennek esélye nulla (nincs területe). Aztviszont meg lehet mondani, hogy mennyi annak valószínű-sége, hogy a véletlen változónk várhatóan egy adott interval-lumba essen (pl. 47,69-47,70), vagy egy adott értéknél kisebb/nagyobb legyen. Vannak nevezetes intervallumok. Mondok egy példát. Hamég emlékszel a hibakorlátokra, akkor már tudod, hogy akétszeres szórástávolságokon belül található az adatok 95%-a, a háromszoros szórástávolság felöleli majdnem az összesadatot (99,8%). Úgy is lehet fogalmazni, hogy a véletlen vál-tozónk 95%-os biztos, hogy kétszeres szórástávolságon belülrefog esni. Állítsuk fejre ez utóbbi mondatot: 5% esély van arra,hogy a véletlen változónk kívül esik majd a kétszeres szórás-távolságon. Már megbeszéltük, hogy a véletlen hiba is normál eloszlásúvalószínűségi változó, amelynek várható értéke nulla. Minélnagyobb két minta átlagának különbsége, annál kisebb avalószínűsége, hogy fenntarthatjuk a nullhipotézist. A görbekétoldalt csak közelít az alapvonalhoz, soha nem éri el azt, 39
  38. 38. ezért meg kell mondanunk, hogy hol van a határ, az a küszöb,ahol még fenntartjuk a nullhipotézist. A standard normáliseloszlású görbén (9. ábra) kevéssel +2s felett (kb. 97%-nál)húztam is egy függőleges vonalat. Kijelenthetem, hogy a vona-lon kívül eső adatokat (p=3%) nem fogadjuk el, de lehetséges,hogy ezt a küszöböt túl alacsonyra tettem, lehetséges, hogymajd elutasítok egy olyan értéket, amelyet tényleg a véletlenokozott. Na, ez az elsőfajú hiba (α-risk, type I error). Akitévesen utasít el egy nullhipotézist, az elsőfajú hibát követ el.Másodfajú hibát (β-risk, type II error) követünk el, ha fenn-tartunk egy helytelen nullhipotézist [5]. Vagyis ha a küszöbötfelteszem 99,999999%-ra, akkor könnyen lehet, hogy olyanértékeket is elfogadok, amelyek köszönő viszonyban sincse-nek a várt középértékkel (a véletlennel). Ugye érted, hogy akét típusú hiba egymás ellen dolgozik, ha egyiknek kis esélythagysz, akkor a másik felerősödik, és viszont. �� �� ������������������ ������ ������ ���������������� ���������������� ������ ������ ������������������ 10. ábra. Első és másodfajú hiba Nem lehet pontosan megfogalmazni, hogy melyik az a kisvalószínűségű küszöbérték, amelynél sem első- sem másod-fajú hibát nem követünk el. Kompromisszum eredményekénta biológiai-orvosi kutatásban elfogadott leggyakoribb küszöb-értékek (szignifikancia-szint, significance level, α): α=0,05,α=0,01, és a legszigorúbb az α=0,001 (p küszöbértékeit α-val40
  39. 39. jelöljük). Ha egy statisztikai próba eredményeként példáulp=0,02-t kapsz, akkor bejelentheted, hogy a különbség szig-nifikáns α=0,05-ös szinten (átlépte ezt a küszöböt). Máskéntfogalmazva: száz esetből kevesebb mint ötször fordulhat előilyen érték kizárólag a véletlen eredményeképpen, és ezt nemtartja az ember valószínűnek, ebben az esetben elvetheted anullhipotézist. Szerintem ezt már túltárgyaltuk.Paraméteres és nemparaméteres tesztekA statisztikai próbák (tesztek) két nagy családba sorolhatók:vannak paraméteres és nemparaméteres tesztek. A paraméteres tesztek esetén a nullhipotézis egy normál(vagy más ismert) eloszlású változó valamelyik paraméterérőlállít valamit [1]. Nominális és ordinális változókon használninem ajánlott. A paraméteres tesztek kb. 5%-al erősebbek minta nemparaméteresek, ez gyakorlatilag azt jelenti, hogy átlagokközötti létező különbséget már kisebb elemszám mellett is kitudnak mutatni [8]. Hátrányuk azonban az, hogy meglehe-tősen igényesek, van néhány alkalmazási feltétel, amit be kelltartani [2]: • a minták normál eloszlásúak legyenek • a vizsgált változóval kapcsolatos megfigyelések függetle- nek legyenek (mintavételezés!) • a minták szórása legyen egyenlő, legalábbis ne különböz- zenek szignifikánsan. A normál eloszlás ellenőrzését megbeszéltük, a mintavé-telezés pl. legyen véletlenszerű (nem válogatunk csak úgy akórlapokban), a szórások különbségét pedig ellenőrizni tudod,majd meglátod hogyan. A nemparaméteres tesztek esetén nem szükséges a populá-ció valamely paraméterének (pl. átlag) becslése, és nem köve- 41
  40. 40. telmény a normál eloszlás. Nominális és ordinális változókonis használhatjuk; nem érzékenyek kiugró adatokra [10]. Ha csak az a kérdésünk, hogy két minta között van-e bár-milyen különbség, akkor az alkalmazási feltétel betartásamellett bármelyik próbát alkalmazhatjuk, vagyis nem kellmegszokásból leragadni egy próba mellett. Tudnunk kell azon-ban, hogy a nem-paraméteres próbák nem (közvetlenül) a kétcsoport átlagának a különbségét vizsgálják, hanem a csopor-tok más (próbánként változik) tulajdonságait. Így aztán a szig-nifikáns különbség nem biztosan jelenti azt, hogy a két csoportátlaga (várható értéke) is különbözik, mert lehet, hogy a kétvizsgált populáció eloszlásának valamilyen más tulajdonságakülönbözik, nem a várható értékük. Ha az a gyanúnk, hogycsak az eloszlás jellege más, akkor ezt a Kolmogorov-Smirnov,vagy a Wald-Wolfowitz próbával bizonyíthatjuk. Ezt a kéttesztet nem részletezem, ha a minták eloszlásának valamelytulajdonsága (ferdeség, hegyesség, szórás stb.) nagyon külön-bözik, akkor szignifikáns a próba. Nem érdekes, vannak ennélfontosabb dolgok.a) Paraméteres tesztek 1. u-teszt, z-teszt Egyesek z-tesztnek, mások u-tesztnek hívják. Az alapköve-telményekre figyelni kell, plusz a minta elemszáma 30 felettilegyen. Ez a teszt arra ad választ, hogy két nagy minta szár-mazhat-e ugyanabból a populációból (vagyis az átlagaik szig-nifikánsan különböznek-e) [2]. A nullhipotézis azt állítja, hogy az átlagok különbsége nor-mális eloszlású véletlen változó, amelynek várható értéke nulla.A nullától való lényeges eltérés valószínűsége pedig kicsi, és haez a szignifikancia-szint alatti, akkor elvetjük a nullhipotézist.42
  41. 41. A paraméteres hipotézis-vizsgálatok közül ez az egyik leg-régebben használt eljárás. A z érték szerint kellett kikeresni amegfelelő p értéket a standard normális eloszlás táblázatából.Ez ma már gombnyomásra megy. Erről röviden ennyit, nemsokat fogod használni. 2. Student-t teszt Egyszer volt (a XX. század elején), hol nem volt (Dublinban),volt egyszer egy sörfőzde. Ebben a sörfőzdében dolgozottegy – nem fogod kitalálni – matematikus. Úgy hívták, hogyGossett. Ma úgy mondanánk, hogy minőségi ellenőr volt. Ez aGossett észrevette, hogy kis elemszámú minták esetén (n<30)a valószínűségi eloszlás megváltozik, itt már nem használhatóa Gauss-görbe [2]. Elemszámtól függően a harang kövérebbvagy soványabb egy kicsit – ez a t-eloszlás. Sajnos a gyár szak-mai titoknak tekintette a lelkes matematikus felfedezését, ígyaztán Student álnév alatt szivárgott ki az igazság. Ezt a tesztetazóta is Student-tesztnek hívják. Tehát kis elemszámú minták esetén használhatjuk. Az orvo-si-biológiai kísérletek gyakorlatában gyakran szembesülünkkis elemszámmal (költségigényes, időigényes, túl speciális cso-port, stb.). Jegyezd meg, hogy a t próba alkalmazási feltételei: • a változók függetlenek és • normális eloszlásúak, • a minták szórása pedig egyenlő (két minta esetén azok szórása nem különbözik szignifikánsan egymástól). Ezt a tesztet fogod várhatóan a legtöbbet használni. A kép-leteket, számításokat mellőzzük, ha érdekel utánanézhetszbárhol, nem tankönyv, amelyikben nincs benne. Most csak aztmondom el, hogy mikor mire klikkelj. a) egy minta átlagát hasonlítjuk egy fix értékhez (Onesample T-test): a patagóniai skizofrén férfiak életkorát tar- 43
  42. 42. talmazó minta mellett a fix érték legyen például az indonézkutató kijelentése, hogy az ők hasonló patagóniai mintájukbanaz átlagéletkor 40 évnek jött ki. A statisztika program ebből kifogja számolni, hogy t=-4,54, p=0,000 (vagyis p<0,001). Tehátannak valószínűsége, hogy az indonéz kutató jól dolgozott,gyakorlatilag nulla (nem egyenlő nullával, csak nagyon közelvan hozzá). Ilyenkor arra is kell gondolni, hogy esetleg a mimunkánkban van a hiba . Tény az, hogy a 32,7-es átlag ésa 40-es átlag között akkora a különbség, hogy a véletlen eztnem okozhatta (ilyen kis szórás mellett). Ha az indonézekazt mondták volna, hogy 33 év jött ki nekik, akkor a t-tesztp=0,84-et adott volna eredményül, amit úgy olvasnánk ki,hogy 84% eséllyel a véletlen is okozhat ekkora különbséget(33-32,7=0,3év). Ebben az esetben a nullhipotézis érvénybenmarad, lényegében ugyanazt az eredményt kaptuk, mindenrendben. b) független minták átlagának összehasonlítása (Indepen-dent samples T-test): ha a kedves indonéz kollega elküldi amintát (pl. n=22, x =40,0), akkor még biztosabb összehason-lítást végezhetünk kétmintás T-teszttel. Ezt a számolást azzalkell kezdeni, hogy eldöntjük, hogy a két minta szórása külön-bözik-e egymástól vagy nem. Ezt az F-teszttel (vagy Bartlettteszt) lehet elvégezni. • F-teszt: a varianciák egyenlőségének ellenőrzésére való ez a teszt. A két minta varianciájának aránya egyenlő F- el [5]. Az F-eloszlásnak külön táblázata van, kis minták esetén az eloszlása nem olyan mint a normál görbe. A kétmintás t-próbának feltétele, hogy a minták szórása kb. azonos legyen (F≈1), vagyis statisztikai értelemben a szórások ne különbözzenek. Tehát az F-teszt dönti el, hogy használhatsz-e Student t tesztet vagy nem.44
  43. 43. • Welch-teszt: ha az F-teszt azt mondja, hogy a két minta varianciája nem egyenlő, akkor a t-próba helyett használ- juk [1]. Ez a teszt gyengébb, mint a kétmintás t-próba, amúgy a lényeg ugyanaz. Most azt kellene mondanom, hogy ha mindkét mintaelemszáma meghaladja a 30-at, akkor z-teszttel dolgozzál,mert 30 felett már használható a standard normáleloszlás.A gyakorlatban minden másképp van. Akármilyen mintáidlegyenek, jó a t-teszt, mert 30 alatt kötelező, 30 felett pedignyugodtan használható, mert nagy számoknál nem különbö-zik a normál-eloszlástól. Ami a varianciák egyenlőségét illeti– egyes programok az eredményt az F-teszttel együtt adjákmeg, még a Welch-tesztet is elvégezik, csak arra kell figyelned,hogy a megfelelő sorból olvasd ki az eredményt. c) párosított minták átlagának összehasonlítása (pairedsamples T-test): önkontrollos vizsgálatoknál használható,vagyis ha ugyanazokon az egyedeken mérünk pl. élettani para-métereket valamilyen beavatkozás előtt és után [5]. Ez az egyiklegerősebb próba, ezért javaslom, hogy lehetőség szerint úgytervezd a kísérleteidet, hogy önkontrollosak legyenek, mert ittnem kell tartani egy rakás ismert és ismeretlen tényezőtől, amimintánként különbözhet. Itt nem kell a varianciát figyelni. Szerintem már elfelejtetted, hogy a patagóniai betegeinkmásodik feladatsorát még nem hasonlítottuk össze az első-vel. A nullhipotézis és az alternatív hipotézis megfogalmazá-sa néhány oldallal előbb megtörtént; mindkét teszt normáleloszlású (Shapiro: p1=0,517 és p2=0,456), és a varianciák semkülönböznek (F-teszt: F=0,082, p=0,776). Az elemszám nemnagy (n1=n2=27), ugyanazon a mintán végeztünk két mérést,tehát minden együtt van ahhoz, hogy a párosított t-tesztetmegkérdezzük. Az eredmény: p<0,001. Nullhipotézis elvetve. 45
  44. 44. Tehát valami történt a két megmérettetés között, ami nemmagyarázható a véletlennel: hatásos volt a terápia. Rövid kitérő következik. Az eddig tárgyalt hipotézisvizsgálatok csak arra adtakválaszt, hogy az átlagok különböznek vagy sem. Megtehetjükazt is, hogy célzottan rákérdezünk, hogy mennyi a valószí-nűsége annak, hogy az egyik minta nagyobb (nem egyenlő ésnem is kisebb) mint a másik. Ezt ritkábban szokás használni,úgy hívják, hogy egy-véges teszt (one-tailed test). Ami ennéltalán fontosabb, az a két-véges teszt (two-tailed test). Aki nemfoglalkozik az egy/két végek kérdésével, az egész életében két-véges teszttel dolgozik anélkül, hogy tudna róla. Nem tudja,hogy a konfidenciaszintet automatikusan α = 0,05-re tette, ésezzel levágott 2,5-2,5%-ot az eloszlási görbe két végéről. Jótudni, hogy ha egy két-véges hipotézis alig 5%-on szignifikáns,akkor egyvéges hipotézisként már 2,5%-on szignifikáns lenne[5, 10]. Éppen ezért fontos, hogy először a hipotézist mondjukki, és az alapján válasszunk egy-véges vagy két-véges tesztet.Nyilván, látod te is, hogy esetenként egyvéges teszttel szigni-fikánsra lehet kozmetikázni az eredményt (p=0,06, ráklikkelszaz egy-véges tesztre, és láss csodát: p=0,03). 3. Varianciaanalízis (Analysis of Variance, ANOVA) Az élő rendszerek egyik csodálatos és ugyanakkor szörnyenbosszantó tulajdonsága a nagy variabilitás. Bármilyen mérhe-tő dolgot próbálnál meghatározni élőlényeken, egy csomó füg-getlen tényező versenyzik, hogy jól megszórja az adataidat. Hapontosan akarsz számolni, csoportosítanod kell az adatokat avélt befolyásoló tényezők szerint. Mindazonáltal, ha ezeket acsoportokat mind kettesével hasonlítgatjuk össze, soha nemérünk a végére. A varianciaanalízis arra jó, hogy egyszerre sok46
  45. 45. mintát hasonlíthass össze. Ha például van tízféle protokoll egybizonyos karcinóma kezelésére, és sejted, hogy egyik sem érsemmit, akkor beteszed tizenegyediknek a kontrollcsoportot,lefuttatod a varianciaanalízist, és azonnal kijön, hogy egyfor-ma az összes; megspóroltál egy félnapi számolgatást. Megbeszéltük, hogy a T-teszt alapfeltétele a varianciákegyenlősége, és azt is tudod, hogy ezt F-teszttel vizsgálják. Avarianciaanalízis ugyanazt az F-eloszlást használja, mint az F-teszt, csak itt nem két minta varianciáját osztjuk el egymással,hanem másról van szó. Nagyon figyelj! 1950-ben egy Fisher nevű matematikus azt találta ki, hogyha sok minta van, először kiszámítja a minták egybeömleszté-séből kapott főátlagot, majd az egyes mintaátlagokat, és ezeketösszehasonlítja. Rövidesen rájött, hogy az adatok főátlagtólvaló eltérése két helyről származik: a mintákon belüli átlagtólvaló eltérésből és a mintaátlagok egymás közötti eltéréséből.Még egy utolsó csavarás következik: azt mondta, hogy ne átla-gok különbségeivel számoljunk, hanem a szórásnégyzetekkel,azaz a varianciával [5]. Minden mintának van tehát egy saját varianciája, ezekneka saját varianciáknak az összege a mintákon belüli variancia( ). Mivel a minták átlaga nem egyenlő, ez is kifejezhető egyvarianciaként, ez lesz a csoportok közötti variancia ( ). Legyen Ha igaz a nullhipotézis, akkor a csoportokon belüli varianciaegyenlő a csoportok közötti varianciával, tehát . 47
  46. 46. Minél nagyobb az F, annál biztosabb, hogy dobhatod el anullhipotézist. Használatának alapfeltétele, hogy • az egyes mérések egymástól függetlenek legyenek • normális eloszlás • a belső varianciák nem különböznek szignifikánsan a) Egyutas, egyszeres osztályozású varianciaanalízis (One-way ANOVA): Kettőnél több független minta összehasonlítása.Mondok egy példát: legyenek A, B, C és D gyógyszerek, mond-juk herpesz kezelésére. Adjunk mellé placebónak egy ötödiket,ez lesz az E. A függő paraméter legyen a kezelés időtartama(napok). A táblázat így néz ki: 4. Táblázat. Herpesz kezelése Gyógyszer Napok száma E 7 C 7 D 6 E 7 A 8 B 7 E 8 ... ... Egyutas varianciaanalízissel p=0,265 azt jelenti, hogy a her-pesz A, B, C vagy D gyógyszerrel kezelve ugyanannyi idő alattgyógyul (egy hét), mint azok nélkül (E= placebo, 7 nap). Hap<0,01, akkor csak annyit tudunk, hogy a vizsgált csoportokközött van legalább egy, amely szignifikánsan különbözik atöbbitől. Ebben az esetben érdemes valamilyen többszörösösszehasonlításos tesztre klikkelni (pl. a Bonferroni-teszt48
  47. 47. mindenkit mindenkivel páronként összehasonlít), vagy a leg-alaposabb a páronként kiszámolt Student t-teszt. b) Kétutas varianciaanalízis (Two-way ANOVA): Két füg-getlen változó egyidejű hatásának vizsgálata. Példa: van egygyógyszercég négy gyógyszerügynök (Ü) alkalmazottal, ésháromféle fájdalomcsillapító (X) azonos áron. 5. Táblázat. Fájdalomcsillapítók, napi kereslet Bevétel (RON/nap) X Ü 34 1 1 12 1 2 30 1 3 28 1 4 53 2 1 ... ... ... A gazdasági igazgató arra kíváncsi, hogy a fájdalom-csillapí-tókból származó bevételek mitől függnek inkább: a gyógyszer-ügynökök teljesítményétől vagy a gyógyszer típusától. Ha aztkapta eredménynek, hogy a bevétel az X-változóra, illetve azX × Ü interakcióra nem szignifikáns, viszont az Ü-változóraigen, akkor a következtetés az, hogy az ügynökök nem egy-formán dolgoznak. Érdekesebb a helyzet, ha kizárólag az X*Üinterakció szignifikáns. Ez azt jelenti, hogy egyik ügynök vala-melyik gyógyszert nagyon másképpen forgalmazza. Létezik háromutas, négyutas, stb. varianciaanalízis is, denem érdemes bonyolítani, amire kell, arra nekünk elég ez a kétmódszer. Talán mondanom sem kell, hogy igaz ugyan, hogynévlegesen varianciák különbségét számoljuk, de ettől mégátlagok különbségéről szól a történet. 49
  48. 48. b) Nemparaméteres tesztek4. Előjelpróba (sign-test) Ez a legegyszerűbb nemparaméteres teszt, egy bélyeg hátánki lehet számolni. Mondok egy példát: az a kérdés, hogy adottgyógyszer befolyásolja-e a szívfrekvenciát. Kettős vak kísér-letet (double mind randomized trial) alkalmazunk, vagyis:két részre osztjuk a beteganyagot, az egyik csoport a vizsgáltgyógyszert kapja, a másik a placebót, sem az orvos, sem a bete-gek nem tudják, hogy milyen gyógyszert kaptak éppen. 6. Táblázat. Szívfrekvencia gyógyszeres befolyásolása Placebo Gyógyszer Különbség Előjel 70 82 12 + 78 80 2 + 74 73 -1 - 69 77 8 + ... ... ... ... A kísérlet tart mondjuk kétszer egy hetet, és egy hét utángyógyszercsere van; az egyetlen megkötés az, hogy mind-két pirula egy hétig fusson. Fontos, hogy a gyógyszernek nelegyen hosszú távú hatása a betegség menetére. Az adatokatszámítógépbe írjuk, az első sorba írjuk például Mari néni ada-tait, placebo mellett 70, a gyógyszer hatására pedig 82 volt aszívfrekvenciája. Az nem érdekel, hogy kezelés előtt mennyivolt a szívfrekvencia, mert itt mindenki saját magának a kont-rollja: minden betegnél felírjuk a harmadik oszlopba a place-bo-gyógyszer különbséget; a negyedik oszlopba kerül csak akülönbség előjele. Könnyen belátható, hogy a nullhipotézisérvényessége esetén kb. ugyanannyi pozitív előjelet fogunkkapni mint negatívat. Összeszámoljuk tehát a + előjeleket, s50
  49. 49. megnézzük egy táblázatban (maradj nyugton, a számítógépmegnézi), hogy pl. 40 elem esetén 39 + előjelet mekkoravalószínűséggel adhat a véletlen. Szerinted? Az előjelpróba egyéb alkalmazási területe pl. a nemek gya-korisága közötti eltérés egy beteganyagban, vagy igen-nemválaszos kérdőívek esete stb., vagyis amikor két egymást kizáróesemény előfordulásának valószínűségét hasonlítjuk össze. 5. Mann-Whitney-U teszt (Wilcoxon rank sum test) Ez a teszt a kétmintás t-teszt nemparaméteres megfelelője.Ezzel a teszttel több név alatt is találkozhatsz, tudjad, hogylényegében ugyanazon eljárásról van szó (Mann-WhitneyU test, vagy Mann-Whitney-Wilcoxon rangösszeg próba,Wilcoxon kétmintás teszt). Ha olyan mintád van, amely nemnormális eloszlású, ha a varianciák különböznek, ha az adataidnem numerikus adatok, de rangsorolhatók – nincs semmi baj,a Mann-Whitney-U-teszt erre van kitalálva. Ha a mintád nor-mális eloszlású, és numerikus adataid vannak (arányskálán),de neked nincs kedved Student-tesztet csinálni, akkor sincssemmi gond, mert a Mann-Whitney-U-teszt majdnem olyanerős, mint a t-teszt [2]. A lényege egy nagyon érdekes trükk. 7. Táblázat. APGAR-score: varicellás újszülöttek vizsgálata Varicella Egészséges 7 10 10 9 6 10 8 10 7 8 10 51
  50. 50. Egy példa segítségével fogom előadni: az a kérdés, hogyújszülöttkori varicella esetén az APGAR-score (újszülöt-tek általános fizikai állapotát méri 5 perccel a születés után)különbözik-e az egészséges újszülöttekétől. Egy ritka betegsé-get vizsgálunk, az elemszám nagyon kicsi (5+6), az adatainkatsorrendi skálán mérjük (APGAR 0..10), tehát az eddigi tesztekhasználhatatlanok. 8. Táblázat. APGAR-score, rangszámok 6 7 7 8 8 9 10 10 10 10 10 1 2,5 2,5 4,5 4,5 6 9 9 9 9 9 A két mintát egyetlen sorozattá egyesítjük, és növekvő nagy-ságrendbe tesszük. Minden érték egytől kezdődően rangszá-mot kap, ha több adat is egyenlő, akkor mindegyik az illetőrangszámok átlagát kapja. Például két nyolcas van, ki legyena negyedik, és ki legyen az ötödik? Mindkettő megkapja a(4+5)/2 rangszámot. Ezután szétválasztjuk a mintákat, és arangszámokkal számolunk tovább. A varicella-csoportban a rangok átlaga 3,9, az egészsége-seknél pedig 7,75, ennek megfelelően p=0,043 – hűha, eznecces volt. Erről jut eszembe, hogy ha szignifikáns eredménytkapunk, akkor lehet ünnepelni, de ha nem, az még nem jelentiazt, hogy nincs is összefüggés. Ebben az esetben ismét megkell próbálni nagyobb elemszámnál, esetleg más statisztikaipróbával, esetleg kiszűrni a befolyásoló tényezőket, stb. Nehézügy. 6. Wilcoxon-féle előjeles rangpróba (Wilcoxon signedranks test) A legfontosabb mondanivalóm az, hogy ezt a tesztet netéveszd össze a kétmintás Wilcoxon (rangösszeg) próbával,sem az egymintás Wilcoxon próbával (erről nem esett szó, egy52
  51. 51. elméleti várt értékhez hasonlítjuk a mintánk átlagát, most nemtöltjük az időt vele). Akárcsak az előjel-próbánál, a Wilcoxon-féle előjeles rangpróba esetén is párosított mintákkal dolgo-zunk. A párok közötti különbségekhez rangokat társítunk úgy,hogy azok előjelét is megtartjuk. A 6. táblázatból radírozd ki az„Előjel” című oszlopot, és máris kész a táblázatod. A „Különb-ség” felirat alatti adatokból számolhatunk előjeles rangpróbát.A nullhipotézis értelmében a rangok összege kb. nulla kelllegyen. Gondolom, érthető, hogy ez a teszt egyesíti az előjel-próba és a Mann-Whitney-U teszt előnyeit. Felesleges belefá-radni a részletekbe, a számítógépbe csak az első két oszlopotkell beírni, abból ki tudja számolni az előjeles rangpróbát. 7. Kruskal-Wallis teszt (Nemparaméteres ANOVA) Ez a teszt a Mann-Whitney U teszt általánosításaként isfelfogható [2]. Ha kettőnél több mintát akarok összehason-lítani, de az egyutas ANOVA valami miatt nem megy, akkorklikkelj a Kruskal-Wallis tesztre. Alkalmazási feltételei nem túlszigorúak: legyen véletlen mintavétel, független minták, a vál-tozó pedig legalább ordinális skálán legyen mérhető. Átlagokközötti különbség kimutatására nagyon érzékeny ez a próba.Ha elvetjük a nullhipotézist, akkor a minták páronkénti össze-hasonlításához Mann-Whitney U rangösszeg próbákat lehetvégezni. 8. Khi-négyzet (χ2) próba Független kvalitatív vagy diszkrét kvantitatív változókelemzésére alkalmas tesztről van szó. Aki papíron számol, azgyakorisági táblázatot készít. Ezt a táblázatot úgy hívjuk, hogykontingencia-táblázat. 53
  52. 52. 9. Táblázat. Szívfrekvencia gyógyszeres befolyásolása – kontingencia-táblázat CSOPORT Szívfrekvencia Összes Placebo Kezelt 3 7 10 Nőtt 13,6% 35,0% 23,8% 9 8 17 Változatlan 40,9% 40,0% 40,5% 10 5 15 Csökkent 45,5% 25,0% 35,7% 22 20 42 Összes 100,0% 100,0% 100,0% Térjünk vissza az előjelpróbánál felvetett példához: az akérdés, hogy befolyásolja-e a szívfrekvenciát egy bizonyosgyógyszer. Összesen 42 beteget vizsgáltunk, ezek közül 20részesült gyógyszeres kezelésben, 22 pedig csak azt hitte. Atovábbiakban azt fogjuk megnézni, hogy ezek a kapott gya-koriságok mennyiben térnek el a nullhipotézis által jósoltgyakoriságoktól. A nullhipotézis azt mondja, nincs semmilyenösszefüggés a gyógyszerelés és a ritmuszavarok gyakoriságaközött, a két véletlen változó egymástól független. Ahhoz, hogy szemléletes legyen a kontingencia-táblázat,érdemes feltüntetni a két csoporton belüli relatív gyako-riságokat is. Láthatjuk, hogy a placebo csoportban a bete-gek 13,6%-a mutatott szívfrekvencia növekedést, a kezeltcsoportban viszont jóval nagyobb ez az arány (35,0%).A szívfrekvencia csökkenését nézve, éppen fordított ahelyzet: 45,5%-25%. Ez alapján azt sejtjük, hogy a keze-lés növeli a szívfrekvenciát, de ezt be is kell bizonyítani.Nézzük meg, mit jósol a nullhipotézis az első cellába. A 4254
  53. 53. páciens közül 10-nek nőtt a szívfrekvenciája, tehát a rela-tív növekedés egyenlő 10/42 (=23,8%). Amennyiben igaz anullhipotézis, akkor mindkét csoportban nagyjából 23,8%-otkell kapjunk az első sorban. Tehát az első cellában a várható(expected nr., E) gyakoriság: 22 × 10/42=5,2, de látod, hogya tapasztalt gyakoriság (observed nr., O) nem ennyi, hanemegyenlő 3-al. A χ2 próba minden cellára kiszámolja a �O � E �2 Eértéket, pl. az első cellában: �3 � 5,2�2 � 0,93 5,2ezeket összegzi, és máris meg van a χ2 értéke, amelynek a χ2eloszlás táblázatában megfelel egy p érték. Ezzel az általánoseljárással bármilyen n×m-es kontingencia-táblázatra számol-ható χ2 teszt. A mi példánkban χ2 = 3,238 és p = 0,198 az eredmény. Teháta nullhipotézist nem tudtuk elvetni, nem tudtuk bizonyítani,hogy a gyógyszer hatásos lett volna. Remélem érthető, hogy eznem jelent bizonyítékot arra, hogy a gyógyszer hatástalan! Jó, ha tudod, hogy a χ2 próba érvényességének feltétele, hogya cellák legalább 80%-ban a várható gyakoriságok (E) értékenagyobb legyen mint 5, és sehol ne legyen 1 alatti (a megfigyeltgyakoriság természetesen lehet 0). Ha ezt nem tudod tartani,akkor Fisher-féle exakt teszttel kell dolgoznod. 55
  54. 54. 10. Táblázat. 2×2-es kontingencia-táblázat Két vizsgált csoport Válasz Összesen 1 2 Igen a b s1 Nem c d s2 Összesen n1 n2 N Gyakran fordul elő, hogy csak 2×2-es kontingencia-tábláza-tunk van. Ha beteg- és kontrollcsoportunk van, vagy ha epide-miológiai vizsgálatokban a két vizsgált csoport a kockázatnakkitettek és a kockázat nélküliek, valamilyen tünet jelenlététvagy terápiás választ vizsgálunk, akkor ilyen táblázattal fogunkdolgozni. Ez a χ2 tesztnek egy olyan sajátos esete, amellyel számítógépnélkül is jól meg tudsz birkózni. Ennyi az egész: N �a � d � c � b � 2 �2 � n1 � n2 � s1 � s 2 Ezt tényleg egy bélyeg hátán is ki lehet számolni. Nem? 11. Táblázat. Gyakran használt Khi-négyzet küszöbértékek χ2 > p< 3,841 0,05 6,635 0,01 10,827 0,001 Itt a nagyszerű alkalom, hogy megvizsgáld, hogy a nemekközött van-e szignifikáns különbség a sapkahordás tekinteté-ben. Fog ez menni: kontingencia-táblázat, fiúk és lányok, van56
  55. 55. sapkája, nincs sapkája. Mondok egy példát, te majd átjavítoda számokat. Nullhipotézis: sapkaviselet gyakoriságát tekintve nincskülönbség a nemek között. Alternatív hipotézis: igenis, van különbség! 12. Táblázat. Kontingencia-táblázat: sapkaviselet vizsgálata nemek szerint Nemek Sapka Összesen Fiúk Lányok Van 18 4 22 Nincs 6 10 16 Összesen 24 14 38 Tehát a 11. táblázat szerint ez p<0,01. (A 11. táblázat érté-kei csak 2×2-es kontingencia-táblázat esetén használhatók!)Tehát nagy bizonyossággal (p<0,01) állítjuk, hogy a sapkavi-selet nemek szerint eltérő. Maga a teszt csak ennyit mond, deha rendesen felírtuk volna a relatív gyakoriságokat, akkor mégjobban látszana, hogy a fiúk állandóan sapkában vannak, alányok alig (75% vs. 40%). Mondom, egy bélyeg hátán...Ha számítógéppel dolgozunk, akkor...Lehetőleg jól bevált, valamelyik legismertebb statisztikai prog-ramcsomagot használd (SPSS, STATA, BMDP, MINITAB,SAS). Ha egyik sem hozzáférhető, akkor a Microsoft Excelbena Tools alatt az „Addins...”-re klikkelve az Analysis ToolPak-etinstallálhatod. A Tools menüben megjelenik a Data Analysisopció. Használata nehézkes és korlátozott, de meg fogsz lepőd-ni, hogy mennyi mindent tud. Már az adatok bevitele előtt definiáld a változókat, vagyismindegyiknek adjál nevet, aztán mondd meg a programnak, 57
  56. 56. hogy egész vagy nem egész számot, dátumot vagy szövegetakar jelenteni az a változó. Minden információt számmá kellalakítani. Beírod például, hogy neme, beállítod, hogy egészszámokkal fogod jelölni, tehát nulla tizedesig kéred, a skálanominális, aztán a values vagy hasonló címszó alatt meg lehetadni, hogy 1=fiú, 2=lány. Ugyanígy beviszed a sapka változót,ugyancsak nominális, 0=nincs, 1=van. Ha hiányzik egy adat,azt is jelölni kell valamivel! Mondjuk a –1 jelentse azt, hogynincs adat. Ha szérumkoleszterin szintet mérsz, akkor a col(=szérum koleszterin) változó numerikus adat, arányskálán(scale, ratio) mérendő, beállítod, hogy 2 vagy 3 tizedesig, stb.Ez után jöhet az adatok bepötyögése. Ha az első sorba azt írod, hogy 13. Táblázat. Adatbevitel általános formája neme sapka col 1 0 9,5 ... ... ...ez azt jelenti, hogy egy fiúról van szó, akinek nincs sapkája ésa szérumkoleszterin szintje 9,5 mM/l. Minden sor egy embertjelent, minden oszlop egy paramétert, tulajdonságot. A leíró statisztikák számolásánál, hipotézis-vizsgálatoknálés mindenféle műveleteknél csak a változók nevével dolgozol.Ha például azt szeretnéd, hogy helyetted a gép számolja ki asapkák és a nemek közötti összefüggést, akkor a χ2 tesztnélmegadod, hogy az oszlopokban legyen a neme, a sorokban asapka, és OK. Csak olyan módszereket alkalmazz, amelyeket jól ismersz.A bőség zavarában vigyázz, hogy mit jelölsz be. Legjobb, haelőbb elolvasod a súgót.58
  57. 57. Mielőtt megkapnád az eredményt, legyen elképzelésed,hogy milyen válasz várható. A számítógép tudja a statisztikákértékét, de az értelmét nem! Vedd észre, ha nyilvánvalóanrossz eredmény kaptál. Nagyon vigyázz, mert a számítógépnem fog néhány keresetlen szóval figyelmeztetni, hogy mármegint értelmetlen kérdést tettél fel; egyszerűen értelmetlenválaszt ad. A p=0,000 eredmény azt jelenti, hogy p<0,001, de ezt márrégóta tudod. 59
  58. 58. Utószó helyettHivatalos statisztikák szerint az autópályákon a halálos autó-balesetek 8%-át menetiránnyal szemben közlekedő sofőrökokozzák, ami azt jelenti, hogy a halálos autóbalesetek 92%-a ahelyes menetirányba haladó sofőröknek tulajdonítható, tehátstatisztikai szempontból biztonságosabb az autópályán menet-iránnyal szemben haladni!? Szerinted?Szimbólumok jegyzékeN alapsokaság elemszáman minta elemszáma x minta átlagaµ alapsokaság átlagaS ferdeség (Skewness)K hegyesség (Kurtosis)s minta szórásaSD, σ alapsokaság szórása, standard deviációv, σ2 varianciaQ1, Q2, Q3 kvartilisekr korrelációs együttható mintábanρ korrelációs együttható alapsokaságbanSEM átlag standard hibája60
  59. 59. Felhasznált irodalom[1] Barta Z. – Biometria (http://puma.unideb.hu/~zbarta/teaching/ biometria)[2] Belágyi J. – Orvosi biometria, Pécsi Orvostudományi Egyetem, Pécs, 1999.[3] Farkas E. – Îndreptar de lucrări practice în sănătatea publică. Legislaţie sanitară, UMF Tg. Mureş, Târgu Mureş, 2000.[4] Hajtman B. – Matematika orvosok és gyógyszerészek részére, Medici- na Könyvkiadó, Bp, 1980.[5] Kirkovits M. – A biostatisztika alapjai, Debreceni Orvostudományi Egyetem, Debrecen, 1998.[6] László J. – Prelucrarea statistică a datelor experimentale, IMF Tg. Mureş, Tg. Mureş, 1973.[7] Makara B. G.: Bevezetés a biometriába (http://xenia.sote.hu/hu/biosci/docs/biometr/course/introduc/index2.htm)[8] Marc S. – Prelucrarea statistică în medicină şi biologie, Editura Academiei, Bucureşti, 1961.[9] Mezei E., Veres V. – Társadalomstatisztika, Kolozsvári Egyetemi Kiadó, Kolozsvár, 2001[10] Patrick, R. – Metodele statistice şi experimentale în ştiinţele umane, Polirom, Iaşi, 2004.[11] Puri, K. B. – Statistics for the Health Sciences using SPSS, Saunders, London, 1996[12] Trebici, V. – Mica enciclopedie de statistică, Editura ştiinţifică şi enciclopedică, Bucureşti, 1985.[13] Vargáné H. P., Boján F. – Demográfiai és epidemiológiai módszerek a népegészségügyben, Literatura Medica Kiadó, Bp, 1996. 61

×