Verkostoanalyysi 2011, TTY – 11.3.2011                                                                      1Verkostoanaly...
Sisältö                                                                                                 2•   SNA-graafit j...
3SNA-graafit    Taustat   Määritelmät  Ominaisuudet  Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus      ...
Taustaa                                                                                                4• Tapoja sosiaalis...
Perusteluja graafien käytölle                                                                               5• SNA:ssa (So...
Historiaa graafeista ja niiden käytöstä SNA:ssa                                                          6• Jacob Levy Mor...
Graafit                                                                                               7• Seuraavassa esite...
Suuntaamaton graafi                                                                                         8• Suuntaamato...
Perusmääritelmiä                                                                                          9• Kaksi solmua ...
Solmun aste                                                                                             10• Suuntaamattoma...
Graafin tiheys                                                                                            11• Graafin G (N...
Graafin tiheys                                                                                      12• Suuntaamattomassa ...
Suunnattu graafi eli digraafi                                                                            13• Jos verkoston...
Kulku, reitti ja polku                                                                                 14• Kulku (a walk, ...
Geodeesi, etäisyys, halkaisija ja eksentrisyys                                                         15• Geodeesi (a geo...
16SNA-matriisit    Määritelmät   Ominaisuudet   Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus           ...
Sosiomatriisi                                                                                                   17• Verkos...
Sosiomatriisi                                                                                         18• Taulukko on g x ...
Sosiomatriisin ominaisuuksia                                                                       19• Sosiomatriisi on yl...
Insidenssimatriisi                                                                                  20• Insidenssimatriisi...
Insidenssimatriisi                                                                                          21      l1   l...
Kulku                                                                                                       22• Sosiomatri...
Saavutettavuus                                                                                       23• Saavutettavuudell...
Geodeesi ja etäisyys                                                                                   24• Geodeesit eli s...
Solmujen asteluvut                                                                                          25• Suuntaamat...
Solmujen vienti- ja tuontiluvut                                                                           26• Suunnatuille...
Tiheys                                                                                             27• Verkoston tiheys mä...
28SNA-tunnusluvut       Keskeisyys        Arvostus    Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus     ...
Yleisesti keskeisyydestä ja arvostuksesta                                                             29• Suuntaamattomill...
Keskeisyys                                                                                              30• Keskeisyyden k...
Keskeisyysaste                                                                                      31• Toimijan ni keskei...
Läheisyys ja välillisyys                                                                             32• Läheisyys on toim...
Arvostus                                                                                            33• Kuten keskeisyyttä...
Arvostusaste                                                                                              34• Toimijan ni ...
Arvostusläheisyys                                                                                    35• Toimijalle ni voi...
Arvoasema                                                                                                  36• Edellä esit...
Esimerkki – Valtioiden kauppaverkosto                                                                                 37• ...
Esimerkki – Valtioiden kauppaverkosto                                                                                  38•...
Huomioitavaa                                                                                           39• On selvää, että...
Lähteet                                                                                                         40Johansso...
Verkostoanalyysi 2011, TTY – 11.3.2011                                                         41Kiitos mielenkiinnostanne...
Upcoming SlideShare
Loading in …5
×

Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

1,188 views

Published on

Verkostoanalyysi 2011 seminaarin avausluennon materiaali.

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,188
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
3
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

  1. 1. Verkostoanalyysi 2011, TTY – 11.3.2011 1Verkostoanalyysin peruskäsitteitä ja visualisointiaGraafit ja matriisit, keskeisyys ja arvostus11.3.2011Thumas Miilumäkithumas.miilumaki@tut.fiTampereen teknillinen yliopistoHypermedialaboratorioMatematiikan laitos Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  2. 2. Sisältö 2• SNA-graafit ja niiden ominaisuudet• SNA-matriisit ja niiden ominaisuudet• Suuntaamattomien verkostojen keskeisyyden tunnusluvut• Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut• Taustalla pääosin Wassermanin ja Faustin Social Network Analysis: Methods and Applications (1994) teokessa esitetyt SNA-teoriat• Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin (2000) teoksista• Termistön suomennokset pohjautuvat Ruohosen (2006), Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa käytettyihin suomennoksiin• Esitysaineisto noudattaa sisällöltään pitkälti aiempia seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  3. 3. 3SNA-graafit Taustat Määritelmät Ominaisuudet Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  4. 4. Taustaa 4• Tapoja sosiaalisten verkostojen mallintamiseen on useita• Käytettävät menetelmät riippuvat mallinnuksen kohteesta, näkökulmasta ja tavoitteesta• Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia• Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn• Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi• Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  5. 5. Perusteluja graafien käytölle 5• SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita • Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen • Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla • Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.)• Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen • Graafi on esitys tarkasteltavasta verkosta • Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  6. 6. Historiaa graafeista ja niiden käytöstä SNA:ssa 6• Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953)• Graafiteoria on ollut voimakkaasti käytössä • Antropologiassa • Kommunikaatiotutkimuksissa • Elinkeino- ja liiketaloustutkimuksissa • Organisaatiotutkimuksissa • Maantieteissä (Wasserman & Faust 1994, 94.) • Piiriteoriassa ja -analyysissa• Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  7. 7. Graafit 7• Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina• Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia• Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  8. 8. Suuntaamaton graafi 8• Suuntaamaton graafi G koostuu kahdesta joukosta: • Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes) • Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines)• Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta• Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun ni ja nj ei-järjestetty pari, ts. kaari lk = (ni,nj) = (nj,ni)• Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni, sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie) • Silmukoita ei useinkaan käytetä sosiogrammeissa • Sosiogrammit yksinkertaisia (simple) graafeja • Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä • Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  9. 9. Perusmääritelmiä 9• Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari lk=(ni,nj) on joukossa L ts. lk = (ni,nj) ∈ L• Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen solmuista, jotka muodostavat kaaren lk määrittelevän järjestämättömän parin lk=(ni,nj)• Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial)• Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen välissä, ts. G (N , L ): N = {n1,n2,…,ng}, L = Ø Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  10. 10. Solmun aste 10• Suuntaamattomassa graafissa solmun aste (degree) d(ni) kertoo solmuun ni liittyneiden kaarien lukumäärän• Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla • Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta • Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet suoraan erillisillä kaarilla solmuun ni• Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään ∑ ig=1 d (ni ) 2 L d = = g g• Edelleen astelukujen varianssi (variance of degrees) ∑ ig=1 (d (ni ) − d ) 2 S = 2 D g Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  11. 11. Graafin tiheys 11• Graafin G (N , L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista• Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan ⎛ g ⎞ g (g − 1) ⎜ ⎟= ⎜2⎟ ⎝ ⎠ 2• Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle ∆ määritelmä L 2L Δ= = g ( g − 1) / 2 g ( g − 1)• Tiheys voi olla • Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0) • Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2) • Täydellistä graafia, jossa on g solmua, merkitään Kg Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  12. 12. Graafin tiheys 12• Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g• Täten tiheys voidaan kirjoittaa muodossa 2L d Δ= = g ( g − 1) ( g − 1) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  13. 13. Suunnattu graafi eli digraafi 13• Jos verkoston yhteydet tulkitaan suunnatuiksi, on nuoli (an arc) lk kahden solmun ni ja nj järjestetty pari se., lk = <ni,nj> ≠ <nj,ni> (Wasserman & Faust, 1994.)• Mikäli yhteys tomijaparin välillä vaikuttaa molempiin suuntiin, on digraafissa tällöin rinnakkaiset vastakkaissuuntaiset nuolet solmuparin välillä• Digraafilla on käytännössä samat perusominaisuudet kuin graafilla • Muistettava on kuitenkin, että digraafissa nuolia voi olla kaksi kertaa enemmän verrattuna vastaavan toimijajoukon graafin kaarien lukumäärään – Yhteyden tulkinnassa on ero • Yksityiskohtaisemmat määritelmät esim. digraafin tiheydelle on esitetty teoksessa Miilumäki (2010) Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit 11.3.2011
  14. 14. Kulku, reitti ja polku 14• Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien äärellinen jakso W = ni0, lj0, ni1, lj1, … , ljk, nik • Kulku alkaa aina solmusta ja päättyy solmuun • Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n, on kulku suljettu (closed) • Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa • Kulun pituus (length) on kulun sisältämien kaarien lukumäärä • Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä kaarina kulun pituuteen • Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä• Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran• Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain kerran Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  15. 15. Geodeesi, etäisyys, halkaisija ja eksentrisyys 15• Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä• Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena • Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j) • Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko. solmujen välillä • Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys ääretön (tai määrittämätön) • Suuntaamattomilla graafeilla d(i,j) = d(j,i)• Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys• Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun ni ja minkä tahansa graafin muun solmun nj kanssa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  16. 16. 16SNA-matriisit Määritelmät Ominaisuudet Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  17. 17. Sosiomatriisi 17• Verkoston toimijat ja eri toimijaparien väliset suunnatut / suuntaamattomat yhteydet voidaan esittää yhtenä matriisina• Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi ja vastaava pystysarake• Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei ole, ja arvon 1, jos toimijoiden välillä on yhteys• Koska silmukoita ei sallita verkostossa, n n n n4 1 2 3 taulukon lävistäjän alkiot jätetään n - 1 0 1 1 n 1 - 1 0 määrittelemättä n 0 1 - 2 1 3 n4 0 1 0 - Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  18. 18. Sosiomatriisi 18• Taulukko on g x g vieruspistematriisi (an adjacency matrix) X, joka alkiot xij määritellään ⎧0, lk = (ni , n j ) ei ole olemassa xij = ⎨ ⎩ 1, lk = (ni , n j ) on olemassa• Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi (a sociomatrix, sociomatrices)• Edellä esitetystä taulukosta saadaan siis sosiomatriisi X n1 n 2 n 3 4n ⎡− 1 0 1 ⎤ n 1 - 1 0 1 ⎢1 − 1 0 ⎥ n 2 1 - 1 0 X =⎢ ⎥ n 0 1 - 1 ⎢0 1 − 1 ⎥ ⎢ ⎥ 3 n 4 0 1 0 - ⎣ 0 1 0 −⎦ Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  19. 19. Sosiomatriisin ominaisuuksia 19• Sosiomatriisi on yleisesti asymmetrinen (asymmetric) suuntaamattomille graafeille, mutta aina symmetrinen (symmetric) suuntaamattomille graafeille• Täydellisen Kg -graafin sosiomatriisin jokainen diagonaalialkiosta poikkeava alkio on arvoltaan 1• Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen (diagonaalialkiosta poikkeava) alkio on arvoltaan 0• Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja, jotka vastaavat toimijoiden välisten yhteyksien arvoja vk Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  20. 20. Insidenssimatriisi 20• Insidenssimatriisissa (an incidence matrix) on esitetty tieto siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident) minkin graafin (verkoston) kaaren suhteen• Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja kutakin kaarta yksi sarake• Jos siis verkostossa on g solmua ja L kaarta, on insidenssimatriisi I g x L matriisi• Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole liittynyt kaareen lj, on Iij = 0• Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren päätepisteitä Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  21. 21. Insidenssimatriisi 21 l1 l2 l3 l4 l5 ⎡1 1 0 0 1⎤ n1 1 1 0 0 1 ⎢1 0 1 0 0⎥ n2 1 0 1 0 0 I =⎢ ⎥ ⎢0 1 1 1 0⎥ ⎢ ⎥ n3 0 1 1 1 0 n4 0 0 0 1 1 ⎣0 0 0 1 1⎦Insidenssimatriisia Ivastaava graafi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  22. 22. Kulku 22• Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja nj välillä kulku ninj• Sosiomatriisin X neliön X2 alkio xij määritellään xij2 ] = ∑k =1 xik xkj [ g• Tämän summan yksi termi xikxkj = 1 vain, jos molemmat yhteydet (ni,nk) ja (nk,nj) ovat olemassa Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj• Sosiomatriisin X neliön X2 alkiot xij2 ] ilmoittavat verkostossa [ olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj• Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien kulkujen, joiden pituus on p, lukumäärän Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  23. 23. Saavutettavuus 23• Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku• Saavutettavuusmatriisissa (a reachability matrix) X [R ] alkio xijR ] [ on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin• Verkostossa kulku voi olla pituudeltaan korkeintaan g-1• Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat solmujen välisten erimittaisten kulkujen lukumäärät [Σ ]• Näiden summamatriisi X X [Σ ] = ∑i=1 X i = X + X 2 + X 3 + ... + X g −1 g −1 ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä [Σ ]• Tästä summamatriisista X saadaan saavutettavuusmatriisi X [R ] , kun matriisin X [Σ ] nollasta poikkeavat alkiot merkitään ykkösiksi• Saavutettavuusmatriisi on määritettävissä myös Warshallin algoritmilla laskentatehokkaammin suurille verkostoille Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  24. 24. Geodeesi ja etäisyys 24• Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (a distance matrix) avulla• Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja nj välisen lyhimmän etäisyyden pituuden• Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia X ja sen potenssimatriiseja X2, X3, …, Xg-1 se., d (i, j ) = min p xijp ] > 0 [• Verkoston halkaisija on yhtä suuri kuin suurin verkostosta löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)]) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  25. 25. Solmujen asteluvut 25• Suuntaamattomille verkostoille solmujen asteluvut ovat helposti laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla • Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun • Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin rivisummana, eli L d (ni ) = ∑ I ij j =1 • Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava solmu on liittynyt kaarella riviä vastaavaan solmuun • Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin rivisummana tai sarakesummana, koska matriisi on symmetrinen, eli ts. g g d (ni ) = ∑ xij =∑ xij = xi + = x+ j j =1 i =1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  26. 26. Solmujen vienti- ja tuontiluvut 26• Suunnatuille verkostoille solmujen vienti- ja tuontiluvut (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin X avulla • Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta solmusta lähtee nuoli saraketta vastaavaan solmuun • Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin rivisummana, eli g d O (ni ) = ∑ xij = xi+ j =1 • Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta • Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin sarakesummana, eli g d I (ni ) = ∑ x ji = x+i j =1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  27. 27. Tiheys 27• Verkoston tiheys määriteltiin verkostossa olemassa olevien solmujen välisten yhteyksien summan ja verkoston kaikkien mahdollisten solmujen välisten yhteyksien summan välisenä suhteena• Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1) toimijaparien välistä suoraa yhteyttä• Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu yhteys• Nyt siis olemassa olevien yhteyksien summa saadaan yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli tiheys ∆ määritellään Σ ig=1Σ g=1 xij Δ= j g ( g − 1)• Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  28. 28. 28SNA-tunnusluvut Keskeisyys Arvostus Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  29. 29. Yleisesti keskeisyydestä ja arvostuksesta 29• Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyden (centrality) tunnuslukuja • Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä• Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan • Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa” • Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien vastaanottamista eli arvostuksen kohteena olemista Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  30. 30. Keskeisyys 30• Keskeisyyden käsite määritellään suuntaamattomille verkostoille• Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla • Keskeisyysaste (degree centrality) • Läheisyys (closeness centrality) • Välillisyys (betweenness centrality) • Informaatiokeskeisyys (information centrality)• Suuntaamattomissa verkostoissa keskeinen toimija on osallisena monissa yhteyksissä • Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden• Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas koko verkostolle yhteisesti voidaan määrittää keskittyneisyys (centralization), joka on verkostosta toiseen vertailtava tunnusluku • Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko verkoston tasolla Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  31. 31. Keskeisyysaste 31• Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni))• Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava tunnusluku • Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden keskeisyysasteita vertailla eri verkostojen välillä • Normeerattu keskeisyysaste C´D(ni) määritellään d(ni) C´D(ni) = , missä g on verkoston toimijoiden lukumäärä g–1• Keskeisyysaste määritellään myös suunnatuille verkostoille, jolloin käsitellään erikseen vientikeskeisyyttä (outdegree centrality) ja tuontikeskeisyyttä (indegree centrality) Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  32. 32. Läheisyys ja välillisyys 32• Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien) summa ci kaikkiin verkoston muihin toimijoihin nj • Itsessään summa ei ole vertailtava tunnusluku eri verkostojen välillä• Verkostojen kesken vertailukelpoinen normeerattu läheisyys määritellään g–1 C´C(ni) = , missä g on verkoston toimijoiden lukumäärä ci• Toimijan välillisyys puolestaan mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu • Toimijan välillisyys on merkityksellinen tunnusluku mm. tutkittaessa verkoston toiminnan tehokkuutta Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  33. 33. Arvostus 33• Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin• Verkoston toimijoille voidaan määrittää seuraavat arvostukset • Arvostusaste (actor degree prestige) • Arvostusläheisyys (actor proximity prestige) • Arvoasema (actor status prestige, actor rank prestige)• Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja • Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  34. 34. Arvostusaste 34• Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana • Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(ni)• Arvostusaste määritellään formaalisti PD(ni) = dI(ni) = Σj xij = x+i , missä dI(ni) on solmun ni tuontiluku ja x+i on verkoston sosiomatriisin X sarakesumma sarakkeesta i• Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P´D(ni) x+i P´D(ni) = , missä g on verkoston toimijoiden lukumäärä g–1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  35. 35. Arvostusläheisyys 35• Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka moni toimija nj voi saavuttaa toimijan ni• Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Ii avulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta ni• Toimijan ni arvostusläheisyys PP(ni) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta ni• Arvostusläheisyys saa muiden normeerattujen tunnuslukujen tavoin arvoja välillä [0,1] • Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi • Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään nollaksi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  36. 36. Arvoasema 36• Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä• Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä olevien toimijoiden nj arvoasemista PR(nj) • Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden nk arvoasemista jne.• Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan ni arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio• Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts. PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng)• Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm. matriisin ominaisarvoprobleeman ratkaisusta • Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden arvoasemat voidaan määrittää erilaisissa verkostoissa Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  37. 37. Esimerkki – Valtioiden kauppaverkosto 37• Seuraavassa on esitetty 24 valtion kauppaverkosto (Wasserman & Faust 1994) http://matriisi.ee.tut.fi/~miilumak/sna/ Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  38. 38. Esimerkki – Valtioiden kauppaverkosto 38• Verkostosta määritetyt arvostuksen tunnusluvut (g = 24) i VALTIO dI (ni) dO (ni) PD (ni) PP (ni) PR (ni) 1 Algeria 13 4 0,565 0,661 0,222 2 Argentina 10 13 0,435 0,599 0,805 3 Brazil 11 21 0,478 0,619 1,000 4 China 15 21 0,652 0,710 0,711 5 Czechoslovakia 13 21 0,565 0,661 0,818 6 Ecuador 9 2 0,391 0,581 0,183 7 Egypt 12 9 0,522 0,639 0,482 8 Ethiopia 10 2 0,435 0,599 0,131 9 Finland 15 21 0,652 0,710 0,758 10 Honduras 9 1 0,391 0,581 0,072 11 Indonesia 14 14 0,609 0,685 0,617 12 Israel 10 11 0,435 0,599 0,682 13 Japan 17 23 0,739 0,767 0,680 14 Liberia 9 0 0,391 0,601 0,000 15 Madagascar 6 1 0,261 0,533 0,106 16 New Zealand 14 11 0,609 0,685 0,461 17 Pakistan 14 13 0,609 0,685 0,525 18 Spain 17 22 0,739 0,767 0,673 19 Switzerland 15 23 0,652 0,710 0,765 20 Syria 12 0 0,522 0,658 0,000 21 Thailand 15 14 0,652 0,710 0,589 22 United Kingdom 16 22 0,696 0,738 0,633 23 United States 19 23 0,826 0,834 0,644 24 Yugoslavia 15 18 0,652 0,710 0,680 MEAN 12,917 13,292 0,562 0,668 0,510 VARIANCE 9,993 67,955 0,018 0,005 0,085 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  39. 39. Huomioitavaa 39• On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla• Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta• Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta • Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic Network Analysis) • Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa • Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  40. 40. Lähteet 40Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011)Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage Publications.Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_- _Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_- _Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja- arvostus.pdf (Viitattu 10.3.2011)Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö. Tampere: Tampereen teknillinen yliopisto. http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf.Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc.Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5, uusi sarja.Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications.Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York: Cambridge University Press. Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011
  41. 41. Verkostoanalyysi 2011, TTY – 11.3.2011 41Kiitos mielenkiinnostanne.Kysymyksiä? thumas.miilumaki@tut.fi Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011

×