Tietosuoja etäopetuksessa ja opetuksessa käytettävissä digilaitteissa
Juuri nyt: Somen trendit ja algoritmit
1. Kuva: Aman Pal @paman0744, Unsplash
Juuri nyt:
Somen trendit ja algoritmit
30.11.2023
Harto Pönkä
Innowise
2. Suomalaisten yhteisöpalvelujen käyttö päivittäin tai lähes päivittäin 2020-2022
Lähde: Tilastokeskus, 2020-2022, Väestön tieto- ja viestintätekniikan käyttö sukupuolen ja ikäluokan mukaan,
https://pxdata.stat.fi/PXWeb/pxweb/fi/StatFin/StatFin__sutivi/statfin_sutivi_pxt_13ud.px, kuva: Harto Pönkä (22.12.2022)
2
3. YouTube ja Facebook ovat Suomen suosituimpien verkkosivustojen TOP 5:ssä
YouTube nousi Suomen toiseksi
suosituimmaksi verkkosivustoksi vuonna
2009 ja sillä sijalla se on yhä.
YouTubea kutsutaan usein maailman
toiseksi suosituimmaksi hakukoneeksi.
Sitä se on myös Suomessa.
Facebook on säilyttänyt 4. sijansa.
Wikipedia on noussut kaksi sijaa
vuodessa.
Twitter ja Instagram ovat nousseet
listalla pykälän viime vuodesta.
Lähde: Similarweb, 1.11.2023, Suomen lista, https://www.similarweb.com/top-websites/finland/
3
4. Suosituimmat sosiaalisen median palvelut Suomessa 2023
Datalähde: DNA, Digitaaliset elämäntavat 2023 -tutkimus, https://corporate.dna.fi/digitaalinenelama2023
(n=1011, 16-74-vuotiaat), käyttö vähintään viikoittain, SVT:n väestötiedot 2022 (stat.fi), kuva: Harto Pönkä, 31.10.2023.
4
7. Somepalvelujen käytön muutokset 2014-2023
Lähde: Reuters institute, Digital News Report 2023, https://reutersinstitute.politics.ox.ac.uk/digital-news-report/2023
Tampereen yliopisto, Uutismedia verkossa 2023, Suomen maaraportti, https://trepo.tuni.fi/handle/10024/149682
7
8. Some muuttaa varsinkin nuorten uutismaisemaa
Uutisten seuranta somessa keskittyy yhä
perinteisiin tiedotusvälineisiin ja toimittajiin
Twitterissä uutisten seuranta keskittyy
poliitikoihin ja muihin poliittisesti aktiivisiin
Instagramissa korostuu somevaikuttajat
TikTokissa uutisia seurataan eniten tavallisten
ihmisten kautta. Sama ilmiö on vahva myös
Twitterissä/X:ssä.
Lähde: Tampereen yliopisto, Uutismedia verkossa 2023, Suomen maaraportti, https://trepo.tuni.fi/handle/10024/149682
8
Facebookin uutiskäyttö on yleisintä
15 % kertoi käyttävänsä WhatsAppia ja
YouTubea uutisten seuraamiseen.
TikTokin ja Instagramin uutiskäyttö kasvaa
Some on pääasiallinen uutisten lähde:
34 %:illa 18-24-vuotiaista ja
19 %:illa 25-34-vuotiasta.
10. Noin puolet reagoi some-julkaisuihin, vain harva julkaisee itse aktiivisesti
Datalähde: DNA, Digitaaliset elämäntavat 2023 -tutkimus, https://corporate.dna.fi/digitaalinenelama2023 (n=1011, 16-74-vuotiaat)
10
11. Eniten omaa sisältöä tekevät Snapchatin käyttäjät
Datalähde: DNA, Digitaaliset elämäntavat 2022 -tutkimus, 17.6.2022 (N=1000, 16-74-v.), käyttö vähintään 1-2 kertaa päivässä,
https://www.dna.fi/documents/753910/11433306/Digitaaliset_elamantavat_tutkimusraportti_2022.pdf/
11
12. TikTokissa julkaisuihin reagoidaan eniten
TikTokissa on korkein osallistumisaste.
Instagramissa osallistumisaste on jopa
nelinkertainen Facebookiin verrattuna.
Instagramissa reelsit/kelat saavat
seuraajat reagoimaan eniten.
Lähde: Socialinsider, 2023, https://www.socialinsider.io/blog/social-media-industry-benchmarks/
12
Reel/kela Karuselli/albumi Video Kuva
13. Tutkimus: TikTokissa reaktioiden määrät olivat ylivoimaisia verrattuna muihin
TikTokin keskimääräiset reaktioiden
määrät (ja sisältöjen näyttömäärät
ovat täysin poikkeavat muihin
verrattuna.
On hyvä kysymys, ovatko TikTokin
lukemat oikeasti luotettavia?
Videoiden koukuttavuus näkyy: myös
YouTube erottui ns. perinteisemmistä
sosiaalisen median palveluista.
Tutkimus kohdistui aiheisiin, joista
levitettiin disinformaatiota.
Disinformaatiota sisältävät julkaisut
saivat määrällisesti eniten reaktioita
TikTokissa ja suhteellisesti eniten
Twitterissä ja YouTubessa.
Raportti: TrustLab, 2023, Code of Practice on Disinformation, https://disinfocode.eu/wp-content/uploads/2023/09/code-of-practice-on-disinformation-september-22-2023.pdf,
virallinen sivu: https://disinfocode.eu/structural-indicators/ (tutkimuksen kohteena oli Puola, Slovakia ja Espanja)
13
TikTok
200 x
620 x
3900 x
850 x
30 x
14. Raportti TikTokin datankeruusta
TikTok pyrkii saamaan puhelimesta mm. laitteen
tiedot ja tunnisteet, kontaktit, sijainnin, kalenterin,
kuvat, laitteen muistin, asennetut ja käytössä olevat sovellukset.
TikTokin huomattiin lähettävän tietoja lukuisille verkkopalvelimille – myös Kiinaan.
TikTokin sisältämät tunnetut datankerääjät (9): AppsFlyer, Bolts, Facebook Share, Facebook
Analytics, Facebook Login, Google Firebase Analytics, Google CrashLytics, Pangle, VKontakte SDK
Lähde: Internet 2.0, 2022, TikTok Analysis, https://internet2-0.com/wp-content/uploads/2022/08/TikTok-Technical-Analysis-17-Jul-2022.-Media-Release.pdf
14
15. Somepalveluista linkkien kautta tulevat vierailijat nettisivuille
Lähde: Kepios, 2023, DataReportal, Digital 2023: Finland, https://datareportal.com/reports/digital-2023-finland
15
16. Linkkien jako tapahtuu useimmin pikaviestisovelluksilla
Uutisia jaetaan jo kaksi
kertaa enemmän
pikaviestisovelluksilla
kuin muilla
somepalveluilla.
Ns. dark social
korostuu: suurin osa
somepalveluista ei
erotu liikenteen
lähteenä nettisivujen
kävijäseurannoissa.
Lähde: Tampereen yliopisto, Uutismedia verkossa 2023, Suomen maaraportti, https://trepo.tuni.fi/handle/10024/149682
16
18. Mitä nuoret ajattelevat somesta?
82 % oli sitä mieltä, että viiden vuoden päästä
nuoret käyttävät entistä enemmän aikaa
sosiaalisessa mediassa.
67 % nuorista haluaisi kuitenkin viettää
keskenään enemmän aikaa ilman sosiaalista
mediaa.
18
Lähde: Lasten ja nuorten säätiö, 2021, Unelmien some, https://www.nuori.fi/unelmien-some-2021/ (n=731, 15-18-vuotiaat)
19. 19
“Että jos ei käytä somea niin kukaan ei huomioi sinua.”
– nuori, 17
”Se, että sosiaalinen media alkaisi enemmän korvata
aitoja ihmissuhteita.”
– nuori, 17
“Että koko elämä perustuu sosiaaliseen mediaan ja
sen ympärille.”
– nuori, 18
Someen liittyviä pelkoja
Lähde: Lasten ja nuorten säätiö, 2021, Unelmien some, https://www.nuori.fi/unelmien-some-2021/ (n=731, 15-18-vuotiaat)
21. Nuorten somen käytön syyt ovat säilyneet tuttuina
”Tärkeimmäksi nimeäisin
päivittäisessä käytössä olevat
Snapchatin ja WhatsAppin
koska niillä keskustelen
kavereitteni kanssa ja
WhatsApissa on esim. koulun
ryhmächattejä joissa kiertää
tärkeää tietoa, ja yleisesti sitä
käytetään tekstiviestin
korvikkeena nykyään.”
Lähde: eBrand Suomi Oy ja Oulun kaupungin sivistys- ja kulttuuripalvelut , Some ja nuoret 2022 -kysely, https://wordpress.ebrand.fi/somejanuoret2022/2-suosituimmat-sosiaalisen-
median-palvelut/ (N=2653, 13-29-v.)
21
22. 13-29-vuotiaiden somen käytön erot ikävuosittain
WhatsApp, YouTube ja
Instagram ovat kaiken
ikäisten nuorten suosimia
TikTok on erityisesti alle
18-vuotiaiden suosiossa
Snapchatin käyttö laskee
nopeasti tultaessa yli 25-
vuotiaisiin
Facebookin käyttö nousee
tultaessa yli 20-vuotiaisiin
Lähde: eBrand Suomi Oy ja Oulun kaupungin sivistys- ja kulttuuripalvelut , Some ja nuoret 2022 -kysely, https://wordpress.ebrand.fi/somejanuoret2022/2-suosituimmat-sosiaalisen-
median-palvelut/ (N=2653, 13-29-v.)
22
23. TikTokin käyttö lapsilla ja nuorilla Suomessa 2019-2023
TikTokin käyttö on lisääntynyt 13-16-vuotiailla, mutta kääntynyt jo laskuun 5-12-vuotiailla.
TikTokin ikäraja on 13 vuotta, ja suurta osaa sen sisällöistä ei voi suositella alaikäisille.
Datalähde: DNA, Koululaistutkimus 2019, 2020, 2021, 2022 ja 2023, käyttö päivittäin, lähes päivittäin tai useita kertoja viikossa, kuva: Harto Pönkä, 3.7.2023.
*) vuonna 2019 6-12-vuotiaat
23
25. Kuvia luovat tekoälymallit ovat kehittyneet nopeasti vain parissa vuodessa
Vasemmalla: GAN-tekoälymallilla luotuja kuvia, This Person Does Not Exists, https://thispersondoesnotexist.com/
Oikealla: DALLE 3 –tekoälymallilla luotuja kuvia, Microsoft Bing Image Creator, https://www.bing.com/images/create/
25
26. Eliot Higginsin esimerkit AI-kuvista: Trumpin pidätys
26
Kuvat teki demonstraatiotarkoituksessa Bellingcat-järjestön perustaja Eliot Higgins
Kuvat on tehty Midjourney-tekoälymallilla
Pitäisikö JO:issa olla erikseen velvollisuus varmistua kuvien aitoudesta?
Kuvat: @EliotHiggins, 21.3.2023, https://twitter.com/EliotHiggins/status/1638198679201890306, lisää aiheesta esim. https://yle.fi/a/74-20024214
Trumpin aito pidätyskuva: Wikipedia, 24.8.2023, https://en.wikipedia.org/wiki/Mug_shot_of_Donald_Trump
Fake
27. Tekoälykuvia tehtaillaan ahkerasti – ja myös aitoja valokuvia väitetään AI-kuviksi
27
Lähde: Faktabaari, 28.11.2023, Näin tarkistat, onko materiaali aitoa vai deepfake, https://faktabaari.fi/fakta/nain-tarkistat-onko-materiaali-aitoa-vai-deepfake/
Fake Aito
28. Mitä bottifarmeilta voi ostaa 10 eurolla?
28
Heikoimmin
botteja estää
TikTok
Instagramia
moderoidaan
huomattavasti
heikommin kuin
Facebookia
Twitter pärjää
vertailussa hyvin
ostettuja näyttöjä
lukuun ottamatta
Lähde: NATO StratCom, 2023, Social media manipulation 2022/2023, https://stratcomcoe.org/publications/social-media-manipulation-20222023-assessing-the-ability-of-social-media-
companies-to-combat-platform-manipulation/272
29. EU-komission selvitys disinformaatiosta 2023
Aineisto kerättiin Puolassa,
Slovakiassa ja Espanjassa 2023.
Twitterissä disinformaatiota
sisältävien julkaisujen
löydettävyys oli suurin.
Twitterissä oli suhteellisesti
eniten disinformaation
levittäjiä.
Facebook pärjäsi vertailussa
toiseksi huonoimmin.
TikTokissa ja YouTubessa
disinformaatio sai määrällisesti
eniten reaktioita.
Tutkimuksen tilaajat: Meta,
YouTube, TikTok ja LinkedIn
osana EU:n disinformaation
vastaisia käytännesääntöjä.
Raportti: TrustLab, 2023, Code of Practice on Disinformation, https://disinfocode.eu/wp-content/uploads/2023/09/code-of-practice-on-disinformation-september-22-2023.pdf,
virallinen sivu: https://disinfocode.eu/structural-indicators/
29
30. Twitterin/X:n sääntöjen muutos lisäsi valtiollisen propagandan näkyvyyttä
Twitter rajoitti aiemmin valtioihin sidoksissa olevien tunnusten näkyvyyttä algoritmeissaan.
Tämä lopetettiin maaliskuun lopussa 2023 Muskin uuden linjauksen mukaisesti.
Käytännössä muutos tarkoittaa, että X/Twitter ei enää estä valtioiden propagandaa.
Vaikutus: esim. Venäjän valtioon liittyvien tunnusten julkaisutiheys tuplaantui ja näkyvyys kasvoi 60 %.
Monien aiemmin rajoitettujen tunnusten seuraajamäärä kääntyi nopeaan kasvuun, esim. @RT_com.
Lähteet: NATO StratCom, 2023, Virtual Manipulation Brief 2023/1, https://stratcomcoe.org/publications/virtual-manipulation-brief-20231-generative-ai-and-its-implications-for-social-
media-analysis/287, DFRLab, 21.4.2023, https://dfrlab.org/2023/04/21/state-controlled-media-experience-sudden-twitter-gains-after-unannounced-platform-policy-change/
30
@RT_com-tunnuksen seuraajamäärän kehitys
32. 32
Sosiaalisen median algoritmit yleisesti (FB, IG, X, TiKTok)
Suositut julkaisut aiheista, jotka ovat
aiemmin käyttäjää kiinnostaneet
Data
käyttäjistä
Data
muista
julkaisuista
Data
julkaisusta
ja tekijästä
Algoritmi
▪ Algoritmi päättää, mitä kukin käyttäjä näkee.
▪ Algoritmi huomioi käyttäjän aiemman
toiminnan, kiinnostukset ja verkoston.
▪ Algoritmi nostaa esiin käyttäjälle ”tärkeiden”
ihmisten ja ryhmien julkaisuja.
▪ Käyttäjälle näytetään enemmän sen tyyppisiä
julkaisuja, joihin hän on aiemmin reagoinut.
▪ Algoritmi palkitsee runsaasta julkaisemisesta.
▪ Algoritmi voi suosia palvelun uusien
toimintojen käyttöä.
▪ Algoritmi voi rangaista julkaisujen heikosta
osallistumisasteesta.
▪ Algoritmi voi antaa ”miinuspisteitä” esim.
spämmäämisestä ja seuraajien
vähenemisestä.
33. Lisää aiheesta blogissa: https://harto.wordpress.com/2021/10/31/infografiikka-facebookin-viha-reaktio-ja-algoritmin-muutokset/
Wallaroo, 2023, https://wallaroomedia.com/facebook-newsfeed-algorithm-history/
33
Facebookin algoritmin muutokset 2008-2023
2018:
Emoji-reaktioiden arvo
vähennetään neljäksi
tavalliseksi tykkäykseksi.
Cambridge Analytica –kohu.
2017:
Emoji-reaktioiden arvoksi
muutettiin algoritmissa
viiden normaalin
tykkäyksen arvo.
2019:
Facebookin tutkijoiden
mukaan ”vihainen”-
reaktioita saaneet julkaisut
sisälsivät usein virheellistä ja
vahingollista sisältöä.
Algoritmi saattoi antaa niille
näkyvyyttä suhteettomasti.
2020:
Facebook lisää koronan
myötä ”läheisyys”-reaktion.
”Vihainen”-reaktion arvoksi
1,5 tykkäystä.
2021:
Kritiikki Facebookia
kohtaan kasvaa. Frances
Haugen vuotaa yhtiön
sisäisiä dokumentteja.
Syyskuussa ”vihainen”-
reaktion arvoksi nolla
tykkäystä.
2016:
Emojit: ”ihastu”, ”haha”, ”vau”,
”surullinen” ja ”vihainen”.
Algoritmi suosittelee julkaisuja
eri reaktioiden perusteella.
2008:
Facebookin
tykkäykset. Algoritmi
hyödyntää niitä
suosittelussa.
2022-2023:
Facebook reagoi
TikTokin suosioon ja
lisää IG:n tarinoiden
ja kelojen näkyvyyttä.
34. X/Twitter: Suositeltujen twiittien lähteet
Verkoston sisäinen lähde – noin 50 %
Tarkoittaa seurattuja käyttäjiä
Real Graph –malli, joka ennustaa käyttäjien
välisen sitoutumisen todennäköisyyden.
”Läheisiltä” näytetään enemmän twiittejä.
Aiemmin, ei käytössä enää maaliskuun 2023
jälkeen: Fanout, twiittien toimituksen välimuisti.
Verkoston ulkopuoliset lähteet – noin 50 %
Tarkoittaa ei-seurattuja käyttäjiä
Sosiaalinen verkosto, GraphJet-käsittelymoottori
ja käyttäjien TweepCred-pisteet. Valitsee noin 15
% twiiteistä.
Yhteisöihin upottaminen, mm. SimClusters ja
TwHIN. Valitsee noin 35 % twiiteistä.
Lähde: Twitter, 31.3.2023, Twitter's Recommendation Algorithm, https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm
34
35. Yhteisöihin upottaminen – Twitterin klusterit (verkoston ulkoinen lähde, 35 %)
145 000 luotua yhteisöä/
verkoston klusteria.
Tuhansista satoihin
miljooniin käyttäjiin.
Päivitetään 3 viikon välein.
Keskiössä suositut käyttäjät.
Twiittejä suositellaan niiden
yhteisöjen käyttäjille, joissa
twiitti on suosittu.
Käyttäjät näkevät ”omien”
yhteisöjensä suosittuja
twiittejä, vaikka eivät
seuraisi niiden twiittaajia.
Kannattaa keskittyä
tiettyihin aiheisiin ja twiitata
”omille” yhteisöille.
Lähde: Twitter, 31.3.2023, Twitter's Recommendation Algorithm, https://blog.twitter.com/engineering/en_us/topics/open-source/2023/twitter-recommendation-algorithm
35
36. Reaktioiden vaikutus For You/Sinulle –twiittien näkyvyyteen
Lähde: Tey Steven, 31.3.2023, https://steventey.com/blog/twitter-algorithm
36
Käyttäjän reaktio/toiminta twiittiisi Vaikutus Painoarvo
Tykkää twiitistäsi Positiivinen 0.5
Retweettaa twiittisi Positiivinen 1
Klikkaa twiittisi auki ja pysyy siinä yli 2 minuuttia Positiivinen 11
Katsoo profiiliasi ja tykkää tai vastaa johonkin twiittiisi Positiivinen 12
Vastaa twiittiisi Positiivinen 27
Vastaa twiittiisi ja sinä reagoit vastaukseen jollain
tavalla takaisin
Positiivinen 75
Merkitsee twiittiisi “Tämä twiitti ei kiinnosta minua”
(sovelluksessa), blokkaa tai hiljentää sinut
Negatiivinen -74
Raportoi ylläpidolle twiittisi Negatiivinen -369
37. Tutkimus: twiittien synnyttämät tunteet käyttäjissä
Aineisto kerättiin Yhdysvalloissa helmikuussa
2023 vapaaehtoisilta Twitterin käyttäjiltä.
Tutkijat pyysivät osallistujia arvioimaan mm.
1) twiitin kirjoittajan (author) tunnetilan
2) twiitin vaikutus heidän (reader) tunnetilaansa
Twiittien sijoittumista algoritmin
muodostamassa syötteessä verrattiin niiden
kronologiseen järjestykseen (punainen viiva).
Algoritmi näytti suosivan twiittejä, joiden
kirjoittajat arvioitiin vihaisiksi ja jotka
aiheuttivat lukijoissa vihaisuutta.
Vihaisuuden vaikutus oli huomattavasti
suurempi poliittisissa twiiteissä kuin muissa.
Algoritmi näytti tukevan käyttäjien positiivisia
tunteita omasta poliittisesta ryhmästään.
Algoritmi tuki poliittista polarisaatiota.
Lähde: Smitha Milli, Micah Carroll, Yike Wang, Sashrika Pandey, Sebastian Zhao ja Anca D. Dragan, 2023, https://arxiv.org/abs/2305.16941 (n=806, 1730 twiittiä/arviota)
Kuva: Jay Van Bavel, https://twitter.com/jayvanbavel/status/1711387680485863858
37
38. Kokeilu TikTokin algoritmista: ”Masentava sovellus”
Yle loi testiä varten 13-v. tytöltä näyttävän TikTok-käyttäjän.
TikTok on kertonut poistavansa esim. itsetuhoisuutta
ihannoivia videoita. Testin mukaan algoritmi käytännössä
tarjosi syömishäiriötä ja masennusta aiheuttavaa sisältöä.
Algoritmi reagoi siihen, mitä videoita katsottiin. Sisältöä ei
haettu hakusanoilla eikä videoista tykätty.
Algoritmin toiminnassa oli ero tietokoneen ja kännykän
välillä. Algoritmi vaikutti nimenomaan kännykällä.
Kokeilun tulokset kännykkäsovelluksella:
1 tunti: 7 % haitallista sisältöä
2 tuntia: 28 % haitallista sisältöä
3 tuntia: 68 % haitallista sisältöä
4 tuntia: 57 % haitallista sisältöä
5 tuntia: 65 % haitallista sisältöä
Yli 6 h: 95 % haitallista sisältöä
Lähde: Yle, 11.11.2023, https://yle.fi/a/74-20059318
38
39. Yhteenvetoa
▪ Nousussa: Facebook, WhatsApp ja TikTok.
▪ Sosiaalinen media on yhä merkittävämpi uutisten seuraamisen,
jakamisen ja kommentoinnin kanava.
▪ 18-24-vuotiailla korostuu somen kautta saadut uutiset ns. tavallisilta
käyttäjiltä (TikTok) ja somevaikuttajilta (Instagram).
▪ 5-12-vuotiailla lapsilla TikTokin käyttö on lopulta kääntynyt laskuun.
▪ Tekoälymalleilla luodut kuvat ja videot yleistyvät nopeasti.
▪ Disinformaatio on lisääntynyt somessa isojen kriisien myötä (korona,
Ukrainan sota, Israelin ja Hamasin konflikti, itärajan tilanne).
▪ Algoritmeihin liittyvät ongelmat korostuvat Twitterissä ja TikTokissa.
39