Timo Honkela, kutsuttu esitelmä Automaatiopäivillä 2017

Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Timo Honkela
23.3.2017
Nykyaikainen tekoäly
ymmärtämisen,
reiluuden ja
tehokkuuden työkaluna
timo.honkela@helsinki.fi
Automaatiopäivät 2017, Vaasa

Miten käy, jos emme
hyödynnä koneita (koneoppimista)
nykyistä paremmin?
https://www.pinterest.com/pin/509680882801748515/
Emme pärjää kilpailussa
junaan käyttävälle
kilpailijallemme, vaikka
annamme hevosille
vähemmän kauraa,
ratsastajille pienempää
palkkaa, …
… tuotamme
halvempaa
energiaa,
karsimme
kustannuksia,
pienennämme
työntekijöiden
palkkoja, ...

Nykyaikainen tekoäly (1/2)
● Pyrkimyksenä matkia ihmisen älykkäitä
toimintoja
● Laaja joukko menetelmiä ja tekniikoita
● Työtä on tehty yli 50 vuotta eivätkä kaikki
merkitykselliset keksinnöt ole kovin uusia
● Koneista tulee yhä ihmismäisempiä, mutta kyse
on yhteisevoluutiosta: ihmiset saavat
kehityksen myötä uusia mahdollisuuksia;
kyse ei ole ihmisten korvaamisesta kaiken
kaikkiaan vaan uusista työnjaoista

Nykyaikainen tekoäly (2/2)
● Luokittelua, ryhmittelyä, tiedon tiivistämistä,
(monitavoite)optimointia, dynaamisten ja kaoottisten
ilmiöiden mallintamista, aikasarja-analyysia, kieli- ja
käsitelejärjestelmien mallintamista, jne.
● Ihmisen osaamisen erilaisten osien matkiminen:
– tiedon esittäminen,
– päättely,
– ongelmanratkaisu ja luovuus,
– hahmontunnistus (silmät, näkö / kuva- ja videoanalyysi, korvat,
kuulo / puheentunnistus, iho, tuntoaisti / robotiikka),
– kielen ja puheen tuottaminen,
– tunteiden mallintaminen

Tekoälyn perinteitä
● Sumeat järjestelmät (Zadeh ym.)
● Neuroverkot (Kohonen ym.)
● Geneettiset algoritmit (Alander ym.)
Teoreettiset perusteet
Reaalimaailman esimerkit

Kokemuksellinen ja kielellisesti
välittynyt tieto
● Jako on tunnettu pitkään
– esimerkiksi Vygotsky
● Tullut suosituksi tarkastelun kohteeksi viime
vuosikymmeninä
– Gigerenzer, Dijksterhuis, jne.
● Tekoälyn peruslähestymistavat heijastelevat
samaa jaottelua
– havaintodataa käsittelevät neuroverkot versus
sääntöjärjestelmät

Deep learning
● Monikerrosneuroverkoilla tavoitellaan ihmismäistä
kykyä käsitteellistää automaattisesti
havaintodatasta käsitteellisiä ja kielellisiä sisältäjä
● Perinteisesti monikerrosverkkoja on opetettu
ohjatusti, luojat valmiiksi antaen
● Ohjatun oppimisen haaste on tarvittavan datan
suuri määrä
● Harri Valpola tutkimusryhmineen on kehittänyt
menetelmiä, joita tarvitsisi ohjata mahdollisimman
vähän

Kielten ymmärtämään
oppivat koneet (1/2)
● Kielellisten merkitysten mallintamiseen eivät
riitä perinteiset symbolisen logiikan keinot
● Ongelmat logiikan käytössä ovat määrällisiä ja
laadullisia
● Sääntöjä kokonaisen kielen merkitysten
tulkitsemiseksi tarvittaisiin valtava määrä
● Säännöt eivät vastaa esittämisen tarvetta:
kohteena on symbolisten rakenteiden ja
dynaamisten moniulotteisten jatkuvien
ilmiöiden välisiä suhteita

Kielten ymmärtämään
oppivat koneet (2/2)
● Sanojen ja ilmaisujen merkitystä voidaan
mallintaa tarkastelemalla tilastollisesti niiden
esiintymisyhteyksiä
● Sanat "kissa" ja "koira" tai "hyppivät kissa" ja
"loikkiva koira" ovat esiintymiskonteksteiltaan
ja sitä myöten oletusarvoisesti myös
merkitykseltään lähempänä toisiaan kuin
vaikkapa "ovi" tai "nariseva ovi".

Suomen tieteen kartta
Akatemian aineistosta
(Honkela&Klami,2008)
Kemia
Luonnon- ja
insinööritieteet
Bio- ja
ympäristötieteet
Terveystieteet
Kulttuuri- ja
yhteiskunta-
tieteet

Merkitysneuvotteluiden perusteet
oppivia koneita
● Sanojen merkityssuhteiden tai dokumenttien aiheiden
tilastollisessa mallintamisessa hyödynnetään sana-konteksti-
tai sana-dokumentti -matriiseja
● Yksilö saadaan mukaan laajentamalla matriisi eli
kaksisuuntainen tensori kolmisuuntaiseksi tensoriksi
● Yhdellä sivulla ovat sana (tai ilmaisut), toisella kontekstit ja
kolmannella yksilöt (tai ryhmät)
● Jos saatavilla on tarpeeksi dataa, voidaan kullekin yksilölle
laskea erikseen kunkin sanan merkitysten
● Useimmiten tilastollisesti datasta päätellyt merkitykset ovat
lähellä toisiaan, kuten olettaa sopii, mutta läheskään aina näin
ei ole

Taustaa: tulkinnan yksilöllisyyden
mallintaminen (GICA-menetelmä)
● GICA-menetelmät (Grounded Intersubjective
Concept Analysis) (Honkela ym. 2012)
mahdollistaa mallit, joissa kunkin sanan
merkitystä tarkastellaan yksilöllisesti
● Esimerkkinä USAn presidenttien puheet
(State of the Union Address) ja sanan
HEALTH merkityksen analyysi kontekstitietoa
tilastollisesti analysoide

Sanan “health” analyysi
Honkela ym. 2012

Reiluuden käsite ja toteutuma?
● Yksilöllisesti muodostetuilla voidaan määritellä
tulkintaerot vaikkapa reiluus-sanan suhteen
● Jo sanan punainen tulkinnassa on selviä tilanne- ja
yksilökohtaisia eroja
● Teollisesti ja yhteiskunnallisesti tärkeät sanat ovat
monesti haastavia; niiden merkitys ei välttämättä ole
kovinkaan hyvin jaettu ("aita ja aidan seipäät")
● Niinpä merkitysneuvottelut koneiden avulla olisi hyvä
käydä ennen kuin ryhdykään keskustelemaan itse
asioista

Tehokkuuden välineet
● Tehokkuutta kohti päästään erilaisilla optimoinnin
keinoilla
● Tehokkuus on olennaista esimerkiksi kilpailukyvyn tai
resurssiniukkuuden (kulut, ympäristöasiat)
näkökulmasta
● Monitavoiteoptimoinnilla on syytä tavoittaa erilaisten
intressien tasapainoja
● Nykyaikainen tekoäly tarjoaa keinoja kvantitatiivisten ja
kvalitatiivisten kysymysten tarkasteluun (ks. esim.
Janasik ym. 2009)
Janasik, N., Honkela, T. & H. Bruun. (2009) Text Mining in Qualitative Research: Application of an unsupervised learning method.
Organizational Research Methods 12 (3). http://orm.sagepub.com/content/12/3/436.full.pdf

Rauhankone – konsepti ja kirjahanke
● Ymmärtäminen
– merkitysneuvottelut
● Terveet ja rauhalliset tunteet
● Reilu talous ja yhteiskunta

Kiitos!

Timo Honkela, kutsuttu esitelmä Automaatiopäivillä 2017

Recommended

Recommended

More Related Content

More from Timo Honkela

More from Timo Honkela (20)

Timo Honkela, kutsuttu esitelmä Automaatiopäivillä 2017