Timo Honkela: A short introduction to Modeling ambiguity and vagueness
Timo Honkela, kutsuttu esitelmä Automaatiopäivillä 2017
1. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Timo Honkela
23.3.2017
Nykyaikainen tekoäly
ymmärtämisen,
reiluuden ja
tehokkuuden työkaluna
timo.honkela@helsinki.fi
Automaatiopäivät 2017, Vaasa
2. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Miten käy, jos emme
hyödynnä koneita (koneoppimista)
nykyistä paremmin?
https://www.pinterest.com/pin/509680882801748515/
Emme pärjää kilpailussa
junaan käyttävälle
kilpailijallemme, vaikka
annamme hevosille
vähemmän kauraa,
ratsastajille pienempää
palkkaa, …
… tuotamme
halvempaa
energiaa,
karsimme
kustannuksia,
pienennämme
työntekijöiden
palkkoja, ...
3. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Nykyaikainen tekoäly (1/2)
● Pyrkimyksenä matkia ihmisen älykkäitä
toimintoja
● Laaja joukko menetelmiä ja tekniikoita
● Työtä on tehty yli 50 vuotta eivätkä kaikki
merkitykselliset keksinnöt ole kovin uusia
● Koneista tulee yhä ihmismäisempiä, mutta kyse
on yhteisevoluutiosta: ihmiset saavat
kehityksen myötä uusia mahdollisuuksia;
kyse ei ole ihmisten korvaamisesta kaiken
kaikkiaan vaan uusista työnjaoista
4. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Nykyaikainen tekoäly (2/2)
● Luokittelua, ryhmittelyä, tiedon tiivistämistä,
(monitavoite)optimointia, dynaamisten ja kaoottisten
ilmiöiden mallintamista, aikasarja-analyysia, kieli- ja
käsitelejärjestelmien mallintamista, jne.
● Ihmisen osaamisen erilaisten osien matkiminen:
– tiedon esittäminen,
– päättely,
– ongelmanratkaisu ja luovuus,
– hahmontunnistus (silmät, näkö / kuva- ja videoanalyysi, korvat,
kuulo / puheentunnistus, iho, tuntoaisti / robotiikka),
– kielen ja puheen tuottaminen,
– tunteiden mallintaminen
6. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Kokemuksellinen ja kielellisesti
välittynyt tieto
● Jako on tunnettu pitkään
– esimerkiksi Vygotsky
● Tullut suosituksi tarkastelun kohteeksi viime
vuosikymmeninä
– Gigerenzer, Dijksterhuis, jne.
● Tekoälyn peruslähestymistavat heijastelevat
samaa jaottelua
– havaintodataa käsittelevät neuroverkot versus
sääntöjärjestelmät
7. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Deep learning
● Monikerrosneuroverkoilla tavoitellaan ihmismäistä
kykyä käsitteellistää automaattisesti
havaintodatasta käsitteellisiä ja kielellisiä sisältäjä
● Perinteisesti monikerrosverkkoja on opetettu
ohjatusti, luojat valmiiksi antaen
● Ohjatun oppimisen haaste on tarvittavan datan
suuri määrä
● Harri Valpola tutkimusryhmineen on kehittänyt
menetelmiä, joita tarvitsisi ohjata mahdollisimman
vähän
8. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Kielten ymmärtämään
oppivat koneet (1/2)
● Kielellisten merkitysten mallintamiseen eivät
riitä perinteiset symbolisen logiikan keinot
● Ongelmat logiikan käytössä ovat määrällisiä ja
laadullisia
● Sääntöjä kokonaisen kielen merkitysten
tulkitsemiseksi tarvittaisiin valtava määrä
● Säännöt eivät vastaa esittämisen tarvetta:
kohteena on symbolisten rakenteiden ja
dynaamisten moniulotteisten jatkuvien
ilmiöiden välisiä suhteita
9. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Kielten ymmärtämään
oppivat koneet (2/2)
● Sanojen ja ilmaisujen merkitystä voidaan
mallintaa tarkastelemalla tilastollisesti niiden
esiintymisyhteyksiä
● Sanat "kissa" ja "koira" tai "hyppivät kissa" ja
"loikkiva koira" ovat esiintymiskonteksteiltaan
ja sitä myöten oletusarvoisesti myös
merkitykseltään lähempänä toisiaan kuin
vaikkapa "ovi" tai "nariseva ovi".
10. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Suomen tieteen kartta
Akatemian aineistosta
(Honkela&Klami,2008)
Kemia
Luonnon- ja
insinööritieteet
Bio- ja
ympäristötieteet
Terveystieteet
Kulttuuri- ja
yhteiskunta-
tieteet
11. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Merkitysneuvotteluiden perusteet
oppivia koneita
● Sanojen merkityssuhteiden tai dokumenttien aiheiden
tilastollisessa mallintamisessa hyödynnetään sana-konteksti-
tai sana-dokumentti -matriiseja
● Yksilö saadaan mukaan laajentamalla matriisi eli
kaksisuuntainen tensori kolmisuuntaiseksi tensoriksi
● Yhdellä sivulla ovat sana (tai ilmaisut), toisella kontekstit ja
kolmannella yksilöt (tai ryhmät)
● Jos saatavilla on tarpeeksi dataa, voidaan kullekin yksilölle
laskea erikseen kunkin sanan merkitysten
● Useimmiten tilastollisesti datasta päätellyt merkitykset ovat
lähellä toisiaan, kuten olettaa sopii, mutta läheskään aina näin
ei ole
12. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Taustaa: tulkinnan yksilöllisyyden
mallintaminen (GICA-menetelmä)
● GICA-menetelmät (Grounded Intersubjective
Concept Analysis) (Honkela ym. 2012)
mahdollistaa mallit, joissa kunkin sanan
merkitystä tarkastellaan yksilöllisesti
● Esimerkkinä USAn presidenttien puheet
(State of the Union Address) ja sanan
HEALTH merkityksen analyysi kontekstitietoa
tilastollisesti analysoide
14. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Reiluuden käsite ja toteutuma?
● Yksilöllisesti muodostetuilla voidaan määritellä
tulkintaerot vaikkapa reiluus-sanan suhteen
● Jo sanan punainen tulkinnassa on selviä tilanne- ja
yksilökohtaisia eroja
● Teollisesti ja yhteiskunnallisesti tärkeät sanat ovat
monesti haastavia; niiden merkitys ei välttämättä ole
kovinkaan hyvin jaettu ("aita ja aidan seipäät")
● Niinpä merkitysneuvottelut koneiden avulla olisi hyvä
käydä ennen kuin ryhdykään keskustelemaan itse
asioista
15. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Tehokkuuden välineet
● Tehokkuutta kohti päästään erilaisilla optimoinnin
keinoilla
● Tehokkuus on olennaista esimerkiksi kilpailukyvyn tai
resurssiniukkuuden (kulut, ympäristöasiat)
näkökulmasta
● Monitavoiteoptimoinnilla on syytä tavoittaa erilaisten
intressien tasapainoja
● Nykyaikainen tekoäly tarjoaa keinoja kvantitatiivisten ja
kvalitatiivisten kysymysten tarkasteluun (ks. esim.
Janasik ym. 2009)
Janasik, N., Honkela, T. & H. Bruun. (2009) Text Mining in Qualitative Research: Application of an unsupervised learning method.
Organizational Research Methods 12 (3). http://orm.sagepub.com/content/12/3/436.full.pdf
16. Timo Honkela, 23.3.2017, Automaatiopäivät 2017, Vaasa
Rauhankone – konsepti ja kirjahanke
● Ymmärtäminen
– merkitysneuvottelut
● Terveet ja rauhalliset tunteet
● Reilu talous ja yhteiskunta