Timo Honkela: Ihminen+ -esitelmä, Mikkeli, 22.9.2016Timo Honkela
Timo Honkela discusses "Wise Machines" that help people to acquire knowledge and to understand and solve problems related to economy/business, emotions and health.
Timo Honkela: Tekoälyn ja koneoppimisen uhat ja mahdollisuudet, Turku, 27.10....Timo Honkela
Professor Timo Honkela's Studia Generalia presentation for the Society of Futures Studies at Turku University, Finland, on Thursday 27th of October, 2016. The title of the talk is "Threats and opportunities related to artificial intelligence and machine learning". The topics include 1) an introduction to AI and ML, 2) information on why AI and ML are societally relevant just in this moment of history, 3) natural language processing based on ML, 4) presentation of meta-analysis in humanities (cf. Helsinki Studia Generalia presentation a week earlier), 5) AI and intuition, and 6) discussion on the positive and negative scenarios related to AI and ML.
Esitelmä Eduskunnan tulevaisuusvaliokunnalle 4.5.2016 "Tieteen uuden valtatiet: Tiede 2.0 ja digitaaliset ihmistieteet".
A talk to the Committee for the Future of Finnish Parliament with the topic "New highways of science: Science 2.0 and Digital Humanities".
Timo Honkela: Ihminen+ -esitelmä, Mikkeli, 22.9.2016Timo Honkela
Timo Honkela discusses "Wise Machines" that help people to acquire knowledge and to understand and solve problems related to economy/business, emotions and health.
Timo Honkela: Tekoälyn ja koneoppimisen uhat ja mahdollisuudet, Turku, 27.10....Timo Honkela
Professor Timo Honkela's Studia Generalia presentation for the Society of Futures Studies at Turku University, Finland, on Thursday 27th of October, 2016. The title of the talk is "Threats and opportunities related to artificial intelligence and machine learning". The topics include 1) an introduction to AI and ML, 2) information on why AI and ML are societally relevant just in this moment of history, 3) natural language processing based on ML, 4) presentation of meta-analysis in humanities (cf. Helsinki Studia Generalia presentation a week earlier), 5) AI and intuition, and 6) discussion on the positive and negative scenarios related to AI and ML.
Esitelmä Eduskunnan tulevaisuusvaliokunnalle 4.5.2016 "Tieteen uuden valtatiet: Tiede 2.0 ja digitaaliset ihmistieteet".
A talk to the Committee for the Future of Finnish Parliament with the topic "New highways of science: Science 2.0 and Digital Humanities".
Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014Digitalmikkeli
Digitalmikkeli-aamukahvitilaisuudessa 11.3.2014 esitetty materiaali: TIMO HONKELA, digitaalisten aineistojen professori, Helsingin Yliopisto, Kansalliskirjaston digitointi- ja konservointikeskus
Maria Ruuska (Kaskas Media) ja Pauli Komonen (15/30 Research) puhuivat tutkimus- ja tiedeviestinnän trendeistä, ilmiöistä ja tulevaisuudesta Futures Specialists Helsinki -verkoston aamutilaisuudessa 16.9.2015.
Datajalostamo-seminaari 5.6.2014: Tekstilouhinta: yritysten ja yhteiskunnan t...Digitalmikkeli
Datajalostamo-seminaari 5.6.2014: Tekstilouhinta: yritysten ja yhteiskunnan tärkeä työkalu / Timo Honkela, Helsingin Yliopisto
http://datajalostamo.fi/2014/05/keskusteluseminaari/
Helsinki Region Infosharen 9.5.2019 järjestämän, pääkaupunkiseudun kaupunkien työntekijöille suunnatun koulutuksen koulutusmateriaalit.
- avoimen datan peruskäsitteet
- HRI:n toiminta lyhyesti
- sovellusesimerkkejä
- datan avaamisen perusteet käytännössä
OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatastaDigitalmikkeli
Avoimen tiedon kuntakiertue - Open Knowledge Roadshow - Mikkeli 13.10.2014:
Sovelluksia ja viisautta avoimesta tekstidatasta / Timo Honkela, Helsingin yliopisto, Kansalliskirjasto
Helsinki Region Infosharen (hri.fi) järjestämän Näin avaat dataa -koulutuspäivän materiaalit.
Sisältö:
Mitä on avoin data? Mikä on Helsinki Region Infoshare?
Avoimen datan hyödyntämisesimerkkejä
Paritehtävä
Datan avaamisen perusteet käytännössä
Pulahduksia AVO-vesillä - Kuvauksia AVO-hankkeen toiminnasta 2008–2011 - AVO-...Suomen eOppimiskeskus ry
Pulahduksia AVO-vesillä – Kuvauksia AVO-hankkeen toiminnasta 2008–2011 sisältää kahdeksan kertomusta, joista kukin valottaa hankkeen käytännön toteutuksia eri näkökulmista. Raportti on suunnattu sekä asiantuntijoille että asiasta kiinnostuneille. Teemat käsittelevät avointa oppimista, avointa toimintakulttuuria, yhteisöllistä mediaa ja sisällöntuotantoa. Niin ikään virtuaalimaailmojen ja mobiililaitteiden opetuskäyttö sekä vapaiden ja avoimien ohjelmistojen käyttö opetuksessa ja organisaatioissa ovat esillä kuvauksissa.
Avoimet verkostot oppimiseen (AVO) -hanke toteutettiin vuosina 2008–2011 valtakunnallisessa Manner-Suomen ESR-kehittämisohjelman toimintalinjassa 3: Avoimissa oppimisympäristöissä aktiiviseksi kansalaiseksi. Rahoittajana on toiminut Lapin ELY -keskus. Hanketta koordinoi Suomen eOppimiskeskus ry ja mukana oli kaikkiaan 11 organisaatiota.
CSC - Tieteen tietotekniikan keskus Oy:n tiedottaja Heta Koski kertoo CSC:stä viestintämateriaalien sisällöntuottajana ja yhteistyökumppanina. Esitetty yliopistoviestinnän päivillä 4.6.2015
Timo Honkela: Meaning negotiations as phenomenon and as languages technology...Timo Honkela
Abstract:
Models of linguistic semantics can be viewed through representation and reasoning. This distinction concerns questions on how do we represent the world that we refer to by linguistic expressions and what kind of reasoning do we apply based on these representations. It has been commonplace to assume that each word or expression has one or a limited number of different, distinct senses. The classification task of disambiguation has been devised to find the right reference in each case. It is also possible to represent the world using a high-dimensional continuous space. In that case, we do not need to assume that the world is represented as a network of nodes and their connections. These mathematical representations go beyond the capacities provided by symbolic logic. The word embeddings has history that stems from vector space representations in information retrieval. When a framework of multidimensional continuous spaces is available, it is possible to study nuances of meaning that go beyond conducting disambiguation or choosing between alternatives within a logical framework.
In the present work, it is postulated that semantic processes are essentially subjective and thus individual. When high-dimensional continuous spaces are used to represent meanings and defining contextual distributions, subjective aspects can be modelled. It is possible to measure subjectivity of meaning. This can be studied, for instance, in the framework of brain research (Saalasti et al. 2019) or motions tracking (Honkela & Förger 2013). The methodology or measuring subjective contextually grounded meaning has been been presented, for instance, in Raitio et al. 2014. Further methodological work and an empirical demonstration is presented in Sintonen et al. (2014). When it is possible to represent individually contextual meaning of expressions, it is consequently possible to analyse the differences of meaning between two individuals. A hypothesis is that suitable data for the purpose of meaning negotiation can be collected, computational algorithms devised and applied in real world contexts that helps in meaning negotiations. An alternative view is to aim at defining the meaning of words in a precise way and to teach all people to use these definition. In this present work, it is claimed that that objectivity can be reached only to a degree as it would require vast human cognitive and time resources and the mapping between words and the world is doomed to be partial. This concern has implications both in scientific and in real world communication and representation and has been applied in building the Peace Machine framework.
Meaning negotiations
as phenomena and
as LT challenges
Timo Honkela
University of Helsinki
with Iiro Jääskeläinen (Aalto University) on
the Study of Individualized Meanings
using Brain Research
University of Helsinki, Topelia, F211
4th of April, 2019
Timo Honkela: Meaning negotiations as phenomenon and as languages technology ...Timo Honkela
Abstract:
Models of linguistic semantics can be viewed through representation and reasoning. This distinction concerns questions on how do we represent the world that we refer to by linguistic expressions and what kind of reasoning do we apply based on these representations. It has been commonplace to assume that each word or expression has one or a limited number of different, distinct senses. The classification task of disambiguation has been devised to find the right reference in each case. It is also possible to represent the world using a high-dimensional continuous space. In that case, we do not need to assume that the world is represented as a network of nodes and their connections. These mathematical representations go beyond the capacities provided by symbolic logic. The word embeddings has history that stems from vector space representations in information retrieval. When a framework of multidimensional continuous spaces is available, it is possible to study nuances of meaning that go beyond conducting disambiguation or choosing between alternatives within a logical framework.
In the present work, it is postulated that semantic processes are essentially subjective and thus individual. When high-dimensional continuous spaces are used to represent meanings and defining contextual distributions, subjective aspects can be modelled. It is possible to measure subjectivity of meaning. This can be studied, for instance, in the framework of brain research (Saalasti et al. 2019) or motions tracking (Honkela & Förger 2013). The methodology or measuring subjective contextually grounded meaning has been been presented, for instance, in Raitio et al. 2014. Further methodological work and an empirical demonstration is presented in Sintonen et al. (2014). When it is possible to represent individually contextual meaning of expressions, it is consequently possible to analyse the differences of meaning between two individuals. A hypothesis is that suitable data for the purpose of meaning negotiation can be collected, computational algorithms devised and applied in real world contexts that helps in meaning negotiations. An alternative view is to aim at defining the meaning of words in a precise way and to teach all people to use these definition. In this present work, it is claimed that that objectivity can be reached only to a degree as it would require vast human cognitive and time resources and the mapping between words and the world is doomed to be partial. This concern has implications both in scientific and in real world communication and representation and has been applied in building the Peace Machine framework.
Meaning negotiations
as phenomena and
as LT challenges
Timo Honkela
University of Helsinki
with Iiro Jääskeläinen (Aalto University) on
the Study of Individualized Meanings
using Brain Research
University of Helsinki, Topelia, F211
4th of April, 2019
More Related Content
Similar to Timo Honkela: Kylmä data kohtaa inhimillisen tulkinnan, Studia Generalia -esitys 6.10.2016
Timo Honkela, Kansalliskirjasto | Digitalmikkeli-aamukahvit 11.3.2014Digitalmikkeli
Digitalmikkeli-aamukahvitilaisuudessa 11.3.2014 esitetty materiaali: TIMO HONKELA, digitaalisten aineistojen professori, Helsingin Yliopisto, Kansalliskirjaston digitointi- ja konservointikeskus
Maria Ruuska (Kaskas Media) ja Pauli Komonen (15/30 Research) puhuivat tutkimus- ja tiedeviestinnän trendeistä, ilmiöistä ja tulevaisuudesta Futures Specialists Helsinki -verkoston aamutilaisuudessa 16.9.2015.
Datajalostamo-seminaari 5.6.2014: Tekstilouhinta: yritysten ja yhteiskunnan t...Digitalmikkeli
Datajalostamo-seminaari 5.6.2014: Tekstilouhinta: yritysten ja yhteiskunnan tärkeä työkalu / Timo Honkela, Helsingin Yliopisto
http://datajalostamo.fi/2014/05/keskusteluseminaari/
Helsinki Region Infosharen 9.5.2019 järjestämän, pääkaupunkiseudun kaupunkien työntekijöille suunnatun koulutuksen koulutusmateriaalit.
- avoimen datan peruskäsitteet
- HRI:n toiminta lyhyesti
- sovellusesimerkkejä
- datan avaamisen perusteet käytännössä
OKRoadshow Mikkeli 13.10.2014: Sovelluksia ja viisautta avoimesta tekstidatastaDigitalmikkeli
Avoimen tiedon kuntakiertue - Open Knowledge Roadshow - Mikkeli 13.10.2014:
Sovelluksia ja viisautta avoimesta tekstidatasta / Timo Honkela, Helsingin yliopisto, Kansalliskirjasto
Helsinki Region Infosharen (hri.fi) järjestämän Näin avaat dataa -koulutuspäivän materiaalit.
Sisältö:
Mitä on avoin data? Mikä on Helsinki Region Infoshare?
Avoimen datan hyödyntämisesimerkkejä
Paritehtävä
Datan avaamisen perusteet käytännössä
Pulahduksia AVO-vesillä - Kuvauksia AVO-hankkeen toiminnasta 2008–2011 - AVO-...Suomen eOppimiskeskus ry
Pulahduksia AVO-vesillä – Kuvauksia AVO-hankkeen toiminnasta 2008–2011 sisältää kahdeksan kertomusta, joista kukin valottaa hankkeen käytännön toteutuksia eri näkökulmista. Raportti on suunnattu sekä asiantuntijoille että asiasta kiinnostuneille. Teemat käsittelevät avointa oppimista, avointa toimintakulttuuria, yhteisöllistä mediaa ja sisällöntuotantoa. Niin ikään virtuaalimaailmojen ja mobiililaitteiden opetuskäyttö sekä vapaiden ja avoimien ohjelmistojen käyttö opetuksessa ja organisaatioissa ovat esillä kuvauksissa.
Avoimet verkostot oppimiseen (AVO) -hanke toteutettiin vuosina 2008–2011 valtakunnallisessa Manner-Suomen ESR-kehittämisohjelman toimintalinjassa 3: Avoimissa oppimisympäristöissä aktiiviseksi kansalaiseksi. Rahoittajana on toiminut Lapin ELY -keskus. Hanketta koordinoi Suomen eOppimiskeskus ry ja mukana oli kaikkiaan 11 organisaatiota.
CSC - Tieteen tietotekniikan keskus Oy:n tiedottaja Heta Koski kertoo CSC:stä viestintämateriaalien sisällöntuottajana ja yhteistyökumppanina. Esitetty yliopistoviestinnän päivillä 4.6.2015
Timo Honkela: Meaning negotiations as phenomenon and as languages technology...Timo Honkela
Abstract:
Models of linguistic semantics can be viewed through representation and reasoning. This distinction concerns questions on how do we represent the world that we refer to by linguistic expressions and what kind of reasoning do we apply based on these representations. It has been commonplace to assume that each word or expression has one or a limited number of different, distinct senses. The classification task of disambiguation has been devised to find the right reference in each case. It is also possible to represent the world using a high-dimensional continuous space. In that case, we do not need to assume that the world is represented as a network of nodes and their connections. These mathematical representations go beyond the capacities provided by symbolic logic. The word embeddings has history that stems from vector space representations in information retrieval. When a framework of multidimensional continuous spaces is available, it is possible to study nuances of meaning that go beyond conducting disambiguation or choosing between alternatives within a logical framework.
In the present work, it is postulated that semantic processes are essentially subjective and thus individual. When high-dimensional continuous spaces are used to represent meanings and defining contextual distributions, subjective aspects can be modelled. It is possible to measure subjectivity of meaning. This can be studied, for instance, in the framework of brain research (Saalasti et al. 2019) or motions tracking (Honkela & Förger 2013). The methodology or measuring subjective contextually grounded meaning has been been presented, for instance, in Raitio et al. 2014. Further methodological work and an empirical demonstration is presented in Sintonen et al. (2014). When it is possible to represent individually contextual meaning of expressions, it is consequently possible to analyse the differences of meaning between two individuals. A hypothesis is that suitable data for the purpose of meaning negotiation can be collected, computational algorithms devised and applied in real world contexts that helps in meaning negotiations. An alternative view is to aim at defining the meaning of words in a precise way and to teach all people to use these definition. In this present work, it is claimed that that objectivity can be reached only to a degree as it would require vast human cognitive and time resources and the mapping between words and the world is doomed to be partial. This concern has implications both in scientific and in real world communication and representation and has been applied in building the Peace Machine framework.
Meaning negotiations
as phenomena and
as LT challenges
Timo Honkela
University of Helsinki
with Iiro Jääskeläinen (Aalto University) on
the Study of Individualized Meanings
using Brain Research
University of Helsinki, Topelia, F211
4th of April, 2019
Timo Honkela: Meaning negotiations as phenomenon and as languages technology ...Timo Honkela
Abstract:
Models of linguistic semantics can be viewed through representation and reasoning. This distinction concerns questions on how do we represent the world that we refer to by linguistic expressions and what kind of reasoning do we apply based on these representations. It has been commonplace to assume that each word or expression has one or a limited number of different, distinct senses. The classification task of disambiguation has been devised to find the right reference in each case. It is also possible to represent the world using a high-dimensional continuous space. In that case, we do not need to assume that the world is represented as a network of nodes and their connections. These mathematical representations go beyond the capacities provided by symbolic logic. The word embeddings has history that stems from vector space representations in information retrieval. When a framework of multidimensional continuous spaces is available, it is possible to study nuances of meaning that go beyond conducting disambiguation or choosing between alternatives within a logical framework.
In the present work, it is postulated that semantic processes are essentially subjective and thus individual. When high-dimensional continuous spaces are used to represent meanings and defining contextual distributions, subjective aspects can be modelled. It is possible to measure subjectivity of meaning. This can be studied, for instance, in the framework of brain research (Saalasti et al. 2019) or motions tracking (Honkela & Förger 2013). The methodology or measuring subjective contextually grounded meaning has been been presented, for instance, in Raitio et al. 2014. Further methodological work and an empirical demonstration is presented in Sintonen et al. (2014). When it is possible to represent individually contextual meaning of expressions, it is consequently possible to analyse the differences of meaning between two individuals. A hypothesis is that suitable data for the purpose of meaning negotiation can be collected, computational algorithms devised and applied in real world contexts that helps in meaning negotiations. An alternative view is to aim at defining the meaning of words in a precise way and to teach all people to use these definition. In this present work, it is claimed that that objectivity can be reached only to a degree as it would require vast human cognitive and time resources and the mapping between words and the world is doomed to be partial. This concern has implications both in scientific and in real world communication and representation and has been applied in building the Peace Machine framework.
Meaning negotiations
as phenomena and
as LT challenges
Timo Honkela
University of Helsinki
with Iiro Jääskeläinen (Aalto University) on
the Study of Individualized Meanings
using Brain Research
University of Helsinki, Topelia, F211
4th of April, 2019
Timo Honkela: From early to later Wittgenstein and Artificial IntelligenceTimo Honkela
Professor Timo Honkela presented an argument that there is a analogy between the developments that took place in Ludwig Wittgenstein's philosophy and in the artificial intelligence when turned away from relying rule-based systems. Honkela also discusses more in general epistemological questions, the underlying questions regarding the objectives and motivations of formalisation. Formalization often relies on assumptions such as the basic or primary role of objects, relations and properties or truth values and propositions. Honkela proposed a pattern and distribution based epistemology as an alternative.
Timo Honkela: Peace Machine: Peace from a difference perspective - Dialogue o...Timo Honkela
A presentation given in the National Dialogues Conference in Helsinki, Finland. The theme was how to use artificial intelligence, machine learning and other similar technologies to promote peace in the world. The three ares considered were language and meaning, emotions and society. Computers can help humans, for instance, by improving mutual understanding through meaning negotiations.
Timo Honkela: Turning quantity into quality and making concepts visible using...Timo Honkela
Professor Timo Honkela gave an invited talk in the Göran Mickwitz seminar that took place in Helsinki, 9th of February 2017. The event was organized in the honor of Doc. Jessica Parland-von Essen.
Timo Honkela: Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ...Timo Honkela
Professori Timo Honkelan esitelmä luonnonfilosofian seurassa 24.1.2017 aiheesta "Tietokone lukemassa yli 100 miljoonaa eri kirjaa: Kielitieteen ja filosofian näkökulmia". Tilaisuus järjestettiin Tieteiden talossa huoneessa 505. Erityisen tarkastelun kohteina olivat erilaiset merkitysteoriat ja niiden suhde koneoppimisen tutkimukseen. Yksi keskeinen johtopäätös oli, että koneoppimis- ja neuroverkkotutkimus tarjoaa tietoteoreettisille tarkasteluille uutta pohjaa.
Title in English:
Computer reading over one hundred books: Linguistics and philosophical views
Timo Honkela: Introducing the book Encyclopedia of Artificial Intelligence (i...Timo Honkela
The book "Encyclopedia of Artificial Intelligence" (Tekoälyn ensyklopedia), edited by Eero Hyvönen, Ilkka Karanta and Markku Syrjänen (1993), was an important landmark in the Finnish AI research and development. Finland has been and remains an important country in this field. Many of the authors were already prominent figures at that time, especially Professor and later Academician Teuvo Kohonen. Since then many authors have become processors in different universities. One of the authors, Tuomas Sandholm received in 2003 the IJCAI Computers and Thought Award and serves as a professor at Carnegie Mellon University.
Timo Honkela: Kohonen's Self-Organizing Maps for Intelligent Systems Developm...Timo Honkela
An invited talk given in the FODO'98, Foundations of Data Organization conference. The conference took place in Kobe, Japan, November 12-13, 1998. Main themes of the talk included Self-Organizing Maps (SOMs), Fuzzy Sets, context analysis, and systems of SOMs.
Timo Honkela: Analysis of Qualitative Data using Machine Learning MethodsTimo Honkela
A keynote talk given in the Arcada Analytics Workshop, Helsinki on 8th of June, 2016. The other keynote talks were given by Peter Sarlin (Machine Learning and Network Analytics for Measuring Systemic Risk) and Amaury Lendasse (ELMVIS+: Fast Nonlinear Visualization Technique based on Cosine Distance and Extreme Learning Machines).
Timo Honkela: Modeling evolution and dynamical systemsTimo Honkela
A short tutorial for Modeling Meaning and Knowledge, 18 April 2016, at University of Helsinki. Followed by presentations by Mika Pantzar and Sakari Virkki.
Timo Honkela: Kuhn’s Structure of Scientific Revolutions and Gärdenfors’ Conc...Timo Honkela
A tutorial talk by Timo Honkela in Modeling Meaning and Knowledge series of mini-symposia at University of Helsinki. The talk took place on Monday, 4st of April, 2016.
Timo Honkela: Kuhn’s Structure of Scientific Revolutions and Gärdenfors’ Conc...
Timo Honkela: Kylmä data kohtaa inhimillisen tulkinnan, Studia Generalia -esitys 6.10.2016
1. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Timo Honkela
Helsingin yliopisto
6.10.2016
Kylmä data kohtaa
inhimillisen tulkinnan:
koneoppiminen
ihmistieteiden työkaluna
timo.honkela@helsinki.fi
Studia Generalia: MIKÄ BIG DATA?
2. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Liisa, meillä
on tehtävänä
opetella
ohjelmointia.
Kuvalähde: http://digi.kansalliskirjasto.fi/pienpainate/binding/346723?page=1 Inspiraatio: http://www.geekculture.com/joyoftech/joyarchives/2193.html
3. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
ILMIÖT JA ORGANISAATIOT:
HUMANISTISET JA
YHTEISKUNTATIETEET
HELSINGIN YLIOPISTON
KESKUSTAKAMPUS
4. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Tieteiden kohteiden monimutkaisuus
Biologinen maailma
Fysikaalinen maailma
Kulttuurinen maailma
5. 5
Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Englannin kielen osuus
eri tieteenaloilla Suomessa (1.-15.)
Matematiikka 95.3
Farmasia 94.1
Kemia 93.7
Fysiikka 93.4
Biokemia, molekyylibiologia, mikrobiologia, perinnöllisyystiede ja biotekniikka 93.4
Solu ja kehitysbiologia, fysiologia ja ekofysiologia 93.4
Tietojenkäsittelytieteet 93.0
Sähkötekniikka ja elektroniikka 92.8
Ympäristötekniikka 92.7
Geotieteet 92.1
Ekologia, evoluutiotutkimus ja systematiikka 92.1
Kone ja valmistustekniikka 91.9
Metsätieteet 91.4
Avaruustieteet ja tähtitiede 91.0
Prosessi ja materiaalitekniikka 90.8
(Timo Honkela, TUTKAS-seminaari 17.11.2010)
VANHA
TIETEEN-
ALALUO-
KITUS
6. 6
Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Englannin kielen osuus
eri tieteenaloilla Suomessa (31.-44.)
(Timo Honkela, TUTKAS-seminaari 17.11.2010)
TIETEENALA %
Rakennus ja yhdyskuntatekniikka 85.9
Maatalous ja elintarviketieteet 85.4
Ympäristöpolitiikka, talous ja oikeus 85.3
Maantiede 84.8
Arkkitehtuuri ja teollinen muotoilu 83.7
Viestintä ja informaatiotieteet 83.1
Kasvatustiede 82.6
Valtiooppi ja hallintotiede 82.2
Taiteiden tutkimus 81.6
Sosiaalitieteet 80.4
Kulttuurien tutkimus 79.3
Historia ja arkeologia 78.1
Teologia 77.0
Oikeustiede 70.8
VANHA
TIETEEN-
ALALUO-
KITUS
7. 7
Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Englannin kielen osuus
eri tieteenaloilla Suomessa (31.-44.)
TIETEENALA %
Rakennus ja yhdyskuntatekniikka 85,9
Maatalous ja elintarviketieteet 85,4
Ympäristöpolitiikka, talous ja oikeus 85,3
Maantiede 84,8
Arkkitehtuuri ja teollinen muotoilu 83,7
Viestintä ja informaatiotieteet 83,1
Kasvatustiede 82,6
Valtiooppi ja hallintotiede 82,2
Taiteiden tutkimus 81,6
Sosiaalitieteet 80,4
Kulttuurien tutkimus 79,3
Historia ja arkeologia 78,1
Teologia 77,0
Oikeustiede 70,8
VANHA
TIETEEN-
ALALUO-
KITUS
Tärkeitä tieteenaloja, joissa
kieli-, tulkitsija-, tilanne- ja
kulttuurisidonnaisuus
on paljon voimakkaampaa
kuin listan alkupään aloilla.
8. 8
Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Digitaalisten ihmistieteiden
kehittyvä kukoistus
● Perinteinen syvällinen osaaminen ja ymmärrys
liittyen humanitisten ja yhteiskuntatieteiden
alueeseen
● Tämä ymmärrys yhdistetään nykyaikaisiin
tietojenkäsittelymenetelmiin kuten tilastolliseen
koneoppimiseen
● Avoin tiede ja laajat tietoaineistot antavat vahvan
pohjan työlle
● Helsingin yliopistossa on tehty työtä tällä saralla jo
esimerkiksi kielen tutkimuksessa pitkään. Viime
aikoina alue on laajentunut ja panostuksia on lisätty.
9. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Varieng - Research Unit for the Study of
Variation, Contacts and Change in English
Big Data, Rich Data,
Uncharted Data
19–22 October 2015
Helsinki, Finland
Terttu Nevalainen
Irma TaavitsainenTanja Säilyhttp://www.helsinki.fi/varieng/
http://www.helsinki.fi/varieng/people/varieng_saily.html
ja moni
muu ...
10. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
FIN-CLARIN on suomalaisten yliopistojen, CSC:n ja Kotimaisten
kielten keskuksen muodostama konsortio, joka auttaa eri alojen
tutkijoita käyttämään, jalostamaan, säilyttämään ja jakamaan
kieliaineistoja. Osa kansainvälistä CLARIN ERI -tutkimusinfrastruktuuria.
Krister Lindén
ja moni muu ...
11. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Koneellinen ja koneavusteinen
kääntäminen ja tulkkaus
Jörg Tiedemann
ja muut
12. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Historiallisten sanomalehtien
tekstilouhinta
Mikko Tolonen
Kimmo Kettunen
13. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Citizen Mindscapes
Ymmärrystä yhteiskunnasta louhimalla
suuria sosiaalisen median aineistoja
14. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Esimerkki uudenlaisesta opetusta:
Digital Humanities Hackathon
15. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
375 humanistia
http://375humanistia.helsinki.fi/
16. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
HELDIG-avajaiset eilen 5.10.2016
Eero Hyvönen, Mikko Tolonen, Arto Mustajoki
Anna Mauranen
17. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Anna Mauranen
Arto Mustajoki
https://www.helsinki.fi/en/researchgroups/helsinki-digital-humanities/heldig-kick-off-symposium
18. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Maailman suurin
ongelma on, että
ihmiset eivät
ymmärrä toisiaan
Arto Mustajoki
20. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Yli sata miljoonaa kirjaa
http://www.pcworld.com/article/202803/google_129_million_different_books_have_been_published.html
● Googlen kirjaprojektissa kerrottiin vuonna
2010, että maailmassa on julkaistu
129 864 880 kirjaa
● Tarkan luvun antaminen ei ole kovin
mielekästä, koska kaikkia kirjoja Googlekaan
ei ole voinut löytää ja luku muuttuu jatkuvasti
21. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Pohjoismaat kirjoissa
(Google Books 1860-2006)
22. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Julkaisemisen volyymi
kolmessa yliopistossa 1980-2015
Kiitokset:LeoNäteaho,Helsinginyliopistonkirjasto
Artikkelit, kirjoissa
ilmestyneet artikkelit,
kirjat, konferenssijulkaisut
23. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Aineistojen digitointi:
esimerkkinä Kansalliskirjaston
sanomalehtiaineisto
http://digi.kansalliskirjasto.fi/
Digitointi > OCR > Hakutoiminnot ja jatkojalostus
https://www.kansalliskirjasto.fi/fi/palvelut#digitointi--ja-sailytyspalvelut
24. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Inhimillisen ymmärryksen
keruun vaiheita
● Puheeseen perustuva perinne
● Käsin kirjoitettu kieli: hidas leviäminen
● Kirjapainotaito ja painetut tekstit:
nopea leviäminen
● Digitaaliset tekstit:
entistäkin nopeampi leviäminen
● Tiedon määrämuotoinen linkittäminen ja avoin jakelu
(Open Linked Data)
● Sosiokognitiiviset keinotekoiset toimijat:
tiedon ja kokemuksen leviäminen yli
yksilö-, kieli-, kulttuuri- ja sosiaalisten rajojen
25. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
VÄLINEET:
TIETOKONEET
JA
OHJELMISTOT
26. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Laskenta- ja muistikapasiteetti
http://yle.fi/uutiset/3-6467338
http://yle.fi/uutiset/3-6467338
CSC Tieteen tietotekniikan keskus
https://www.csc.fi/
27. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Valtavat ohjelmistomassat
yhteiskunnan peruspilareina
http://www.informationisbeautiful.net/visualizations/million-lines-of-code/
Ohjelmarivejä:
- Unix 1.0 ~ 10.000
- Windows 3.1 ~ 2.000.000
- Firefox ~ 10.000.000
- Facebook ~ 60.000.000
- Googlen palvelut ~
2.000.000.000
Suomalaislähtöisiä:
- MySQL ~ 13.000.000
- Linux 3.1 ~ 15.000.000
28. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
MENETELMÄT:
TILASTOLLINEN
KONEOPPIMINEN
JA
KIELITEKNOLOGIA
29. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Tietämyksen ohjelmoimisesta
koneoppimiseen
● Pitkään on ollut tapana ohjelmoida koneita inhimisen
tiedon puitteissa rajoituksineen
● 1980-luvulla maailmassa kehitettiin
miljardipanostuksin asiantuntijajärjestelmiä
ajatuksella, että asiantuntija tietää parhaiten ja pystyy
kuvaamaan tietämyksensä sääntöinä
● Nykyään koneet ohjelmoimaan oppimaan
● Tilastollisen koneoppimisen avulla kone voi osata
enemmän kuin kukaan ihminen
● Olennaisia ovat aineistot
●
30. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Koneoppiminen ja tiedon louhinta
● Tilastollisen koneoppimisen avulla matkitaan
ihmisen oppimista
● Kone käy läpi sille annettuja esimerkkejä
● Annetun datan perusteella kone oppii
esimerkiksi luokittelemaan, järjestämään,
ryhmittelemään, hahmottamaan,
käsitteistämään tai laittamaan
paremmuusjärjestykseen erilaisia tietoalkioita
31. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Koneille opetetaan kieltä
Koneet oppivat kieltä
● Perinteisesti koneet on pyritty saamaan
“kielitaitoisiksi” kirjoittamalla kielen sääntöjä
koneen ymmärtämään muotoon
● Tämän on kuitenkin osoittautunut
ongelmalliseksi
● Nykyisin hyödynnetään
koneoppimismenetelmiä
32. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Sanojen suhteet
paljastuvat niiden käytöstä
● Kun käytettävissä on suuria tekstiaineistoja,
mielivaltaisen kielen sanojen välisiä suhteita
voidaan selvittää tilastollisesti
● Perusidea on se, että kahta sanaa käytetään
tyypillisesti samaan tapaan (samanlaisessa
lauseyhteydessä), jos niiden merkitykset ja/tai
kieliopillinen rooli on samankaltainen
33. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Klassikkoesimerkki:
Grimmin satujen analyysi (1995)
Honkela, Pulkki & Kohonen 1995
34. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Klassikkoesimerkki:
Grimmin satujen analyysi (1995)
Huom: Suomessa tehtiin
tällaista työtä jo ennen
kuin esimerkiksi
Googlea oli olemassa
Akateemikko Teuvo
Kohonen on ollut
yksi neuroverkko- ja
hahmontunnistusalan
perustajahahmoista
http://www.aka.fi/fi/akatemia/tutkimuksen-tekijoita/tieteen-akateemikot/suomalaiset-tieteen-akateemikot/akateemikko-teuvo-kohonen/
35. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Tilastollisesti etsittyjä assosiaatioita
sanoille 1) onnellisuus ja 2) lätäkkö
● mielenrauha
●
tyytyväisyys
●
onnellisuuden
● elämänilo
● yksilöllisyys
●
rakkaus
●
välittäminen
●
onni
● hyvinvointi
●
positiivisuus
● lammikko
●
lampi
●
oja
● läntti
● kuoppa
●
kolo
●
hiekka
●
allas
● pläntti
●
läikkä
http://bionlp-www.utu.fi/wv_demo/Kiitokset: Turku BioNLP group, Filip Ginter ja
Citizen Mindscapes -projekti (Helsinki, Turku) http://blogs.helsinki.fi/citizenmindscapes/
36. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Tekstien louhinta
● Edellä kuvatulla tavalla mitä tahansa suuria
data- tai tekstiaineistoja voidaan tutkia
(Honkela&Klami,2008)
37. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Suomen tieteen kartta
Akatemian aineistosta
(Honkela&Klami,2008)
Kemia
Luonnon- ja
insinööritieteet
Bio- ja
ympäristötieteet
Terveystieteet
Kulttuuri- ja
yhteiskunta-
tieteet
Tieteellisiä tekstejä
ei lueta ainoastaan
ihmisvoimin yksi
kerrallaan
Kone auttaa käymään
läpi tuhansia, jopa
miljoonia dokumentteja
38. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Uusi askel:
Humanistinen meta-analyysi
39. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Taustaa: tulkinnan yksilöllisyyden
mallintaminen (GICA-menetelmä)
● GICA-menetelmät (Grounded Intersubjective
Concept Analysis) (Honkela ym. 2012)
mahdollistaa mallit, joissa kunkin sanan
merkitystä tarkastellaan yksilöllisesti
● Esimerkkinä USAn presidenttien puheet
(State of the Union Address) ja sanan
HEALTH merkityksen analyysi kontekstitietoa
tilastollisesti analysoide
41. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Humanistinen meta-analyysi
(Honkela 2016)
Aineisto
sanoineen
Analyysi
olettaen
sanojen
jaettu
merkitys Honkelan
ehdotus
Aineisto
sanoineen
Analyysi hyödyntäen
merkityksien
vaihtelumallia
Merkityksien analyysi
rikkaissa konteksteissa
42. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Humanistinen meta-analyysi
(Honkela 2016)
Aineisto
sanoineen
Analyysi
olettaen
sanojen
jaettu
merkitys Honkelan
ehdotus
Aineisto
sanoineen
Analyysi hyödyntäen
merkityksien
vaihtelumallia
Merkityksien analyysi
rikkaissa konteksteissa
Sanoja ei voi ottaa
analyysin perusdataksi
olettaen, että sana tarkoittaa
täsmälleen samaa, kun
puhuja/ kirjoittaja on eri ja
eri kontekstissa
Sanan merkitys on
tilastollinen, subjektiivinen
ja kontekstiriippuva ilmiö
43. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Humanistinen meta-analyysi
(Honkela 2016)
...
AUTENTTINEN
...
HAUVA
KATTI
KISSA
KOIRA
…
REILU
...
TEHOKAS
...
DATA (1)
RIKAS
MERKITYS-
MALLI
SISÄLTÖ-
ANALYYSI
(HUMANISTINEN
META-ANALYYSI)
DATA (2)
44. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Yhteisen ymmärryksen
uusia mahdollisuuksia
Humanistinen meta-analyysi
ja vastaavat keinot voivat
auttaa meitä tuomaan
yhteen ymmärrystä, jota
ihmiset ovat keränneet eri
kielellisissä, sosiaalisissa,
kulttuurissa ja historiallisissa
konteksteissa
Merkitysneuvotteluiden osittaiseen automatisointi
Tieteen uudet
keinot tilanteisiin
ja kysymyksiin,
joita koskien
yhtä oikeaa
tulkintaa ei ole
eikä voi olla.
45. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Uusi valistuksen aika?
Ratkaisuja maailman
polttaviin ongelmiin
46. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Koneet eivät ole ihmeidentekijöitä
vaan apuvälineitä
● Koneet eivät voi tarjota objektiivisuutta sen
enempää kuin ihminenkään, kun tarkastelun
kohteena ovat monimutkaiset ja
tulkinnanvaraiset teemat
● Koneiden avulla voidaan kuitenkin kerätä
yhteen ihmisten keräämää tietoa ja kokemusta
ennennäkemättömällä tavalla
● Menetelmät täytyy kehittää humanistisen
ymmärryksen pohjalta
47. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Filosofiaa eivät voi paeta
tietojenkäsittelijätkään
● Uusi valituksen aika?
● Empirismin ja rationalismin vuoropuhelu
● Vuosisataiset filosofiset näkökulmat ja teemat
ovat edelleen tärkeitä ja aina vain tärkeämpiä
koneiden käyttöön liittyen eli kun tekoälyä ja
koneoppimista sovelletaan ihmistieteiden
piirissä
48. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Skenaarioita:
digihumanismin mahdollisuuksia
● Ihmisten välinen parempi ymmärrys ja
vuorovaikutus
– sodan ja rauhan kysymykset
– yhteiskunnallinen päätöksenteko ja politiikka
● Monimutkaisia ilmiöitä koskeva
ongelmanratkaisu:
– esimerkiksi ympäristökysymykset
– terveyttä ja hyvinvointia koskevan tutkimus- ja
kokemustiedon kerääminen ja yhteen tuominen
49. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Kuvalähde: http://digi.kansalliskirjasto.fi/pienpainate/binding/346723?page=1
50. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
Kiitos!
http://375humanistia.helsinki.fi/humanistit/timo-honkela
http://www.slideshare.net/timohonkela
https://www.youtube.com/watch?v=UXwkGPMMZdk
51. Timo Honkela, Helsingin yliopisto, Studia Generalia, 6.10.2016
http://375humanistia.helsinki.fi/humanistit/timo-honkela
http://www.slideshare.net/timohonkela
https://www.youtube.com/watch?v=UXwkGPMMZdk
Avoin data moraaliseksi periaatteksi, kiitos!