SlideShare a Scribd company logo
1 of 45
Download to read offline
Analytiikka toiminnan kehittämisessä 
Jari Jussila 
Novi tutkimuskeskus 
Data-analytiikka PK-yritysten toiminnan kehittämisessä 
4.12.2014
Johdanto 
•Big Datan ja analytiikkamaailman käsitteiden läpikäyminen 
•Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat 
•Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 
8.12.2014 
2
Big datan ja analytiikkamaailman käsitteet 
8.12.2014 
3
Päätöksenteon tukijärjestelmät ja johdon tietojärjestelmät ”1970-1990” 
8.12.2014 
4 
vrt. erilaiset johdon työpöydät, kuten markkinoinnin työpöytä 
Vierailut 
Toiminnot sivustolla 
Liidit 
Mahdollisuudet 
Voitot 
Metriikka 
Tavoitteen saavuttaminen 
64 % 
51 % 
70 % 
29 % 
35 % 
Myyntisuppilo 
Lähde: erilaisia esimerkkejä nähtävillä esim. Klipfolion sivuilla (ks. Dashboards); ks. myös Visualisointi ja tiedon jakamisen käytännöt (Aho 2014)
Kuutioiden mallinnus - OLAP (online analytical processing) 
8.12.2014 
5 
Tuote 
Aika 
Markkinat 
image Athanasios Kastanidis 
”1980-1990”
OLAP-kuutioiden perusidea 
•OLAP-tekniikka poikkeaa perinteisestä tilastoinnista ja raportoinnista siten, että käyttäjä voi vaihtaa näkökulmaa tiedontarpeensa mukaan. 
•Esimerkiksi analyytikko voi lähteä 1) tarkastelemaan tuoteryhmien myyntiä maittain, 2) filtteröidä aineisto tiettyihin maihin 3) joista löytää jotain esimerkiksi myyntitavoitteista poikkeavaa. Tämän jälkeen 4) porautua esimerkiksi myyntiin tietyissä kaupungeissa. 5) Vaihtaa näkökulmaa liikevoittoon tuoteryhmittäin, jne. 
8.12.2014 
6 
”1980-1990”
Liiketoimintatiedon hallinnan ulottuvuudet 
8.12.2014 
7 
Organisaation 
sisäinen 
Organisaation 
ulkoinen 
TIEDON 
KOHDE 
Määrällinen 
Laadullinen 
TIEDON 
TYYPPI 
Organisaation 
sisäinen 
Organisaation 
ulkoinen 
TIEDON 
LÄHDE 
Lähde: [Hannula 2005]; image Athanasios Kastanidis 
”1989-2005”
Tiedon arvoketju liiketoimintatiedon hallinnan näkökulmasta 
8.12.2014 
8 
Lähde: [Myllärniemi 2012]
Minkälaista tietoa tarvitaan? 
Tieto, joka on pystytty hankkimaan 
Tieto, joka todella tarvitaan 
Tieto, joka määritellään tarpeelliseksi 
8.12.2014 
9 
Lähde: [Hannula 2005]
Liiketoimintatiedon hallinnan prosessimalli ja keskeiset tehtävät 
8.12.2014 
10 
Lähde: Tietojohtaminen [Laihonen et al. 2013]
Tiedonlouhinta, data mining, knowledge discovery in databases (KDD) ”1990-2007” 
8.12.2014 
11 
10-20 % 
20-30 % 
50-70 % 
10-20 % 
10-20 % 
5-10 % 
1. Liiketoiminnan ymmärtäminen 
2. Datan ymmärtäminen 
3. Datan valmistelu 
3. Mallinnus, tiedonlouhinta 
5. Arviointi 
6. Tulosten julkaisu 
Lähde: The CRISP-DM Model [Shearer 2000], [Aho 2014]
CRISP-DM referenssimalli 
CRISP-DM referenssimallin tehtävät 
Liiketoiminnan ymmärtäminen 
Datan ymmärtäminen 
Datan valmistelu 
Mallinnus, tiedonlouhinta 
Arviointi 
Tulosten julkaisu 
Määritä liiketoiminnan tavoitteet 
Tee tilannearvio 
Määritä tiedonlouhinnan tavoitteet 
Laadi projektisuunnitelma 
Kerää alustava data 
Kuvaa data 
Tutki dataa 
Varmista datan laatu 
Datasetin kuvaus 
Datan valinta 
Datan siivous 
Datan rakentaminen 
Datan integrointi 
Datan formatointi 
Valitse mallinnus menetelmä 
Suunnittele koe 
Rakenna malli 
Arvioi mallia 
Arvioi tuloksia 
Arvioi ja varmista tiedonlouhintaprosessin laatu 
Määrittele seuraavat stepit 
Suunnittele mallin julkaisu (esim. verkkosivuna) asiakkaalle 
Suunnittele mallin ylläpito 
Laadi loppuraportti 
Arvioi projekti 
8.12.2014 
12 
Lähde: The CRISP-DM Model [Shearer 2000]
Analytiikka ”2005-2010” 
•Deskriptiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää dataa ja analysoida liiketoiminnan suoriutumiskykyä 
•Diagnostiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää mitä on tapahtunut ja miksi 
•Prediktiivinen analytiikka: tekniikoita joiden avulla voidaan analysoida nyky- ja historiatietoa jotta voidaan päätellä mitä todennäköisesti tapahtuu tai ei tapahdu 
•Preskriptiivinen analytiikka: tekniikoita joiden avulla voidaan laskennallisesti kehittää ja analysoida vaihtoehtoja organisaation toiminnalle 
•Päätöksentekoa tukeva analytiikka: tekniikoita joiden avulla voidaan visualisoida informaatiota päätöksen teon tueksi 
8.12.2014 
13 
Lähde: Big Data and Analytics [Kaisler et al. 2014]
Analytiikkasykli 
1.Määrittele liiketoimintaongelma tai kysymys johon haluat vastauksen 
2.Tunnista, kerää, siivoa ja valmistele data kysymyksen vastausta varten 
3.Deskriptiivinen analytiikka 
–Perehdy dataan (descriptives, correlations, factor analysis, cluster analysis, ym.) 
–Luo mahdollisia hypoteeseja (data mining ym.) 
4.Prediktiivinen analytiikka 
–Muodosta hypoteesit 
–Tunnista soveltuvimmat analytiikkamenetelmät 
–Kehitä analyyttiset mallit (multivariate regression, logistic regression, forecasting, non-linear models, decision trees, ym.) 
–Aja mallit ja luo ennusteet 
5.Preskriptiivinen analytiikka 
–Kehitä päätös- ja optimointimallit 
–Hyödynnä koneoppimista päätöksien ohjelmointiin 
6.Kirjoita johtopäätökset ja suositukset 
8.12.2014 
14 
Lähde: Introduction to Big Data [Kaisler et al. 2014]
Big Data ”2010-” 
8.12.2014 
15 
Volyymi 
Vauhti 
Variaatio 
Varmuus 
Data at Rest 
Data in Motion 
Data in Many Forms 
Data in Doubt 
Terabittejä olemassa olevaa dataa prosessoitavaksi 
Striimattua dataa, nopea vasteaika millisekunneista sekunteihin 
Strukturoitua, ei- strukturoitua, ja semistrukturoitua dataa 
Epävarmuutta liittyen datan epätäydellisyyteen, puutteellisuuteen, tai virheellisyyteen 
Lähde: [Breuker 2014; Laney, Meta Group 2001 (3V:tä)]
Big Data transaktioista interaktioihin 
8.12.2014 
16 
WEB 
BIG DATA 
Lähde: mukaillen [Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013] 
ERP 
CRM 
ostotiedot 
maksutiedot 
segmentointi 
tarjoustiedot 
asiakaskohtaamiset 
tukikontaktit 
weblogit 
tarjoushistoria 
A/B testaaminen 
Dynaaminen 
hinnoittelu 
Hakukonemarkkinointi 
ja optimointi 
Mainosverkostot 
Käyttäytymispohjainen 
kohdentaminen 
Dynaamiset 
funnellit 
Sentimentti 
Ulkopuolinen demografia 
Kuvat ja videot 
Puheen muuttaminen tekstiksi 
Feedit 
Anturi/sensoridata 
Tuote / palvelu logit 
SMS/MMS 
Sosiaaliset verkostot 
Sosiaalinen media 
Käyttäjien luoma sisältö 
Mobiilidata 
Klikkivirran analyysi 
Sijaintidata
Datan lajeja 
Datan laji 
Muoto 
Volyymi 
Kuvaus 
Esimerkkejä 
Master Data 
Strukturoitu 
Matala 
Yritystason dataa jolla on strategista arvoa organisaatiolle 
Asiakas, tuote, toimittaja 
Transaktiodata 
Struktoroitu & semi- strukturoitu 
Keskinkertainen - korkea 
Transaktiot joita syntyy liiketoiminta-prosesseissa 
Tilaukset, ostot, maksut 
Referenssidata 
Struktoroitu & semi- strukturoitu 
Matala – keskin- kertainen 
Faktoja jotka tukevat organisaation kykyä tehokkaasti prosessoida transaktioita, hallita masterdataa ja tukea päätöksiä 
Demografiset kentät 
Metadata 
Strukturoitu 
Matala 
”Dataa datasta” 
Datan nimi, datan dimensiot tai yksiköt, ym. 
Analytiikkadata 
Strukturoitu 
Keskinkertainen - korkea 
Liiketoimintaoperaatiosta tai transaktioista jalostettua tietoa raportoinnin ja analytiikan tarpeisiin 
Data joka sijaitsee tietovarastoissa ja päätöksenteon tukijärjestelmissä 
Big Data 
Struktoroitu, semi- strukturoitu ja ei strukturoitu 
Korkea 
Isoja data settejä, joita on haastava tallentaa, etsiä, jakaa, visualisoida ja analysoida 
Ihmisten ja koneiden luomaa dataa sosiaalisesta mediasta, webistä, mobiililaitteista, sensoreista, ym. 
8.12.2014 
17 
Lähde: Big Data and Analytics [Kaisler et al. 2014]
Master data 
•organisaation ydintieto on usein kaikkein tärkeintä liiketoiminnalle ja siinä menestymiselle sekä data-lähtöiselle päätöksenteolle 
•ydintietoa käytetään useissa yrityksen prosesseissa ja tietojärjestelmissä, joten ydintietojen muotojen standardointi ja arvojen synkronointi on kriittistä järjestelmien onnistuneelle integroinnille 
•ydintiedoksi mielletään usein esimerkiksi asiakastiedot ja tuotetiedot 
8.12.2014 
18 
Lähde: [Vilminko-Heikkinen & Pekkola 2013]
Datan käyttöön ja analysointiin liittyvää terminologiaa 
Termi 
Ajanjakso 
Kuvaus 
Päätöksenteon tuki 
[Decision Support] 
1970-1985 
Hyödynnetään data analyysiä tukemaan päätöksentekoa 
Johdon tukijärjestelmät 
[Executive Support Systems] 
1980-1990 
Fokus data analyysissä ylemmän johdon tueksi 
Kuutioiden mallinnus 
[Online Analytical Processing OLAP] 
1990-2000 
Ohjelmistoja multidimensionaalisten data taulujen analysointiin 
Liiketoimintatiedon hallinta [Business Intelligence] 
1989-2005 
Työkaluja tukemaan datalähtöistä päätöksentekoa, painopiste raportoinnissa 
Analytiikka 
[Analytics] 
2005-2010 
Fokus tilastollisessa ja matemaattisessa analyysissä päätöksenteon tueksi 
Massadata 
[Big Data] 
2010- 
Fokus erittäin isossa, monimuotoisessa ja nopeasti liikkuvassa datassa 
8.12.2014 
19 
Lähde: Big Data at Work [Davenport, 2014]
Kuinka liiketoimintatiedon hallinta on muuttunut massadatan myötä? 
Massadata 
Business analytiikka 
Liiketoimintatiedon hallinta 
Vanhaa 
•Relaatiotietokannat 
•SQL 
•Tietovarastot 
•Tiedonlouhinta 
•Kvantitatiivinen analyysi 
•Tilastotiede 
•Operaatiotutkimus 
•Päätöksenteon tukijärjestelmät 
•Johdon tietojärjestelmät 
•OLAP 
Uutta 
•4V:tä 
•Monimuotoista dataa 
•Vähemmän struktuuria 
•Big Data teknologiat (MapReduce, Hadoop, NoSQL, ym.) 
•Ei strukturoitua dataa 
•Dataa monesta lähteestä 
•Monimuotoista dataa 
•Data liikkeessä 
•Tekstianalytiikka 
•Visuaalinen analytiikka 
•Sosiaalisen median analytiikka 
•Helppokäyttöisyys 
•Visuaalisuus 
•Dynaamisuus 
•Kattaa organisaation prosessit 
•Koneoppiminen 
•RTAP 
8.12.2014 
20 
Lähde: mukailtu Introduction to Big Data [Kaisler et al. 2014]
Big Data, data-analytiikka ja lähikäsitteet 
•Big Data can be defined as the amount of data just beyond technology’s capability to store, manage and process efficiently. (Kaisler et al. 2014) 
•Data analytics is the science of examining raw data with the purpose of drawing conclusions about that information. (Rouse 2008) 
•Business analytics is the scientific process of transforming data into insight for making better decisions (INFORMS) 
•Tiedonlouhinta (engl. data mining) on kokoelma menetelmiä, jotka valikoivat, kuvailevat ja mallintavat suuria tietomääriä tavoitteenaan löytää tiedon omistajalle uusia ja hyödyllisiä säännönmukaisuuksia ymmärrettävässä muodossa (Hand et al. 2001) 
•Business Intelligence refers to the technologies, applications, and processes for gathering, storing, accessing, and analyzing data to help its users make better decisions (Wixom and Watson, Teradata University Network 2012) 
8.12.2014 
21
Ymmärrys 
Tiedon tasot 
8.12.2014 
22 
Data 
Informaatio 
Tietämys 
Lähde: [Laihonen et al. 2013; Tuomi 1999; Thierauf 1999; Ackoff 1989]
Tiedon tasot esimerkein avattuna 
8.12.2014 
23 
Informaatio 
Data 
Tietämys 
Ymmärrys 
A 
X1 
X2 
1 
1 
300 
2 
0 
159 
… 
… 
… 
100 
1 
501 
A 
X1 
X2 
1 
1 
300 
2 
0 
159 
… 
… 
… 
100 
1 
501 
A = asiakasnumero 
X1 = sukupuoli (0=nainen, 1=mies) 
X2 = kk-ostot 
•”Meillä on tietokannassamme 100 asiakkuutta” 
•”85% asiakkaistamme on naisia” 
•”Keskimääräiset kk-ostot ovat 250€” 
•”Suurin osa asiakkaistamme on naisia, vaikka tuotteemme ovat suunnattu pääasiassa miehille -?!@%!” 
Lähde: [Väisänen 2011]
Tiedonhallinnan tasot 
8.12.2014 
24 
Innovoiva 
Erottuva 
Arkistoiva 
Mallinnus 
Visualisointi 
Ennustaminen 
Optimointi 
Raportointi 
”Löytyisikö 
täältä jotain?” 
”Tiedän mitä 
tarvitsen mutta 
haluan tehdä 
sen kilpailijoita 
paremmin" 
”Tätä tarvitaan 
mutta tällä ei 
erotuta" 
Lähde: Informaatiosta kilpailuetua teollisuusyrityksiin [Valli & Ahlgren 2013] 
tieto, joka on tallennettava esimerkiksi määräysten perusteella 
tieto, jonka avulla voidaan edistää ja parantaa nykyistä liiketoimintaa 
tieto, jonka avulla voidaan innovoida uutta liiketoimintaa
Lähteitä 
•Breuker, D. 2014. Towards Model-Driven Engineering for Big Data Analytics – An Exploratory Analysis of Domain- Specific Languages for Machine Learning. 47th Hawaii International Conference on System Sciences. 
•Davenport, T. H., Patil, D. J. 2012. Data Scientist. The Sexiest Job of the 21st Century. Harvard Business Review. October 2012. 
•Davenport, T. H. 2014. Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business Review. 
•Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Introduction to Big Data. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. 
•Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Big Data and Analytics. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. 
•Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Advanced Analytics – Issues and Challenges in the Global Environment. 47th Hawaii International Conference on System Sciences. 
•Hannula, M. 2005. Tieto- ja liiketoiminta. Tekniset välineet ja sovellukset. Luento 23.10.2005. 
•Laihonen, H., Hannula, M; Helander, N; Ilvonen, I; Jussila, J; Kukko, M; Kärkkäinen, H; Lönnqvist, A; Myllärniemi, J; Pekkola, S; Virtanen, P; Vuori, V; Yliniemi, T. 2013. Tietojohtaminen. Laitosraportti. Tampereen teknillinen yliopisto. 
•Laney, D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. Retrieved 6 February 2001. 
•Loukides, M. 2010. What is Data Science? O’ Reilly, Cambridge. http://www.kiwidatascience.it/wp- content/uploads/2013/05/What_Is_Data_Science_.pdf 
•Yli-Pietilä & Backman 2013. Management by analytics. Commercial and technical applications in the Big Data era. Teradata 
•Valli, K., Alhgren 2013. Informaatiosta kilpailuetua teollisuusyrityksiin. Teknologiateollisuus. http://www.teknologiateollisuus.fi/file/16270/Informaatiostakilpailuetua.pdf.html 
•Vilminko-Heikkinen, R., Pekkola, S. 2013. Establishing an Organization’s Master Data Management Function: A Step-wise Approach. 46th Hawaii International Conference on System Sciences. 
•Väisänen, J. 2011. Tiedonlouhinta. Luentomateriaali. 
8.12.2014 
25
Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat 
8.12.2014 
26
Raportoinnista operationaaliseen data-analytiikkaan 
8.12.2014 
27 
Raportit 
RAPORTOIDAAN 
MITÄ 
tapahtui? 
ANALYSOIDAAN 
MIKSI 
se tapahtui? 
Ad hoc 
BI työkalut 
ENNUSTETAAN 
MITÄ TULEE 
tapahtumaan? 
Ennustavat 
mallit 
OPERATIONALISOIDAAN 
MITÄ ON 
tapahtumassa nyt? 
Linkki operatiivisiin 
järjestelmiin 
AKTIVOIDAAN 
PISTETÄÄN 
tapahtumaan 
Automaattiset 
linkitykset 
STRATEGINEN ÄLYKKYYS 
OPERATIONAALINEN ÄLYKKYYS 
Lähde: mukaillen [Yli-Pietilä & Backman 2013]
Tiedonlouhinnan menetelmiä 
8.12.2014 
28 
Suunnattu 
Ei-suunnattu 
Ad Hoc 
Strateginen suunnittelu 
Ennustaminen 
Segmentointi 
Klusterointi 
Visualisointi 
OLAP 
Neuroverkot 
Regressio 
Lähde: [Kudyba & Hoptroff, 2001; Väisänen, 2011]
Klusterointi 
•Kuvailevaa tiedonlouhintaa / deskriptiivistä analytiikkaa 
•Tavoitteena klusteroida (luokitella) datamatriisin havainnot siten, että jokaisen klusterin sisällä olevat havainnot ovat mahdollisimman homogeenisia, ja jokainen klusteri mahdollisimman heterogeeninen muiden klusterien kanssa 
•Yleisiä käyttötarkoituksia 
–asiakkaiden segmentointi 
–myymälöiden ryhmittely menestyksen mukaan esimerkiksi kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin [Niemijärvi 2013] 
8.12.2014 
29
Esimerkki hierarkkisesta klusteroinnista 
8.12.2014 
30 
Klusterien lukumäärä 
Klusterit 
5 
(1) (2) (3) (4) (5) 
4 
(1,2) (3) (4) (5) 
3 
(1,2) (3,4) (5) 
2 
(1,2) (3,4,5) 
1 
(1,2,3,4,5) 
1 2 3 4 5 
Lähde: [Väisänen, 2011]
Assosiaatiosäännöt 
•Tarkoituksena löytää havaintoja, jotka esiintyvät yhdessä useammin kuin muut 
•Usein käytettyjä sovelluksia 
–Ostoskorianalyysi, engl. market basket analysis (MBA), ks. Esim. [Niemijärvi 2014]; [Ollikainen 2013] 
–Klikkivirran analyysi, engl. web clickstream analysis (WCA) [Paananen 2006] 
•Normaaleista tietokannoista poiketen assosiaatiosääntöjä tarkastellaan transaktio- ei asiakaspohjaisesti 
–MBA:ssa yksi datamatriisin rivi vastaa yhtä kassalla käyntiä 
–WCA:ssa yksi datamatriisin rivi vastaa yhtä vierailua verkkosivuille 
8.12.2014 
31
Assosiaatiosäännöt 
•Assosiaatiosääntö on todennäköisyyteen perustuva lausuma tiettyjen tapahtumien samanaikaisesta tapahtumisesta: 
•JOS A=1 ja B=1, NIIN (tietyllä todennäköisyydellä p) C=1 
•Todennäköisyys, että ostetaan tavara X, kun tavara Y on ostettu: X → Y 
•Esim. (Maito & Tee) → Keksejä (assosioaatiosääntö) 
•Säännön oikealla puolella yleensä vain yksi tekijä 
•Säännön vasemmalla puolella harvoin kolmea tekijää enempää (3. asteen sääntö) 
•Todennäköisyydet tavaroiden ostamiselle saadaan jakamalla ostotapahtumien esiintymistiheys kaikkien ostotapahtumien lukumäärällä 
8.12.2014 
32 
Lähde: [Väisänen, 2011]
•Tuki (”Support”) {A → B} = P(A ja B) 
–Todennäköisyys, että tuotteet A ja B löytyvät satunnaisesta ostoskorista. Jos 40% ostoksista sisältää sekä maitoa että leipää, tuki {maitoa→ leipää} = 0.4 
•Symmetrinen, eli tuki {leipää → juustoa} = tuki {juustoa → leipää} 
•Jos tuki kovin alhainen, ei säännöllä välttämättä ole kovin suurta käytännön merkitystä 
•Luottamus (”Confidence”) {A → B} = tuki {A → B} / tuki {A} 
–Todennäköisyys, että satunnaisesta ostoskorista löytyy tuote B, jos siellä on tuote A 
–Jos 80 % ostoksista sisältää leipää, mutta vain 40 % sisältää sekä leipää että maitoa, luottamus {leipää → maitoa} = 0.4 / 0.8 = 0.5 
–Luku ei välttämättä ole symmetrinen 
•Noste (”Lift”) {A → B} = luottamus {A → B} / tuki {B} 
–Normalisoitu luku, joka ilmaisee, kuinka paljon tuotteen A ostaminen vaikuttaa tuotteen B ostamiseen 
–Jos luottamus {leipää → maitoa} = 0.5 ja 40 % ostoksista sisältää maitoa, noste {leipää → maitoa} = 0.5 / 0.4 = 1.25 
–Eli henkilöt, jotka ostelevat leipää, ostelevat 1.25-kertaisesti maitoa verrattuna koko porukkaan 
8.12.2014 
33 
Assosiaatiosäännöt 
Lähde: [Väisänen, 2011]
Regressio 
•Lineaarinen regressio auttaa ennustamaan toisen muuttujan arvoja toisen muuttujan arvoilla 
•Logistisen regression avulla voidaan selittää/ennustaa binääristä muuttujaa 
•Kuinka mallinnuksen avulla ennustetaan asiakkaan ostotodennäköisyys? [Ollikainen 2014] 
8.12.2014 
34
Puumallit 
•Yhdistetään regressio ja klusterointi 
–Jaetaan havaintoja osajoukkoihin (klusterointi) tietyn ennustettavan muuttujan mukaan (regressio) 
•Käytetään usein asiakkaiden luokitteluun, kun tiedetään, minkä ominaisuuden mukaan halutaan luokitella 
–Puhelinoperaattorilla tiedossa, että 70 % asiakkaista maksaa laskunsa myöhässä, ja nyt halutaan tietää, keitä nämä ihmiset oikein ovat, ja miten voidaan ennustaa, maksaako uusi asiakas mahdollisesti laskunsa ajoissa 
–Asiakastiedoista valitaan ne muuttujat, joiden arvellaan olevan keskeisessä roolissa. Oletetaan, että seuraavat muuttujat voisivat vaikuttaa siihen, maksaako asiakas laskunsa ajoissa (0= ei maksa ajoissa, 1= maksaa ajoissa) 
1.Keskimääräinen puhelimen käyttöaste (min/kk) 
2.Ikä (1 = alle, 30v. 2 = yli 30v.) 
3.Siviilisääty (1 = naimaton, 2 = naimisissa) 
8.12.2014 
35 
Lähde: [Väisänen, 2011]
8.12.2014 
36 
•Puhelinoperaattoriesimerkki jatkuu… 
–Alussa meillä on kaikki havainnot (10 000) yhdessä, joista siis 3 000 maksaa laskunsa ajoissa 
–Puumalli jaottelee kaikki 10 000 havaintoa parhaiten kohdemuuttujaa (laskun ajoissa maksu) luokittelevalla muuttujalla 
1: 30% 3000 
0: 70% 7000 
Yht. 100% 10000 
1: 30% 3000 
0: 70% 7000 
Yht. 100% 10000 
1: 11.7% 460 
0: 88.3% 3480 
Yht. 100% 3940 
1: 41.9% 2540 
0: 58.1% 3520 
Yht. 100% 6060 
Ikä 
2 
1 
Ikä (1 = alle, 30v. 2 = yli 30v.) 
Puumallit 
Lähde: [Väisänen, 2011]
8.12.2014 
37 
1: 30% 3000 
0: 70% 7000 
Yht. 100% 10000 
1: 11.7% 460 
0: 88.3% 3480 
Yht. 100% 3940 
1: 41.9% 2540 
0: 58.1% 3520 
Yht. 100% 6060 
2 
1 
1: 67.1% 490 
0: 32.9% 240 
Yht. 100% 730 
1: 38.5% 2050 
0: 61.5% 3280 
Yht. 100% 5330 
1: 9.3% 310 
0: 90.7% 3030 
Yht. 100% 3340 
1: 25.0% 150 
0: 75.0% 450 
Yht. 100% 600 
Puh. käyttö 
Ikä 
Siviili- sääty 
1 
2 
1 
2 
•Puhelinoperaattoriesimerkki jatkuu… 
•Lopullinen malli voi näyttää tältä 
Siviilisääty (1 = naimaton, 2 = naimisissa) 
Ikä (1 = alle, 30v. 2 = yli 30v.) 
Keskimääräinen puhelimen käyttöaste (1 = <300, 2 = >300 ) 
Puumallit 
Lähde: [Väisänen, 2011]
Puumallit 
•Mitä saatiin selville? 
–91 % alle kolmekymppisistä naimattomista ei maksa laskuaan ajoissa 
–Ainoa ryhmä, joka maksaa laskunsa ennemmin ajoissa kuin myöhässä on yli kolmekymppiset alle 300min/kk puhujat 
–Ikä on silti tärkein kriteeri 
8.12.2014 
38 
Lähde: [Väisänen, 2011]
Ennakoiva analytiikka 
•Millä ohjelmistoilla ennakoiva analytiikka onnistuu ja millä ei? 
–Onnistuu: RapidMiner, SAS, SPSS, MS analysis services, R, AnyLogic.. 
–Ei onnistu: IBM Cognos, Qlikview, Business Objects, MS reporting services, Tableau, Oracle OBIEE… 
•Vinkki: Jos myyntimies vakuuttaa, että heidän softa tekee ennakoivaa analytiikkaa, niin kysy mm. seuraavien ennustemenetelmien sisältymisestä ohjelmistoon: 
–Luokittelumuuttujille - naive bayes, neuroverkko, logistinen regressio, päätöspuut.. 
–Jatkuville muuttujille - erilaiset regressioanalyysit, neuroverkot.. 
•Jos ei löydy, niin kyseessä lienee raportointiohjelmisto. 
•Milloin kannattaisi investoida ennakoivaan analytiikkaan? 
–Silloin kun sinulla on edellytyksiä hyödyntää tuloksia, esim. 
•Voit toteuttaa ennakoivan huollon ennen laitteen vikaantumista 
•Voit torjua asiakaspoistumaa tai ostoskorin hylkäämistä aktiivisilla toimenpiteillä 
•Kykenet kohdistettuun myyntiin ja markkinointiin.. 
8.12.2014 
39 
Muokattu lähteestä: [Laukkanen]
Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 
8.12.2014 
40
Hakukoneoptimointi 
•Esimerkkejä analytiikkatyökaluista hakukoneoptimointiin 
–Google Analytics 
–Google Webmaster Tools 
–ClickHeat 
–ks. esim. Konsepton blogi (Paltamaa 2010) 
8.12.2014 
41
Sosiaalisen median analytiikka esimerkki 
8.12.2014 
42 
Impressions 
-number of times users saw the Tweet on Twitter 
Engagements 
-number of times users have interacted with a Tweet, e.g. clicks, retweets, replies…
Myynti ja web-analytiikka 
8.12.2014 
43 
Prospektit 
Suspektit 
Liidit 
Liidit 
Liidit 
Awareness 
Interest 
Desire 
Action 
Impressions 
Bounce rate 
Engagements 
Shopping area traction 
Shopping cart actions 
Payments 
Repeat visits 
Asiakkaat 
Satisfaction 
Recommendations
Starbucks hinnoittelun korjaaminen twiittien perusteella 
8.12.2014 
44 
Lähde: [Kaisler 2014] Introduction to Big Data 
•Huoli siitä kuinka asiakkaat pitävät uuden kahvituotteen mausta 
•Seurattiin sosiaalista mediaa 
•Maku oli hyvä, mutta hinta oli liian suuri 
•Hinta laskettiin saman päivän aikana
Linkkejä lisätietoon 
8.12.2014 
45 
Twitter: @Noviresearch ja @tietojohtaminen 
Novi tutkimuskeskuksen kotisivut: https://www.tut.fi/novi/ 
Slideshare: http://www.slideshare.net/Noviresearch 
YouTube: http://youtube.com/noviresearch

More Related Content

What's hot

Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Mika Aho
 
Eväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenEväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenMika Aho
 
Lean startup - lyhyt johdanto
Lean startup - lyhyt johdantoLean startup - lyhyt johdanto
Lean startup - lyhyt johdantoJukka Huhtamäki
 
Visualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötVisualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötMika Aho
 
Data analytiikkakoulutus pk-yrityksille
Data analytiikkakoulutus pk-yrityksilleData analytiikkakoulutus pk-yrityksille
Data analytiikkakoulutus pk-yrityksilleMika Aho
 
Excel 2013 Power BI -seminaari
Excel 2013 Power BI -seminaariExcel 2013 Power BI -seminaari
Excel 2013 Power BI -seminaariSovelto
 
HR-analytiikka - ilmiöistä käytäntöön
HR-analytiikka - ilmiöistä käytäntöönHR-analytiikka - ilmiöistä käytäntöön
HR-analytiikka - ilmiöistä käytäntöönSilta
 
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?Mika Aho
 
Data analytiikan opas pk-yrityksille 2.0
Data analytiikan opas pk-yrityksille 2.0Data analytiikan opas pk-yrityksille 2.0
Data analytiikan opas pk-yrityksille 2.0HAMK Design Factory
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...ivoriofinland
 
Citizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaCitizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaAffecto
 
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014ivoriofinland
 
Kevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanKevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanJukka Huhtamäki
 
Profittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaProfittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaivoriofinland
 
Kevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanKevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanJukka Huhtamäki
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014ivoriofinland
 
Big data esitys, 14.11.2013, Ivorio Oy
Big data  esitys, 14.11.2013, Ivorio OyBig data  esitys, 14.11.2013, Ivorio Oy
Big data esitys, 14.11.2013, Ivorio Oyivoriofinland
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorioivoriofinland
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master DatanLoihde Advisory
 
Big data tietoisku julkishallinnolle 2.10.2013
Big data  tietoisku julkishallinnolle 2.10.2013Big data  tietoisku julkishallinnolle 2.10.2013
Big data tietoisku julkishallinnolle 2.10.2013ivoriofinland
 

What's hot (20)

Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
 
Eväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseenEväitä edistyneen analytiikan hyödyntämiseen
Eväitä edistyneen analytiikan hyödyntämiseen
 
Lean startup - lyhyt johdanto
Lean startup - lyhyt johdantoLean startup - lyhyt johdanto
Lean startup - lyhyt johdanto
 
Visualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötVisualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännöt
 
Data analytiikkakoulutus pk-yrityksille
Data analytiikkakoulutus pk-yrityksilleData analytiikkakoulutus pk-yrityksille
Data analytiikkakoulutus pk-yrityksille
 
Excel 2013 Power BI -seminaari
Excel 2013 Power BI -seminaariExcel 2013 Power BI -seminaari
Excel 2013 Power BI -seminaari
 
HR-analytiikka - ilmiöistä käytäntöön
HR-analytiikka - ilmiöistä käytäntöönHR-analytiikka - ilmiöistä käytäntöön
HR-analytiikka - ilmiöistä käytäntöön
 
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?
Tietokulttuuri - Miten data-ohjautunut kulttuuri muodostuu organisaatioon?
 
Data analytiikan opas pk-yrityksille 2.0
Data analytiikan opas pk-yrityksille 2.0Data analytiikan opas pk-yrityksille 2.0
Data analytiikan opas pk-yrityksille 2.0
 
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...Big data   liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
Big data liiketoiminnan johtamiseen tarvitaan tietoa, Microsoft-tilaisuus 1...
 
Citizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoaCitizen data science muuttaa julkishallintoa
Citizen data science muuttaa julkishallintoa
 
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
My Data -selvitys, Liikenne- ja viestintäministeriö (LVM), 09-2014
 
Kevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanKevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaan
 
Profittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaProfittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datasta
 
Kevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaanKevyitä lähtöjä data-analytiikkaan
Kevyitä lähtöjä data-analytiikkaan
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014
 
Big data esitys, 14.11.2013, Ivorio Oy
Big data  esitys, 14.11.2013, Ivorio OyBig data  esitys, 14.11.2013, Ivorio Oy
Big data esitys, 14.11.2013, Ivorio Oy
 
Pilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, IvorioPilvi ja big data 3.10.2013, Ivorio
Pilvi ja big data 3.10.2013, Ivorio
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master Datan
 
Big data tietoisku julkishallinnolle 2.10.2013
Big data  tietoisku julkishallinnolle 2.10.2013Big data  tietoisku julkishallinnolle 2.10.2013
Big data tietoisku julkishallinnolle 2.10.2013
 

Viewers also liked

Web-analytiikka ja digitaalisen markkinoinnin mittarit
Web-analytiikka ja digitaalisen markkinoinnin mittaritWeb-analytiikka ja digitaalisen markkinoinnin mittarit
Web-analytiikka ja digitaalisen markkinoinnin mittaritJoni Salminen
 
Nitro - Analytiikan hyödyntäminen markkinoinnissa
Nitro - Analytiikan hyödyntäminen markkinoinnissaNitro - Analytiikan hyödyntäminen markkinoinnissa
Nitro - Analytiikan hyödyntäminen markkinoinnissaSami Puutio
 
Analytiikka ja tiedolla johtaminen markkinoinnissa - Dagmar
Analytiikka ja tiedolla johtaminen markkinoinnissa - DagmarAnalytiikka ja tiedolla johtaminen markkinoinnissa - Dagmar
Analytiikka ja tiedolla johtaminen markkinoinnissa - DagmarDagmar
 
How has the internet transformed marketing
How has the internet transformed marketingHow has the internet transformed marketing
How has the internet transformed marketingJoni Salminen
 
Big data mita se on 10 casea
Big data mita se on 10 caseaBig data mita se on 10 casea
Big data mita se on 10 caseaASML
 
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)Joni Salminen
 
Digitaalisen markkinoinnin perusteet
Digitaalisen markkinoinnin perusteetDigitaalisen markkinoinnin perusteet
Digitaalisen markkinoinnin perusteetJoni Salminen
 

Viewers also liked (9)

Web-analytiikka ja digitaalisen markkinoinnin mittarit
Web-analytiikka ja digitaalisen markkinoinnin mittaritWeb-analytiikka ja digitaalisen markkinoinnin mittarit
Web-analytiikka ja digitaalisen markkinoinnin mittarit
 
Elinkeinoelämän EU-vaaliviestit visualisoituna
Elinkeinoelämän EU-vaaliviestit visualisoitunaElinkeinoelämän EU-vaaliviestit visualisoituna
Elinkeinoelämän EU-vaaliviestit visualisoituna
 
Digitalisaation edelläkävijät Suomessa
Digitalisaation edelläkävijät Suomessa Digitalisaation edelläkävijät Suomessa
Digitalisaation edelläkävijät Suomessa
 
Nitro - Analytiikan hyödyntäminen markkinoinnissa
Nitro - Analytiikan hyödyntäminen markkinoinnissaNitro - Analytiikan hyödyntäminen markkinoinnissa
Nitro - Analytiikan hyödyntäminen markkinoinnissa
 
Analytiikka ja tiedolla johtaminen markkinoinnissa - Dagmar
Analytiikka ja tiedolla johtaminen markkinoinnissa - DagmarAnalytiikka ja tiedolla johtaminen markkinoinnissa - Dagmar
Analytiikka ja tiedolla johtaminen markkinoinnissa - Dagmar
 
How has the internet transformed marketing
How has the internet transformed marketingHow has the internet transformed marketing
How has the internet transformed marketing
 
Big data mita se on 10 casea
Big data mita se on 10 caseaBig data mita se on 10 casea
Big data mita se on 10 casea
 
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)
Digitaalinen analytiikka (MA23 Digitaalinen markkinointi)
 
Digitaalisen markkinoinnin perusteet
Digitaalisen markkinoinnin perusteetDigitaalisen markkinoinnin perusteet
Digitaalisen markkinoinnin perusteet
 

Similar to Analytiikka toiminnan kehittämisessä

Tiedolla johtaminen tänään ja huomenna
Tiedolla johtaminen  tänään ja huomennaTiedolla johtaminen  tänään ja huomenna
Tiedolla johtaminen tänään ja huomennaHarri Kulmala
 
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissa
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissaTietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissa
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissaMika Aho
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Tilastokeskus
 
Markkinointijohdon ryhmä vierailulla 31012012
Markkinointijohdon ryhmä vierailulla 31012012Markkinointijohdon ryhmä vierailulla 31012012
Markkinointijohdon ryhmä vierailulla 31012012Pekka Eloholma
 
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Timo Halima
 
Asiakastietojen hallinta ja ylläpito
Asiakastietojen hallinta ja ylläpitoAsiakastietojen hallinta ja ylläpito
Asiakastietojen hallinta ja ylläpitoMarko Ruusinen
 
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnitteluSpartaConsulting
 
Väikkärin kootut tulokset, osa 1
Väikkärin kootut tulokset, osa 1Väikkärin kootut tulokset, osa 1
Väikkärin kootut tulokset, osa 1Mika Aho
 
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)TietRa-projekti (Tietotyöratkaisujen ekosysteemi)
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)Leena Kanerva
 
Digimarkkinoinnin seminaari-kovala-31-3-2017
Digimarkkinoinnin seminaari-kovala-31-3-2017Digimarkkinoinnin seminaari-kovala-31-3-2017
Digimarkkinoinnin seminaari-kovala-31-3-2017Timo Kovala
 
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?IMS Business Solutions Oy
 
Suorituskyvyn johtaminen
Suorituskyvyn johtaminenSuorituskyvyn johtaminen
Suorituskyvyn johtaminenMika Aho
 
Millä tasolla organisaationne suorituskyvyn johtaminen on?
Millä tasolla organisaationne suorituskyvyn johtaminen on?Millä tasolla organisaationne suorituskyvyn johtaminen on?
Millä tasolla organisaationne suorituskyvyn johtaminen on?Mika Aho
 
SOLITA Data visualisointi ja dashboard suunnittelu webinaari 2017
SOLITA Data visualisointi ja dashboard suunnittelu  webinaari 2017SOLITA Data visualisointi ja dashboard suunnittelu  webinaari 2017
SOLITA Data visualisointi ja dashboard suunnittelu webinaari 2017Aino Tuominen
 
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajana
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajanaAnalytiikka suomalaisyritysten asiakasymmärryksen kasvattajana
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajanaInstanssi Oy
 

Similar to Analytiikka toiminnan kehittämisessä (20)

Tiedolla johtaminen tänään ja huomenna
Tiedolla johtaminen  tänään ja huomennaTiedolla johtaminen  tänään ja huomenna
Tiedolla johtaminen tänään ja huomenna
 
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissa
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissaTietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissa
Tietopohjaisen suorituskyvyn johtamisen kehittyminen organisaatioissa
 
Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas Kärkihankkeen esittely, Taru Rastas
Kärkihankkeen esittely, Taru Rastas
 
Markkinointijohdon ryhmä vierailulla 31012012
Markkinointijohdon ryhmä vierailulla 31012012Markkinointijohdon ryhmä vierailulla 31012012
Markkinointijohdon ryhmä vierailulla 31012012
 
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
 
Asiakastietojen hallinta ja ylläpito
Asiakastietojen hallinta ja ylläpitoAsiakastietojen hallinta ja ylläpito
Asiakastietojen hallinta ja ylläpito
 
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu
3. Ydintiedon hallinnan LT perusteet ja kehittämisen suunnittelu
 
Väikkärin kootut tulokset, osa 1
Väikkärin kootut tulokset, osa 1Väikkärin kootut tulokset, osa 1
Väikkärin kootut tulokset, osa 1
 
Dynamics 365 : Accountor Enterprise Solutions:
Dynamics 365 : Accountor Enterprise Solutions:Dynamics 365 : Accountor Enterprise Solutions:
Dynamics 365 : Accountor Enterprise Solutions:
 
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)TietRa-projekti (Tietotyöratkaisujen ekosysteemi)
TietRa-projekti (Tietotyöratkaisujen ekosysteemi)
 
Digimarkkinoinnin seminaari-kovala-31-3-2017
Digimarkkinoinnin seminaari-kovala-31-3-2017Digimarkkinoinnin seminaari-kovala-31-3-2017
Digimarkkinoinnin seminaari-kovala-31-3-2017
 
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?
Miten kuvaat ja kehität organisaation kokonaisarkkitehtuuria?
 
Suorituskyvyn johtaminen
Suorituskyvyn johtaminenSuorituskyvyn johtaminen
Suorituskyvyn johtaminen
 
Millä tasolla organisaationne suorituskyvyn johtaminen on?
Millä tasolla organisaationne suorituskyvyn johtaminen on?Millä tasolla organisaationne suorituskyvyn johtaminen on?
Millä tasolla organisaationne suorituskyvyn johtaminen on?
 
Mobiilistrategia
MobiilistrategiaMobiilistrategia
Mobiilistrategia
 
Data X Dashboard
Data X DashboardData X Dashboard
Data X Dashboard
 
ICT PK-Yrityksessä
ICT PK-YrityksessäICT PK-Yrityksessä
ICT PK-Yrityksessä
 
SOLITA Data visualisointi ja dashboard suunnittelu webinaari 2017
SOLITA Data visualisointi ja dashboard suunnittelu  webinaari 2017SOLITA Data visualisointi ja dashboard suunnittelu  webinaari 2017
SOLITA Data visualisointi ja dashboard suunnittelu webinaari 2017
 
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajana
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajanaAnalytiikka suomalaisyritysten asiakasymmärryksen kasvattajana
Analytiikka suomalaisyritysten asiakasymmärryksen kasvattajana
 
koulutusmateriaali1.pptx
koulutusmateriaali1.pptxkoulutusmateriaali1.pptx
koulutusmateriaali1.pptx
 

More from Jari Jussila

Open Data and Standard APIs
Open Data and Standard APIsOpen Data and Standard APIs
Open Data and Standard APIsJari Jussila
 
Tutkimuksen tekeminen näkyväksi
Tutkimuksen tekeminen näkyväksiTutkimuksen tekeminen näkyväksi
Tutkimuksen tekeminen näkyväksiJari Jussila
 
HAMK Design Factory and Product Development Project 21
HAMK Design Factory and Product Development Project 21HAMK Design Factory and Product Development Project 21
HAMK Design Factory and Product Development Project 21Jari Jussila
 
Social media and online communities
Social media and online communitiesSocial media and online communities
Social media and online communitiesJari Jussila
 
Hamk Design Factory opening
Hamk Design Factory openingHamk Design Factory opening
Hamk Design Factory openingJari Jussila
 
Cognitive computing approaches for human activity recognition
Cognitive computing approaches for human activity recognitionCognitive computing approaches for human activity recognition
Cognitive computing approaches for human activity recognitionJari Jussila
 
Social media analysis and document based research
Social media analysis and document based researchSocial media analysis and document based research
Social media analysis and document based researchJari Jussila
 
Social media impact after publishing
Social media impact after publishingSocial media impact after publishing
Social media impact after publishingJari Jussila
 
Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Jari Jussila
 
Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Jari Jussila
 
Literature review on customer emotions in social media
Literature review on customer emotions in social mediaLiterature review on customer emotions in social media
Literature review on customer emotions in social mediaJari Jussila
 
SAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiSAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiJari Jussila
 
Deeva project introduction
Deeva project introductionDeeva project introduction
Deeva project introductionJari Jussila
 
Digitaalinen arvonluonti - tunneympyräsovellus
Digitaalinen arvonluonti -  tunneympyräsovellusDigitaalinen arvonluonti -  tunneympyräsovellus
Digitaalinen arvonluonti - tunneympyräsovellusJari Jussila
 
Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Jari Jussila
 
A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes Jari Jussila
 
Big social data analytics - social network analysis
Big social data analytics - social network analysis Big social data analytics - social network analysis
Big social data analytics - social network analysis Jari Jussila
 
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Jari Jussila
 
Computational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workComputational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workJari Jussila
 
Someanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaSomeanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaJari Jussila
 

More from Jari Jussila (20)

Open Data and Standard APIs
Open Data and Standard APIsOpen Data and Standard APIs
Open Data and Standard APIs
 
Tutkimuksen tekeminen näkyväksi
Tutkimuksen tekeminen näkyväksiTutkimuksen tekeminen näkyväksi
Tutkimuksen tekeminen näkyväksi
 
HAMK Design Factory and Product Development Project 21
HAMK Design Factory and Product Development Project 21HAMK Design Factory and Product Development Project 21
HAMK Design Factory and Product Development Project 21
 
Social media and online communities
Social media and online communitiesSocial media and online communities
Social media and online communities
 
Hamk Design Factory opening
Hamk Design Factory openingHamk Design Factory opening
Hamk Design Factory opening
 
Cognitive computing approaches for human activity recognition
Cognitive computing approaches for human activity recognitionCognitive computing approaches for human activity recognition
Cognitive computing approaches for human activity recognition
 
Social media analysis and document based research
Social media analysis and document based researchSocial media analysis and document based research
Social media analysis and document based research
 
Social media impact after publishing
Social media impact after publishingSocial media impact after publishing
Social media impact after publishing
 
Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...Towards ecosystem for research and development of electrodermal activity appl...
Towards ecosystem for research and development of electrodermal activity appl...
 
Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...Visualising maritime vessel open data for better situational awareness in ice...
Visualising maritime vessel open data for better situational awareness in ice...
 
Literature review on customer emotions in social media
Literature review on customer emotions in social mediaLiterature review on customer emotions in social media
Literature review on customer emotions in social media
 
SAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-FoorumiSAPSyke Hackathon Y-Foorumi
SAPSyke Hackathon Y-Foorumi
 
Deeva project introduction
Deeva project introductionDeeva project introduction
Deeva project introduction
 
Digitaalinen arvonluonti - tunneympyräsovellus
Digitaalinen arvonluonti -  tunneympyräsovellusDigitaalinen arvonluonti -  tunneympyräsovellus
Digitaalinen arvonluonti - tunneympyräsovellus
 
Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...Application for pre-processing and visualization of electrodermal activity we...
Application for pre-processing and visualization of electrodermal activity we...
 
A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes A bibliometric study on authorship trends and research themes
A bibliometric study on authorship trends and research themes
 
Big social data analytics - social network analysis
Big social data analytics - social network analysis Big social data analytics - social network analysis
Big social data analytics - social network analysis
 
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
Rakennetun ympäristön sähköinen asiointipalvelu kuntien tiedolla johtamis...
 
Computational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge workComputational methods for intelligent matchmaking for knowledge work
Computational methods for intelligent matchmaking for knowledge work
 
Someanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassaSomeanalytiikan hyödyntäminen liiketoiminnassa
Someanalytiikan hyödyntäminen liiketoiminnassa
 

Analytiikka toiminnan kehittämisessä

  • 1. Analytiikka toiminnan kehittämisessä Jari Jussila Novi tutkimuskeskus Data-analytiikka PK-yritysten toiminnan kehittämisessä 4.12.2014
  • 2. Johdanto •Big Datan ja analytiikkamaailman käsitteiden läpikäyminen •Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat •Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 8.12.2014 2
  • 3. Big datan ja analytiikkamaailman käsitteet 8.12.2014 3
  • 4. Päätöksenteon tukijärjestelmät ja johdon tietojärjestelmät ”1970-1990” 8.12.2014 4 vrt. erilaiset johdon työpöydät, kuten markkinoinnin työpöytä Vierailut Toiminnot sivustolla Liidit Mahdollisuudet Voitot Metriikka Tavoitteen saavuttaminen 64 % 51 % 70 % 29 % 35 % Myyntisuppilo Lähde: erilaisia esimerkkejä nähtävillä esim. Klipfolion sivuilla (ks. Dashboards); ks. myös Visualisointi ja tiedon jakamisen käytännöt (Aho 2014)
  • 5. Kuutioiden mallinnus - OLAP (online analytical processing) 8.12.2014 5 Tuote Aika Markkinat image Athanasios Kastanidis ”1980-1990”
  • 6. OLAP-kuutioiden perusidea •OLAP-tekniikka poikkeaa perinteisestä tilastoinnista ja raportoinnista siten, että käyttäjä voi vaihtaa näkökulmaa tiedontarpeensa mukaan. •Esimerkiksi analyytikko voi lähteä 1) tarkastelemaan tuoteryhmien myyntiä maittain, 2) filtteröidä aineisto tiettyihin maihin 3) joista löytää jotain esimerkiksi myyntitavoitteista poikkeavaa. Tämän jälkeen 4) porautua esimerkiksi myyntiin tietyissä kaupungeissa. 5) Vaihtaa näkökulmaa liikevoittoon tuoteryhmittäin, jne. 8.12.2014 6 ”1980-1990”
  • 7. Liiketoimintatiedon hallinnan ulottuvuudet 8.12.2014 7 Organisaation sisäinen Organisaation ulkoinen TIEDON KOHDE Määrällinen Laadullinen TIEDON TYYPPI Organisaation sisäinen Organisaation ulkoinen TIEDON LÄHDE Lähde: [Hannula 2005]; image Athanasios Kastanidis ”1989-2005”
  • 8. Tiedon arvoketju liiketoimintatiedon hallinnan näkökulmasta 8.12.2014 8 Lähde: [Myllärniemi 2012]
  • 9. Minkälaista tietoa tarvitaan? Tieto, joka on pystytty hankkimaan Tieto, joka todella tarvitaan Tieto, joka määritellään tarpeelliseksi 8.12.2014 9 Lähde: [Hannula 2005]
  • 10. Liiketoimintatiedon hallinnan prosessimalli ja keskeiset tehtävät 8.12.2014 10 Lähde: Tietojohtaminen [Laihonen et al. 2013]
  • 11. Tiedonlouhinta, data mining, knowledge discovery in databases (KDD) ”1990-2007” 8.12.2014 11 10-20 % 20-30 % 50-70 % 10-20 % 10-20 % 5-10 % 1. Liiketoiminnan ymmärtäminen 2. Datan ymmärtäminen 3. Datan valmistelu 3. Mallinnus, tiedonlouhinta 5. Arviointi 6. Tulosten julkaisu Lähde: The CRISP-DM Model [Shearer 2000], [Aho 2014]
  • 12. CRISP-DM referenssimalli CRISP-DM referenssimallin tehtävät Liiketoiminnan ymmärtäminen Datan ymmärtäminen Datan valmistelu Mallinnus, tiedonlouhinta Arviointi Tulosten julkaisu Määritä liiketoiminnan tavoitteet Tee tilannearvio Määritä tiedonlouhinnan tavoitteet Laadi projektisuunnitelma Kerää alustava data Kuvaa data Tutki dataa Varmista datan laatu Datasetin kuvaus Datan valinta Datan siivous Datan rakentaminen Datan integrointi Datan formatointi Valitse mallinnus menetelmä Suunnittele koe Rakenna malli Arvioi mallia Arvioi tuloksia Arvioi ja varmista tiedonlouhintaprosessin laatu Määrittele seuraavat stepit Suunnittele mallin julkaisu (esim. verkkosivuna) asiakkaalle Suunnittele mallin ylläpito Laadi loppuraportti Arvioi projekti 8.12.2014 12 Lähde: The CRISP-DM Model [Shearer 2000]
  • 13. Analytiikka ”2005-2010” •Deskriptiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää dataa ja analysoida liiketoiminnan suoriutumiskykyä •Diagnostiivinen analytiikka: tekniikoita joiden avulla voidaan ymmärtää mitä on tapahtunut ja miksi •Prediktiivinen analytiikka: tekniikoita joiden avulla voidaan analysoida nyky- ja historiatietoa jotta voidaan päätellä mitä todennäköisesti tapahtuu tai ei tapahdu •Preskriptiivinen analytiikka: tekniikoita joiden avulla voidaan laskennallisesti kehittää ja analysoida vaihtoehtoja organisaation toiminnalle •Päätöksentekoa tukeva analytiikka: tekniikoita joiden avulla voidaan visualisoida informaatiota päätöksen teon tueksi 8.12.2014 13 Lähde: Big Data and Analytics [Kaisler et al. 2014]
  • 14. Analytiikkasykli 1.Määrittele liiketoimintaongelma tai kysymys johon haluat vastauksen 2.Tunnista, kerää, siivoa ja valmistele data kysymyksen vastausta varten 3.Deskriptiivinen analytiikka –Perehdy dataan (descriptives, correlations, factor analysis, cluster analysis, ym.) –Luo mahdollisia hypoteeseja (data mining ym.) 4.Prediktiivinen analytiikka –Muodosta hypoteesit –Tunnista soveltuvimmat analytiikkamenetelmät –Kehitä analyyttiset mallit (multivariate regression, logistic regression, forecasting, non-linear models, decision trees, ym.) –Aja mallit ja luo ennusteet 5.Preskriptiivinen analytiikka –Kehitä päätös- ja optimointimallit –Hyödynnä koneoppimista päätöksien ohjelmointiin 6.Kirjoita johtopäätökset ja suositukset 8.12.2014 14 Lähde: Introduction to Big Data [Kaisler et al. 2014]
  • 15. Big Data ”2010-” 8.12.2014 15 Volyymi Vauhti Variaatio Varmuus Data at Rest Data in Motion Data in Many Forms Data in Doubt Terabittejä olemassa olevaa dataa prosessoitavaksi Striimattua dataa, nopea vasteaika millisekunneista sekunteihin Strukturoitua, ei- strukturoitua, ja semistrukturoitua dataa Epävarmuutta liittyen datan epätäydellisyyteen, puutteellisuuteen, tai virheellisyyteen Lähde: [Breuker 2014; Laney, Meta Group 2001 (3V:tä)]
  • 16. Big Data transaktioista interaktioihin 8.12.2014 16 WEB BIG DATA Lähde: mukaillen [Yli-Pietilä & Backman 2013; Valli & Ahlgren 2013] ERP CRM ostotiedot maksutiedot segmentointi tarjoustiedot asiakaskohtaamiset tukikontaktit weblogit tarjoushistoria A/B testaaminen Dynaaminen hinnoittelu Hakukonemarkkinointi ja optimointi Mainosverkostot Käyttäytymispohjainen kohdentaminen Dynaamiset funnellit Sentimentti Ulkopuolinen demografia Kuvat ja videot Puheen muuttaminen tekstiksi Feedit Anturi/sensoridata Tuote / palvelu logit SMS/MMS Sosiaaliset verkostot Sosiaalinen media Käyttäjien luoma sisältö Mobiilidata Klikkivirran analyysi Sijaintidata
  • 17. Datan lajeja Datan laji Muoto Volyymi Kuvaus Esimerkkejä Master Data Strukturoitu Matala Yritystason dataa jolla on strategista arvoa organisaatiolle Asiakas, tuote, toimittaja Transaktiodata Struktoroitu & semi- strukturoitu Keskinkertainen - korkea Transaktiot joita syntyy liiketoiminta-prosesseissa Tilaukset, ostot, maksut Referenssidata Struktoroitu & semi- strukturoitu Matala – keskin- kertainen Faktoja jotka tukevat organisaation kykyä tehokkaasti prosessoida transaktioita, hallita masterdataa ja tukea päätöksiä Demografiset kentät Metadata Strukturoitu Matala ”Dataa datasta” Datan nimi, datan dimensiot tai yksiköt, ym. Analytiikkadata Strukturoitu Keskinkertainen - korkea Liiketoimintaoperaatiosta tai transaktioista jalostettua tietoa raportoinnin ja analytiikan tarpeisiin Data joka sijaitsee tietovarastoissa ja päätöksenteon tukijärjestelmissä Big Data Struktoroitu, semi- strukturoitu ja ei strukturoitu Korkea Isoja data settejä, joita on haastava tallentaa, etsiä, jakaa, visualisoida ja analysoida Ihmisten ja koneiden luomaa dataa sosiaalisesta mediasta, webistä, mobiililaitteista, sensoreista, ym. 8.12.2014 17 Lähde: Big Data and Analytics [Kaisler et al. 2014]
  • 18. Master data •organisaation ydintieto on usein kaikkein tärkeintä liiketoiminnalle ja siinä menestymiselle sekä data-lähtöiselle päätöksenteolle •ydintietoa käytetään useissa yrityksen prosesseissa ja tietojärjestelmissä, joten ydintietojen muotojen standardointi ja arvojen synkronointi on kriittistä järjestelmien onnistuneelle integroinnille •ydintiedoksi mielletään usein esimerkiksi asiakastiedot ja tuotetiedot 8.12.2014 18 Lähde: [Vilminko-Heikkinen & Pekkola 2013]
  • 19. Datan käyttöön ja analysointiin liittyvää terminologiaa Termi Ajanjakso Kuvaus Päätöksenteon tuki [Decision Support] 1970-1985 Hyödynnetään data analyysiä tukemaan päätöksentekoa Johdon tukijärjestelmät [Executive Support Systems] 1980-1990 Fokus data analyysissä ylemmän johdon tueksi Kuutioiden mallinnus [Online Analytical Processing OLAP] 1990-2000 Ohjelmistoja multidimensionaalisten data taulujen analysointiin Liiketoimintatiedon hallinta [Business Intelligence] 1989-2005 Työkaluja tukemaan datalähtöistä päätöksentekoa, painopiste raportoinnissa Analytiikka [Analytics] 2005-2010 Fokus tilastollisessa ja matemaattisessa analyysissä päätöksenteon tueksi Massadata [Big Data] 2010- Fokus erittäin isossa, monimuotoisessa ja nopeasti liikkuvassa datassa 8.12.2014 19 Lähde: Big Data at Work [Davenport, 2014]
  • 20. Kuinka liiketoimintatiedon hallinta on muuttunut massadatan myötä? Massadata Business analytiikka Liiketoimintatiedon hallinta Vanhaa •Relaatiotietokannat •SQL •Tietovarastot •Tiedonlouhinta •Kvantitatiivinen analyysi •Tilastotiede •Operaatiotutkimus •Päätöksenteon tukijärjestelmät •Johdon tietojärjestelmät •OLAP Uutta •4V:tä •Monimuotoista dataa •Vähemmän struktuuria •Big Data teknologiat (MapReduce, Hadoop, NoSQL, ym.) •Ei strukturoitua dataa •Dataa monesta lähteestä •Monimuotoista dataa •Data liikkeessä •Tekstianalytiikka •Visuaalinen analytiikka •Sosiaalisen median analytiikka •Helppokäyttöisyys •Visuaalisuus •Dynaamisuus •Kattaa organisaation prosessit •Koneoppiminen •RTAP 8.12.2014 20 Lähde: mukailtu Introduction to Big Data [Kaisler et al. 2014]
  • 21. Big Data, data-analytiikka ja lähikäsitteet •Big Data can be defined as the amount of data just beyond technology’s capability to store, manage and process efficiently. (Kaisler et al. 2014) •Data analytics is the science of examining raw data with the purpose of drawing conclusions about that information. (Rouse 2008) •Business analytics is the scientific process of transforming data into insight for making better decisions (INFORMS) •Tiedonlouhinta (engl. data mining) on kokoelma menetelmiä, jotka valikoivat, kuvailevat ja mallintavat suuria tietomääriä tavoitteenaan löytää tiedon omistajalle uusia ja hyödyllisiä säännönmukaisuuksia ymmärrettävässä muodossa (Hand et al. 2001) •Business Intelligence refers to the technologies, applications, and processes for gathering, storing, accessing, and analyzing data to help its users make better decisions (Wixom and Watson, Teradata University Network 2012) 8.12.2014 21
  • 22. Ymmärrys Tiedon tasot 8.12.2014 22 Data Informaatio Tietämys Lähde: [Laihonen et al. 2013; Tuomi 1999; Thierauf 1999; Ackoff 1989]
  • 23. Tiedon tasot esimerkein avattuna 8.12.2014 23 Informaatio Data Tietämys Ymmärrys A X1 X2 1 1 300 2 0 159 … … … 100 1 501 A X1 X2 1 1 300 2 0 159 … … … 100 1 501 A = asiakasnumero X1 = sukupuoli (0=nainen, 1=mies) X2 = kk-ostot •”Meillä on tietokannassamme 100 asiakkuutta” •”85% asiakkaistamme on naisia” •”Keskimääräiset kk-ostot ovat 250€” •”Suurin osa asiakkaistamme on naisia, vaikka tuotteemme ovat suunnattu pääasiassa miehille -?!@%!” Lähde: [Väisänen 2011]
  • 24. Tiedonhallinnan tasot 8.12.2014 24 Innovoiva Erottuva Arkistoiva Mallinnus Visualisointi Ennustaminen Optimointi Raportointi ”Löytyisikö täältä jotain?” ”Tiedän mitä tarvitsen mutta haluan tehdä sen kilpailijoita paremmin" ”Tätä tarvitaan mutta tällä ei erotuta" Lähde: Informaatiosta kilpailuetua teollisuusyrityksiin [Valli & Ahlgren 2013] tieto, joka on tallennettava esimerkiksi määräysten perusteella tieto, jonka avulla voidaan edistää ja parantaa nykyistä liiketoimintaa tieto, jonka avulla voidaan innovoida uutta liiketoimintaa
  • 25. Lähteitä •Breuker, D. 2014. Towards Model-Driven Engineering for Big Data Analytics – An Exploratory Analysis of Domain- Specific Languages for Machine Learning. 47th Hawaii International Conference on System Sciences. •Davenport, T. H., Patil, D. J. 2012. Data Scientist. The Sexiest Job of the 21st Century. Harvard Business Review. October 2012. •Davenport, T. H. 2014. Big Data at Work: Dispelling the Myths, Uncovering the Opportunities. Harvard Business Review. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Introduction to Big Data. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Big Data and Analytics. Presented at HICSS-47, January 6, 2014, Waikoloa, Hawai’i. •Kaisler, S. H., Armour, F. J., Espinosa, A., Money, W. H. Advanced Analytics – Issues and Challenges in the Global Environment. 47th Hawaii International Conference on System Sciences. •Hannula, M. 2005. Tieto- ja liiketoiminta. Tekniset välineet ja sovellukset. Luento 23.10.2005. •Laihonen, H., Hannula, M; Helander, N; Ilvonen, I; Jussila, J; Kukko, M; Kärkkäinen, H; Lönnqvist, A; Myllärniemi, J; Pekkola, S; Virtanen, P; Vuori, V; Yliniemi, T. 2013. Tietojohtaminen. Laitosraportti. Tampereen teknillinen yliopisto. •Laney, D. 3D Data Management: Controlling Data Volume, Velocity and Variety. Gartner. Retrieved 6 February 2001. •Loukides, M. 2010. What is Data Science? O’ Reilly, Cambridge. http://www.kiwidatascience.it/wp- content/uploads/2013/05/What_Is_Data_Science_.pdf •Yli-Pietilä & Backman 2013. Management by analytics. Commercial and technical applications in the Big Data era. Teradata •Valli, K., Alhgren 2013. Informaatiosta kilpailuetua teollisuusyrityksiin. Teknologiateollisuus. http://www.teknologiateollisuus.fi/file/16270/Informaatiostakilpailuetua.pdf.html •Vilminko-Heikkinen, R., Pekkola, S. 2013. Establishing an Organization’s Master Data Management Function: A Step-wise Approach. 46th Hawaii International Conference on System Sciences. •Väisänen, J. 2011. Tiedonlouhinta. Luentomateriaali. 8.12.2014 25
  • 26. Toiminnan kehittämisen eri ulottuvuudet, mihin kaikkeen data ja analytiikka taipuvat 8.12.2014 26
  • 27. Raportoinnista operationaaliseen data-analytiikkaan 8.12.2014 27 Raportit RAPORTOIDAAN MITÄ tapahtui? ANALYSOIDAAN MIKSI se tapahtui? Ad hoc BI työkalut ENNUSTETAAN MITÄ TULEE tapahtumaan? Ennustavat mallit OPERATIONALISOIDAAN MITÄ ON tapahtumassa nyt? Linkki operatiivisiin järjestelmiin AKTIVOIDAAN PISTETÄÄN tapahtumaan Automaattiset linkitykset STRATEGINEN ÄLYKKYYS OPERATIONAALINEN ÄLYKKYYS Lähde: mukaillen [Yli-Pietilä & Backman 2013]
  • 28. Tiedonlouhinnan menetelmiä 8.12.2014 28 Suunnattu Ei-suunnattu Ad Hoc Strateginen suunnittelu Ennustaminen Segmentointi Klusterointi Visualisointi OLAP Neuroverkot Regressio Lähde: [Kudyba & Hoptroff, 2001; Väisänen, 2011]
  • 29. Klusterointi •Kuvailevaa tiedonlouhintaa / deskriptiivistä analytiikkaa •Tavoitteena klusteroida (luokitella) datamatriisin havainnot siten, että jokaisen klusterin sisällä olevat havainnot ovat mahdollisimman homogeenisia, ja jokainen klusteri mahdollisimman heterogeeninen muiden klusterien kanssa •Yleisiä käyttötarkoituksia –asiakkaiden segmentointi –myymälöiden ryhmittely menestyksen mukaan esimerkiksi kolmeen ryhmään: menestyjiin, keskinkertaisiin ja huonoihin [Niemijärvi 2013] 8.12.2014 29
  • 30. Esimerkki hierarkkisesta klusteroinnista 8.12.2014 30 Klusterien lukumäärä Klusterit 5 (1) (2) (3) (4) (5) 4 (1,2) (3) (4) (5) 3 (1,2) (3,4) (5) 2 (1,2) (3,4,5) 1 (1,2,3,4,5) 1 2 3 4 5 Lähde: [Väisänen, 2011]
  • 31. Assosiaatiosäännöt •Tarkoituksena löytää havaintoja, jotka esiintyvät yhdessä useammin kuin muut •Usein käytettyjä sovelluksia –Ostoskorianalyysi, engl. market basket analysis (MBA), ks. Esim. [Niemijärvi 2014]; [Ollikainen 2013] –Klikkivirran analyysi, engl. web clickstream analysis (WCA) [Paananen 2006] •Normaaleista tietokannoista poiketen assosiaatiosääntöjä tarkastellaan transaktio- ei asiakaspohjaisesti –MBA:ssa yksi datamatriisin rivi vastaa yhtä kassalla käyntiä –WCA:ssa yksi datamatriisin rivi vastaa yhtä vierailua verkkosivuille 8.12.2014 31
  • 32. Assosiaatiosäännöt •Assosiaatiosääntö on todennäköisyyteen perustuva lausuma tiettyjen tapahtumien samanaikaisesta tapahtumisesta: •JOS A=1 ja B=1, NIIN (tietyllä todennäköisyydellä p) C=1 •Todennäköisyys, että ostetaan tavara X, kun tavara Y on ostettu: X → Y •Esim. (Maito & Tee) → Keksejä (assosioaatiosääntö) •Säännön oikealla puolella yleensä vain yksi tekijä •Säännön vasemmalla puolella harvoin kolmea tekijää enempää (3. asteen sääntö) •Todennäköisyydet tavaroiden ostamiselle saadaan jakamalla ostotapahtumien esiintymistiheys kaikkien ostotapahtumien lukumäärällä 8.12.2014 32 Lähde: [Väisänen, 2011]
  • 33. •Tuki (”Support”) {A → B} = P(A ja B) –Todennäköisyys, että tuotteet A ja B löytyvät satunnaisesta ostoskorista. Jos 40% ostoksista sisältää sekä maitoa että leipää, tuki {maitoa→ leipää} = 0.4 •Symmetrinen, eli tuki {leipää → juustoa} = tuki {juustoa → leipää} •Jos tuki kovin alhainen, ei säännöllä välttämättä ole kovin suurta käytännön merkitystä •Luottamus (”Confidence”) {A → B} = tuki {A → B} / tuki {A} –Todennäköisyys, että satunnaisesta ostoskorista löytyy tuote B, jos siellä on tuote A –Jos 80 % ostoksista sisältää leipää, mutta vain 40 % sisältää sekä leipää että maitoa, luottamus {leipää → maitoa} = 0.4 / 0.8 = 0.5 –Luku ei välttämättä ole symmetrinen •Noste (”Lift”) {A → B} = luottamus {A → B} / tuki {B} –Normalisoitu luku, joka ilmaisee, kuinka paljon tuotteen A ostaminen vaikuttaa tuotteen B ostamiseen –Jos luottamus {leipää → maitoa} = 0.5 ja 40 % ostoksista sisältää maitoa, noste {leipää → maitoa} = 0.5 / 0.4 = 1.25 –Eli henkilöt, jotka ostelevat leipää, ostelevat 1.25-kertaisesti maitoa verrattuna koko porukkaan 8.12.2014 33 Assosiaatiosäännöt Lähde: [Väisänen, 2011]
  • 34. Regressio •Lineaarinen regressio auttaa ennustamaan toisen muuttujan arvoja toisen muuttujan arvoilla •Logistisen regression avulla voidaan selittää/ennustaa binääristä muuttujaa •Kuinka mallinnuksen avulla ennustetaan asiakkaan ostotodennäköisyys? [Ollikainen 2014] 8.12.2014 34
  • 35. Puumallit •Yhdistetään regressio ja klusterointi –Jaetaan havaintoja osajoukkoihin (klusterointi) tietyn ennustettavan muuttujan mukaan (regressio) •Käytetään usein asiakkaiden luokitteluun, kun tiedetään, minkä ominaisuuden mukaan halutaan luokitella –Puhelinoperaattorilla tiedossa, että 70 % asiakkaista maksaa laskunsa myöhässä, ja nyt halutaan tietää, keitä nämä ihmiset oikein ovat, ja miten voidaan ennustaa, maksaako uusi asiakas mahdollisesti laskunsa ajoissa –Asiakastiedoista valitaan ne muuttujat, joiden arvellaan olevan keskeisessä roolissa. Oletetaan, että seuraavat muuttujat voisivat vaikuttaa siihen, maksaako asiakas laskunsa ajoissa (0= ei maksa ajoissa, 1= maksaa ajoissa) 1.Keskimääräinen puhelimen käyttöaste (min/kk) 2.Ikä (1 = alle, 30v. 2 = yli 30v.) 3.Siviilisääty (1 = naimaton, 2 = naimisissa) 8.12.2014 35 Lähde: [Väisänen, 2011]
  • 36. 8.12.2014 36 •Puhelinoperaattoriesimerkki jatkuu… –Alussa meillä on kaikki havainnot (10 000) yhdessä, joista siis 3 000 maksaa laskunsa ajoissa –Puumalli jaottelee kaikki 10 000 havaintoa parhaiten kohdemuuttujaa (laskun ajoissa maksu) luokittelevalla muuttujalla 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 11.7% 460 0: 88.3% 3480 Yht. 100% 3940 1: 41.9% 2540 0: 58.1% 3520 Yht. 100% 6060 Ikä 2 1 Ikä (1 = alle, 30v. 2 = yli 30v.) Puumallit Lähde: [Väisänen, 2011]
  • 37. 8.12.2014 37 1: 30% 3000 0: 70% 7000 Yht. 100% 10000 1: 11.7% 460 0: 88.3% 3480 Yht. 100% 3940 1: 41.9% 2540 0: 58.1% 3520 Yht. 100% 6060 2 1 1: 67.1% 490 0: 32.9% 240 Yht. 100% 730 1: 38.5% 2050 0: 61.5% 3280 Yht. 100% 5330 1: 9.3% 310 0: 90.7% 3030 Yht. 100% 3340 1: 25.0% 150 0: 75.0% 450 Yht. 100% 600 Puh. käyttö Ikä Siviili- sääty 1 2 1 2 •Puhelinoperaattoriesimerkki jatkuu… •Lopullinen malli voi näyttää tältä Siviilisääty (1 = naimaton, 2 = naimisissa) Ikä (1 = alle, 30v. 2 = yli 30v.) Keskimääräinen puhelimen käyttöaste (1 = <300, 2 = >300 ) Puumallit Lähde: [Väisänen, 2011]
  • 38. Puumallit •Mitä saatiin selville? –91 % alle kolmekymppisistä naimattomista ei maksa laskuaan ajoissa –Ainoa ryhmä, joka maksaa laskunsa ennemmin ajoissa kuin myöhässä on yli kolmekymppiset alle 300min/kk puhujat –Ikä on silti tärkein kriteeri 8.12.2014 38 Lähde: [Väisänen, 2011]
  • 39. Ennakoiva analytiikka •Millä ohjelmistoilla ennakoiva analytiikka onnistuu ja millä ei? –Onnistuu: RapidMiner, SAS, SPSS, MS analysis services, R, AnyLogic.. –Ei onnistu: IBM Cognos, Qlikview, Business Objects, MS reporting services, Tableau, Oracle OBIEE… •Vinkki: Jos myyntimies vakuuttaa, että heidän softa tekee ennakoivaa analytiikkaa, niin kysy mm. seuraavien ennustemenetelmien sisältymisestä ohjelmistoon: –Luokittelumuuttujille - naive bayes, neuroverkko, logistinen regressio, päätöspuut.. –Jatkuville muuttujille - erilaiset regressioanalyysit, neuroverkot.. •Jos ei löydy, niin kyseessä lienee raportointiohjelmisto. •Milloin kannattaisi investoida ennakoivaan analytiikkaan? –Silloin kun sinulla on edellytyksiä hyödyntää tuloksia, esim. •Voit toteuttaa ennakoivan huollon ennen laitteen vikaantumista •Voit torjua asiakaspoistumaa tai ostoskorin hylkäämistä aktiivisilla toimenpiteillä •Kykenet kohdistettuun myyntiin ja markkinointiin.. 8.12.2014 39 Muokattu lähteestä: [Laukkanen]
  • 40. Analytiikka web-sivujen seurannassa, hakukoneoptimointi, sosiaalisen median hyödyntäminen toiminnan kehittämisessä ja asiakasanalyysissa 8.12.2014 40
  • 41. Hakukoneoptimointi •Esimerkkejä analytiikkatyökaluista hakukoneoptimointiin –Google Analytics –Google Webmaster Tools –ClickHeat –ks. esim. Konsepton blogi (Paltamaa 2010) 8.12.2014 41
  • 42. Sosiaalisen median analytiikka esimerkki 8.12.2014 42 Impressions -number of times users saw the Tweet on Twitter Engagements -number of times users have interacted with a Tweet, e.g. clicks, retweets, replies…
  • 43. Myynti ja web-analytiikka 8.12.2014 43 Prospektit Suspektit Liidit Liidit Liidit Awareness Interest Desire Action Impressions Bounce rate Engagements Shopping area traction Shopping cart actions Payments Repeat visits Asiakkaat Satisfaction Recommendations
  • 44. Starbucks hinnoittelun korjaaminen twiittien perusteella 8.12.2014 44 Lähde: [Kaisler 2014] Introduction to Big Data •Huoli siitä kuinka asiakkaat pitävät uuden kahvituotteen mausta •Seurattiin sosiaalista mediaa •Maku oli hyvä, mutta hinta oli liian suuri •Hinta laskettiin saman päivän aikana
  • 45. Linkkejä lisätietoon 8.12.2014 45 Twitter: @Noviresearch ja @tietojohtaminen Novi tutkimuskeskuksen kotisivut: https://www.tut.fi/novi/ Slideshare: http://www.slideshare.net/Noviresearch YouTube: http://youtube.com/noviresearch