SlideShare a Scribd company logo
1 of 24
Mitä Big Data on? 
Teknologianäkökulma 
Asko Relas
Hype
Erilaisia tulkintoja 
• Big Data ilmiönä 
– Tiedon määrän räjähdysmäinen kasvu 
• Big Data mahdollisuutena 
– Data, jonka tallentaminen ja analysointi ei aikaisemmin taloudellisesti kannattavaa 
• Big Data teknologiana 
– Uudet teknologiat haluavat erottautua perinteisistä kilpailijoista 
• Uusi termi vanhalle asialle 
– Edistyksellinen analytiikka, tai oikeastaan mikä tahansa analytiikka
Määritelmiä 
… kun data itsessään on osa ongelmaa 
Too big to fit on a server, too unstructured to fit into conventional 
databases, too fast-moving to be easily warehoused 
Big data is high-volume, -velocity and -variety information 
assets that demand cost-effective, innovative forms of 
information processing for enhanced insight and decision 
making.
Kolme dataan liittyvää haastetta 
• Volume 
– Tieto ei mahdu yhdelle palvelimelle, perinteiset relaatiokannat eivät skaalaudu 
• Velocity 
– Tietoa kyettävä prosessoimaan palveluväylän suorituskykyä nopeammin 
• Variety 
– Tieto ei rakenteista: vapaatekstiä, kuvia, ääntä, videota 
• Mikä on ratkaisu näille haasteille?
Ratkaisu 
Volume 
Velocity 
Variety 
Hadoop, NoSQL, NewSQL 
Koneoppiminen 
Storm 
Stream Computing
Hadoop, NoSQL, NewSQL 
Volume
Hadoop 
• Hadoop on tietokoneklusteri, joka koostuu kahdesta 
komponentista: 
– Hajautettu tiedostojärjestelmä HDFS 
• Suunniteltu kuluttajaraudalla ajettavaksi luotettavaksi 
tallennusmekanismiksi 
• Laitteiston hajoaminen huomioitu suunnittelussa 
– Java ohjelmointikehys tallennetun tiedon käsittelyyn 
(MapReduce) 
Volume
NoSQL tietokannat 
• No SQL? Not only SQL? 
• ~ Mikä tahansa paitsi relaatiotietokanta 
• Suunniteltu horisontaalisesti skaalautuvaksi 
• Joustava tietorakenne 
• Ei yhtä yleistä kyselykieltä 
• Ei relaatioita 
• Ei transaktioita 
• Ei noudata ACID-periaatetta 
•  Relaatiokantojen joistakin hyvistä ominaisuuksista luovuttu paremman suorituskyvyn 
vuoksi 
Volume
NoSQL tietokantojen eri tyyppejä 
• Avain-arvo-varastot (Key-Value store) 
• Sarakevarastot (Column store) 
• Dokumenttivarastot (Document store) 
• Verkkotietokannat (Graph database) 
Volume
NewSQL tietokannat 
• Uuden sukupolven relaatiotietokannat 
• Suunniteltu suurille web-sovelluksille: horisontaalinen 
skaalaus kuluttajaraudalla 
• Uskollisia ACID-periaatteelle 
• Usein muistipohjaisia 
Volume
Stream computing 
Velocity
App 1 
App 2 
App 1 App 2 
App 1 
App 2 
DB 1 DB 2 
Haaste 
Velocity 
Hajautettujen viestijonopohjaisten sovellusten ylläpito työlästä. 
Viestijonojen konfigurointi ja sovellusklusterien ylläpito vie työaikaa sovelluskehitykseltä.
Mitä on stream computing? 
“A high-performance computer system that analyzes multiple 
data streams from many sources, live” 
• “Reaaliaikaisen laskennan Hadoop” 
– Verkko viestijonoja ja viestejä käsitteleviä sovelluksia klusterissa 
– Klusterin konfiguraation hallinta tuotteen toimesta 
• Tuotteita: 
– Apache Storm 
– Yahoo! S4 
– IBM InfoSphere Streams 
Velocity
Koneoppiminen 
Variety
Mitä on koneoppiminen? 
Variety 
• “Field of study that gives computers the ability to learn without 
being explicitly programmed.” Arthur Samuel 1959 
• Tekoälyn osa-alue 
• Datasta oppivien järjestelmien suunnittelua ja rakentamista
Vapaamuotoisen tekstin analysointi 
Variety
Kuvien analysointi 
Variety
Videon analysointi 
Variety
Koneoppiminen: Työkaluja 
• Apache Mahout 
– Hadoopin päällä ajettavia koneoppimisalgoritmeja 
• Weka 
– Open source desktop-sovellus 
– Koneoppimisalgoritmeja ja visualisointityökaluja 
• IBM SPSS Modeler 
Variety 
– Kaupallinen desktop-sovellus 
– Drag and drop -editori, koneoppimisalgoritmeja, visualisointityökaluja
Haasteet taklattu 
Entä sitten?
Big Data -ratkaisun kerrokset 
Kuluttavat sovellukset 
Raportointi, visualisointi, monitorointisovellukset, räätälöidyt sovellukset... 
Analytiikkakerros 
Koneoppiminen, Suosittelut, Ennustavat mallit... 
Tallennuskerros 
RDBMS, MPP, DW, Hadoop, NoSQL, NewSQL... 
Datalähteet 
SoMe, lokit, sensorit, RDBMS ... 
Integraatiotyökalut 
Tietoturva 
Datanhallinta 
Stream 
computing
Big Data-ratkaisun toteuttaminen 
Kysy kysymys 
Mitä haluaisit tietää tai ennustaa jos 
sinulla olisi käytettävissä kaikki maailman data? 
Mikä on business case? 
Hanki data 
Mitä dataa tarvitaan ja mistä / miten se saadaan? 
Missä muodossa se on? 
Kuinka paljon sitä on? 
Kuinka usein se päivittyy? 
Business 
Määrittele 
arkkitehtuuri ja 
governance 
Mihin data tallennetaan? 
Data quality, security,… 
Data Scientist / Analyst 
IT Architect 
Muodosta 
analyysi 
Kuinka luotettavaa data on? 
Tutki ja visualisoi dataa 
Rakenna ja validoi malli / analyysi 
Integroi 
olemassa oleviin 
järjestelmiin 
Mitkä sovellukset käyttävät analyysin tulosta? 
Mihin järjestelmiin tulokset pitää ladata? 
Jalkauta 
operatiiviseen 
toimintaan 
Koulutus, tiedotus, …
Lisätietoja: 
asko.relas@talentbase.fi 
@AskoRelas

More Related Content

Viewers also liked (18)

El valiente jefe cobarde
El valiente jefe cobardeEl valiente jefe cobarde
El valiente jefe cobarde
 
Presentación11
Presentación11Presentación11
Presentación11
 
Experimento 6
Experimento 6Experimento 6
Experimento 6
 
Poster.Ppt
Poster.PptPoster.Ppt
Poster.Ppt
 
Studyguide
StudyguideStudyguide
Studyguide
 
werita
weritawerita
werita
 
lagos
lagoslagos
lagos
 
Ma 35100 pc-en-200_14
Ma 35100 pc-en-200_14Ma 35100 pc-en-200_14
Ma 35100 pc-en-200_14
 
Portfolio
PortfolioPortfolio
Portfolio
 
BAD PAINTING
BAD PAINTINGBAD PAINTING
BAD PAINTING
 
Diapositiva
DiapositivaDiapositiva
Diapositiva
 
Cob 20090812 2
Cob 20090812 2Cob 20090812 2
Cob 20090812 2
 
MIPO Model
MIPO ModelMIPO Model
MIPO Model
 
Plan de trabajo upnf
Plan de trabajo upnfPlan de trabajo upnf
Plan de trabajo upnf
 
PLAN DE ÁREA CIENCIAS SOCIALES, ADECUACIONES 2016
PLAN DE ÁREA CIENCIAS SOCIALES, ADECUACIONES 2016PLAN DE ÁREA CIENCIAS SOCIALES, ADECUACIONES 2016
PLAN DE ÁREA CIENCIAS SOCIALES, ADECUACIONES 2016
 
Sol lewitt infantil
Sol lewitt infantilSol lewitt infantil
Sol lewitt infantil
 
Habitats Digitais e Comunidades de Prática
Habitats Digitais e Comunidades de PráticaHabitats Digitais e Comunidades de Prática
Habitats Digitais e Comunidades de Prática
 
BAD PAINTING
BAD PAINTINGBAD PAINTING
BAD PAINTING
 

Similar to Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan

Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Bilot
 
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostusta
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostustaVincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostusta
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostustaVincitOy
 
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Management Institute of Finland MIF
 
Visualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötVisualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötMika Aho
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Mika Aho
 
Profittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaProfittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaivoriofinland
 
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...Accountor Enterprise Solutions Oy
 
Big Data -tilaisuus, 19.03.2013
Big Data -tilaisuus, 19.03.2013Big Data -tilaisuus, 19.03.2013
Big Data -tilaisuus, 19.03.2013ivoriofinland
 
Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläivoriofinland
 
Tiedolla johtaminen ja data analytiikan työkalut
Tiedolla johtaminen ja data analytiikan työkalutTiedolla johtaminen ja data analytiikan työkalut
Tiedolla johtaminen ja data analytiikan työkalutHAMK Design Factory
 
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Lari Hotari
 
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Digitalmikkeli
 
WOA: Web APIt
WOA: Web APItWOA: Web APIt
WOA: Web APItExove
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master DatanLoihde Advisory
 
Ostajan opas ohjelmistopohjaiseen tallennukseen
Ostajan opas ohjelmistopohjaiseen tallennukseenOstajan opas ohjelmistopohjaiseen tallennukseen
Ostajan opas ohjelmistopohjaiseen tallennukseenFinceptum Oy
 
Tiedon avaaminen käytännössa
Tiedon avaaminen käytännössaTiedon avaaminen käytännössa
Tiedon avaaminen käytännössassaarela
 
AgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenAgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenDigia Plc
 
KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013Kari Lehtomaa
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014ivoriofinland
 

Similar to Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan (20)

Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
Case Ruukki Constructions: Tehokas tiedon keräys, jalostaminen ja visualisoin...
 
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostusta
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostustaVincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostusta
Vincit Teatime 2015.2 - Aleksi Häkli: SaaSiin pa(i)nostusta
 
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
Uusi MIF -kiertue. Kai Lehtonen: IT –infrastruktuurin uudistaminen IaaS –pilv...
 
Visualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännötVisualisointi ja tiedon jakamisen käytännöt
Visualisointi ja tiedon jakamisen käytännöt
 
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
Prosessipäivät 2017 - Korvaako tekoäly perinteisen tietovaraston?
 
Profittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datastaProfittable.fi 20.03.2014, esitys big datasta
Profittable.fi 20.03.2014, esitys big datasta
 
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...
Microsoft Power BI -webinaarin materiaali 6.9.2018: Accountor Enterprise Solu...
 
Big Data -tilaisuus, 19.03.2013
Big Data -tilaisuus, 19.03.2013Big Data -tilaisuus, 19.03.2013
Big Data -tilaisuus, 19.03.2013
 
Big data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:lläBig data -tilaisuus, 19.03.2013 IBM:llä
Big data -tilaisuus, 19.03.2013 IBM:llä
 
Tiedolla johtaminen ja data analytiikan työkalut
Tiedolla johtaminen ja data analytiikan työkalutTiedolla johtaminen ja data analytiikan työkalut
Tiedolla johtaminen ja data analytiikan työkalut
 
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
Microservices - Palveluarkkitehtuurin uusi tuleminen - EMC Forum 2014
 
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
Datajalostamo-seminaari 5.6.2014: Sovelluskehittäjät ja data – kehittäjäyhtei...
 
Sp2013 mitä uutta_henrik
Sp2013 mitä uutta_henrikSp2013 mitä uutta_henrik
Sp2013 mitä uutta_henrik
 
WOA: Web APIt
WOA: Web APItWOA: Web APIt
WOA: Web APIt
 
Big Data kohtaa Master Datan
Big Data kohtaa Master DatanBig Data kohtaa Master Datan
Big Data kohtaa Master Datan
 
Ostajan opas ohjelmistopohjaiseen tallennukseen
Ostajan opas ohjelmistopohjaiseen tallennukseenOstajan opas ohjelmistopohjaiseen tallennukseen
Ostajan opas ohjelmistopohjaiseen tallennukseen
 
Tiedon avaaminen käytännössa
Tiedon avaaminen käytännössaTiedon avaaminen käytännössa
Tiedon avaaminen käytännössa
 
AgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti VartiainenAgileJKL Meetup 2016 - Antti Vartiainen
AgileJKL Meetup 2016 - Antti Vartiainen
 
KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013KLehtomaa_HAMK_loppuseminaari_31.10.2013
KLehtomaa_HAMK_loppuseminaari_31.10.2013
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014
 

More from Loihde Advisory

Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...
Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...
Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...Loihde Advisory
 
Gamebook for digital era – 4 cornerstones of success
Gamebook for digital era – 4 cornerstones of successGamebook for digital era – 4 cornerstones of success
Gamebook for digital era – 4 cornerstones of successLoihde Advisory
 
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019Loihde Advisory
 
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent Base
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent BaseDigitalisaation pelisuunnitelma – Tero Laatikainen, Talent Base
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent BaseLoihde Advisory
 
Tuija Riekkinen: Omnichannel Content Strategy
Tuija Riekkinen: Omnichannel Content StrategyTuija Riekkinen: Omnichannel Content Strategy
Tuija Riekkinen: Omnichannel Content StrategyLoihde Advisory
 
Asko Relas: Machine Learning for conversion optimization – How to be relevant...
Asko Relas: Machine Learning for conversion optimization – How to be relevant...Asko Relas: Machine Learning for conversion optimization – How to be relevant...
Asko Relas: Machine Learning for conversion optimization – How to be relevant...Loihde Advisory
 
Theresa Regli: Tame the chaos – image and video management for multi-channel...
Theresa Regli: Tame the chaos – image and video management  for multi-channel...Theresa Regli: Tame the chaos – image and video management  for multi-channel...
Theresa Regli: Tame the chaos – image and video management for multi-channel...Loihde Advisory
 
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...Loihde Advisory
 
Digitalisaation pelikirja – onnistumisen neljä kulmakiveä
Digitalisaation pelikirja – onnistumisen neljä kulmakiveäDigitalisaation pelikirja – onnistumisen neljä kulmakiveä
Digitalisaation pelikirja – onnistumisen neljä kulmakiveäLoihde Advisory
 
Tekoälystä puhutaan, mutta mitä se oikeastaan on?
Tekoälystä puhutaan, mutta mitä se oikeastaan on?Tekoälystä puhutaan, mutta mitä se oikeastaan on?
Tekoälystä puhutaan, mutta mitä se oikeastaan on?Loihde Advisory
 
Johdatus tietosuojakulttuuriin
Johdatus tietosuojakulttuuriinJohdatus tietosuojakulttuuriin
Johdatus tietosuojakulttuuriinLoihde Advisory
 
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseista
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseistaKäytännön kokemuksia tietosuojaan liittyvistä asiakascaseista
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseistaLoihde Advisory
 
Value of data in digital transformation
Value of data in digital transformationValue of data in digital transformation
Value of data in digital transformationLoihde Advisory
 
Valtio Expo 2016 virtuaalinen robotisointi
Valtio Expo 2016 virtuaalinen robotisointiValtio Expo 2016 virtuaalinen robotisointi
Valtio Expo 2016 virtuaalinen robotisointiLoihde Advisory
 
Talent Base Master Data Management Services
Talent Base Master Data Management ServicesTalent Base Master Data Management Services
Talent Base Master Data Management ServicesLoihde Advisory
 
Key Take-Aways: Master Data and Enterprise Information Conference
Key Take-Aways: Master Data and Enterprise Information ConferenceKey Take-Aways: Master Data and Enterprise Information Conference
Key Take-Aways: Master Data and Enterprise Information ConferenceLoihde Advisory
 
Master Data as Critical Success Factor in Digitalising Service Business
Master Data as Critical Success Factor in Digitalising Service BusinessMaster Data as Critical Success Factor in Digitalising Service Business
Master Data as Critical Success Factor in Digitalising Service BusinessLoihde Advisory
 
Customer Experience: more than meets the eye
Customer Experience: more than meets the eyeCustomer Experience: more than meets the eye
Customer Experience: more than meets the eyeLoihde Advisory
 
Process modeling in agile environment alec sharp
Process modeling in agile environment alec sharpProcess modeling in agile environment alec sharp
Process modeling in agile environment alec sharpLoihde Advisory
 

More from Loihde Advisory (20)

Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...
Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...
Talent Base ja Azets Suomi: Johtajuus ketterassä ja itseohjautuvassa organisa...
 
Gamebook for digital era – 4 cornerstones of success
Gamebook for digital era – 4 cornerstones of successGamebook for digital era – 4 cornerstones of success
Gamebook for digital era – 4 cornerstones of success
 
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019
Avaimet ketterään datan hallintaan -aamiaisseminaari 29.3.2019
 
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent Base
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent BaseDigitalisaation pelisuunnitelma – Tero Laatikainen, Talent Base
Digitalisaation pelisuunnitelma – Tero Laatikainen, Talent Base
 
Tuija Riekkinen: Omnichannel Content Strategy
Tuija Riekkinen: Omnichannel Content StrategyTuija Riekkinen: Omnichannel Content Strategy
Tuija Riekkinen: Omnichannel Content Strategy
 
Asko Relas: Machine Learning for conversion optimization – How to be relevant...
Asko Relas: Machine Learning for conversion optimization – How to be relevant...Asko Relas: Machine Learning for conversion optimization – How to be relevant...
Asko Relas: Machine Learning for conversion optimization – How to be relevant...
 
Theresa Regli: Tame the chaos – image and video management for multi-channel...
Theresa Regli: Tame the chaos – image and video management  for multi-channel...Theresa Regli: Tame the chaos – image and video management  for multi-channel...
Theresa Regli: Tame the chaos – image and video management for multi-channel...
 
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...
Reni Waegelein & Talent Base: Digitalisaation pelikirja – onnistumisen neljä ...
 
Digitalisaation pelikirja – onnistumisen neljä kulmakiveä
Digitalisaation pelikirja – onnistumisen neljä kulmakiveäDigitalisaation pelikirja – onnistumisen neljä kulmakiveä
Digitalisaation pelikirja – onnistumisen neljä kulmakiveä
 
Tekoälystä puhutaan, mutta mitä se oikeastaan on?
Tekoälystä puhutaan, mutta mitä se oikeastaan on?Tekoälystä puhutaan, mutta mitä se oikeastaan on?
Tekoälystä puhutaan, mutta mitä se oikeastaan on?
 
Johdatus tietosuojakulttuuriin
Johdatus tietosuojakulttuuriinJohdatus tietosuojakulttuuriin
Johdatus tietosuojakulttuuriin
 
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseista
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseistaKäytännön kokemuksia tietosuojaan liittyvistä asiakascaseista
Käytännön kokemuksia tietosuojaan liittyvistä asiakascaseista
 
Value of data in digital transformation
Value of data in digital transformationValue of data in digital transformation
Value of data in digital transformation
 
Valtio Expo 2016 virtuaalinen robotisointi
Valtio Expo 2016 virtuaalinen robotisointiValtio Expo 2016 virtuaalinen robotisointi
Valtio Expo 2016 virtuaalinen robotisointi
 
Talent Base Master Data Management Services
Talent Base Master Data Management ServicesTalent Base Master Data Management Services
Talent Base Master Data Management Services
 
Key Take-Aways: Master Data and Enterprise Information Conference
Key Take-Aways: Master Data and Enterprise Information ConferenceKey Take-Aways: Master Data and Enterprise Information Conference
Key Take-Aways: Master Data and Enterprise Information Conference
 
Master Data as Critical Success Factor in Digitalising Service Business
Master Data as Critical Success Factor in Digitalising Service BusinessMaster Data as Critical Success Factor in Digitalising Service Business
Master Data as Critical Success Factor in Digitalising Service Business
 
UX in eCom projects
UX in eCom projectsUX in eCom projects
UX in eCom projects
 
Customer Experience: more than meets the eye
Customer Experience: more than meets the eyeCustomer Experience: more than meets the eye
Customer Experience: more than meets the eye
 
Process modeling in agile environment alec sharp
Process modeling in agile environment alec sharpProcess modeling in agile environment alec sharp
Process modeling in agile environment alec sharp
 

Talent Base: Mitä on Big Data - teknologianäkökulma Big Datan hallintaan

  • 1. Mitä Big Data on? Teknologianäkökulma Asko Relas
  • 3. Erilaisia tulkintoja • Big Data ilmiönä – Tiedon määrän räjähdysmäinen kasvu • Big Data mahdollisuutena – Data, jonka tallentaminen ja analysointi ei aikaisemmin taloudellisesti kannattavaa • Big Data teknologiana – Uudet teknologiat haluavat erottautua perinteisistä kilpailijoista • Uusi termi vanhalle asialle – Edistyksellinen analytiikka, tai oikeastaan mikä tahansa analytiikka
  • 4. Määritelmiä … kun data itsessään on osa ongelmaa Too big to fit on a server, too unstructured to fit into conventional databases, too fast-moving to be easily warehoused Big data is high-volume, -velocity and -variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making.
  • 5. Kolme dataan liittyvää haastetta • Volume – Tieto ei mahdu yhdelle palvelimelle, perinteiset relaatiokannat eivät skaalaudu • Velocity – Tietoa kyettävä prosessoimaan palveluväylän suorituskykyä nopeammin • Variety – Tieto ei rakenteista: vapaatekstiä, kuvia, ääntä, videota • Mikä on ratkaisu näille haasteille?
  • 6. Ratkaisu Volume Velocity Variety Hadoop, NoSQL, NewSQL Koneoppiminen Storm Stream Computing
  • 8. Hadoop • Hadoop on tietokoneklusteri, joka koostuu kahdesta komponentista: – Hajautettu tiedostojärjestelmä HDFS • Suunniteltu kuluttajaraudalla ajettavaksi luotettavaksi tallennusmekanismiksi • Laitteiston hajoaminen huomioitu suunnittelussa – Java ohjelmointikehys tallennetun tiedon käsittelyyn (MapReduce) Volume
  • 9. NoSQL tietokannat • No SQL? Not only SQL? • ~ Mikä tahansa paitsi relaatiotietokanta • Suunniteltu horisontaalisesti skaalautuvaksi • Joustava tietorakenne • Ei yhtä yleistä kyselykieltä • Ei relaatioita • Ei transaktioita • Ei noudata ACID-periaatetta •  Relaatiokantojen joistakin hyvistä ominaisuuksista luovuttu paremman suorituskyvyn vuoksi Volume
  • 10. NoSQL tietokantojen eri tyyppejä • Avain-arvo-varastot (Key-Value store) • Sarakevarastot (Column store) • Dokumenttivarastot (Document store) • Verkkotietokannat (Graph database) Volume
  • 11. NewSQL tietokannat • Uuden sukupolven relaatiotietokannat • Suunniteltu suurille web-sovelluksille: horisontaalinen skaalaus kuluttajaraudalla • Uskollisia ACID-periaatteelle • Usein muistipohjaisia Volume
  • 13. App 1 App 2 App 1 App 2 App 1 App 2 DB 1 DB 2 Haaste Velocity Hajautettujen viestijonopohjaisten sovellusten ylläpito työlästä. Viestijonojen konfigurointi ja sovellusklusterien ylläpito vie työaikaa sovelluskehitykseltä.
  • 14. Mitä on stream computing? “A high-performance computer system that analyzes multiple data streams from many sources, live” • “Reaaliaikaisen laskennan Hadoop” – Verkko viestijonoja ja viestejä käsitteleviä sovelluksia klusterissa – Klusterin konfiguraation hallinta tuotteen toimesta • Tuotteita: – Apache Storm – Yahoo! S4 – IBM InfoSphere Streams Velocity
  • 16. Mitä on koneoppiminen? Variety • “Field of study that gives computers the ability to learn without being explicitly programmed.” Arthur Samuel 1959 • Tekoälyn osa-alue • Datasta oppivien järjestelmien suunnittelua ja rakentamista
  • 20. Koneoppiminen: Työkaluja • Apache Mahout – Hadoopin päällä ajettavia koneoppimisalgoritmeja • Weka – Open source desktop-sovellus – Koneoppimisalgoritmeja ja visualisointityökaluja • IBM SPSS Modeler Variety – Kaupallinen desktop-sovellus – Drag and drop -editori, koneoppimisalgoritmeja, visualisointityökaluja
  • 22. Big Data -ratkaisun kerrokset Kuluttavat sovellukset Raportointi, visualisointi, monitorointisovellukset, räätälöidyt sovellukset... Analytiikkakerros Koneoppiminen, Suosittelut, Ennustavat mallit... Tallennuskerros RDBMS, MPP, DW, Hadoop, NoSQL, NewSQL... Datalähteet SoMe, lokit, sensorit, RDBMS ... Integraatiotyökalut Tietoturva Datanhallinta Stream computing
  • 23. Big Data-ratkaisun toteuttaminen Kysy kysymys Mitä haluaisit tietää tai ennustaa jos sinulla olisi käytettävissä kaikki maailman data? Mikä on business case? Hanki data Mitä dataa tarvitaan ja mistä / miten se saadaan? Missä muodossa se on? Kuinka paljon sitä on? Kuinka usein se päivittyy? Business Määrittele arkkitehtuuri ja governance Mihin data tallennetaan? Data quality, security,… Data Scientist / Analyst IT Architect Muodosta analyysi Kuinka luotettavaa data on? Tutki ja visualisoi dataa Rakenna ja validoi malli / analyysi Integroi olemassa oleviin järjestelmiin Mitkä sovellukset käyttävät analyysin tulosta? Mihin järjestelmiin tulokset pitää ladata? Jalkauta operatiiviseen toimintaan Koulutus, tiedotus, …