SlideShare a Scribd company logo
1 of 33
Download to read offline
DATA-SUOMI-SANAKIRJA
Termiviidakon selviytymisopas
© Leisca Contents
YLEISTÄ DATASTA
Data ei ole IT:n synonyymi.
© Leisca Contents
”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!)
HEIKKOLAATUINEN DATA AIHEUTTI
SUOMALAISILLE YRITYKSILLE ARVIOLTA 10
MILJARDIN EURON TAPPIOT ”
- DAMA FINLAND ARVIO ECKERSONIN TUTKIMUKSEN POHJALTA -
© Leisca Contents
”ALKUJAAN TODELLISUUTTA REKISTERÖITIIN
DATAKSI.
NYKYÄÄN DATA ON TODELLISUUS.”
- PETER R. BENSON, ECCMA -
© Leisca Contents
MITÄ ON DATA?
Perustermit tutuksi:
© Leisca Contents
DATA ON INFORMAATION RAKENNUSAINE
Informaatio
Data
Yksittäiset termit, kirjaimet,
symbolit, signaalit. Järjestelmät
välittävät dataa toistensa kesken.
Data prosessoidaan
informaatioksi.
Dataa ymmärrettävässä muodossa, datasta
tehty tulkinta. Esim. Varastoinnissa yhdistetään
eri datoja (tuotekoodi ja numeraalinen
saldotieto), jonka perusteella voidaan
muodostaa informaatiota siitä, onko tuotetta
varastossa ja kuinka paljon.
© Leisca Contents
ESIMERKKI
Etunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/
ovi
Kalle Niemi 04012345 Suomi Pori 28130 Teljänkatu 8 A 3
DATA
Ylläolevasta datasetistä voidaan muodostaa erilaista
informaatiota käyttötarpeen/ kontekstin mukaan.
DATA IS WHAT IT IS AND INFORMATION IS WHAT
WE MAKE OF IT.
- PETER R. BENSON, ECCMA -
MASTER DATA - METADATA - REFERENCE DATA?
MASTER DATA
§  Tarkoittaa yrityksen liiketoiminnalle
tärkeään informaatioon liittyvää dataa,
kuten asiakasdata, työntekijädata,
toimittajadata, tuotedata, materiaalidata
yms.
§  Master Data on yrityksen strateginen
resurssi ja sitä tulee hallita sen mukaisesti.
METADATA
§  Metadata on dataa datasta tai datan
taltioinnista (esim. Kuvatiedoston
tallennusasetukset)
§  Esimerkiksi Word-dokumentti sisältää
metadatana dokumentin tekijän,
tallennuspäivän, muokkauspäivän,
avainsanoja, tiedoston koon yms.
§  Metadataa hyödynnetään parantamaan
tiedon löydettävyyttä.REFERENCE DATA
§  Organisaation ulkopuolelta tulevaa
standardidataa, kuten valuuttakoodit
(EUR, USD yms.) tai maakoodit. Myös
toimittajan tai valmistajan omasta
tuotekoodista puhutaan usein
referenssidatana.
© Leisca Contents
BIG DATA
§  Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot tai
perinteiset tietokantaratkaisut eivät itsekseen kykene.
§  Esimerkiksi Facebookin palvelinkeskuksissa tapahtuva viestiliikenne tai
Amazon.com –verkkokaupan ostotapahtumat kerryttävät valtavat
määrät dataa.
§  Usein viitataan myös useista eri lähteistä koostettuun suureen
datamassaan, jota analysoidaan esim. Sää- ja liikennetietojen suhdetta
kuluttajan ostokäyttäytymiseen.
§  Datan määrän kasvaessa joka vuosi eksponentiaalisesti myös
määritelmä siitä, mikä oikeastaan on ”BIG”, elää jatkuvasti.
© Leisca Contents
DATAN HALLINNAN TERMINOLOGIA
Perusteet hallussa?
© Leisca Contents
MDM ELI MASTER DATA MANAGEMENT
§  Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien,
sääntöjen ja työkalujen muodostamaa kokonaisuutta, millä yritys luo ja
ylläpitää master dataa.
§  Ei tarkoita mitään yksittäistä, tiettyä tapaa toimia.
§  Master data management lähtee useimmiten liikkeelle päällekkäisten
datojen poistamisesta hallinnan keskittämisellä, ettei esim. sama tuote
esiinny useampaan kertaan, mahdollisesti eri kuvaustiedoin yrityksen
tietojärjestelmissä.
§  Muita tyypillisiä kehittämisen osa-alueita ovat mm. datan laatu, datan
luokittelu ja datan identifiointi.
© Leisca Contents
DATA GOVERNANCE
§  Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihin
ja vastuujakoihin.
§  Jos master data management kuvaa enemmänkin operatiivista
kokonaisuutta, niin data governance viittaa tuon kokonaisuuden
määrittelyyn, ohjeistukseen, tavoitteiden asetantaan, johtamiseen yms.
§  Data Governanceen liittyvät osa-alueet:
Data Quality, Data Security, Data Storage, Data Warehouse & Business
Intelligence, Data Modeling & Design, Data Integration & Interoperability, Data
Architechture.
Data Governance ilman operatiivista datan hallintaa muodostuu nopeasti
akateemiseksi himmeliksi.
© Leisca Contents
DATA GOVERNANCE ESIMERKKIMALLI
(MALLEJA ON USEITA ERILAISIA)
Määrittele
vastuut
Jalkauta säännöt
Tarkasta /
hyväksy
Eskaloi
Luo säännöt
Auditoi /
Taltioi
Jäljitettävyys
Korjaa
ongelmat
Tarkkaile /
raportoi
Määrittele
käytännöt
Profilointi ja
löydökset
Datan laatu
DataOwners
Määrittely
DataStewards
Käytäntö
DataCustodians
Operointi
Spesifikaatiot
Spesifikaatiot Tapahtumat (poikkeamat, rikkeet..)
Raja-arvoissa pysyminen
© Leisca Contents
MASTER DATA MANAGEMENT
=
KÄSITE KUVAA OPERATIIVISTA MASTER DATAN
HALLINTAA.
DATA GOVERNANCE
=
KÄSITE KUVAA DATAN HALLINTAAN LIITTYVÄN
OPERATIIVISEN TOIMINNAN OHJAAMISTA JA
MÄÄRITTELYÄ
© Leisca Contents
DATAN HALLINNAN ALAKÄSITTEET
Yhä syvemmälle viidakkoon:
© Leisca Contents
HALLINTOHENKILÖT
DATA OWNER =
Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset ja
prosessikehyksen data-alueen ylläpidolle. Useimmiten ylemmän johtotason
henkilö, esim. Myyntijohtaja voi olla asiakasdatan Data Owner. Päävastuullinen
omasta data-alueestaan.
DATA STEWARD =
Data Steward eli kavereiden kesken Data Paimen valvoo ja huolehtii, että
määritellyt reunaehdot toteutuvat käytännössä ja korjaa virheitä tarvittaessa.
Määrittelee. Keskeinen rooli datan laadun parantamisessa informaation
elinkaaren eri vaiheissa.
DATA CUSTODIAN =
Usein IT-osasto, jonka tehtävänä on huolehtia datan turvallisesta taltioinnista,
liikkuvuudesta, pääsynhallinnasta ja muista käytännön asioista.
© Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Quality =
Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datan
hallinnan toimenpiteet tähtäävät lopputulemana datan laadun parantamiseen
ja varmistamiseen.
Eri dataryhmillä voi olla erilaisia laatuvaatimuksia, mutta usein laatua peilataan
seuraavaan viiteen (5) ehtoon *Dama finland:
①  ACCURACY: data kuvastaa oikein reaalimaailman tilannetta
②  COMPLETENESS: kaikki tarvittava tieto on annettu
③  CONSISTENCY: tieto on yhdenmukaista esim. järjestelmien välillä
④  DUPLICATION: samaa tietoa ei ole kahdesti
⑤  TIMELINESS: tieto on saatavilla riittävän nopeasti
© Leisca Contents
TYYPILLISIÄ VIRHEITÄ DATASSA
SISÄLTÖVIRHEITÄ:
§  Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vrt.
Helsinki, Hki), joka johtuu sääntöjen puuttumisesta.
KENTTIEN VÄÄRINKÄYTTÖÄ:
§  Vääriä asioita pistetty vääriin kenttiin. Esimerkiksi materiaalidatassa
toimittajatieto laitettuna tekniseen kuvauskenttään.
LUOKITTELUHAJONTAA
§  Sama asia laitettu luokiteltu eri kategoriaan.
LÖYDETTÄVYYS KÄRSII, DUPLIKAATTIEN MÄÄRÄ KASVAA JA RAPORTIT
EIVÄT PIDÄ PAIKKAANSA.
HAJATELMIA DATAN LAADUSTA
ACCURACY=
Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta?
Laadukkaan datan ei tarvitse vastata reaalimaailman tilannetta,
informaation täytyy.
TIMELINESS=
Laadukas data ei ole aikariippuvaista. Laadukas informaatio on.
LAADUKAS DATA EI TAKAA LAADUKASTA INFORMAATIOTA, MUTTA ILMAN
LAADUKASTA DATAA EI VOI OLLA LAADUKASTA INFORMAATIOTA.
© Leisca Contents
DATAN LAATU EI OLE UNIVERSAALI KÄSITE.
DATAN LAADUN MÄÄRITTELEE DATAN
TARVITSIJA.
© Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Security =
Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut ja
toimintatavat.
Data Storage =
Datan taltiointi/ varastoiminen ja varmistus. Työkalut ja toimintatavat, eli koska
arkistoituu, miten käytettävyys ja 24/7 pääsy on varmistettu yms.
Data Warehouse =
Keskitetty tietovarasto, joka taltio dataa eri lähteistä yhteen pisteeseen
useimmiten raportointia varten.
Business Intelligence =
Ratkaisu, joka muodostaa erilaisia liiketoimintanäkymiä, -raportteja ja
-analytiikkaa Data Warehouseen taltioidusta datasta päätöksenteon tueksi.
© Leisca Contents
DATAHALLINNAN OSA-ALUEET
Data Modeling & Design =
Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimukset
tukemaan parhaalla tavalla liiketoimintaprosesseja ja niihin liittyviä
järjestelmiä.
Data Integration & Interoperability =
Määrittely ja toteutus; miten data liikkuu ja toimii eri järjestelmien välillä,
miten dataa siirretään.
Data Architechture =
Määrittelee mallit, politiikat ja säännöt mitä dataa taltioidaan, minne, miten,
miten se parhaiten valjastetaan liiketoiminnan tarpeisiin.
© Leisca Contents
MIKSI KANNATTAA TOIMIA NYT
”Ainahan ne on ollut kuralla…”
© Leisca Contents
YLEINEN ENNUSTE:
TULEVAN VIIDEN (5) VUODEN AIKANA DATAN
MÄÄRÄ YHDEKSÄNKERTAISTUU (9).
© Leisca Contents
1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB)
2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI
3. INFORMAATIOSIILOJEN ( TIEDOSTOT, OBJEKTIT, LAITTEET JNE. ) MÄÄRÄ
KASVAA 75-KERTAISEKSI.
4. PALVELINTEN ( FYYSISTEN JA VIRTUAALISTEN ) MÄÄRÄ
KYMMENKERTAISTUU.
5. IT-OSAAJIEN MÄÄRÄ KASVAA VAIN 50 %
- IDC Digital Universe Study, 2012 -
Vuonna 2020:
*1 ZB = 1 099 511 627 776 GB
© Leisca Contents
KOKO DATAMASSAN VOISI TALTIOIDA
39 MILJARDILLE 1 TB:N ULKOISELLE
KIINTOLEVYLLE.
1,9 CM KORKEISTA KIINTOLEVYISTÄ
RAKENTUISI
741 000 KM KORKEAN TORNI
2020
=
ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄN
KÄSIPAREJA.
© Leisca Contents
NIIN MITÄ SE DATA OLI?
Eksekjuutiv sammari:
© Leisca Contents
DATA IT
© Leisca Contents
DATA =
© Leisca Contents
KIITOKSIA
© Leisca Contents
Kalle Niemi
+35840 702 6270
kalle.niemi@leisca.com
@kaheniem

More Related Content

Similar to Data-suomi, selittävä sanakirja

Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskeroAvoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskeroFloApps
 
Talent Base: Master Data Management (MDM) - mistä siinä on kyse
Talent Base: Master Data Management (MDM) - mistä siinä on kyseTalent Base: Master Data Management (MDM) - mistä siinä on kyse
Talent Base: Master Data Management (MDM) - mistä siinä on kyseLoihde Advisory
 
pdf-koulutusmateriaali (1).pdf
pdf-koulutusmateriaali (1).pdfpdf-koulutusmateriaali (1).pdf
pdf-koulutusmateriaali (1).pdfKyber2
 
Analytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäAnalytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäJari Jussila
 
Data Management / MDM - Avaus Open
Data Management / MDM - Avaus OpenData Management / MDM - Avaus Open
Data Management / MDM - Avaus OpenAvaus
 
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxSinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxJaana Sinipuro
 
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Timo Halima
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014ivoriofinland
 
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)Jarmo Talvivaara
 
Elinkaaren hallinta tiedonohjausksen avulla - Nina Eerikäinen
Elinkaaren hallinta tiedonohjausksen avulla - Nina EerikäinenElinkaaren hallinta tiedonohjausksen avulla - Nina Eerikäinen
Elinkaaren hallinta tiedonohjausksen avulla - Nina EerikäinenMaija Pylkkänen
 
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenBig datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenJari Jussila
 
1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteetSpartaConsulting
 
SQL Server 2012 aamiaisseminaari
SQL Server 2012 aamiaisseminaariSQL Server 2012 aamiaisseminaari
SQL Server 2012 aamiaisseminaariSalcom Group
 
Tiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenTiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenJyrki Kasvi
 
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptx
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptxEero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptx
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptxEero Siljander
 
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...BearingPoint Finland
 
Tutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanTutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanJari Jussila
 

Similar to Data-suomi, selittävä sanakirja (20)

Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskeroAvoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
Avoin tieto laadukkaaksi_talent_base_oy_nino_ilveskero
 
Talent Base: Master Data Management (MDM) - mistä siinä on kyse
Talent Base: Master Data Management (MDM) - mistä siinä on kyseTalent Base: Master Data Management (MDM) - mistä siinä on kyse
Talent Base: Master Data Management (MDM) - mistä siinä on kyse
 
pdf-koulutusmateriaali (1).pdf
pdf-koulutusmateriaali (1).pdfpdf-koulutusmateriaali (1).pdf
pdf-koulutusmateriaali (1).pdf
 
koulutusmateriaali1.pptx
koulutusmateriaali1.pptxkoulutusmateriaali1.pptx
koulutusmateriaali1.pptx
 
Analytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessäAnalytiikka toiminnan kehittämisessä
Analytiikka toiminnan kehittämisessä
 
Data Management / MDM - Avaus Open
Data Management / MDM - Avaus OpenData Management / MDM - Avaus Open
Data Management / MDM - Avaus Open
 
Big data -strategia
Big data  -strategiaBig data  -strategia
Big data -strategia
 
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptxSinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
Sinipuro, Johdatko tiedolla vai luulolla 20052015.pptx
 
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
Aalto-yliopisto Tiedolla johtaminen Timo Halima luento lukukausi 2015
 
Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014Big data -esitys, joulukuu 2014
Big data -esitys, joulukuu 2014
 
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)
02 - Johdanto EAI 1 (BD2226 Tietojärjestelmien integrointi)
 
Elinkaaren hallinta tiedonohjausksen avulla - Nina Eerikäinen
Elinkaaren hallinta tiedonohjausksen avulla - Nina EerikäinenElinkaaren hallinta tiedonohjausksen avulla - Nina Eerikäinen
Elinkaaren hallinta tiedonohjausksen avulla - Nina Eerikäinen
 
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminenBig datan ja analytiikkamaailman käsitteiden läpikäyminen
Big datan ja analytiikkamaailman käsitteiden läpikäyminen
 
Datpro Finug
Datpro FinugDatpro Finug
Datpro Finug
 
1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet1. Ydintieto (MDM) peruskäsitteet
1. Ydintieto (MDM) peruskäsitteet
 
SQL Server 2012 aamiaisseminaari
SQL Server 2012 aamiaisseminaariSQL Server 2012 aamiaisseminaari
SQL Server 2012 aamiaisseminaari
 
Tiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseenTiedolla johtamisesta tiedolla tekemiseen
Tiedolla johtamisesta tiedolla tekemiseen
 
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptx
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptxEero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptx
Eero_Siljander_Consent_Management_Solution_Offer_2023_AVAUS.pptx
 
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
Magenta advisory: Tietopohjainen päätöksenteko - onko organisaatiosi valmis b...
 
Tutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaanTutustuminen data-analytiikan ja big datan maailmaan
Tutustuminen data-analytiikan ja big datan maailmaan
 

Data-suomi, selittävä sanakirja

  • 2. YLEISTÄ DATASTA Data ei ole IT:n synonyymi. © Leisca Contents
  • 3. ”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!) HEIKKOLAATUINEN DATA AIHEUTTI SUOMALAISILLE YRITYKSILLE ARVIOLTA 10 MILJARDIN EURON TAPPIOT ” - DAMA FINLAND ARVIO ECKERSONIN TUTKIMUKSEN POHJALTA - © Leisca Contents
  • 4. ”ALKUJAAN TODELLISUUTTA REKISTERÖITIIN DATAKSI. NYKYÄÄN DATA ON TODELLISUUS.” - PETER R. BENSON, ECCMA - © Leisca Contents
  • 5. MITÄ ON DATA? Perustermit tutuksi: © Leisca Contents
  • 6. DATA ON INFORMAATION RAKENNUSAINE Informaatio Data Yksittäiset termit, kirjaimet, symbolit, signaalit. Järjestelmät välittävät dataa toistensa kesken. Data prosessoidaan informaatioksi. Dataa ymmärrettävässä muodossa, datasta tehty tulkinta. Esim. Varastoinnissa yhdistetään eri datoja (tuotekoodi ja numeraalinen saldotieto), jonka perusteella voidaan muodostaa informaatiota siitä, onko tuotetta varastossa ja kuinka paljon. © Leisca Contents
  • 7. ESIMERKKI Etunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/ ovi Kalle Niemi 04012345 Suomi Pori 28130 Teljänkatu 8 A 3 DATA Ylläolevasta datasetistä voidaan muodostaa erilaista informaatiota käyttötarpeen/ kontekstin mukaan.
  • 8. DATA IS WHAT IT IS AND INFORMATION IS WHAT WE MAKE OF IT. - PETER R. BENSON, ECCMA -
  • 9. MASTER DATA - METADATA - REFERENCE DATA? MASTER DATA §  Tarkoittaa yrityksen liiketoiminnalle tärkeään informaatioon liittyvää dataa, kuten asiakasdata, työntekijädata, toimittajadata, tuotedata, materiaalidata yms. §  Master Data on yrityksen strateginen resurssi ja sitä tulee hallita sen mukaisesti. METADATA §  Metadata on dataa datasta tai datan taltioinnista (esim. Kuvatiedoston tallennusasetukset) §  Esimerkiksi Word-dokumentti sisältää metadatana dokumentin tekijän, tallennuspäivän, muokkauspäivän, avainsanoja, tiedoston koon yms. §  Metadataa hyödynnetään parantamaan tiedon löydettävyyttä.REFERENCE DATA §  Organisaation ulkopuolelta tulevaa standardidataa, kuten valuuttakoodit (EUR, USD yms.) tai maakoodit. Myös toimittajan tai valmistajan omasta tuotekoodista puhutaan usein referenssidatana. © Leisca Contents
  • 10. BIG DATA §  Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot tai perinteiset tietokantaratkaisut eivät itsekseen kykene. §  Esimerkiksi Facebookin palvelinkeskuksissa tapahtuva viestiliikenne tai Amazon.com –verkkokaupan ostotapahtumat kerryttävät valtavat määrät dataa. §  Usein viitataan myös useista eri lähteistä koostettuun suureen datamassaan, jota analysoidaan esim. Sää- ja liikennetietojen suhdetta kuluttajan ostokäyttäytymiseen. §  Datan määrän kasvaessa joka vuosi eksponentiaalisesti myös määritelmä siitä, mikä oikeastaan on ”BIG”, elää jatkuvasti. © Leisca Contents
  • 11. DATAN HALLINNAN TERMINOLOGIA Perusteet hallussa? © Leisca Contents
  • 12. MDM ELI MASTER DATA MANAGEMENT §  Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien, sääntöjen ja työkalujen muodostamaa kokonaisuutta, millä yritys luo ja ylläpitää master dataa. §  Ei tarkoita mitään yksittäistä, tiettyä tapaa toimia. §  Master data management lähtee useimmiten liikkeelle päällekkäisten datojen poistamisesta hallinnan keskittämisellä, ettei esim. sama tuote esiinny useampaan kertaan, mahdollisesti eri kuvaustiedoin yrityksen tietojärjestelmissä. §  Muita tyypillisiä kehittämisen osa-alueita ovat mm. datan laatu, datan luokittelu ja datan identifiointi. © Leisca Contents
  • 13. DATA GOVERNANCE §  Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihin ja vastuujakoihin. §  Jos master data management kuvaa enemmänkin operatiivista kokonaisuutta, niin data governance viittaa tuon kokonaisuuden määrittelyyn, ohjeistukseen, tavoitteiden asetantaan, johtamiseen yms. §  Data Governanceen liittyvät osa-alueet: Data Quality, Data Security, Data Storage, Data Warehouse & Business Intelligence, Data Modeling & Design, Data Integration & Interoperability, Data Architechture. Data Governance ilman operatiivista datan hallintaa muodostuu nopeasti akateemiseksi himmeliksi. © Leisca Contents
  • 14. DATA GOVERNANCE ESIMERKKIMALLI (MALLEJA ON USEITA ERILAISIA) Määrittele vastuut Jalkauta säännöt Tarkasta / hyväksy Eskaloi Luo säännöt Auditoi / Taltioi Jäljitettävyys Korjaa ongelmat Tarkkaile / raportoi Määrittele käytännöt Profilointi ja löydökset Datan laatu DataOwners Määrittely DataStewards Käytäntö DataCustodians Operointi Spesifikaatiot Spesifikaatiot Tapahtumat (poikkeamat, rikkeet..) Raja-arvoissa pysyminen © Leisca Contents
  • 15. MASTER DATA MANAGEMENT = KÄSITE KUVAA OPERATIIVISTA MASTER DATAN HALLINTAA. DATA GOVERNANCE = KÄSITE KUVAA DATAN HALLINTAAN LIITTYVÄN OPERATIIVISEN TOIMINNAN OHJAAMISTA JA MÄÄRITTELYÄ © Leisca Contents
  • 16. DATAN HALLINNAN ALAKÄSITTEET Yhä syvemmälle viidakkoon: © Leisca Contents
  • 17. HALLINTOHENKILÖT DATA OWNER = Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset ja prosessikehyksen data-alueen ylläpidolle. Useimmiten ylemmän johtotason henkilö, esim. Myyntijohtaja voi olla asiakasdatan Data Owner. Päävastuullinen omasta data-alueestaan. DATA STEWARD = Data Steward eli kavereiden kesken Data Paimen valvoo ja huolehtii, että määritellyt reunaehdot toteutuvat käytännössä ja korjaa virheitä tarvittaessa. Määrittelee. Keskeinen rooli datan laadun parantamisessa informaation elinkaaren eri vaiheissa. DATA CUSTODIAN = Usein IT-osasto, jonka tehtävänä on huolehtia datan turvallisesta taltioinnista, liikkuvuudesta, pääsynhallinnasta ja muista käytännön asioista. © Leisca Contents
  • 18. DATAHALLINNAN OSA-ALUEET Data Quality = Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datan hallinnan toimenpiteet tähtäävät lopputulemana datan laadun parantamiseen ja varmistamiseen. Eri dataryhmillä voi olla erilaisia laatuvaatimuksia, mutta usein laatua peilataan seuraavaan viiteen (5) ehtoon *Dama finland: ①  ACCURACY: data kuvastaa oikein reaalimaailman tilannetta ②  COMPLETENESS: kaikki tarvittava tieto on annettu ③  CONSISTENCY: tieto on yhdenmukaista esim. järjestelmien välillä ④  DUPLICATION: samaa tietoa ei ole kahdesti ⑤  TIMELINESS: tieto on saatavilla riittävän nopeasti © Leisca Contents
  • 19. TYYPILLISIÄ VIRHEITÄ DATASSA SISÄLTÖVIRHEITÄ: §  Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vrt. Helsinki, Hki), joka johtuu sääntöjen puuttumisesta. KENTTIEN VÄÄRINKÄYTTÖÄ: §  Vääriä asioita pistetty vääriin kenttiin. Esimerkiksi materiaalidatassa toimittajatieto laitettuna tekniseen kuvauskenttään. LUOKITTELUHAJONTAA §  Sama asia laitettu luokiteltu eri kategoriaan. LÖYDETTÄVYYS KÄRSII, DUPLIKAATTIEN MÄÄRÄ KASVAA JA RAPORTIT EIVÄT PIDÄ PAIKKAANSA.
  • 20. HAJATELMIA DATAN LAADUSTA ACCURACY= Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta? Laadukkaan datan ei tarvitse vastata reaalimaailman tilannetta, informaation täytyy. TIMELINESS= Laadukas data ei ole aikariippuvaista. Laadukas informaatio on. LAADUKAS DATA EI TAKAA LAADUKASTA INFORMAATIOTA, MUTTA ILMAN LAADUKASTA DATAA EI VOI OLLA LAADUKASTA INFORMAATIOTA. © Leisca Contents
  • 21. DATAN LAATU EI OLE UNIVERSAALI KÄSITE. DATAN LAADUN MÄÄRITTELEE DATAN TARVITSIJA. © Leisca Contents
  • 22. DATAHALLINNAN OSA-ALUEET Data Security = Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut ja toimintatavat. Data Storage = Datan taltiointi/ varastoiminen ja varmistus. Työkalut ja toimintatavat, eli koska arkistoituu, miten käytettävyys ja 24/7 pääsy on varmistettu yms. Data Warehouse = Keskitetty tietovarasto, joka taltio dataa eri lähteistä yhteen pisteeseen useimmiten raportointia varten. Business Intelligence = Ratkaisu, joka muodostaa erilaisia liiketoimintanäkymiä, -raportteja ja -analytiikkaa Data Warehouseen taltioidusta datasta päätöksenteon tueksi. © Leisca Contents
  • 23. DATAHALLINNAN OSA-ALUEET Data Modeling & Design = Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimukset tukemaan parhaalla tavalla liiketoimintaprosesseja ja niihin liittyviä järjestelmiä. Data Integration & Interoperability = Määrittely ja toteutus; miten data liikkuu ja toimii eri järjestelmien välillä, miten dataa siirretään. Data Architechture = Määrittelee mallit, politiikat ja säännöt mitä dataa taltioidaan, minne, miten, miten se parhaiten valjastetaan liiketoiminnan tarpeisiin. © Leisca Contents
  • 24. MIKSI KANNATTAA TOIMIA NYT ”Ainahan ne on ollut kuralla…” © Leisca Contents
  • 25. YLEINEN ENNUSTE: TULEVAN VIIDEN (5) VUODEN AIKANA DATAN MÄÄRÄ YHDEKSÄNKERTAISTUU (9). © Leisca Contents
  • 26. 1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB) 2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI 3. INFORMAATIOSIILOJEN ( TIEDOSTOT, OBJEKTIT, LAITTEET JNE. ) MÄÄRÄ KASVAA 75-KERTAISEKSI. 4. PALVELINTEN ( FYYSISTEN JA VIRTUAALISTEN ) MÄÄRÄ KYMMENKERTAISTUU. 5. IT-OSAAJIEN MÄÄRÄ KASVAA VAIN 50 % - IDC Digital Universe Study, 2012 - Vuonna 2020: *1 ZB = 1 099 511 627 776 GB © Leisca Contents
  • 27. KOKO DATAMASSAN VOISI TALTIOIDA 39 MILJARDILLE 1 TB:N ULKOISELLE KIINTOLEVYLLE.
  • 28. 1,9 CM KORKEISTA KIINTOLEVYISTÄ RAKENTUISI 741 000 KM KORKEAN TORNI
  • 29. 2020 = ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄN KÄSIPAREJA. © Leisca Contents
  • 30. NIIN MITÄ SE DATA OLI? Eksekjuutiv sammari: © Leisca Contents
  • 31. DATA IT © Leisca Contents
  • 32. DATA = © Leisca Contents
  • 33. KIITOKSIA © Leisca Contents Kalle Niemi +35840 702 6270 kalle.niemi@leisca.com @kaheniem