Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
DATA-SUOMI-SANAKIRJATermiviidakon selviytymisopas© Leisca Contents
YLEISTÄ DATASTAData ei ole IT:n synonyymi.© Leisca Contents
”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!)HEIKKOLAATUINEN DATA AIHEUTTISUOMALAISILLE YRITYKSILLE ARVIOLTA 10MILJARD...
”ALKUJAAN TODELLISUUTTA REKISTERÖITIINDATAKSI.NYKYÄÄN DATA ON TODELLISUUS.”- PETER R. BENSON, ECCMA -© Leisca Contents
MITÄ ON DATA?Perustermit tutuksi:© Leisca Contents
DATA ON INFORMAATION RAKENNUSAINEInformaatioDataYksittäiset termit, kirjaimet,symbolit, signaalit. Järjestelmätvälittävät ...
ESIMERKKIEtunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/oviKalle Niemi 04012345 Suomi Pori 28130...
DATA IS WHAT IT IS AND INFORMATION IS WHATWE MAKE OF IT.- PETER R. BENSON, ECCMA -
MASTER DATA - METADATA - REFERENCE DATA?MASTER DATA§  Tarkoittaa yrityksen liiketoiminnalletärkeään informaatioon liittyv...
BIG DATA§  Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot taiperinteiset tietokantaratkaisut eivät i...
DATAN HALLINNAN TERMINOLOGIAPerusteet hallussa?© Leisca Contents
MDM ELI MASTER DATA MANAGEMENT§  Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien,sääntöjen ja työkalujen m...
DATA GOVERNANCE§  Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihinja vastuujakoihin.§  Jos maste...
DATA GOVERNANCE ESIMERKKIMALLI(MALLEJA ON USEITA ERILAISIA)MäärittelevastuutJalkauta säännötTarkasta /hyväksyEskaloiLuo sä...
MASTER DATA MANAGEMENT=KÄSITE KUVAA OPERATIIVISTA MASTER DATANHALLINTAA.DATA GOVERNANCE=KÄSITE KUVAA DATAN HALLINTAAN LIIT...
DATAN HALLINNAN ALAKÄSITTEETYhä syvemmälle viidakkoon:© Leisca Contents
HALLINTOHENKILÖTDATA OWNER =Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset japrosessikehyksen dat...
DATAHALLINNAN OSA-ALUEETData Quality =Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datanhall...
TYYPILLISIÄ VIRHEITÄ DATASSASISÄLTÖVIRHEITÄ:§  Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vr...
HAJATELMIA DATAN LAADUSTAACCURACY=Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta?Laadukkaan datan ...
DATAN LAATU EI OLE UNIVERSAALI KÄSITE.DATAN LAADUN MÄÄRITTELEE DATANTARVITSIJA.© Leisca Contents
DATAHALLINNAN OSA-ALUEETData Security =Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut jatoimin...
DATAHALLINNAN OSA-ALUEETData Modeling & Design =Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimuksettukema...
MIKSI KANNATTAA TOIMIA NYT”Ainahan ne on ollut kuralla…”© Leisca Contents
YLEINEN ENNUSTE:TULEVAN VIIDEN (5) VUODEN AIKANA DATANMÄÄRÄ YHDEKSÄNKERTAISTUU (9).© Leisca Contents
1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB)2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI3...
KOKO DATAMASSAN VOISI TALTIOIDA39 MILJARDILLE 1 TB:N ULKOISELLEKIINTOLEVYLLE.
1,9 CM KORKEISTA KIINTOLEVYISTÄRAKENTUISI741 000 KM KORKEAN TORNI
2020=ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄNKÄSIPAREJA.© Leisca Contents
NIIN MITÄ SE DATA OLI?Eksekjuutiv sammari:© Leisca Contents
DATA IT© Leisca Contents
DATA =© Leisca Contents
KIITOKSIA© Leisca ContentsKalle Niemi+35840 702 6270kalle.niemi@leisca.com@kaheniem
Upcoming SlideShare
Loading in …5
×

Data-suomi, selittävä sanakirja

1,198 views

Published on

Kaikki kelmut eivät valitettavasti näy tässä oikein, mutta anti mennä :) Vielä beta-vaiheessa oleva, termiviidakon selviytymisopas kaikille, jotka ovat koittavat ymmärtää mitä se kaikki datahöpinä tarkoittaa. Tullaan elävöittämään myöhemmin vielä esimerkkien avulla.

Published in: Technology
  • Be the first to comment

Data-suomi, selittävä sanakirja

  1. 1. DATA-SUOMI-SANAKIRJATermiviidakon selviytymisopas© Leisca Contents
  2. 2. YLEISTÄ DATASTAData ei ole IT:n synonyymi.© Leisca Contents
  3. 3. ”VUONNA 2002 (SIIS YLI KYMMENEN VUOTTA SITTEN !!)HEIKKOLAATUINEN DATA AIHEUTTISUOMALAISILLE YRITYKSILLE ARVIOLTA 10MILJARDIN EURON TAPPIOT ”- DAMA FINLAND ARVIO ECKERSONIN TUTKIMUKSEN POHJALTA -© Leisca Contents
  4. 4. ”ALKUJAAN TODELLISUUTTA REKISTERÖITIINDATAKSI.NYKYÄÄN DATA ON TODELLISUUS.”- PETER R. BENSON, ECCMA -© Leisca Contents
  5. 5. MITÄ ON DATA?Perustermit tutuksi:© Leisca Contents
  6. 6. DATA ON INFORMAATION RAKENNUSAINEInformaatioDataYksittäiset termit, kirjaimet,symbolit, signaalit. Järjestelmätvälittävät dataa toistensa kesken.Data prosessoidaaninformaatioksi.Dataa ymmärrettävässä muodossa, datastatehty tulkinta. Esim. Varastoinnissa yhdistetääneri datoja (tuotekoodi ja numeraalinensaldotieto), jonka perusteella voidaanmuodostaa informaatiota siitä, onko tuotettavarastossa ja kuinka paljon.© Leisca Contents
  7. 7. ESIMERKKIEtunimi Sukunimi Puhelin Maa Kaupunki Postinro Katu Talonro Rappu Asunto/oviKalle Niemi 04012345 Suomi Pori 28130 Teljänkatu 8 A 3DATAYlläolevasta datasetistä voidaan muodostaa erilaistainformaatiota käyttötarpeen/ kontekstin mukaan.
  8. 8. DATA IS WHAT IT IS AND INFORMATION IS WHATWE MAKE OF IT.- PETER R. BENSON, ECCMA -
  9. 9. MASTER DATA - METADATA - REFERENCE DATA?MASTER DATA§  Tarkoittaa yrityksen liiketoiminnalletärkeään informaatioon liittyvää dataa,kuten asiakasdata, työntekijädata,toimittajadata, tuotedata, materiaalidatayms.§  Master Data on yrityksen strateginenresurssi ja sitä tulee hallita sen mukaisesti.METADATA§  Metadata on dataa datasta tai datantaltioinnista (esim. Kuvatiedostontallennusasetukset)§  Esimerkiksi Word-dokumentti sisältäämetadatana dokumentin tekijän,tallennuspäivän, muokkauspäivän,avainsanoja, tiedoston koon yms.§  Metadataa hyödynnetään parantamaantiedon löydettävyyttä.REFERENCE DATA§  Organisaation ulkopuolelta tulevaastandardidataa, kuten valuuttakoodit(EUR, USD yms.) tai maakoodit. Myöstoimittajan tai valmistajan omastatuotekoodista puhutaan useinreferenssidatana.© Leisca Contents
  10. 10. BIG DATA§  Suurten, jäsentymättömien tietomassojen käsittely, johon ihmisaivot taiperinteiset tietokantaratkaisut eivät itsekseen kykene.§  Esimerkiksi Facebookin palvelinkeskuksissa tapahtuva viestiliikenne taiAmazon.com –verkkokaupan ostotapahtumat kerryttävät valtavatmäärät dataa.§  Usein viitataan myös useista eri lähteistä koostettuun suureendatamassaan, jota analysoidaan esim. Sää- ja liikennetietojen suhdettakuluttajan ostokäyttäytymiseen.§  Datan määrän kasvaessa joka vuosi eksponentiaalisesti myösmääritelmä siitä, mikä oikeastaan on ”BIG”, elää jatkuvasti.© Leisca Contents
  11. 11. DATAN HALLINNAN TERMINOLOGIAPerusteet hallussa?© Leisca Contents
  12. 12. MDM ELI MASTER DATA MANAGEMENT§  Ylätason käsite, jolla pyritään kuvaamaan sitä toimintamallien,sääntöjen ja työkalujen muodostamaa kokonaisuutta, millä yritys luo jaylläpitää master dataa.§  Ei tarkoita mitään yksittäistä, tiettyä tapaa toimia.§  Master data management lähtee useimmiten liikkeelle päällekkäistendatojen poistamisesta hallinnan keskittämisellä, ettei esim. sama tuoteesiinny useampaan kertaan, mahdollisesti eri kuvaustiedoin yrityksentietojärjestelmissä.§  Muita tyypillisiä kehittämisen osa-alueita ovat mm. datan laatu, datanluokittelu ja datan identifiointi.© Leisca Contents
  13. 13. DATA GOVERNANCE§  Viittaa useimmiten datahallinnan prosessien ja työkalujen määrittelyihinja vastuujakoihin.§  Jos master data management kuvaa enemmänkin operatiivistakokonaisuutta, niin data governance viittaa tuon kokonaisuudenmäärittelyyn, ohjeistukseen, tavoitteiden asetantaan, johtamiseen yms.§  Data Governanceen liittyvät osa-alueet:Data Quality, Data Security, Data Storage, Data Warehouse & BusinessIntelligence, Data Modeling & Design, Data Integration & Interoperability, DataArchitechture.Data Governance ilman operatiivista datan hallintaa muodostuu nopeastiakateemiseksi himmeliksi.© Leisca Contents
  14. 14. DATA GOVERNANCE ESIMERKKIMALLI(MALLEJA ON USEITA ERILAISIA)MäärittelevastuutJalkauta säännötTarkasta /hyväksyEskaloiLuo säännötAuditoi /TaltioiJäljitettävyysKorjaaongelmatTarkkaile /raportoiMäärittelekäytännötProfilointi jalöydöksetDatan laatuDataOwnersMäärittelyDataStewardsKäytäntöDataCustodiansOperointiSpesifikaatiotSpesifikaatiot Tapahtumat (poikkeamat, rikkeet..)Raja-arvoissa pysyminen© Leisca Contents
  15. 15. MASTER DATA MANAGEMENT=KÄSITE KUVAA OPERATIIVISTA MASTER DATANHALLINTAA.DATA GOVERNANCE=KÄSITE KUVAA DATAN HALLINTAAN LIITTYVÄNOPERATIIVISEN TOIMINNAN OHJAAMISTA JAMÄÄRITTELYÄ© Leisca Contents
  16. 16. DATAN HALLINNAN ALAKÄSITTEETYhä syvemmälle viidakkoon:© Leisca Contents
  17. 17. HALLINTOHENKILÖTDATA OWNER =Datan oikeellisuudesta vastaava, määrittelee mm. Datan laatuvaatimukset japrosessikehyksen data-alueen ylläpidolle. Useimmiten ylemmän johtotasonhenkilö, esim. Myyntijohtaja voi olla asiakasdatan Data Owner. Päävastuullinenomasta data-alueestaan.DATA STEWARD =Data Steward eli kavereiden kesken Data Paimen valvoo ja huolehtii, ettämääritellyt reunaehdot toteutuvat käytännössä ja korjaa virheitä tarvittaessa.Määrittelee. Keskeinen rooli datan laadun parantamisessa informaationelinkaaren eri vaiheissa.DATA CUSTODIAN =Usein IT-osasto, jonka tehtävänä on huolehtia datan turvallisesta taltioinnista,liikkuvuudesta, pääsynhallinnasta ja muista käytännön asioista.© Leisca Contents
  18. 18. DATAHALLINNAN OSA-ALUEETData Quality =Datan laatu. Vaikkakin usein luokiteltu omaksi osa-alueekseen, niin kaikki datanhallinnan toimenpiteet tähtäävät lopputulemana datan laadun parantamiseenja varmistamiseen.Eri dataryhmillä voi olla erilaisia laatuvaatimuksia, mutta usein laatua peilataanseuraavaan viiteen (5) ehtoon *Dama finland:①  ACCURACY: data kuvastaa oikein reaalimaailman tilannetta②  COMPLETENESS: kaikki tarvittava tieto on annettu③  CONSISTENCY: tieto on yhdenmukaista esim. järjestelmien välillä④  DUPLICATION: samaa tietoa ei ole kahdesti⑤  TIMELINESS: tieto on saatavilla riittävän nopeasti© Leisca Contents
  19. 19. TYYPILLISIÄ VIRHEITÄ DATASSASISÄLTÖVIRHEITÄ:§  Kirjoitusvirheitä tai saman asian kirjoittaminen useilla synonyymeilla (vrt.Helsinki, Hki), joka johtuu sääntöjen puuttumisesta.KENTTIEN VÄÄRINKÄYTTÖÄ:§  Vääriä asioita pistetty vääriin kenttiin. Esimerkiksi materiaalidatassatoimittajatieto laitettuna tekniseen kuvauskenttään.LUOKITTELUHAJONTAA§  Sama asia laitettu luokiteltu eri kategoriaan.LÖYDETTÄVYYS KÄRSII, DUPLIKAATTIEN MÄÄRÄ KASVAA JA RAPORTITEIVÄT PIDÄ PAIKKAANSA.
  20. 20. HAJATELMIA DATAN LAADUSTAACCURACY=Mitä ”vastaa reaalimaailman tilannetta” tarkoittaa datan laadun osalta?Laadukkaan datan ei tarvitse vastata reaalimaailman tilannetta,informaation täytyy.TIMELINESS=Laadukas data ei ole aikariippuvaista. Laadukas informaatio on.LAADUKAS DATA EI TAKAA LAADUKASTA INFORMAATIOTA, MUTTA ILMANLAADUKASTA DATAA EI VOI OLLA LAADUKASTA INFORMAATIOTA.© Leisca Contents
  21. 21. DATAN LAATU EI OLE UNIVERSAALI KÄSITE.DATAN LAADUN MÄÄRITTELEE DATANTARVITSIJA.© Leisca Contents
  22. 22. DATAHALLINNAN OSA-ALUEETData Security =Datan turvaaminen & suojaaminen, pääsynhallinta. Näihin liittyvät työkalut jatoimintatavat.Data Storage =Datan taltiointi/ varastoiminen ja varmistus. Työkalut ja toimintatavat, eli koskaarkistoituu, miten käytettävyys ja 24/7 pääsy on varmistettu yms.Data Warehouse =Keskitetty tietovarasto, joka taltio dataa eri lähteistä yhteen pisteeseenuseimmiten raportointia varten.Business Intelligence =Ratkaisu, joka muodostaa erilaisia liiketoimintanäkymiä, -raportteja ja-analytiikkaa Data Warehouseen taltioidusta datasta päätöksenteon tueksi.© Leisca Contents
  23. 23. DATAHALLINNAN OSA-ALUEETData Modeling & Design =Prosessi , jonka tarkoituksena on määrittää ja luoda datavaatimuksettukemaan parhaalla tavalla liiketoimintaprosesseja ja niihin liittyviäjärjestelmiä.Data Integration & Interoperability =Määrittely ja toteutus; miten data liikkuu ja toimii eri järjestelmien välillä,miten dataa siirretään.Data Architechture =Määrittelee mallit, politiikat ja säännöt mitä dataa taltioidaan, minne, miten,miten se parhaiten valjastetaan liiketoiminnan tarpeisiin.© Leisca Contents
  24. 24. MIKSI KANNATTAA TOIMIA NYT”Ainahan ne on ollut kuralla…”© Leisca Contents
  25. 25. YLEINEN ENNUSTE:TULEVAN VIIDEN (5) VUODEN AIKANA DATANMÄÄRÄ YHDEKSÄNKERTAISTUU (9).© Leisca Contents
  26. 26. 1. DATAN KOKONAISMASSA TULEE OLEMAAN YLI 35 ZB* (2011 = 1.8 ZB)2. ORGANISAATIOIDEN INFORMAATIOMÄÄRÄ KASVAA 50-KERTAISEKSI3. INFORMAATIOSIILOJEN ( TIEDOSTOT, OBJEKTIT, LAITTEET JNE. ) MÄÄRÄKASVAA 75-KERTAISEKSI.4. PALVELINTEN ( FYYSISTEN JA VIRTUAALISTEN ) MÄÄRÄKYMMENKERTAISTUU.5. IT-OSAAJIEN MÄÄRÄ KASVAA VAIN 50 %- IDC Digital Universe Study, 2012 -Vuonna 2020:*1 ZB = 1 099 511 627 776 GB© Leisca Contents
  27. 27. KOKO DATAMASSAN VOISI TALTIOIDA39 MILJARDILLE 1 TB:N ULKOISELLEKIINTOLEVYLLE.
  28. 28. 1,9 CM KORKEISTA KIINTOLEVYISTÄRAKENTUISI741 000 KM KORKEAN TORNI
  29. 29. 2020=ENEMMÄN TYÖSTETTÄVÄÄ JA VÄHEMMÄNKÄSIPAREJA.© Leisca Contents
  30. 30. NIIN MITÄ SE DATA OLI?Eksekjuutiv sammari:© Leisca Contents
  31. 31. DATA IT© Leisca Contents
  32. 32. DATA =© Leisca Contents
  33. 33. KIITOKSIA© Leisca ContentsKalle Niemi+35840 702 6270kalle.niemi@leisca.com@kaheniem

×