SlideShare a Scribd company logo
Het organiseren van data
en informatie

     Hoofdstuk 3:
     Fundamentals of information systems
     Ralph Stair & George Reynolds


Hoorcollege 3/9           Informatiesystemen (INFOB1ISY)
Marco Spruit              http://sites.google.com/a/cs.uu.nl/infob1isy/
Agenda
    Principes en leerdoelen
    Data management en data modellering
    Database management systemen
    Database toepassingen
    Samenvatting




 Data » Databases » Data warehouse >> Data mining »
 Business intelligence
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   2
Principes en Leerdoelen [1/3]
    Data management en data modellering zijn
     centrale aspecten in het organiseren van
     data en informatie
          Definieer algemene data management concepten
           en termen, en licht de voordelen van de
           databasebenadering in data management uit
          Beschrijf het relationele database model en
           schets de basiskenmerken hiervan




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   3
Principes en Leerdoelen [2/3]
    Een goed ontworpen en goed beheerde
     database is een extreem waardevol
     hulpmiddel in het ondersteunen van de
     besluitvorming
          Stel de standaard functies vast die door alle
           database management systems uitgevoerd
           worden
          Bepaal de populaire database management
           systems voor eindgebruikers



dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   4
Principes en Leerdoelen [3/3]
    Het aantal en soorten van database
     toepassingen zal zich verder blijven
     ontwikkelen en zal concrete zakelijke
     voordelen blijven opleveren
          Benoem en bespreek huidige database
           toepassingen




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   5
Flashback 1/3: Data versus Informatie

    Data: ruwe feiten
          Alfanumeriek, beeld, geluid, video
          Voorbeeld: “spruit” “1”
    Informatie: verzameling van feiten die
     dusdanig zijn georganiseerd dat er
     toegevoegde waarde aanwezig is boven de
     ruwe feiten


Voor mensen begrijpelijk en bruikbaar!
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   6
Flashback 2/3: Informatiesystemen




           Componenten van een computer-gebaseerd informatiesysteem:
   één verzameling van […] die zijn geconfigureerd om data te
    verzamelen, manipuleren, bewaren, en transformeren naar informatie
    dinsdag 29 november 2011    Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   7
Flashback 3/3: BIS typologie




                           Figuur 1.5: Bedrijfsinformatiesystemen
dinsdag 29 november 2011           Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   8
Agenda
    Principes en leerdoelen
    Data management en data modellering
    Database management systemen
    Database toepassingen
    Samenvatting




 Data » Databases » Data warehouse >> Data mining »
 Business intelligence
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   9
… Wie waren jullie ook alweer?
Projectmanager                      10                Game tester                                      1
Consultant                          8                 Graphic art designer                             1
Informatie analist                  7                 interaction designer                             1
Software engineer                   7                 IT-auditer                                       1
Informatiemanager                   6                 Jurist (IT)                                      1
entrepreneur / ondernemer           4                 legerofficier IS                                 1
beveiligingsexpert                  3                 Lobbyist                                         1
Systeem ontwikkelaar                3                 Lucht verkeersleider                             1
Functioneel ontwerper               2                 Marketeer                                        1
Systeembeheerder                    2                 muziek producer                                  1
business analyst                    1                 Onderzoeker                                      1
Celbioloog                          1                 PhD                                              1
Correspondent / Journalist          1                 risicoanalist                                    1
digitaal recherceur                 1                 usability expert                                 1
Game designer                       1                 Web redacteur                                    1

dinsdag 29 november 2011     Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS       10
Waarom leren over Database Systemen?
    Databasesystemen (Ned: “gegevensbanken”)
     verwerken en organiseren (grote)
     hoeveelheden gegevens
    Informatiekunde: waar/hoe is de informatie?
    Databasegebruik in allerlei functies:
          Marketing manager: klantgegevens
          Bedrijfsjurist: eerdere vonnissen, precedenten
          …




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   11
Introductie database systemen
    Database: een georganiseerde verzameling
     gegevens
    Database management system (DBMS):
     een verzameling programma’s om een
     database mee te beheren
          Manipuleert de database
          Verschaft een interface tussen de database en de
           gebruiker (zowel database als andere applicaties)
    Database administrator (DBA): een IT
     professional die de databases van een
     organisatie beheert en onderhoudt
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   12
Data Management
    Zonder data en de mogelijkheid om ermee te
     (ver-)werken, kan een organisatie de meeste
     bedrijfsactiviteiten niet succesvol uitvoeren
          Betalen van werknemers
          Versturen van facturen
          Bestellen van nieuwe voorraden
    Data bestaat uit ruwe feiten
    Om data te transformeren naar
     betekenisvolle informatie, moet het eerst
     worden geordend worden op een
     betekenisvolle wijze

dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   13
Wat is data? De Datahiërarchie [1/3]
    Bit (een binair getal): een circuit dat óf AAN
     óf UIT staat
          Byte: acht bits
    Karakter: basis eenheid van informatie
          Elke byte representeert een character
          Kan een hoofdletter, kleine letter, numeriek getal,
           speciaal symbool zijn
    Veld (kolom; rubriek): bijv. een naam,
     nummer, of andere combinatie van karakters
     die een aspect van een zakelijk object of
     activiteit beschrijven

dinsdag 29 november 2011     Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   14
Wat is data? De Datahiërarchie [2/3]
    Record (rij): een verzameling van
     gerelateerde velden
    File (tabel; dossier): een verzameling van
     gerelateerde records
    Database (gegevensbank): een
     verzameling van geïntegreerde en
     gerelateerde files
    Datahiërarchie: bits, karakters, velden,
     records, files, en databases


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   15
Bits-Byte-Karakter: Decimaal versus Binair
     Wikipedia voorbeeld bij getalsystemen
 Bits                                                   Byte                                                      Karakter

 In                        128 64   32           16           8          4            2            1              Uit
                           0   1    1            0            1          0            1            0
 01101010                                                                                                         =106
                               +64 +32                        +8=2   3
                                                                                      +2=2   1




                           0   0    0            1            0          0            0            0
 00010100                                                                                                         =20
                                                 +16                     +4

      …en vice versa: hoeveel is “57”?
                           0   0    -32          -16          -8         0            0            -1
 57                                                                                                               =00111001
                           0   0    1            1            1          0            0            1


dinsdag 29 november 2011                Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS               16
Wat is data? De Datahiërarchie [3/3]




                           Figuur 3.1: De datahiërarchie

dinsdag 29 november 2011         Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   17
Entiteiten, Attributen, en Sleutels [1/2]
    Entiteit: een gegeneraliseerde klasse van
     mensen, plaatsen, of ‘dingen’ (objecten)
     waarvoor data wordt verzameld/onderhouden
    Attribuut: Een kenmerk van een entiteit
    Data item: De waarde van een attribuut
    Sleutel: Een veld of verzameling velden in
     een record dat gebruikt wordt om het record
     te identificeren
    Primaire sleutel: Een sleutel waarmee ieder
     record uniek geïdentificeerd kan worden
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   18
Entiteiten, Attributen, en Sleutels [2/2]




                           Figuur 3.2: Sleutels en Attributen

dinsdag 29 november 2011           Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   19
Entiteiten, Attributen, en Terroristen
      p.112,§1: Van attributen & data naar
       terrorismebestrijding…
       http://news.cnet.com/8301-13578_3-10059987-38.html?part=rss&subj=news&tag=2547-1_3-0-20




dinsdag 29 november 2011                 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   20
Agenda
    Principes en leerdoelen
    Data management en data modellering
    Database management systemen
    Database toepassingen
    Samenvatting




 Data » Databases » Data warehouse >> Data mining »
 Business intelligence
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   21
De Databasebenadering [1/4]
    De traditionele benadering van database
     management: voor iedere toepassing worden
     aparte data bestanden aangemaakt
          Resulteert in dataredundantie (duplicatie)
          Dataredundantie conflicteert met data-integriteit
    De databasebenadering van database
     management: ‘een vijver’ van gerelateerde
     data wordt gedeeld door meerdere
     toepassingen
          Significante voordelen t.o.v. de traditionele
           benadering
          ? bijv vertaald naar PC besturingssystemen?
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   22
De Databasebenadering [2/4]




         Figure 3.3: De databasebenadering van Data Management

dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   23
De Databasebenadering [3/4]




                  Tabel 3.1: Voordelen van de databasebenadering
dinsdag 29 november 2011         Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   24
De Databasebenadering [4/4]




                    Tabel 3.2: Nadelen van de databasebenadering

dinsdag 29 november 2011          Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   25
Data Modellering [1/2]
    Data model: een diagram van data entiteiten
     en hun onderlinge relaties
    Entiteit-relatie (ER) diagram: een type data
     model dat gebruik maakt van eenvoudige
     grafische symbolen om de organisatie van —
     en relaties tussen — de data te tonen




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   26
Data Modellering [2/2]

               1-n relatie =>




               1-1 relatie =>




  Figuur 3.4: Entiteit-Relatie (ER) Diagram voor een Klantorder DB

dinsdag 29 november 2011        Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   27
Het Relationele Database Model [1/2]
    Relationele model: alle data elementen
     worden geplaatst in tweedimensionale
     tabellen (relaties), die het logische equivalent
     zijn van bestanden (files)
    In het relationele model geldt:
          Elke rij in een tabel representeert een data entiteit
          Kolommen van de tabel representeren attributen
          Domein: de toegestane waarden voor data
           attributen
    Data dictionary: gedetailleerde beschrijving
     van alle data die in de database voorkomt

dinsdag 29 november 2011    Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   28
Het Relationele Database Model [2/2]




                       Figuur 3.5: Een Relationeel Database Model
dinsdag 29 november 2011            Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   29
Datamanipulatie [1/2]
    Selecteren: het elimineren van rijen volgens
     bepaalde criteria
    Projecteren: het elimineren van kolommen
     in een tabel
    Samenvoegen: het combineren van twee of
     meer tabellen
    Verbinden: het relateren of verbinden van
     twee of meer tabellen via gedeelde data
     attributen


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   30
Datamanipulatie [2/2]




Figuur 3.7: Het verbinden van tabellen om de vraag teSales beantwoorden:
              Wie is de manager van de kunnen Manual en
 dinsdag 29 november 2011   sindsorganiseren van data en informatie :: Stair & Reynoldsdienst?
                                Het wanneer is hij in :: H3 :: MrS                               31
Koffietijd…


   Principes en leerdoelen
   Data management en data modellering
   Database management systemen
   Database toepassingen
   Samenvatting
Overzicht van Database Types
    Flat file
          Simpel databaseprogramma waarin records geen relatie
           met elkaar hebben
          Voorbeeld: Excel
    Single user
          Slechts één persoon kan tegelijkertijd gebruik maken van
           de database
          Voorbeelden: Access, FileMaker
    Multi-user
          Meerdere mensen hebben tegelijkertijd toegang tot
           hetzelfde database systeem
          Voorbeelden: zie volgende slide…

dinsdag 29 november 2011     Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   33
Belangrijkste (primaire) DBMS




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   34
Datamanipulatie en Rapportage [1/2]
    Structured Query Language (SQL): Dé
     standaard vraagtaal voor relationele databases
    Data manipulation language (DML):
     Commando’s die de data in een database
     manipuleren
    Database programma’s kunnen rapporten
     documenten, en allerlei andere vormen van
     uitvoer produceren



dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   35
Manipulatie en Rapportage [2/2]




                     Table 3.3: Voorbeelden van SQL Commando’s
dinsdag 29 november 2011          Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   36
Database Beheer
    Database administrator (DBA): Stuurt aan en
     voert uit alle activiteiten binnen de database
     omgeving
          Plannen, ontwerpen, aanmaken, opereren,
           beveiligen, monitoren en onderhouden van de
           database systemen (Figuur 3.16!)
          Vaststellen en invoeren van beleid en procedures
          Werknemers trainen




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   37
Selecteren van een Database Systeem
    Belangrijke database eigenschappen die
     overwogen dienen te worden
          Grootte van de database
          Kosten van het systeem
          Aantal gelijktijdige gebruikers
          Uitvoeringssnelheid (lezen/schrijven)
          Integratiemogelijkheden met andere systemen
          Leverancier overwegingen
    Open-source?


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   38
Nieuwe ontwikkelingen: NoSQL
     http://www.rackspacecloud.com/blog/2009/11/09/nosql-ecosystem/
     The “NoSQL” term was actually coined Last.fm wanted to
      organize
      an event to discuss open source distributed databases. The
      name and concept both caught on.
     NoSQL is
      making people aware that there are other options out there.
      But we’re not anti-relational-database for when that really is
      the best tool for the job; it’s “Not Only SQL,” rather than “No
      SQL at all.”
     Three axes along which to think about the many database
      options:
     1.     scalability,
     2.     data and query model, and
      3.    persistence design.
dinsdag 29 november 2011     Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   39
    ... We're currently moving our largest (and most painful to maintain)
     table — the statuses table, which contains all tweets and retweets. ...




dinsdag 29 november 2011     Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   40
Agenda
    Principes en leerdoelen
    Data management en data modellering
    Database management systemen
    Database toepassingen
    Samenvatting




 Data » Databases » Data warehouse >> Data mining »
 Business intelligence
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   41
Verbinden van Databases met Internet
    Verbinden van databases met het Internet is
     belangrijk voor veel organisaties en mensen
    Semantische Web
          Ontwikkeling van een naadloze integratie van traditionele
           databases met het Internet
          Laat mensen een aantal traditionele databases tegelijkertijd
           benaderen en manipuleren via het Internet
    W3C: “The Semantic Web provides a common
     framework that allows data to be shared and reused
     across application, enterprise, and community
     boundaries”. [http://www.w3.org/2001/sw/SW-FAQ]


dinsdag 29 november 2011      Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   42
Over Databases, Internet, en De Wet…
    Wat vindt onze overheid eigenlijk van al die
     databases en het internet…?




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   43
Data Warehouses, Marts, Mining [1/3]
    Data warehouse: verzamelt
     bedrijfsinformatie uit meerdere bronnen in de
     organisatie
    Data mart: een deelverzameling van een
     data warehouse
    Data mining: een informatieanalyse
     gereedschap voor het blootleggen van
     patronen en relaties in een data warehouse
     of data mart


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   44
Data Warehouses, Marts, Mining [2/3]




                  Figuur 3.17: Elementen van een Data Warehouse
dinsdag 29 november 2011        Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   45
Data Warehouses, Marts, Mining [3/3]




    Tabel 3.5: Regelmatig voorkomende Data Mining toepassingen

dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   46
De Weerbarstige Werkelijkheid…




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   47
Big Brother Awards 2009
1.       De DNA-databank voor kinderen
             Een genetisch strafblad voor jeugdzondes
1.       De nieuwe Paspoortwet
             Twee vingerafdrukken van alle Nederlanders in één
              opsporingsregister
1.       Het Centraal Informatiepunt Onderzoek
         Telecommunicatie
             Het telefoonboek van de opsporingsdiensten vindt gretig
              aftrek en dijt uit
1.       De illegale verzamelpraktijken van Advance
             Quizmasters verdienen goed geld met je echte leeftijd
1.       Albert Heijn voor de proef 'TiP2Pay'
             Thumbs down voor vingerafdrukbetaling
1.       …
dinsdag 29 november 2011       Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   48
Big Brother winnaars 2010
    Personen: Ivo Opstelten vanwege het voorstel om
     automatisch gescande kentekens vier weken te bewaren
    Bedrijven: Trans Link Systems en de grootste OV-
     bedrijven vanwege het doorzetten van de OV-chipkaart –
     en zelfs kijken of het ook als betalingsmiddel kan worden
     gebruikt – terwijl de kaart onherstelbaar kapot is.
    Overheden en instellingen: Het ministerie voor Sociale
     Zaken en Werkgelegenheid voor de huisbezoeken door
     de Haagse Pandbrigade, ook zonder concrete
     verdenking van fraude.
    Voorstellen: Deep Packet Inspection, een permanente
     internettap op al het verkeer van alle Nederlandse
     internetters.
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   49
Ook over de grens doet de overheid aan DM




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   50
MBI afstudeervoorbeeld: Data mining
        MBI scriptie van A. Vleugel over Data mining
        Doel: het verbeteren van het matchingsproces van
         vacatures naar uitzendbureau’s mbv data mining
         technieken.




.




    dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   51
Business Intelligence [1/2]
    Business intelligence (BI): het verzamelen
     van de juiste informatie, tijdig, in een
     bruikbare vorm, en het analyseren van deze
     informatie om het zaken doen op een
     positieve manier te beïnvloeden
          Transformeert data naar bruikbare informatie, die
           vervolgens gedistribueerd wordt door de gehele
           organisatie




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   52
Top tien KPI's in ICT-organisaties
1.  Percentage serviceaanvragen dat binnen afgesproken
    tijd is afgehandeld
2. Gemiddelde tijd tot herstel (Mean Time to Repair)

3. Klanttevredenheid

4. Percentage dat ict-middelen niet werken door
    veranderingen (geplande onbeschikbaarheid)
5. Percentage dat ict-middelen niet werken door incidenten
    (ongeplande onbeschikbaarheid)
6. Beschikbaarheid (excl. geplande downtime)

7. Gemiddeld aantal serviceaanvragen per behandelaar

8. Eenheidskosten voor ict-diensten

9. Percentage eerstelijnsafhandeling van serviceaanvragen

10. Percentage incidenten dat te laat is afgehandeld

http://www.computable.nl/artikel/ict_topics/business_intelligence/2585092/1277145/top-tien-kpis-voor-
dinsdagictorganisaties.html
        29 november 2011                      Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   53
Business Intelligence [2/2]
    Competitive intelligence: een aspect van
     business intelligence dat zich beperkt tot
     informatie over concurrenten en de manieren
     waarop deze kennis strategie, tactieken, en
     de dagelijkse gang van zaken beïnvloedt
    Counterintelligence: de stappen die een
     organisatie neemt om informatie te
     beschermen die gezocht wordt door
     “vijandige” intelligence verzamelaars


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS              54
                                                             http://www.fas.org/irp/ops/ci/cistrategy2007.pdf
Competitive intelligence cyclus
    MBI scriptie van R. Ciric




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   55
Wie zijn de Business Intelligence leveranciers tot 2007?

                                             Omzet ($M)                   Markt aandeel                         Groei
     BI Leverancier                            2006                           2006                             2005-2006

1 Business Objects                                  894                          14%                             7%

2 SAS                                               679                          11%                            17%

3 Cognos                                            622                          10%                            10%

4 Microsoft                                         480                            8%                           28%

5 Hyperion                                          322                            5%                           12%

                           [IDC Research (2006), The BI Tools Market in 2006]


dinsdag 29 november 2011             Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS               56
Gartner’s Magic Quadrant for Business Intelligence
                                      Platforms, 1Q07




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   57
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   58
Wat schuift het?




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   59
Hollands glorie




dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   60
Online Analytical Processing (OLAP)
    Software waarmee gebruikers data
     kunnen verkennen vanuit verschillende
     perspectieven




                   Tabel 3.6: Vergelijking van OLAP en Data Mining

dinsdag 29 november 2011          Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   61
Gedistribueerde Databases
    Gedistribueerde database
          De data kan verspreid zijn over verschillende
           kleinere databases die onderling verbonden
           zijn via telecommunicatie apparaten
          Bedrijven krijgen meer flexibiliteit in hoe
           databases georganiseerd en gebruikt worden
    Gerepliceerde database
          Bevat een identieke verzameling van frequent
           gebruikte data


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   62
Objectgeoriënteerde Databases
    Objectgeoriënteerd database management
     systeem (OODBMS)
          Programma’s die een objectgeoriënteerdee
           database manipuleren en een gebruikersinterface
           en verbindingen naar andere toepassingen
           verschaffen
    Object-relational database management
     system (ORDBMS)
          Een DBMS met speciale ondersteuning voor
           audio, video, en geografische data


dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   63
Agenda
    Principes en leerdoelen
    Data management en data modellering
    Database management systemen
    Database toepassingen
    Samenvatting




 Data » Databases » Data warehouse >> Data mining »
 Business intelligence
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   64
Samenvatting [1/3]
    Datahiërarchie: bits, karakters, velden,
     records, files, en databases
    Entiteit: een gegeneraliseerde klasse van
     mensen, plaatsen, of ‘dingen’ (objecten)
     waarvoor data wordt verzameld/onderhouden
    Attribuut: Een kenmerk van een entiteit
    Data model: een diagram van data entiteiten
     en hun onderlinge relaties
    Relationele model: alle data elementen worden
     geplaatst in tweedimensionale tabellen (relaties)

dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   65
Samenvatting [2/3]
    Selecteren: het elimineren van rijen volgens
     bepaalde criteria
    Projecteren: het elimineren van kolommen
     in een tabel
    Een database management system (DBMS)
     is een groep programma’s die als interface
     gebruikt worden tussen:
          Database en toepassingsprogramma’s
          Database en de gebruiker
    Data dictionary: gedetailleerde beschrijving
     van alle data die in de database voorkomt
dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   66
Samenvatting [3/3]
    Data warehouse: database die
     bedrijfsinformatie verzamelt over alle aspecten
     van bedrijfsprocessen, producten, klanten
    Data mining: een informatieanalyse
     gereedschap voor het blootleggen van
     patronen en relaties in oa een data warehouse
    Business intelligence (BI): het verzamelen
     van de juiste informatie, tijdig en bruikbaar, en
     het analyseren van deze informatie om het
     zaken doen positief te beïnvloeden

dinsdag 29 november 2011   Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS   67

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
Christy Abraham Joy
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
Vit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
MindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Het Organiseren van data en informatie

  • 1. Het organiseren van data en informatie Hoofdstuk 3: Fundamentals of information systems Ralph Stair & George Reynolds Hoorcollege 3/9 Informatiesystemen (INFOB1ISY) Marco Spruit http://sites.google.com/a/cs.uu.nl/infob1isy/
  • 2. Agenda  Principes en leerdoelen  Data management en data modellering  Database management systemen  Database toepassingen  Samenvatting Data » Databases » Data warehouse >> Data mining » Business intelligence dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 2
  • 3. Principes en Leerdoelen [1/3]  Data management en data modellering zijn centrale aspecten in het organiseren van data en informatie  Definieer algemene data management concepten en termen, en licht de voordelen van de databasebenadering in data management uit  Beschrijf het relationele database model en schets de basiskenmerken hiervan dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 3
  • 4. Principes en Leerdoelen [2/3]  Een goed ontworpen en goed beheerde database is een extreem waardevol hulpmiddel in het ondersteunen van de besluitvorming  Stel de standaard functies vast die door alle database management systems uitgevoerd worden  Bepaal de populaire database management systems voor eindgebruikers dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 4
  • 5. Principes en Leerdoelen [3/3]  Het aantal en soorten van database toepassingen zal zich verder blijven ontwikkelen en zal concrete zakelijke voordelen blijven opleveren  Benoem en bespreek huidige database toepassingen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 5
  • 6. Flashback 1/3: Data versus Informatie  Data: ruwe feiten  Alfanumeriek, beeld, geluid, video  Voorbeeld: “spruit” “1”  Informatie: verzameling van feiten die dusdanig zijn georganiseerd dat er toegevoegde waarde aanwezig is boven de ruwe feiten Voor mensen begrijpelijk en bruikbaar! dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 6
  • 7. Flashback 2/3: Informatiesystemen Componenten van een computer-gebaseerd informatiesysteem:  één verzameling van […] die zijn geconfigureerd om data te verzamelen, manipuleren, bewaren, en transformeren naar informatie dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 7
  • 8. Flashback 3/3: BIS typologie Figuur 1.5: Bedrijfsinformatiesystemen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 8
  • 9. Agenda  Principes en leerdoelen  Data management en data modellering  Database management systemen  Database toepassingen  Samenvatting Data » Databases » Data warehouse >> Data mining » Business intelligence dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 9
  • 10. … Wie waren jullie ook alweer? Projectmanager 10 Game tester 1 Consultant 8 Graphic art designer 1 Informatie analist 7 interaction designer 1 Software engineer 7 IT-auditer 1 Informatiemanager 6 Jurist (IT) 1 entrepreneur / ondernemer 4 legerofficier IS 1 beveiligingsexpert 3 Lobbyist 1 Systeem ontwikkelaar 3 Lucht verkeersleider 1 Functioneel ontwerper 2 Marketeer 1 Systeembeheerder 2 muziek producer 1 business analyst 1 Onderzoeker 1 Celbioloog 1 PhD 1 Correspondent / Journalist 1 risicoanalist 1 digitaal recherceur 1 usability expert 1 Game designer 1 Web redacteur 1 dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 10
  • 11. Waarom leren over Database Systemen?  Databasesystemen (Ned: “gegevensbanken”) verwerken en organiseren (grote) hoeveelheden gegevens  Informatiekunde: waar/hoe is de informatie?  Databasegebruik in allerlei functies:  Marketing manager: klantgegevens  Bedrijfsjurist: eerdere vonnissen, precedenten  … dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 11
  • 12. Introductie database systemen  Database: een georganiseerde verzameling gegevens  Database management system (DBMS): een verzameling programma’s om een database mee te beheren  Manipuleert de database  Verschaft een interface tussen de database en de gebruiker (zowel database als andere applicaties)  Database administrator (DBA): een IT professional die de databases van een organisatie beheert en onderhoudt dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 12
  • 13. Data Management  Zonder data en de mogelijkheid om ermee te (ver-)werken, kan een organisatie de meeste bedrijfsactiviteiten niet succesvol uitvoeren  Betalen van werknemers  Versturen van facturen  Bestellen van nieuwe voorraden  Data bestaat uit ruwe feiten  Om data te transformeren naar betekenisvolle informatie, moet het eerst worden geordend worden op een betekenisvolle wijze dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 13
  • 14. Wat is data? De Datahiërarchie [1/3]  Bit (een binair getal): een circuit dat óf AAN óf UIT staat  Byte: acht bits  Karakter: basis eenheid van informatie  Elke byte representeert een character  Kan een hoofdletter, kleine letter, numeriek getal, speciaal symbool zijn  Veld (kolom; rubriek): bijv. een naam, nummer, of andere combinatie van karakters die een aspect van een zakelijk object of activiteit beschrijven dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 14
  • 15. Wat is data? De Datahiërarchie [2/3]  Record (rij): een verzameling van gerelateerde velden  File (tabel; dossier): een verzameling van gerelateerde records  Database (gegevensbank): een verzameling van geïntegreerde en gerelateerde files  Datahiërarchie: bits, karakters, velden, records, files, en databases dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 15
  • 16. Bits-Byte-Karakter: Decimaal versus Binair  Wikipedia voorbeeld bij getalsystemen Bits Byte Karakter In 128 64 32 16 8 4 2 1 Uit 0 1 1 0 1 0 1 0 01101010 =106 +64 +32 +8=2 3 +2=2 1 0 0 0 1 0 0 0 0 00010100 =20 +16 +4  …en vice versa: hoeveel is “57”? 0 0 -32 -16 -8 0 0 -1 57 =00111001 0 0 1 1 1 0 0 1 dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 16
  • 17. Wat is data? De Datahiërarchie [3/3] Figuur 3.1: De datahiërarchie dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 17
  • 18. Entiteiten, Attributen, en Sleutels [1/2]  Entiteit: een gegeneraliseerde klasse van mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden  Attribuut: Een kenmerk van een entiteit  Data item: De waarde van een attribuut  Sleutel: Een veld of verzameling velden in een record dat gebruikt wordt om het record te identificeren  Primaire sleutel: Een sleutel waarmee ieder record uniek geïdentificeerd kan worden dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 18
  • 19. Entiteiten, Attributen, en Sleutels [2/2] Figuur 3.2: Sleutels en Attributen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 19
  • 20. Entiteiten, Attributen, en Terroristen  p.112,§1: Van attributen & data naar terrorismebestrijding… http://news.cnet.com/8301-13578_3-10059987-38.html?part=rss&subj=news&tag=2547-1_3-0-20 dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 20
  • 21. Agenda  Principes en leerdoelen  Data management en data modellering  Database management systemen  Database toepassingen  Samenvatting Data » Databases » Data warehouse >> Data mining » Business intelligence dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 21
  • 22. De Databasebenadering [1/4]  De traditionele benadering van database management: voor iedere toepassing worden aparte data bestanden aangemaakt  Resulteert in dataredundantie (duplicatie)  Dataredundantie conflicteert met data-integriteit  De databasebenadering van database management: ‘een vijver’ van gerelateerde data wordt gedeeld door meerdere toepassingen  Significante voordelen t.o.v. de traditionele benadering  ? bijv vertaald naar PC besturingssystemen? dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 22
  • 23. De Databasebenadering [2/4] Figure 3.3: De databasebenadering van Data Management dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 23
  • 24. De Databasebenadering [3/4] Tabel 3.1: Voordelen van de databasebenadering dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 24
  • 25. De Databasebenadering [4/4] Tabel 3.2: Nadelen van de databasebenadering dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 25
  • 26. Data Modellering [1/2]  Data model: een diagram van data entiteiten en hun onderlinge relaties  Entiteit-relatie (ER) diagram: een type data model dat gebruik maakt van eenvoudige grafische symbolen om de organisatie van — en relaties tussen — de data te tonen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 26
  • 27. Data Modellering [2/2] 1-n relatie => 1-1 relatie => Figuur 3.4: Entiteit-Relatie (ER) Diagram voor een Klantorder DB dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 27
  • 28. Het Relationele Database Model [1/2]  Relationele model: alle data elementen worden geplaatst in tweedimensionale tabellen (relaties), die het logische equivalent zijn van bestanden (files)  In het relationele model geldt:  Elke rij in een tabel representeert een data entiteit  Kolommen van de tabel representeren attributen  Domein: de toegestane waarden voor data attributen  Data dictionary: gedetailleerde beschrijving van alle data die in de database voorkomt dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 28
  • 29. Het Relationele Database Model [2/2] Figuur 3.5: Een Relationeel Database Model dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 29
  • 30. Datamanipulatie [1/2]  Selecteren: het elimineren van rijen volgens bepaalde criteria  Projecteren: het elimineren van kolommen in een tabel  Samenvoegen: het combineren van twee of meer tabellen  Verbinden: het relateren of verbinden van twee of meer tabellen via gedeelde data attributen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 30
  • 31. Datamanipulatie [2/2] Figuur 3.7: Het verbinden van tabellen om de vraag teSales beantwoorden: Wie is de manager van de kunnen Manual en dinsdag 29 november 2011 sindsorganiseren van data en informatie :: Stair & Reynoldsdienst? Het wanneer is hij in :: H3 :: MrS 31
  • 32. Koffietijd… Principes en leerdoelen Data management en data modellering Database management systemen Database toepassingen Samenvatting
  • 33. Overzicht van Database Types  Flat file  Simpel databaseprogramma waarin records geen relatie met elkaar hebben  Voorbeeld: Excel  Single user  Slechts één persoon kan tegelijkertijd gebruik maken van de database  Voorbeelden: Access, FileMaker  Multi-user  Meerdere mensen hebben tegelijkertijd toegang tot hetzelfde database systeem  Voorbeelden: zie volgende slide… dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 33
  • 34. Belangrijkste (primaire) DBMS dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 34
  • 35. Datamanipulatie en Rapportage [1/2]  Structured Query Language (SQL): Dé standaard vraagtaal voor relationele databases  Data manipulation language (DML): Commando’s die de data in een database manipuleren  Database programma’s kunnen rapporten documenten, en allerlei andere vormen van uitvoer produceren dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 35
  • 36. Manipulatie en Rapportage [2/2] Table 3.3: Voorbeelden van SQL Commando’s dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 36
  • 37. Database Beheer  Database administrator (DBA): Stuurt aan en voert uit alle activiteiten binnen de database omgeving  Plannen, ontwerpen, aanmaken, opereren, beveiligen, monitoren en onderhouden van de database systemen (Figuur 3.16!)  Vaststellen en invoeren van beleid en procedures  Werknemers trainen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 37
  • 38. Selecteren van een Database Systeem  Belangrijke database eigenschappen die overwogen dienen te worden  Grootte van de database  Kosten van het systeem  Aantal gelijktijdige gebruikers  Uitvoeringssnelheid (lezen/schrijven)  Integratiemogelijkheden met andere systemen  Leverancier overwegingen  Open-source? dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 38
  • 39. Nieuwe ontwikkelingen: NoSQL  http://www.rackspacecloud.com/blog/2009/11/09/nosql-ecosystem/  The “NoSQL” term was actually coined Last.fm wanted to organize an event to discuss open source distributed databases. The name and concept both caught on.  NoSQL is making people aware that there are other options out there. But we’re not anti-relational-database for when that really is the best tool for the job; it’s “Not Only SQL,” rather than “No SQL at all.”  Three axes along which to think about the many database options: 1. scalability, 2. data and query model, and 3. persistence design. dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 39
  • 40. ... We're currently moving our largest (and most painful to maintain) table — the statuses table, which contains all tweets and retweets. ... dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 40
  • 41. Agenda  Principes en leerdoelen  Data management en data modellering  Database management systemen  Database toepassingen  Samenvatting Data » Databases » Data warehouse >> Data mining » Business intelligence dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 41
  • 42. Verbinden van Databases met Internet  Verbinden van databases met het Internet is belangrijk voor veel organisaties en mensen  Semantische Web  Ontwikkeling van een naadloze integratie van traditionele databases met het Internet  Laat mensen een aantal traditionele databases tegelijkertijd benaderen en manipuleren via het Internet  W3C: “The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries”. [http://www.w3.org/2001/sw/SW-FAQ] dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 42
  • 43. Over Databases, Internet, en De Wet…  Wat vindt onze overheid eigenlijk van al die databases en het internet…? dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 43
  • 44. Data Warehouses, Marts, Mining [1/3]  Data warehouse: verzamelt bedrijfsinformatie uit meerdere bronnen in de organisatie  Data mart: een deelverzameling van een data warehouse  Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in een data warehouse of data mart dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 44
  • 45. Data Warehouses, Marts, Mining [2/3] Figuur 3.17: Elementen van een Data Warehouse dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 45
  • 46. Data Warehouses, Marts, Mining [3/3] Tabel 3.5: Regelmatig voorkomende Data Mining toepassingen dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 46
  • 47. De Weerbarstige Werkelijkheid… dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 47
  • 48. Big Brother Awards 2009 1. De DNA-databank voor kinderen  Een genetisch strafblad voor jeugdzondes 1. De nieuwe Paspoortwet  Twee vingerafdrukken van alle Nederlanders in één opsporingsregister 1. Het Centraal Informatiepunt Onderzoek Telecommunicatie  Het telefoonboek van de opsporingsdiensten vindt gretig aftrek en dijt uit 1. De illegale verzamelpraktijken van Advance  Quizmasters verdienen goed geld met je echte leeftijd 1. Albert Heijn voor de proef 'TiP2Pay'  Thumbs down voor vingerafdrukbetaling 1. … dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 48
  • 49. Big Brother winnaars 2010  Personen: Ivo Opstelten vanwege het voorstel om automatisch gescande kentekens vier weken te bewaren  Bedrijven: Trans Link Systems en de grootste OV- bedrijven vanwege het doorzetten van de OV-chipkaart – en zelfs kijken of het ook als betalingsmiddel kan worden gebruikt – terwijl de kaart onherstelbaar kapot is.  Overheden en instellingen: Het ministerie voor Sociale Zaken en Werkgelegenheid voor de huisbezoeken door de Haagse Pandbrigade, ook zonder concrete verdenking van fraude.  Voorstellen: Deep Packet Inspection, een permanente internettap op al het verkeer van alle Nederlandse internetters. dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 49
  • 50. Ook over de grens doet de overheid aan DM dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 50
  • 51. MBI afstudeervoorbeeld: Data mining  MBI scriptie van A. Vleugel over Data mining  Doel: het verbeteren van het matchingsproces van vacatures naar uitzendbureau’s mbv data mining technieken. . dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 51
  • 52. Business Intelligence [1/2]  Business intelligence (BI): het verzamelen van de juiste informatie, tijdig, in een bruikbare vorm, en het analyseren van deze informatie om het zaken doen op een positieve manier te beïnvloeden  Transformeert data naar bruikbare informatie, die vervolgens gedistribueerd wordt door de gehele organisatie dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 52
  • 53. Top tien KPI's in ICT-organisaties 1. Percentage serviceaanvragen dat binnen afgesproken tijd is afgehandeld 2. Gemiddelde tijd tot herstel (Mean Time to Repair) 3. Klanttevredenheid 4. Percentage dat ict-middelen niet werken door veranderingen (geplande onbeschikbaarheid) 5. Percentage dat ict-middelen niet werken door incidenten (ongeplande onbeschikbaarheid) 6. Beschikbaarheid (excl. geplande downtime) 7. Gemiddeld aantal serviceaanvragen per behandelaar 8. Eenheidskosten voor ict-diensten 9. Percentage eerstelijnsafhandeling van serviceaanvragen 10. Percentage incidenten dat te laat is afgehandeld http://www.computable.nl/artikel/ict_topics/business_intelligence/2585092/1277145/top-tien-kpis-voor- dinsdagictorganisaties.html 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 53
  • 54. Business Intelligence [2/2]  Competitive intelligence: een aspect van business intelligence dat zich beperkt tot informatie over concurrenten en de manieren waarop deze kennis strategie, tactieken, en de dagelijkse gang van zaken beïnvloedt  Counterintelligence: de stappen die een organisatie neemt om informatie te beschermen die gezocht wordt door “vijandige” intelligence verzamelaars dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 54 http://www.fas.org/irp/ops/ci/cistrategy2007.pdf
  • 55. Competitive intelligence cyclus  MBI scriptie van R. Ciric dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 55
  • 56. Wie zijn de Business Intelligence leveranciers tot 2007? Omzet ($M) Markt aandeel Groei BI Leverancier 2006 2006 2005-2006 1 Business Objects 894 14% 7% 2 SAS 679 11% 17% 3 Cognos 622 10% 10% 4 Microsoft 480 8% 28% 5 Hyperion 322 5% 12% [IDC Research (2006), The BI Tools Market in 2006] dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 56
  • 57. Gartner’s Magic Quadrant for Business Intelligence Platforms, 1Q07 dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 57
  • 58. dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 58
  • 59. Wat schuift het? dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 59
  • 60. Hollands glorie dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 60
  • 61. Online Analytical Processing (OLAP)  Software waarmee gebruikers data kunnen verkennen vanuit verschillende perspectieven Tabel 3.6: Vergelijking van OLAP en Data Mining dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 61
  • 62. Gedistribueerde Databases  Gedistribueerde database  De data kan verspreid zijn over verschillende kleinere databases die onderling verbonden zijn via telecommunicatie apparaten  Bedrijven krijgen meer flexibiliteit in hoe databases georganiseerd en gebruikt worden  Gerepliceerde database  Bevat een identieke verzameling van frequent gebruikte data dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 62
  • 63. Objectgeoriënteerde Databases  Objectgeoriënteerd database management systeem (OODBMS)  Programma’s die een objectgeoriënteerdee database manipuleren en een gebruikersinterface en verbindingen naar andere toepassingen verschaffen  Object-relational database management system (ORDBMS)  Een DBMS met speciale ondersteuning voor audio, video, en geografische data dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 63
  • 64. Agenda  Principes en leerdoelen  Data management en data modellering  Database management systemen  Database toepassingen  Samenvatting Data » Databases » Data warehouse >> Data mining » Business intelligence dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 64
  • 65. Samenvatting [1/3]  Datahiërarchie: bits, karakters, velden, records, files, en databases  Entiteit: een gegeneraliseerde klasse van mensen, plaatsen, of ‘dingen’ (objecten) waarvoor data wordt verzameld/onderhouden  Attribuut: Een kenmerk van een entiteit  Data model: een diagram van data entiteiten en hun onderlinge relaties  Relationele model: alle data elementen worden geplaatst in tweedimensionale tabellen (relaties) dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 65
  • 66. Samenvatting [2/3]  Selecteren: het elimineren van rijen volgens bepaalde criteria  Projecteren: het elimineren van kolommen in een tabel  Een database management system (DBMS) is een groep programma’s die als interface gebruikt worden tussen:  Database en toepassingsprogramma’s  Database en de gebruiker  Data dictionary: gedetailleerde beschrijving van alle data die in de database voorkomt dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 66
  • 67. Samenvatting [3/3]  Data warehouse: database die bedrijfsinformatie verzamelt over alle aspecten van bedrijfsprocessen, producten, klanten  Data mining: een informatieanalyse gereedschap voor het blootleggen van patronen en relaties in oa een data warehouse  Business intelligence (BI): het verzamelen van de juiste informatie, tijdig en bruikbaar, en het analyseren van deze informatie om het zaken doen positief te beïnvloeden dinsdag 29 november 2011 Het organiseren van data en informatie :: Stair & Reynolds :: H3 :: MrS 67

Editor's Notes

  1. Hoe vonden jullie: het eerste gastcollege over Urban Management en Cyber Security? het eerste werkcollege? Donderdag gastcollege: hoe werkt een mobieltje, en waarom soms niet?
  2. Waar gaan we ‘t over hebben deze week? De verhaallijn van vandaag, samengevat: Data -> databases -> data mining -> business intelligence
  3. Waar gaan we ‘t over hebben deze week? De verhaallijn van vandaag, samengevat: Data -> databases -> data mining -> business intelligence Deze slide gaat over: data (en data management)
  4. Deze slide gaat over: databases
  5. Deze slide gaat over: data mining en business intelligence
  6. Allereerst, een flashback… Vorige keer bespraken we onder meer het verschil tussen data en informatie. Wat is informatie eigenlijk, en hoe verhoudt informatie zich tot data (en kennis)> Daarvoor is het nodig om eerst vast te stellen wat Data is: nl. ruwe feiten. Ruwe feiten zijn bijvoorbeeld samengesteld uit alfanumerieke tekens, zoals woorden en getallen. Maar ook o.m. afbeeldingen en geluid zijn voorbeelden van Data. Voorbeeld: de woorden “spruit” en “1”. VRAAG : Wat is Informatie? Of, anders gesteld, hoe kan de data “spruit” informatie worden? ANTW: Georganiseerd op betekenisvolle manier. Spruit: als in Marco Spruit, geeft 1e jaars vak IOBM. Spruit: als in Spruitkool, bevat 1 mg ijzer per 100 gram. <Informatie> Tot slot: <Barcode> VRAAG: Data of Informatie?
  7. Computer-gebaseerd informatiesysteem (CBIS): één verzameling van Hardware: computer apparatuur t.b.v. invoer-, verwerkings- en uitvoeractiviteiten Software: computer programma’s t.b.v. de aansturing van de computer Database: georganiseerde verzameling van feiten en informatie Telecommunicatie: electronische transmissie van communicatie signalen Netwerken: verbinden van computers en apparatuur, binnen een gebouw, over de wereld Internet: ‘s werelds grootste computernetwerk Mensen: besturen, uitvoeren, programmeren, en onderhouden het systeem Procedures: strategiëen, beleid, methoden, en regels voor het gebruik van een CBIS … die zijn geconfigureerd om data te verzamelen, manipuleren, bewaren, en transformeren naar informatie
  8. Toont bereik van type BIS. Enterprise = meestomvattend. Meestal geintegreerd in 1 product: SAP.
  9. Reden: op volgende slide…
  10. VRAAG: Vorige week beroepen besproken: noem eens de functie die je later zou kunnen gaan uitvoeren, die niet mede afhangt van databasegebruik? <vrijwel geen> Wie van jullie volgt nu ook het tweedejaars vak MSO ( Modelleren en systeemontwikkeling )? Waarom? Dit is een vak bij informatie kunde. Daarom: als informatiekundige moet je simpelweg weten hoe en waar de informatie is waar je kundig over zult worden. Met het 2e deel van dit verhaal, over data mining en business intelligence, zul je zeker direct te maken krijgen als informatiekundige. Hoe kom je tot de informatie op basis waarvan je beslissingen gaat nemen? Nu komt BI ook in H7 nog wel ter sprake, maar aangezien dit het business doel van het hele “organiseren van data en informatie” is, vind ik deze basis zeer relevant voor een beter begrip van de volgende hoofdstukken.
  11. DBA zat al in vorige weekopdracht?
  12. Dus: Zonder data management => geen informatie Katharina Pietzka thesis
  13. Uitleg (start bij bits kolom IN – binair getal 01101010): bytes kolom, vrnl, als in een binair getal de eerste bit aan staat (dus op 1) dan betekent dat 2^0 oftewel 1. Zo ook voor 2^1 voor het 2e binaire getal = 2^1 = 2, etc, t/m 2^7 = 128. Dus, als je het binaire getal 01101010 hebt, en we gaan vlnr, dan is de 8e bit uit maar de 7e staat AAN, tel dus 2^6 = 64 bij de decimale uitkomst op. Het 6e bit staat ook AAN, dus tel vervolgens 2^5 = 32 bij 64 op = 96. Etc. Plus 2^3 = 8, en 2^1 = 2. Dus 106. ?? 57 in binair getalssysteem? 2^7|128 in 57? Nee 2^6|64 in 57? Nee 2^5|32 in 57? => 57-32=25 2^4|16 in 25? => 25-16=9 2^3|8 in 9? => 9-8=1 2^4|4 in 1? Nee 2^1|2 in 1? Nee 2^0|1 in 1? => 1-1=0 >> 00111001.
  14. F = ascii 70
  15. ??? Wat is voor de entiteit MENS een attribuut, data item, … >> Lengte/naam, 180 cm/marco, naam, geb.datum, vingerafdruk?
  16. Entiteiten = records Attributen = velden Sleutels = het unieke veld
  17. ?? VOORUITBLIK : Hoe is onder meer te zien dat dit boek in George Bush-land geschreven is…? Als je het boek bij je hebt, blader dan ‘ns naar pagina 112, paragraaf 1: <Lees 1e 8 regels voor>
  18. ?? Vertaald naar PC besturingssystemen? >> unix = traditioneel; windows = registry; mac = mix? vb: unix OS losse config bestanden, Windows 1 registry
  19. VRAAG: Wie heeft er wel eens met Microsoft Access gewerkt, of kent het Relaties scherm?
  20. VRAAG : Wat de hier de vraag? Van boven naar beneden -> eindigt bij Fiske en 1 mei 85.
  21. VRAAG : Voorbeeld? VRAAG : Nog andere db types? Hierarchisch (Windows Register), Object (Jasmine), Gedistribueerd (zie multi-user db) A navigational database is a type of database characterized by the fact that objects (or records) in it are found primarily by following references from other objects.
  22. VRAAG : Nog meer DBMS? Ik heb zo’n tien jaar geleden meerdere databases besproken voor de PCM: Access, FileMaker Pro, Visual dBase, Jasmine, Paradox, Approach, FoxPro, Visual Objects, … 29-7-2008 : Driekwart van alle organisaties waar gebruik wordt gemaakt van database software geeft aan gebruik te maken van Microsoft SQL Server. Hiermee is het in de Nederlandse zakelijke markt het meest voorkomende DBMS systeem.
  23. SQL = DML + DDL Q: Welke andere uitvoeren? >> html/jsp/php pagina’s
  24. Q: Welk beleid en procedures? >> Backup beleid
  25. VRAAG : Nu, Open source databases zoals MySQL?
  26. There are two things to look for in a distributed database: 1) support for multiple datacenters and 2) the ability to add new machines to a live cluster transparently to your applications. The columnfamily model shared by Cassandra and HBase is inspired by the one described by Google’s Bigtable paper , section 2.  (Cassandra drops historical versions, and adds supercolumns .) In both systems, you have rows and columns like you are used to seeing, but the rows are sparse : each row can have as many or as few columns as desired, and columns do not need to be defined ahead of time. The fundamental problem is that relational databases cannot handle many modern workloads.  There are three specific problem areas: scaling out to data sets like Digg’s ( 3 TB for green badges ) or Facebook’s ( 50 TB for inbox search ) or eBay’s ( 2 PB overall ), per-server performance , and rigid schema design . The Cassandra project was started by Facebook in 2007 to scale their internal applications, particularly Inbox Search. Earlier this year, they released it to the Apache incubator where other people from the community could become involved and start contributing. This allowed  the project to move forward in a direction that is more general to the public than just to Facebook’s needs. Hbase -> Facebook messaging Graafdatabases kunnen bijvoorbeeld worden gebruikt voor sociale-netwerksites of wiki's, waarbij sprake is van een groot aantal onderlinge verbanden. Het is inefficiënt om voor elk mogelijk verband een sql-query uit te voeren, als er ook rechtstreekse verwijzingen naar andere data kunnen worden opgeslagen. 
  27. CouchDB ( Couch  is an acronym for  cluster of unreliable commodity hardware ) Apache CouchDB , commonly referred to as  CouchDB , is an open source document-oriented database written mostly in theErlang programming language. It is part of the NoSQL group of data stores and is designed for local replication and to scale horizontally across a wide range of devices. CouchDB is supported by commercial enterprises Couchbase and Cloudant. Storing status_ids in 64bit unsigned integers means the theoretical maximum number of tweets is 18,446,744,073,709,551,615 or, as Programmable web point out, 2.7 billion tweets for every person on the planet.
  28. ?? Op wat voor manier verschilt het huidige web met dat van deze toekomstvisie? >> gestructureerd publiceren met tags, aangezien ergens de betekenis van de informatie kenbaar moet worden gemaakt…
  29. … en de beoogde reden voor deze Bewaarplicht brengt ons bij het volgende onderwerp… Data mining.
  30. VRAAG : Organisatie voorbeelden? Marktsegmentatie: Google – via AdSense Market Basket Analysis: Albert Heijn – AirMiles Trendanalyse: afstuderen van…
  31. Dankzij goed speur- en rekenwerk van Bits of Freedom en Rejo Zenger weten we nu dat de Nederlandse regering een vieze, obsessieve en gewetenloze stalker is. De Nederlandse opsporingsdiensten checken vaker de bel-, sms- en emailgegevens van burgers dan een Safari-sletje haar Hyves. Als in: ruimschoots meer dan de rest van Europa bij elkaar.
  32. Ter illustratie van de concrete mogelijkheden van data mining in een bedrijfscontext: hier iets over het afstudeeronderzoek van een van mijn MBI studenten. Arjen Vleugel’s werktitel is: Data mining – finding patterns… Doel: het verbeteren van het matchingsproces van vacatures naar uitzendbureau’s mbv data mining technieken.
  33. Percentage serviceaanvragen dat binnen afgesproken tijd is afgehandeld Gemiddelde tijd tot herstel (Mean Time to Repair) Klanttevredenheid Percentage dat ict-middelen niet werken door veranderingen (geplande onbeschikbaarheid) Percentage dat ict-middelen niet werken door incidenten (ongeplande onbeschikbaarheid) Beschikbaarheid (excl. geplande downtime) Gemiddeld aantal serviceaanvragen per behandelaar Eenheidskosten voor ict-diensten Percentage eerstelijnsafhandeling van serviceaanvragen Percentage incidenten dat te laat is afgehandeld
  34. http://www.technalysis.on.ca/cpa.html
  35. VRAAG : En wie zijn dé internationale BI software leveranciers? SAP: nr 7 (213, 3%, 18%) => Overname van Business Objects in 2008! Oracle: nr 8 (206, 3%, 12%) => (incl. Brio) Nu: Overname van Hyperion in 2007! SPSS: nr 9 (198, 3%, 12%) IBM: nr 12: (71, 1%, 12%) => Overname van Cognos in 2007! => SPSS in 2009!
  36. Een ORDBMS is een database management systeem dat lijkt op een relationele database, maar met een object-georienteerd database model: objects, classes and inheritance are directly supported in database schemas and in the query language. In addition, it supports extension of the data model with custom data-types and methods. ??? Wat is het probleem mt het werken met een niet-RDBMS? Welke querytaal? Geen SQL-achtige standaard…