SlideShare a Scribd company logo
1 of 26
Test Data Management




Volg ons op twitter: @DATPROF   www.DATPROF.com
Inhoud

• Problematiek

• Subsetting

• Anonimiseren

• Demo DATPROF Subset & DATPROF Privacy
VEEL
                        DOELEINDEN:
ORGANISATIES
GEBRUIKEN KOPIEËN VAN   •   TESTEN
PRODUCTIE DATABASES
                        •   ONTWIKKELING
                        •   OUTSOURCING
                        •   MARKETING
                        •   OPLEIDING
Wat lost subsetten op?

Minimaliseren van het gebruik van data



Besparen op hardware & infrastructuur




Terugbrengen doorlooptijden




Efficiënter beheren testdata
Wat lost anonimiseren op?

     Beschermen relaties



     Voldoen aan wetgeving



     Voorkomen imagoschade




     Beveiligen concurrentie-gevoelige data
Creëer representatieve subsets van productie databases




                                            www.DATPROF.com
Productie              Ontwikkel & Test


  • Zelfde datastructuur
  • Gespecificeerd deel van de data
CRM




      Alle klanten uit Groningen




      Alle klantenvan Groningen
      Alle orders uit de subset




ERP
Importeren
 Meta data   Classificeren   3. Deployment
Anonimiseer gevoelige persoonsgegevens




                                  www.DATPROF.com
Risico´s voor betrokkenen van gelekte data

           Identiteitsdiefstal


           Creditcard fraude


           Imagoschade


           Chantage


           Spam
Persoonsgegevens
“Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon”
 Bron: Wet Bescherming Persoonsgegevens



                  Identificerende                    Kenmerkende
              -    Naam                              -   Banksaldo

              -    Geboortedatum                     -   Schulden

              -    Email                             -   Medicijn gebruik

              -    Bankrekening nummer               -   Ziekte

              -    BSN nummer                        -   Geloofsovertuiging

              -    Adres                             -   Politieke voorkeur

              -    Polisnummer                       -   Salaris

              -    Telefoonnummer                    -   Telefoonhistorie

              -    Etc…                              -   Etc…
Regulering in het kort
Meest gebruikte oplossing


    Productie
 Productie      Test   Ontwikkel
Anonimiseer functies
Shuffle                                            Conditioneel
Verwissel waarden binnen      +                    Maskeer gespecificeerde delen
een kolom                                          van tabellen




         Voornaam          Naam      Soort

          Frans            Jansen    Klant

          Jan              de Boer   Klant
          Dirk             Huisman   Klant

                           DATPROF   Leverancier
Key-Shuffle
  Verwissel primary keys en
  foreign keys consistent.




Relatie Nr.   Voornaam        Naam
 321
123
789            Frans          de Boer

456            Jan            Huisman
789            Dirk           Jansen

321                           DATPROF




                Relatie Nr.    Polis

                 123            Basis + AV Standaard
                 456            Basis
Blank                                                      Scramble
       Verwijder waarden uit kolom                                    Vervang bestaande
                                                                      karakters met x-tekens.




Voornaam        Naam                 Opmerking Callcenter    E-Mail
 321
Frans            de Boer             “Zwager van D.Jansen”   xxxxxxx@xxxx.xx
                                                             fdeboer@live.nl

Jan              Huisman                                     Xxxxxxx@xxxx.xx
                                                             Huisman@live.nl
Dirk             Jansen              “Heeft schulden”        xxxxx@xxxxxxxxxx.xx
                                                             ikben@dirkjansen.nl
First day
                   Verander datum velden naar de
                   1e van dezelfde maand of jaar




                           Voornaam       Naam            Geboortedatum
                            321
                           Frans           de Boer        01-02-1954
                                                          16-02-1954

                           Jan             Huisman        25-11-1984
                                                          01-11-1984
                           Dirk            Jansen         27-03-1974
                                                          01-03-1974



                        Geboortedatum                1e van de maand      1e van het jaar


      Postcode
                           87%                        3.7%                0.04%
Bron: onderzoek anonimiteit door Prof. Dr. Latanya Sweeney (Harvard University)
Expression
Maak gebruik van standaard
of eigen functies




        Voornaam       Naam       Telefoonnummer
         321
        Frans           de Boer   050-560000
                                  050-568879

        Jan             Huisman   0512-520612
                                  0512-520000
        Dirk            Jansen    020-250000
                                  020-254987
Look-up
                 Vervang waarden met waarden
                 uit een andere tabel




Voornamen

Daan

Thomas                                    Voornaam   Naam      Telefoonnummer
Tim    Tim
                                          Frans      de Boer   050-560000
Lars
                                          Jan        Huisman   0512-520000
Ruben
   Ruben                                  Dirk       Jansen    020-250000
Levi

Luuk
Referentiedata




                    Random, Waarde of Sleutel gebaseerd
Importeren
 Meta data   Definiëren regels   3. Deployment
Enterprise Service Bus
20130318   datprof privacy & subset

More Related Content

More from DATPROF

Test Data Management in an agile environment
Test Data Management in an agile environmentTest Data Management in an agile environment
Test Data Management in an agile environmentDATPROF
 
Test automatisering en test data management | data subsets
Test automatisering en test data management | data subsetsTest automatisering en test data management | data subsets
Test automatisering en test data management | data subsetsDATPROF
 
Gebruikerssessie DATPROF februari 2015
Gebruikerssessie DATPROF februari 2015Gebruikerssessie DATPROF februari 2015
Gebruikerssessie DATPROF februari 2015DATPROF
 
Presentatie Privacy Paleis anonimiseringstool PIA
Presentatie Privacy Paleis anonimiseringstool PIAPresentatie Privacy Paleis anonimiseringstool PIA
Presentatie Privacy Paleis anonimiseringstool PIADATPROF
 
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF Presentatie Agile en Testdata van Bert Nienhuis | DATPROF
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF DATPROF
 
Test Tool Event van Sogeti | DATPROF Testdata Management
Test Tool Event van Sogeti | DATPROF Testdata Management Test Tool Event van Sogeti | DATPROF Testdata Management
Test Tool Event van Sogeti | DATPROF Testdata Management DATPROF
 
Testdata kennissessie: Pas op: Persoonsgegevens?!
Testdata kennissessie: Pas op: Persoonsgegevens?!Testdata kennissessie: Pas op: Persoonsgegevens?!
Testdata kennissessie: Pas op: Persoonsgegevens?!DATPROF
 
20130918 kennis sessie-handout
20130918 kennis sessie-handout20130918 kennis sessie-handout
20130918 kennis sessie-handoutDATPROF
 
Dutchtestingconference2013 slideshare
Dutchtestingconference2013 slideshareDutchtestingconference2013 slideshare
Dutchtestingconference2013 slideshareDATPROF
 
Privacy webslideshare
Privacy webslidesharePrivacy webslideshare
Privacy webslideshareDATPROF
 
20121119 tmapprivacy
20121119 tmapprivacy20121119 tmapprivacy
20121119 tmapprivacyDATPROF
 

More from DATPROF (11)

Test Data Management in an agile environment
Test Data Management in an agile environmentTest Data Management in an agile environment
Test Data Management in an agile environment
 
Test automatisering en test data management | data subsets
Test automatisering en test data management | data subsetsTest automatisering en test data management | data subsets
Test automatisering en test data management | data subsets
 
Gebruikerssessie DATPROF februari 2015
Gebruikerssessie DATPROF februari 2015Gebruikerssessie DATPROF februari 2015
Gebruikerssessie DATPROF februari 2015
 
Presentatie Privacy Paleis anonimiseringstool PIA
Presentatie Privacy Paleis anonimiseringstool PIAPresentatie Privacy Paleis anonimiseringstool PIA
Presentatie Privacy Paleis anonimiseringstool PIA
 
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF Presentatie Agile en Testdata van Bert Nienhuis | DATPROF
Presentatie Agile en Testdata van Bert Nienhuis | DATPROF
 
Test Tool Event van Sogeti | DATPROF Testdata Management
Test Tool Event van Sogeti | DATPROF Testdata Management Test Tool Event van Sogeti | DATPROF Testdata Management
Test Tool Event van Sogeti | DATPROF Testdata Management
 
Testdata kennissessie: Pas op: Persoonsgegevens?!
Testdata kennissessie: Pas op: Persoonsgegevens?!Testdata kennissessie: Pas op: Persoonsgegevens?!
Testdata kennissessie: Pas op: Persoonsgegevens?!
 
20130918 kennis sessie-handout
20130918 kennis sessie-handout20130918 kennis sessie-handout
20130918 kennis sessie-handout
 
Dutchtestingconference2013 slideshare
Dutchtestingconference2013 slideshareDutchtestingconference2013 slideshare
Dutchtestingconference2013 slideshare
 
Privacy webslideshare
Privacy webslidesharePrivacy webslideshare
Privacy webslideshare
 
20121119 tmapprivacy
20121119 tmapprivacy20121119 tmapprivacy
20121119 tmapprivacy
 

20130318 datprof privacy & subset

  • 1. Test Data Management Volg ons op twitter: @DATPROF www.DATPROF.com
  • 2. Inhoud • Problematiek • Subsetting • Anonimiseren • Demo DATPROF Subset & DATPROF Privacy
  • 3. VEEL DOELEINDEN: ORGANISATIES GEBRUIKEN KOPIEËN VAN • TESTEN PRODUCTIE DATABASES • ONTWIKKELING • OUTSOURCING • MARKETING • OPLEIDING
  • 4. Wat lost subsetten op? Minimaliseren van het gebruik van data Besparen op hardware & infrastructuur Terugbrengen doorlooptijden Efficiënter beheren testdata
  • 5. Wat lost anonimiseren op? Beschermen relaties Voldoen aan wetgeving Voorkomen imagoschade Beveiligen concurrentie-gevoelige data
  • 6. Creëer representatieve subsets van productie databases www.DATPROF.com
  • 7. Productie Ontwikkel & Test • Zelfde datastructuur • Gespecificeerd deel van de data
  • 8.
  • 9. CRM Alle klanten uit Groningen Alle klantenvan Groningen Alle orders uit de subset ERP
  • 10. Importeren Meta data Classificeren 3. Deployment
  • 12.
  • 13. Risico´s voor betrokkenen van gelekte data Identiteitsdiefstal Creditcard fraude Imagoschade Chantage Spam
  • 14. Persoonsgegevens “Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon” Bron: Wet Bescherming Persoonsgegevens Identificerende Kenmerkende - Naam - Banksaldo - Geboortedatum - Schulden - Email - Medicijn gebruik - Bankrekening nummer - Ziekte - BSN nummer - Geloofsovertuiging - Adres - Politieke voorkeur - Polisnummer - Salaris - Telefoonnummer - Telefoonhistorie - Etc… - Etc…
  • 16. Meest gebruikte oplossing Productie Productie Test Ontwikkel
  • 18. Shuffle Conditioneel Verwissel waarden binnen + Maskeer gespecificeerde delen een kolom van tabellen Voornaam Naam Soort Frans Jansen Klant Jan de Boer Klant Dirk Huisman Klant DATPROF Leverancier
  • 19. Key-Shuffle Verwissel primary keys en foreign keys consistent. Relatie Nr. Voornaam Naam 321 123 789 Frans de Boer 456 Jan Huisman 789 Dirk Jansen 321 DATPROF Relatie Nr. Polis 123 Basis + AV Standaard 456 Basis
  • 20. Blank Scramble Verwijder waarden uit kolom Vervang bestaande karakters met x-tekens. Voornaam Naam Opmerking Callcenter E-Mail 321 Frans de Boer “Zwager van D.Jansen” xxxxxxx@xxxx.xx fdeboer@live.nl Jan Huisman Xxxxxxx@xxxx.xx Huisman@live.nl Dirk Jansen “Heeft schulden” xxxxx@xxxxxxxxxx.xx ikben@dirkjansen.nl
  • 21. First day Verander datum velden naar de 1e van dezelfde maand of jaar Voornaam Naam Geboortedatum 321 Frans de Boer 01-02-1954 16-02-1954 Jan Huisman 25-11-1984 01-11-1984 Dirk Jansen 27-03-1974 01-03-1974 Geboortedatum 1e van de maand 1e van het jaar Postcode 87% 3.7% 0.04% Bron: onderzoek anonimiteit door Prof. Dr. Latanya Sweeney (Harvard University)
  • 22. Expression Maak gebruik van standaard of eigen functies Voornaam Naam Telefoonnummer 321 Frans de Boer 050-560000 050-568879 Jan Huisman 0512-520612 0512-520000 Dirk Jansen 020-250000 020-254987
  • 23. Look-up Vervang waarden met waarden uit een andere tabel Voornamen Daan Thomas Voornaam Naam Telefoonnummer Tim Tim Frans de Boer 050-560000 Lars Jan Huisman 0512-520000 Ruben Ruben Dirk Jansen 020-250000 Levi Luuk Referentiedata Random, Waarde of Sleutel gebaseerd
  • 24. Importeren Meta data Definiëren regels 3. Deployment