Hilbrand KikkersI T C G
ITCG
Friesestraatweg 215
9743 AD Groningen
Anonimisering van testgegevens
Privacy Paleis
28 januari 2015
I T C GEven voorstellen…
2
I T C G
VEEL
ORGANISATIES
GEBRUIKEN KOPIEËN VAN
PRODUCTIE DATABASES
I T C G
VEEL
ORGANISATIES
GEBRUIKEN KOPIEËN VAN
PRODUCTIE DATABASES
DOELEINDEN:
• TESTEN
• ONTWIKKELING
• OUTSOURCING
• MARKETING
• OPLEIDING
I T C G
 Anonimiseren
 SubsettenHoe beheer je al deze omgevingen?
Hoe ga je om met persoonsgegevens?
I T C G
Productie Test/Ontwikkel
Source Database Target Database
I T C G
Minimaliseer datagebruik
Bespaar op hardware
Verkort doorlooptijden
Efficiënter data beheer
Beschermen van relaties
Voldoen aan wetgeving
Voorkom imagoschade
Behoud concurrentie positie
Subsetten Anonimiseren
Voordelen van het subsetten van data Voordelen van het anonimiseren en maskeren
I T C G
Anonimiseren van gevoelige gegevens
I T C G
Persoonsgegevens
Identificerende Kenmerkende
- Naam
- Geboortedatum
- Email
- Bankrekening nummer
- BSN nummer
- Adres
- Polisnummer
- Telefoonnummer
- Etc…
- Banksaldo
- Schulden
- Medicijn gebruik
- Ziekte
- Geloofsovertuiging
- Politieke voorkeur
- Salaris
- Telefoonhistorie
- Etc…
“Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon”
Bron: Wet Bescherming Persoonsgegevens
I T C G
Identiteitsdiefstal
Chantage
Creditcard fraude
Spam
Imagoschade
Risico
Welke risico’s lopen betrokkenen
I T C G
Technieken
I T C G
Shuffle
Verwissel waarden binnen een kolom
Conditioneel
Maskeer gespecificeerde delen van tabellen+
Voornaam Naam Soort
Frans
Jan
Dirk
Jansen
de Boer
Huisman
DATPROF
Klant
Klant
Klant
Leverancier
I T C G
321
Voornaam Naam Soort Opmerking E-Mail
Frans
Jan
Dirk
de Boer
Huisman
Jansen
Blank
Verwijder waarden uit kolom
Scramble
Vervang bestaande karakters
fjansen@live.nl
jdeboer@live.nl
ikben@dirkhuisman.nl
“Zwager van D.Jansen”
“Heeft schulden”
xxxxxxx@xxxx.xx
Xxxxxxx@xxxx.xx
xxxxx@xxxxxxxxxx.xx
Klant
Klant
Klant
LeverancierDATPROF
I T C G
Nr. Polis
789
321
Nr. Voornaam Naam Soort Opmerking E-mail
Frans
Jan
Dirk
de Boer
Huisman
Jansen
DATPROF
123
456
789
321
123
456
Basis + AV Standaard
Basis
Klant
Klant
Klant
Leverancier
xxxxxxx@xxxx.xx
Xxxxxxx@xxxx.xx
xxxxx@xxxxxxxxxx.xx
Key-Shuffle
Verwissel primary keys en foreign keys consistent.
“Uniek klantnummer dat op pasjes en polissen wordt gedrukt”
I T C G
Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum
Frans
Jan
Dirk
de Boer
Huisman
Jansen
DATPROF
123
Klant
Klant
Klant
Leverancier
xxxxxxx@xxxx.xx
Xxxxxxx@xxxx.xx
xxxxx@xxxxxxxxxx.xx
321
789
456
First day
Verander datum velden naar de 1e van dezelfde maand of jaar
16-02-1954
25-11-1984
27-03-1974
01-02-1954
01-11-1984
01-03-1974
Postcode
Geslacht
Geboortedatum Geboortemaand Geboortejaar
87% 3.7% 0.04%
Bron: onderzoek anonimiteit door Prof. Dr. Latanya Sweeney (Harvard University)
I T C G
Nr. Voornaam Naam Soort Opm.. E-mail Geb-datum
de Boer
Huisman
Jansen
DATPROF
123
Klant
Klant
Klant
Leverancier
xxxxxxx@xxxx.xx
Xxxxxxx@xxxx.xx
xxxxx@xxxxxxxxxx.xx
321
789
01-02-1954
01-11-1984
01-03-1974
Look-up
Vervang waarden met waarden uit een andere tabel
Tim
Ruben
Thomas
Frans
Jan
Dirk
Voornamen
Daan
Thomas
Tim
Lars
Ruben
Levi
Luuk
Referentiedata
I T C G
Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum
Thomas
Tim
Ruben
de Boer
Huisman
Jansen
DATPROF
123
Klant
Klant
Klant
Leverancier
xxxxxxx@xxxx.xx
Xxxxxxx@xxxx.xx
xxxxx@xxxxxxxxxx.xx
321
789
456
01-02-1954
01-11-1984
01-03-1974
Expression
Maak gebruik van standaard of eigen functies
T.deBoer@testdata.nl
T.Huisman@testdata.nl
R.Jansen@testdata.nl
Fictief
Fictief
Fictief
I T C G
Keten
Methodes om over de keten heen te anonimiseren
Stap 1
Anonimiseer database A
Stap 2
Anonimiseer database B
geheugen
I T C G
Berichtenverkeer
Methodes om met ketenpartners te communiceren
geheugen
xml
xml
xml
xml
I T C G
“Blauwdruk”
Productie Master Testset Testsets
I T C G
Concrete tips
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
Identiteitsdiefstal
Chantage
Creditcard fraude
Spam
Imagoschade
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
3. Zoek een kennis-partner (oplossingen, wetgeving, etc)
veilig
bruikbaar
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
3. Zoek een kennis-partner (oplossingen, wetgeving, etc)
4. Doe ervaring op (proefproject)
veilig
bruikbaar
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
3. Zoek een kennis-partner (oplossingen, wetgeving, etc)
4. Doe ervaring op (proefproject)
5. Kijk naar de (extra) voordelen
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
3. Zoek een kennis-partner (oplossingen, wetgeving, etc)
4. Doe ervaring op (proefproject)
5. Kijk naar de (extra) voordelen
6. Maak fictieve data herkenbaar
I T C G
1. Inventariseer de risico’s (privacy-scan, impact assessment, ...)
2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
3. Zoek een kennis-partner (oplossingen, wetgeving, etc)
4. Doe ervaring op (proefproject)
5. Kijk naar de (extra) voordelen
6. Maak fictieve data herkenbaar
7. Begin eenvoudig
I T C G
Vragen?

Presentatie Privacy Paleis anonimiseringstool PIA

  • 1.
    Hilbrand KikkersI TC G ITCG Friesestraatweg 215 9743 AD Groningen Anonimisering van testgegevens Privacy Paleis 28 januari 2015
  • 2.
    I T CGEven voorstellen… 2
  • 3.
    I T CG VEEL ORGANISATIES GEBRUIKEN KOPIEËN VAN PRODUCTIE DATABASES
  • 4.
    I T CG VEEL ORGANISATIES GEBRUIKEN KOPIEËN VAN PRODUCTIE DATABASES DOELEINDEN: • TESTEN • ONTWIKKELING • OUTSOURCING • MARKETING • OPLEIDING
  • 5.
    I T CG  Anonimiseren  SubsettenHoe beheer je al deze omgevingen? Hoe ga je om met persoonsgegevens?
  • 6.
    I T CG Productie Test/Ontwikkel Source Database Target Database
  • 7.
    I T CG Minimaliseer datagebruik Bespaar op hardware Verkort doorlooptijden Efficiënter data beheer Beschermen van relaties Voldoen aan wetgeving Voorkom imagoschade Behoud concurrentie positie Subsetten Anonimiseren Voordelen van het subsetten van data Voordelen van het anonimiseren en maskeren
  • 8.
    I T CG Anonimiseren van gevoelige gegevens
  • 9.
    I T CG Persoonsgegevens Identificerende Kenmerkende - Naam - Geboortedatum - Email - Bankrekening nummer - BSN nummer - Adres - Polisnummer - Telefoonnummer - Etc… - Banksaldo - Schulden - Medicijn gebruik - Ziekte - Geloofsovertuiging - Politieke voorkeur - Salaris - Telefoonhistorie - Etc… “Elk gegeven over een geïdentificeerde of identificeerbare natuurlijke persoon” Bron: Wet Bescherming Persoonsgegevens
  • 10.
    I T CG Identiteitsdiefstal Chantage Creditcard fraude Spam Imagoschade Risico Welke risico’s lopen betrokkenen
  • 11.
    I T CG Technieken
  • 12.
    I T CG Shuffle Verwissel waarden binnen een kolom Conditioneel Maskeer gespecificeerde delen van tabellen+ Voornaam Naam Soort Frans Jan Dirk Jansen de Boer Huisman DATPROF Klant Klant Klant Leverancier
  • 13.
    I T CG 321 Voornaam Naam Soort Opmerking E-Mail Frans Jan Dirk de Boer Huisman Jansen Blank Verwijder waarden uit kolom Scramble Vervang bestaande karakters fjansen@live.nl jdeboer@live.nl ikben@dirkhuisman.nl “Zwager van D.Jansen” “Heeft schulden” xxxxxxx@xxxx.xx Xxxxxxx@xxxx.xx xxxxx@xxxxxxxxxx.xx Klant Klant Klant LeverancierDATPROF
  • 14.
    I T CG Nr. Polis 789 321 Nr. Voornaam Naam Soort Opmerking E-mail Frans Jan Dirk de Boer Huisman Jansen DATPROF 123 456 789 321 123 456 Basis + AV Standaard Basis Klant Klant Klant Leverancier xxxxxxx@xxxx.xx Xxxxxxx@xxxx.xx xxxxx@xxxxxxxxxx.xx Key-Shuffle Verwissel primary keys en foreign keys consistent. “Uniek klantnummer dat op pasjes en polissen wordt gedrukt”
  • 15.
    I T CG Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum Frans Jan Dirk de Boer Huisman Jansen DATPROF 123 Klant Klant Klant Leverancier xxxxxxx@xxxx.xx Xxxxxxx@xxxx.xx xxxxx@xxxxxxxxxx.xx 321 789 456 First day Verander datum velden naar de 1e van dezelfde maand of jaar 16-02-1954 25-11-1984 27-03-1974 01-02-1954 01-11-1984 01-03-1974 Postcode Geslacht Geboortedatum Geboortemaand Geboortejaar 87% 3.7% 0.04% Bron: onderzoek anonimiteit door Prof. Dr. Latanya Sweeney (Harvard University)
  • 16.
    I T CG Nr. Voornaam Naam Soort Opm.. E-mail Geb-datum de Boer Huisman Jansen DATPROF 123 Klant Klant Klant Leverancier xxxxxxx@xxxx.xx Xxxxxxx@xxxx.xx xxxxx@xxxxxxxxxx.xx 321 789 01-02-1954 01-11-1984 01-03-1974 Look-up Vervang waarden met waarden uit een andere tabel Tim Ruben Thomas Frans Jan Dirk Voornamen Daan Thomas Tim Lars Ruben Levi Luuk Referentiedata
  • 17.
    I T CG Nr. Voornaam Naam Soort Opm.. E-mail Geboortedatum Thomas Tim Ruben de Boer Huisman Jansen DATPROF 123 Klant Klant Klant Leverancier xxxxxxx@xxxx.xx Xxxxxxx@xxxx.xx xxxxx@xxxxxxxxxx.xx 321 789 456 01-02-1954 01-11-1984 01-03-1974 Expression Maak gebruik van standaard of eigen functies T.deBoer@testdata.nl T.Huisman@testdata.nl R.Jansen@testdata.nl Fictief Fictief Fictief
  • 18.
    I T CG Keten Methodes om over de keten heen te anonimiseren Stap 1 Anonimiseer database A Stap 2 Anonimiseer database B geheugen
  • 19.
    I T CG Berichtenverkeer Methodes om met ketenpartners te communiceren geheugen xml xml xml xml
  • 20.
    I T CG “Blauwdruk” Productie Master Testset Testsets
  • 21.
    I T CG Concrete tips 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) Identiteitsdiefstal Chantage Creditcard fraude Spam Imagoschade
  • 22.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies)
  • 23.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies) 3. Zoek een kennis-partner (oplossingen, wetgeving, etc) veilig bruikbaar
  • 24.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies) 3. Zoek een kennis-partner (oplossingen, wetgeving, etc) 4. Doe ervaring op (proefproject) veilig bruikbaar
  • 25.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies) 3. Zoek een kennis-partner (oplossingen, wetgeving, etc) 4. Doe ervaring op (proefproject) 5. Kijk naar de (extra) voordelen
  • 26.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies) 3. Zoek een kennis-partner (oplossingen, wetgeving, etc) 4. Doe ervaring op (proefproject) 5. Kijk naar de (extra) voordelen 6. Maak fictieve data herkenbaar
  • 27.
    I T CG 1. Inventariseer de risico’s (privacy-scan, impact assessment, ...) 2. Leer van collega-bedrijven (referentiegesprek, kennis-sessies) 3. Zoek een kennis-partner (oplossingen, wetgeving, etc) 4. Doe ervaring op (proefproject) 5. Kijk naar de (extra) voordelen 6. Maak fictieve data herkenbaar 7. Begin eenvoudig
  • 28.
    I T CG Vragen?