Your SlideShare is downloading. ×
DDMA / Universiteit Utrecht: Datakwaliteit
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

DDMA / Universiteit Utrecht: Datakwaliteit

771
views

Published on

Gerrit Bloothooft geeft een presentatie over DQ in de GBA op de Dag van de Datakwaliteit 2009.

Gerrit Bloothooft geeft een presentatie over DQ in de GBA op de Dag van de Datakwaliteit 2009.

Published in: Travel, Business

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
771
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Event: DDMA DQ Dag Thema: Dag van de datakwaliteit Spreker: Gerrit Bloothooft – Universiteit Utrecht Datum: 3 november 2009 – BIM Huis www.ddma.nl
  • 2. Naamkwaliteit in de Gemeentelijke Basisadministratie Gerrit Bloothooft Taalwetenschap, Universiteit Utrecht email: g.bloothooft@uu.nl
  • 3. Nederland
    • 16 miljoen mensen met een naam
    • >miljoen aardrijkskundige namen
    • >miljoen bedrijfs- en productnamen
    • ..
  • 4. naamkunde
    • Wat zijn namen
      • betekenis
      • rol in taal en communicatie
    • Hoe worden namen gebruikt
      • sociale indicator
      • verspreiding
      • mode (voornamen)
  • 5. voornamen en familienamen
    • Naamkundig onderzoek baseren op de gehele bevolking
      • gebruik van de Gemeentelijke Basisadministratie, sinds 1994 digitaal
      • hoe goed is de GBA?
      • wat leren we uit de GBA?
  • 6. bevolkingsadministratie
    • Sinds 1811 Burgerlijke Stand
      • naamwet
      • eisen aan voornamen en familienamen
    • Bevolkingsregister > GBA
      • persoonskaart
        • bij overlijden naar Centraal Bureau voor Genealogie
      • decentraal per gemeente
        • vanaf 2008 ook centraal
  • 7. GBA digitaal in 1994
    • 1988-1994 digitalisatieproces van persoonskaart naar persoonslijst
      • niet alle gegevens
      • toekenning a-nummer vanaf eind jaren 60
      • consistentie persoonsvermeldingen
        • als persoon
        • als ouder
        • als kind
  • 8. GBA 2007
    • 15,83 miljoen personen
        • met NL nationaliteit wonend in NL
    • 2,25 miljoen personen
        • overleden of ge ë migreerd tussen 1994-2007
    • ~3,57 miljoen personen
        • overleden voor 1994, bekend als ouder of kind
  • 9. cijfers over namen
    • Voornamen
      • 5 miljoen verschillende (compleet)
      • 500.000 enkele
      • 300.000 eerste
      • 7.000 nieuwe per jaar
    • Familienamen
      • 314.000 (ca 140.000 in 1947)
  • 10. naamkwaliteit in GBA
    • Criteria
      • zelfde a-nummer: zelfde gegevens?
        • persoon, als ouder, als kind
      • 1 persoon, 1 vermelding?
      • opdeling in voornamen, voorvoegsel, familienaam, titel correct?
      • juiste tekens gebruikt?
      • in overeenstemming met naamwet?
  • 11. zelfde a-nummer, verschillende voornaam
    • Jenny Francisca H a nna & Jenny Francisca H e nna
    • Maud Marie Claire & Maud Marie
    • Neeltje & Nelly
    • Claudia & Cornelia
    • Jan Nicolaas & Gijsberta
    • Maria - Ilona & Maria Ilona
    • Xiayun & Xia Yun
    • 28.981 records
  • 12. zelfde a-nummer, verschillende geboorteplaats
    • Zandvliet - S antvliet
    • Łódź - Lo d z
    • Hoensbroek - Heerlen
    • Steenbergen en Kruisland - Steenbergen
    • Haarlemmermeer - Groningen
    • Parimaribo - district Suriname
    • Tietjerksteradeel - onbekend
    • 27.633 records
  • 13. zelfde a-nummer, verschillende geboortedatum
    • 1945-07-25 & 1945-07- 02
    • 1963-07-01 & 1963- 00 - 00
    • 1931-04-16 & 1964 -04-16
    • 6.041 records
    • 262 geboortedatums van voor 1840 (~ vroegst mogelijke geboortejaar).
  • 14. zelfde persoon, meerdere a-nummers
    • zelfde persoon, gelijke:
        • voornamen
        • geboortedatum
        • geboorteplaats
        • ID_moeder
    • als persoon, als kind
    • 4.304 records
  • 15. opdeling familienaam <5 á Campo <5 ACampo <5 'Campo A <5 A 'Campo <5 Campo a 5 A' Campo 16 A'Campo 44 Acampo 46 Campo A 57 à Campo aantal familienaam voorvoegsel
  • 16. een familienaam?
    • Hare Koninklijke Hoogheid Máxima, Prinses der Nederlanden, Prinses van Oranje-Nassau , Mevrouw van Amsberg
      • Hare Koninklijke Hoogheid = predikaat
      • Máxima = voornaam
      • Prinses = adellijke titel
      • Mevrouw = aanspreektitel
      • Van Oranje-Nassau van Amsberg = geslachtsnaam
  • 17. aliassen
    • Jacobus ( meergenaamd van der Zande )
    • Baron de Vos van Steenwijk , genaamd van Essen
    • Gmelig , zich noemende en schrijvende Meyling
    • ten Thije , O ok G enoemd Boonkkamp
    • Vennegoor of Hesselink
  • 18. tekens (wat mag wel en wat mag niet?)
    • Simon _ Eugène
    • Bastiaan , Seán
    • Celèste Elise Eugenie 26 Avril
    • van 0 s
    • Jelle Schelte Pietersz .
    • Angela Maria Cornelia Wilhelmina ....
    • K . Roshani Wouterina
    • Dekkers -- Guillou
  • 19. ik geef mijn kind de naam: Jan Peter van de Heilige Geest Jan Peter -van-de-Heilige-Geest Jan Peter J’adore Jan Peter ( Jacob ) jonkheer Jan Peter Jan Peter IV Jan Peter C D A Jan Peter ! J P JP J.P. j p J Peter Jan P Jan P. Jan p Jan Peter sz. Jan Peter szoon Jan Peter ’s Jan van Peter Jan d’ Peter Jan Peter Jan p eter j an peter Jan P eter Jan-Peter Jan ’ Peter Jan P ’ eter Janpeter Jan- p eter Jan ’ peter Jan - pe - ter Ja N Pe T e R J AN P ETER Jan P @’ r
  • 20. GBA zeker niet foutloos
    • foutherstel is ingewikkeld (en duur)
    • wat kan zoal fout gaan?
      • tekenset en spelling
      • naamverdeling over velden
      • ouders die onafhankelijk door meerdere kinderen worden genoemd
      • buitenlandse registraties
      • (re)migratie
  • 21. hoe ouder hoe fouter (moeilijker) 1650 1811 1900 94-09 doop/trouw/ oud-burgerlijke stand GBA begraaf LINKS project GBA project
  • 22. interessante naamverschijnselen
  • 23. Link voornaampopulariteit
    • Vanaf 1900 tot heden beschikbaar
    • Eerst: traditionele vernoeming
      • weinig sociale aspecten zichtbaar
    • Na 1950: vrijheid
      • sociale groepen meer zichtbaar
      • naam wordt leeftijdspecifiek
  • 24. van Maria > Annie > Yvonne > Kimberley
  • 25. complexe populariteit Femke, Sara, Bernhard
  • 26. Link verspreidingskaarten
    • Regionale variatie
      • Waar zijn mensen met een bepaalde voornaam geboren ?
      • Waar wonen mensen met een bepaalde familienaam?
  • 27. relatief en absoluut (Gerrit)
  • 28. link familienamen op -stra
    • stra (absoluut) 169.243 stra (relatief)
  • 29. klankverandering (familienamen relatief)
    • schult (4.191) scholt (24.303) schout (20.285)
  • 30. patronymisch suffix (familienamen relatief)
    • -se (111.866) -sen (508.927) -sens (25.467)
  • 31. toponymisch element (familienamen relatief)
    • horst (hoogte met hakhout, 59.595) donk (rivierduin, 21.816)
  • 32. samenvattend
    • de GBA is natuurlijk niet foutloos
    • maar voor naamkundige analyse geweldig
    • GBA + LINKS project maakt complete naambeschrijving vanaf 1811 of eerder mogelijk