DDMA / Universiteit Utrecht: Datakwaliteit

908 views

Published on

Gerrit Bloothooft geeft een presentatie over DQ in de GBA op de Dag van de Datakwaliteit 2009.

Published in: Travel, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
908
On SlideShare
0
From Embeds
0
Number of Embeds
22
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

DDMA / Universiteit Utrecht: Datakwaliteit

  1. 1. Event: DDMA DQ Dag Thema: Dag van de datakwaliteit Spreker: Gerrit Bloothooft – Universiteit Utrecht Datum: 3 november 2009 – BIM Huis www.ddma.nl
  2. 2. Naamkwaliteit in de Gemeentelijke Basisadministratie Gerrit Bloothooft Taalwetenschap, Universiteit Utrecht email: g.bloothooft@uu.nl
  3. 3. Nederland <ul><li>16 miljoen mensen met een naam </li></ul><ul><li>>miljoen aardrijkskundige namen </li></ul><ul><li>>miljoen bedrijfs- en productnamen </li></ul><ul><li>.. </li></ul>
  4. 4. naamkunde <ul><li>Wat zijn namen </li></ul><ul><ul><li>betekenis </li></ul></ul><ul><ul><li>rol in taal en communicatie </li></ul></ul><ul><li>Hoe worden namen gebruikt </li></ul><ul><ul><li>sociale indicator </li></ul></ul><ul><ul><li>verspreiding </li></ul></ul><ul><ul><li>mode (voornamen) </li></ul></ul>
  5. 5. voornamen en familienamen <ul><li>Naamkundig onderzoek baseren op de gehele bevolking </li></ul><ul><ul><li>gebruik van de Gemeentelijke Basisadministratie, sinds 1994 digitaal </li></ul></ul><ul><ul><li>hoe goed is de GBA? </li></ul></ul><ul><ul><li>wat leren we uit de GBA? </li></ul></ul>
  6. 6. bevolkingsadministratie <ul><li>Sinds 1811 Burgerlijke Stand </li></ul><ul><ul><li>naamwet </li></ul></ul><ul><ul><li>eisen aan voornamen en familienamen </li></ul></ul><ul><li>Bevolkingsregister > GBA </li></ul><ul><ul><li>persoonskaart </li></ul></ul><ul><ul><ul><li>bij overlijden naar Centraal Bureau voor Genealogie </li></ul></ul></ul><ul><ul><li>decentraal per gemeente </li></ul></ul><ul><ul><ul><li>vanaf 2008 ook centraal </li></ul></ul></ul>
  7. 7. GBA digitaal in 1994 <ul><li>1988-1994 digitalisatieproces van persoonskaart naar persoonslijst </li></ul><ul><ul><li>niet alle gegevens </li></ul></ul><ul><ul><li>toekenning a-nummer vanaf eind jaren 60 </li></ul></ul><ul><ul><li>consistentie persoonsvermeldingen </li></ul></ul><ul><ul><ul><li>als persoon </li></ul></ul></ul><ul><ul><ul><li>als ouder </li></ul></ul></ul><ul><ul><ul><li>als kind </li></ul></ul></ul>
  8. 8. GBA 2007 <ul><li>15,83 miljoen personen </li></ul><ul><ul><ul><li>met NL nationaliteit wonend in NL </li></ul></ul></ul><ul><li>2,25 miljoen personen </li></ul><ul><ul><ul><li>overleden of ge ë migreerd tussen 1994-2007 </li></ul></ul></ul><ul><li>~3,57 miljoen personen </li></ul><ul><ul><ul><li>overleden voor 1994, bekend als ouder of kind </li></ul></ul></ul>
  9. 9. cijfers over namen <ul><li>Voornamen </li></ul><ul><ul><li>5 miljoen verschillende (compleet) </li></ul></ul><ul><ul><li>500.000 enkele </li></ul></ul><ul><ul><li>300.000 eerste </li></ul></ul><ul><ul><li>7.000 nieuwe per jaar </li></ul></ul><ul><li>Familienamen </li></ul><ul><ul><li>314.000 (ca 140.000 in 1947) </li></ul></ul>
  10. 10. naamkwaliteit in GBA <ul><li>Criteria </li></ul><ul><ul><li>zelfde a-nummer: zelfde gegevens? </li></ul></ul><ul><ul><ul><li>persoon, als ouder, als kind </li></ul></ul></ul><ul><ul><li>1 persoon, 1 vermelding? </li></ul></ul><ul><ul><li>opdeling in voornamen, voorvoegsel, familienaam, titel correct? </li></ul></ul><ul><ul><li>juiste tekens gebruikt? </li></ul></ul><ul><ul><li>in overeenstemming met naamwet? </li></ul></ul>
  11. 11. zelfde a-nummer, verschillende voornaam <ul><li>Jenny Francisca H a nna & Jenny Francisca H e nna </li></ul><ul><li>Maud Marie Claire & Maud Marie </li></ul><ul><li>Neeltje & Nelly </li></ul><ul><li>Claudia & Cornelia </li></ul><ul><li>Jan Nicolaas & Gijsberta </li></ul><ul><li>Maria - Ilona & Maria Ilona </li></ul><ul><li>Xiayun & Xia Yun </li></ul><ul><li>28.981 records </li></ul>
  12. 12. zelfde a-nummer, verschillende geboorteplaats <ul><li>Zandvliet - S antvliet </li></ul><ul><li>Łódź - Lo d z </li></ul><ul><li>Hoensbroek - Heerlen </li></ul><ul><li>Steenbergen en Kruisland - Steenbergen </li></ul><ul><li>Haarlemmermeer - Groningen </li></ul><ul><li>Parimaribo - district Suriname </li></ul><ul><li>Tietjerksteradeel - onbekend </li></ul><ul><li>27.633 records </li></ul>
  13. 13. zelfde a-nummer, verschillende geboortedatum <ul><li>1945-07-25 & 1945-07- 02 </li></ul><ul><li>1963-07-01 & 1963- 00 - 00 </li></ul><ul><li>1931-04-16 & 1964 -04-16 </li></ul><ul><li>6.041 records </li></ul><ul><li>262 geboortedatums van voor 1840 (~ vroegst mogelijke geboortejaar). </li></ul>
  14. 14. zelfde persoon, meerdere a-nummers <ul><li>zelfde persoon, gelijke: </li></ul><ul><ul><ul><li>voornamen </li></ul></ul></ul><ul><ul><ul><li>geboortedatum </li></ul></ul></ul><ul><ul><ul><li>geboorteplaats </li></ul></ul></ul><ul><ul><ul><li>ID_moeder </li></ul></ul></ul><ul><li>als persoon, als kind </li></ul><ul><li>4.304 records </li></ul>
  15. 15. opdeling familienaam <5 á Campo <5 ACampo <5 'Campo A <5 A 'Campo <5 Campo a 5 A' Campo 16 A'Campo 44 Acampo 46 Campo A 57 à Campo aantal familienaam voorvoegsel
  16. 16. een familienaam? <ul><li>Hare Koninklijke Hoogheid Máxima, Prinses der Nederlanden, Prinses van Oranje-Nassau , Mevrouw van Amsberg </li></ul><ul><ul><li>Hare Koninklijke Hoogheid = predikaat </li></ul></ul><ul><ul><li>Máxima = voornaam </li></ul></ul><ul><ul><li>Prinses = adellijke titel </li></ul></ul><ul><ul><li>Mevrouw = aanspreektitel </li></ul></ul><ul><ul><li>Van Oranje-Nassau van Amsberg = geslachtsnaam </li></ul></ul>
  17. 17. aliassen <ul><li>Jacobus ( meergenaamd van der Zande ) </li></ul><ul><li>Baron de Vos van Steenwijk , genaamd van Essen </li></ul><ul><li>Gmelig , zich noemende en schrijvende Meyling </li></ul><ul><li>ten Thije , O ok G enoemd Boonkkamp </li></ul><ul><li>Vennegoor of Hesselink </li></ul>
  18. 18. tekens (wat mag wel en wat mag niet?) <ul><li>Simon _ Eugène </li></ul><ul><li>Bastiaan , Seán </li></ul><ul><li>Celèste Elise Eugenie 26 Avril </li></ul><ul><li>van 0 s </li></ul><ul><li>Jelle Schelte Pietersz . </li></ul><ul><li>Angela Maria Cornelia Wilhelmina .... </li></ul><ul><li>K . Roshani Wouterina </li></ul><ul><li>Dekkers -- Guillou </li></ul>
  19. 19. ik geef mijn kind de naam: Jan Peter van de Heilige Geest Jan Peter -van-de-Heilige-Geest Jan Peter J’adore Jan Peter ( Jacob ) jonkheer Jan Peter Jan Peter IV Jan Peter C D A Jan Peter ! J P JP J.P. j p J Peter Jan P Jan P. Jan p Jan Peter sz. Jan Peter szoon Jan Peter ’s Jan van Peter Jan d’ Peter Jan Peter Jan p eter j an peter Jan P eter Jan-Peter Jan ’ Peter Jan P ’ eter Janpeter Jan- p eter Jan ’ peter Jan - pe - ter Ja N Pe T e R J AN P ETER Jan P @’ r
  20. 20. GBA zeker niet foutloos <ul><li>foutherstel is ingewikkeld (en duur) </li></ul><ul><li>wat kan zoal fout gaan? </li></ul><ul><ul><li>tekenset en spelling </li></ul></ul><ul><ul><li>naamverdeling over velden </li></ul></ul><ul><ul><li>ouders die onafhankelijk door meerdere kinderen worden genoemd </li></ul></ul><ul><ul><li>buitenlandse registraties </li></ul></ul><ul><ul><li>(re)migratie </li></ul></ul>
  21. 21. hoe ouder hoe fouter (moeilijker) 1650 1811 1900 94-09 doop/trouw/ oud-burgerlijke stand GBA begraaf LINKS project GBA project
  22. 22. interessante naamverschijnselen
  23. 23. Link voornaampopulariteit <ul><li>Vanaf 1900 tot heden beschikbaar </li></ul><ul><li>Eerst: traditionele vernoeming </li></ul><ul><ul><li>weinig sociale aspecten zichtbaar </li></ul></ul><ul><li>Na 1950: vrijheid </li></ul><ul><ul><li>sociale groepen meer zichtbaar </li></ul></ul><ul><ul><li>naam wordt leeftijdspecifiek </li></ul></ul>
  24. 24. van Maria > Annie > Yvonne > Kimberley
  25. 25. complexe populariteit Femke, Sara, Bernhard
  26. 26. Link verspreidingskaarten <ul><li>Regionale variatie </li></ul><ul><ul><li>Waar zijn mensen met een bepaalde voornaam geboren ? </li></ul></ul><ul><ul><li>Waar wonen mensen met een bepaalde familienaam? </li></ul></ul>
  27. 27. relatief en absoluut (Gerrit)
  28. 28. link familienamen op -stra <ul><li>stra (absoluut) 169.243 stra (relatief) </li></ul>
  29. 29. klankverandering (familienamen relatief) <ul><li>schult (4.191) scholt (24.303) schout (20.285) </li></ul>
  30. 30. patronymisch suffix (familienamen relatief) <ul><li>-se (111.866) -sen (508.927) -sens (25.467) </li></ul>
  31. 31. toponymisch element (familienamen relatief) <ul><li>horst (hoogte met hakhout, 59.595) donk (rivierduin, 21.816) </li></ul>
  32. 32. samenvattend <ul><li>de GBA is natuurlijk niet foutloos </li></ul><ul><li>maar voor naamkundige analyse geweldig </li></ul><ul><li>GBA + LINKS project maakt complete naambeschrijving vanaf 1811 of eerder mogelijk </li></ul>

×