Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

20150430 adlibgebruikersgroep openrefine_v0_6

589 views

Published on

Data Cleansing met Open Refine,
door
Alina Saenko, Packed vzw
Inge van Stokkom, Rijksmuseum Amsterdam

  • Be the first to comment

  • Be the first to like this

20150430 adlibgebruikersgroep openrefine_v0_6

  1. 1. WORKSHOP OPEN REFINE Alina Saenko | PACKED vzw Inge van Stokkom | Rijksmuseum 30.04.2015
  2. 2. DATA CLEANING … is arbeidsintensief Open Refine is een gratis open-source tool waarmee je data snel kan:  analyseren  schonen  normaliseren  verrijken
  3. 3. AGENDA  Wat is Open Refine?  Schonen van data  Normaliseren en verrijken (RKD, VIAF, AAT, Wikidata, Geonames…)  Exporteren  CEST: http://www.projectcest.be/index.php/Handleiding_Open_Refine  Handout: http://www.projectcest.be/images/3/38/20150430_Handout_Ope n_Refine_workshop.pdf
  4. 4. OPEN REFINE
  5. 5. Open Refine
  6. 6. WAT?  “a powerful tool for working with messy data”  open-source project - Freebase Gridworks (may 2010) - aankoop Google -> Google Refine (juli 2010) - 2010-2012: v.2.0 > v2.5 - Stop Google support > Open refine (October 2012) beta versie 2.6 - 2015: RefinePro – Cloud oplossing  stand alone desktop application, geen internet nodig  data schonen, normaliseren, transformeren naar verschillende formaten
  7. 7. Features? Facets and filters
  8. 8. Features? Cluster & Merge
  9. 9. Features? Google Refine Expression language
  10. 10. Features? Reconciliation Services
  11. 11. Meer informatie? • Website: http://openrefine.org/ • Wiki: https://github.com/OpenRefine/OpenRefine/wiki • GREL reference: https://github.com/OpenRefine/OpenRefine/wiki/Google -refine-expression-language • Blogs: http://googlerefine.blogspot.com http://blog.ouseful.info/ http://freeyourmetadata.org/cleanup/
  12. 12. Installeren -> http://openrefine.org/ Download, Unzip, Run …
  13. 13. DATASET UPLOADEN IN OPEN REFINE
  14. 14. DATASET UPLOADEN IN OPEN REFINE
  15. 15. LOOK & FEEL
  16. 16. FACET/FILTER
  17. 17. UNDO/REDO
  18. 18. SORT
  19. 19. ONNODIGE KOLOMMEN VERWIJDEREN
  20. 20. ONNODIGE RIJEN VERWIJDEREN
  21. 21. SCHONEN
  22. 22. WAARDES AANPASSEN (GREL EXPRESSIONS)
  23. 23. CONCEPTEN SCHONEN (CLUSTER AND EDIT)
  24. 24. NORMALISEREN EN VERRIJKEN
  25. 25. SEMI-AUTOMATISCHE IDENTIFICATIE EN VERRIJKING Vier mogelijkheden: • Via een export van een authority • Met behulp van een Reconciliation service • Automatisch gegevens ophalen uit externe standaardterminologieën via URLs • DERI RDF Extension
  26. 26. VIA EEN EXPORT
  27. 27. RECONCILIATION SERVICE - ODIS
  28. 28. RECONCILIATION SERVICE - ODIS
  29. 29. RECONCILIATION SERVICE - ODIS
  30. 30. RECONCILIATION SERVICE - RKD
  31. 31. RECONCILIATION SERVICE - RKD
  32. 32. GEGEVENS OPHALEN - VIAF
  33. 33. GEGEVENS OPHALEN - VIAF
  34. 34. VERRIJKING VIAF
  35. 35. GEGEVENS OPHALEN - AAT
  36. 36.  Zie Handout voor Wikidata en Geonames…
  37. 37. EXPORTEREN
  38. 38. EXPORT MAKEN
  39. 39. CUSTOM TABULAR EXPORTER
  40. 40. TEMPLATING
  41. 41. EXPORT VOOR ADLIB
  42. 42. BEDANKT! alina@packed.be I.van.Stokkom@rijksmuseum.nl

×