Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Pentapolitica.nl introductie

486 views

Published on

Korte inleiding op PentaPolitica.nl, gemaakt voor developers bijeenkomst van het PoliticalMashup project (politicalmashup.nl)

Beschrijving van de momenteel beschikbare data, 'current work' en plannen voor de toekomst.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Pentapolitica.nl introductie

  1. 1. Een korte introductie Justin van Wees Bart de Goede justin@vwees.net bart@degoede.nu @justin_v_w @bartdegoede
  2. 2. PentaPolitica.nl • In 2009 op eigen initiatief gestart na project met kamervragen • ‘Trias Politica’ (Montesquieu)
  3. 3. PentaPolitica.nl • Data over personen en partijen (‘statisch’) • Namen, zittingen, nevenfuncties, opleidingen, etc. • Uitingen in social media (‘dynamisch’) • Tweets, video’s (YouTube), foto’s, blogs, etc.
  4. 4. Technische details • Importeren • Verschillende API’s • Python • Dataopslag • MySQL • Frontend • CakePHP
  5. 5. Partijen • Naam • Afkorting • Datum van oprichting • Logo • Lidzittingen
  6. 6. ‘Personalia’ • Voornaam • Levensfilosofie • Achternaam • Loopbaan * • Roepnaam • Periode, instituut, functie • Initialen • Nevenfuncties * • Titels • Periode, instituut, functie • Geslacht * • Opleidingen * • Biografie • Periode, instituut, functie • Foto * • ‘Lidzittingen’ • PDC-code • Periode, Kamer en partij • Geboorteplaats en -datum * niet altijd volledig • Plaats en datum van Bronnen: parlement.com, overlijden tweedekamer.nl, eerstekamer.nl
  7. 7. Feeds
  8. 8. • Foto’s in verschillende formaten (gedownload)* • Metadata van foto’s (datum, locatie, tags, etc.) • Gebruikersinformatie (aanmaakdatum account, aantal views, etc.)
  9. 9. • Titel, beschrijving, tags, etc. • De video zelf (in hoogst beschikbare kwaliteit) • ‘Statistieken’ van video’s (aantal views, beoordelingen, etc.) • Gebruikersinformatie (vrienden, aantal abonnementen, etc.)
  10. 10. • Tweets (inhoud, datum, reply op, RT, Geo- info, etc.) • Gebruikersinformatie (van screen_name tot URL van profielachtergrondafbeelding) • Followers en following door de tijd heen *
  11. 11. RSS • (Hyves-) blogs, partijnieuws, podcasts, etc. • Titel, samenvatting, datum van publicatie, etc. • Downloaden van achterliggende pagina (of andere documenten; HTML + CSS + IMG, podcasts, PDF’s, afbeeldingen)
  12. 12. Wat hebben we? • Tweede Kamer- en kabinetsleden van Balkenende IV • (Handmatig) geverifieerde personalia • (Handmatig) gevonden feeds • (Automatisch geïmporteerde) feeditems
  13. 13. Wat hebben we?
  14. 14. ‘Onvolkomenheden’ • Onzekerheid over volledigheid m.b.t. feeditems • Alleen Balkenende IV en Rutte I (exclusief ministers) • Rijkere informatie (nog) niet opgenomen • ‘Archief van verwijzingen’; bron kan ‘dood’ zijn
  15. 15. Wat doen we nu? • Importeerproces herschrijven • Formele procedures voor het toevoegen en beheren van personen, partijen en feeds • Uitgebreidere personalia (automatisch) verzamelen
  16. 16. Wat willen we nog? • Front-end uitbreiden (compatible met ‘nieuwe’ data) • Meer kabinetten, meer kamers • Normalisatie van personalia • API • ...
  17. 17. Vragen?

×