Your SlideShare is downloading. ×
Abriendo datos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Abriendo datos

257
views

Published on

Descripción de cómo y para qué abrir datos, y de una iniciativa para hacerlo.

Descripción de cómo y para qué abrir datos, y de una iniciativa para hacerlo.

Published in: Technology

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
257
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
1
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • No sé si hace falta dar más razones, pero dado todo lo anterior, ¿por qué se deben liberar los datos de la administración?
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • ¿Qué tenemos que hacer?
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Logotipo de Campanilla, aquí presente
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Transcript

    • 1. Abriendo los datos de la administración J. J. Merelo http://sena2.info
    • 2. ¿Qué hace la administración?
    • 3. ¿En qué se gasta el dinero?
    • 4. ¿Por qué toma ciertas decisiones?
    • 5. Por ejemplo: ¿Cuánto dinero se gasta en investigación?
    • 6. Fácil: 140 megas de PDFs, no indexados.
    • 7. ¿Por qué?
    • 8. Responsabilidad Transparencia Democratización
    • 9. ¿Cómo?
    • 10. http://data.gov http://data.gov.uk http://opendata.euskadi.net
    • 11. Scraping
    • 12. Datos en HTML o PDF
    • 13. Poca estructura (a mano)
    • 14. Primera solución: expresiones regulares
    • 15. Segunda solución: Análisis con librerías
    • 16. WWW::Mechanize Web::Scraper
    • 17. hPricot scrAPI
    • 18. Acceso orientado a objetos a la página
    • 19. Pero siempre nos quedará el DOM
    • 20. ¿Y después?
    • 21. Datos etiquetados: SQL, XML RDF, JSON
    • 22. Los datos sin metainformación sirven de poco
    • 23. Servir como HTML, REST...
    • 24. Desafío Abredatos
    • 25. 48 horas de programación
    • 26. 6 semanas de difusión
    • 27. Software liberado 5000 € premios
    • 28. Ganadores: misparadas.com e infocarretera.com
    • 29.  
    • 30. Ah, ¿pero el Senado hace algo?
      • Scraping de parte de la información
      • 31. Extracción de descriptores
      • 32. Datos ficha personal
      • 33. http://sena2.info/post
    • 34. Kit de construcción del Senado
      • Data::ES::Senado En CPAN
      • 35. Web en PHP (de Rubén Dugo)
      • 36. Todo en GitHub
    • 37. Futuro: Incierto
    • 38. Eso es todo Muchas gracias