Abriendo datos

328
-1

Published on

Descripción de cómo y para qué abrir datos, y de una iniciativa para hacerlo.

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
328
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
4
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • No sé si hace falta dar más razones, pero dado todo lo anterior, ¿por qué se deben liberar los datos de la administración?
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • ¿Qué tenemos que hacer?
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Es imposible averiguarlo con certeza. Cualquier dato es bueno.
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Muchas veces es la única solución, sobre todo cuando no hay estructura HTML clara. En los PDFs (si no son escaneados) no hay otro remedio
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Logotipo de Campanilla, aquí presente
  • Se trata de hacer los datos lo más usables posible
  • Se trata de hacer los datos lo más usables posible
  • Abriendo datos

    1. 1. Abriendo los datos de la administración J. J. Merelo http://sena2.info
    2. 2. ¿Qué hace la administración?
    3. 3. ¿En qué se gasta el dinero?
    4. 4. ¿Por qué toma ciertas decisiones?
    5. 5. Por ejemplo: ¿Cuánto dinero se gasta en investigación?
    6. 6. Fácil: 140 megas de PDFs, no indexados.
    7. 7. ¿Por qué?
    8. 8. Responsabilidad Transparencia Democratización
    9. 9. ¿Cómo?
    10. 10. http://data.gov http://data.gov.uk http://opendata.euskadi.net
    11. 11. Scraping
    12. 12. Datos en HTML o PDF
    13. 13. Poca estructura (a mano)
    14. 14. Primera solución: expresiones regulares
    15. 15. Segunda solución: Análisis con librerías
    16. 16. WWW::Mechanize Web::Scraper
    17. 17. hPricot scrAPI
    18. 18. Acceso orientado a objetos a la página
    19. 19. Pero siempre nos quedará el DOM
    20. 20. ¿Y después?
    21. 21. Datos etiquetados: SQL, XML RDF, JSON
    22. 22. Los datos sin metainformación sirven de poco
    23. 23. Servir como HTML, REST...
    24. 24. Desafío Abredatos
    25. 25. 48 horas de programación
    26. 26. 6 semanas de difusión
    27. 27. Software liberado 5000 € premios
    28. 28. Ganadores: misparadas.com e infocarretera.com
    29. 30. Ah, ¿pero el Senado hace algo? <ul><li>Scraping de parte de la información
    30. 31. Extracción de descriptores
    31. 32. Datos ficha personal
    32. 33. http://sena2.info/post </li></ul>
    33. 34. Kit de construcción del Senado <ul><li>Data::ES::Senado En CPAN
    34. 35. Web en PHP (de Rubén Dugo)
    35. 36. Todo en GitHub </li></ul>
    36. 37. Futuro: Incierto
    37. 38. Eso es todo Muchas gracias
    1. A particular slide catching your eye?

      Clipping is a handy way to collect important slides you want to go back to later.

    ×