• Save
La difusión estadística y la apertura de datos: un viaje de ida y vuelta
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

La difusión estadística y la apertura de datos: un viaje de ida y vuelta

on

  • 4,462 views

Sesión impartida en el Máster en Estadística Pública de la Universidad de Sevilla. Sevilla, 22 de junio del 2012

Sesión impartida en el Máster en Estadística Pública de la Universidad de Sevilla. Sevilla, 22 de junio del 2012

Statistics

Views

Total Views
4,462
Views on SlideShare
1,786
Embed Views
2,676

Actions

Likes
3
Downloads
3
Comments
0

9 Embeds 2,676

http://xavierbadosa.com 2500
http://ultimate 94
http://translate.googleusercontent.com 68
http://abtasty.com 7
https://twitter.com 3
http://cloud 1
http://131.253.14.66 1
http://www.google.es 1
http://xavierbadosa.com&_=1411092011375 HTTP 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

La difusión estadística y la apertura de datos: un viaje de ida y vuelta Presentation Transcript

  • 1. La difusión estadísticay la apertura de datosun viaje de ida y vuelta Xavier BadosaInstituto de Estadística de Cataluña Sevilla, 22 de junio del 2012 Máster en Estadística Pública Universidad de Sevilla
  • 2. 1980: El escritorio dentro del ordenador
  • 3. 1950: El escritorio es el ordenador
  • 4. 1De la apertura de datos a la estadística
  • 5. #opendata
  • 6. #opendata
  • 7. #opendata
  • 8. “uno de los más grandes subproductos de la revolución digital” #opendata “un activo económico” “la nueva materia prima del Siglo XXI”
  • 9. o¿data?
  • 10. “X reside en Barcelona” atributo o ¿data?“X ha visto un vídeo de Hans Rosling” acto
  • 11. “X reside en Barcelona” atributo si lo registro es un o data“X ha visto un vídeo de Hans Rosling” acto
  • 12. odata
  • 13. odata
  • 14. 4.000 millonesde vídeos vistosdiariamente
  • 15. 4.000 millonesde vídeos vistosdiariamente
  • 16. o
  • 17. Siempre digo que el trabajo “sexy”en los próximos 10 años será el deestadístico. La gente piensa quebromeo, pero ¿quién se habríaimaginado que el de ingenieroinformático sería el trabajo “sexy”de los 90?
  • 18. #opendata
  • 19. OpenRegs.com
  • 20. Citywide Data Warehousehttp://data.octo.dc.gov
  • 21. http://www.freeourdata.org.uk
  • 22. http://www.showusabetterway.com
  • 23. Jo Walsh & Rufus PollockOpen Knowledge Foundation
  • 24. Ley de LinusDado un númerosuficientemente elevadode ojos, todos los erroresse convierten en obvios. Eric Steven Raymond La catedral y el bazar
  • 25. El gobierno como plataforma
  • 26. infomediarios (al por mayor)Administración
  • 27. Poniendo datos gubernamentales enlínea en formatos universalmenteaccesibles parapermitir que los ciudadanos losusen para comentarlos, derivar valor yactuar en sus propias comunidades Senator Barack Obama Mountain View, 14 Nov 2007
  • 28. 8 principios deopen government data http://www.opengovdata.org
  • 29. 1 completos Deben ofrecerse todos los datos públicos. Datos públicos son aquellos que no están sujetos a limitaciones legítimas por razones de privacidad, seguridad o privilegios.
  • 30. 2 primarios Los datos son los que se recogieron en la fuente original, con el máximo nivel de granularidad, no de forma agregada o modificada.
  • 31. 3 puntuales Los datos son ofrecidos tan pronto como sea necesario para preservar su valor.
  • 32. 4 accesibles Los datos son ofrecidos al más amplio rango de usuarios para el más amplio rango de fines.
  • 33. 5 procesables por máquinas Los datos están razonablemente estructurados para permitir el procesamiento automatizado.
  • 34. 6 no discriminatorios Los datos se ofrecen a cualquiera, sin requisitos de registro.
  • 35. 7 no propietarios Los datos son ofrecidos en un formato sobre el cual ninguna entidad tiene un control exclusivo.
  • 36. 8 libres de licencia Los datos no están sujetos a ningún copyright, patente, marca registrada o regulación de secreto comercial. Pueden admitirse restricciones razonables por motivos de privacidad, seguridad y privilegio.
  • 37. 8 principios deopen government data http://www.opengovdata.org
  • 38. #opengovdata open government data http://www.opengovdata.org
  • 39. “datos del gobierno abierto”#opengovdata“(open government) data”
  • 40. “datos abiertos del gobierno”#opengovdata “open (government data)”
  • 41. opendata opengov#opengovdata
  • 42. opendataThe New Ambiguity of“Open Government” opengovHarlan Yu y David G. Robinson http://papers.ssrn.com/sol3/papers.cfm?abstract_id=2012489
  • 43. opendata opengov
  • 44. opendata Reutilización opengov Transparencia
  • 45. opendata Reutilización Eficienciaeconómica opengov Transparencia Salud democrática
  • 46. opendata Reutilización Eficienciaeconómica opengov Transparencia Salud democrática
  • 47. opendata Reutilización opengov Transparencia
  • 48. 5 procesables por máquinas Los datos están razonablemente estructurados para permitir el procesamiento automatizado. Formato7 no propietarios Los datos son ofrecidos en un formato sobre el cual ninguna entidad tiene un control exclusivo. Licencia8 libres de licencia Los datos no están sujetos a ningún copyright, patente, marca registrada o regulación de secreto comercial.
  • 49. 5 procesables por máquinas Los datos están razonablemente estructurados para permitir el procesamiento automatizado. Formato Formato7 no propietarios Los datos son ofrecidos en un formato sobre el cual ninguna entidad tiene un control exclusivo. Licencia Licencia8 libres de licencia Los datos no están sujetos a ningún copyright, patente, marca registrada o regulación de secreto comercial.
  • 50. 5 Formato La visión7 del W3C Licencia8 Tim Berners-Lee Director of the W3C
  • 51. en el que los ordenadores son capaces de analizar todos los datos de la Web –el contenido, los enlaces, las transacciones entre personas y ordenadores–. La “Web Semántica”, que debería hacer esto posible, aún ha de surgir, pero cuando lo haga, los mecanismos diarios del comercio, de la burocracia y de nuestras vidas serán manejados por máquinas hablando con máquinas. Tim Berners-Lee Director of the W3C, 1999
  • 52. ★ En la WWW (en cualquier formato), con licencia abierta★★ Datos estructurados procesables por máquinas (p.e. Excel)★★ ★ Formato no propietario (p.e. CSV) sujeto cosas★★ ★★ Formato RDF predicado direcciones objeto★★ ★★★ Enlazados con otros datos
  • 53. ★ En la WWW (en cualquier formato), con licencia abierta★★ Datos estructurados procesables por máquinas (p.e. Excel)★★ ★ Formato no propietario (p.e. CSV) sujeto cosas★★ ★★ Formato RDF predicado direcciones objeto★★ ★★★ Enlazados con otros datos
  • 54. @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .@prefix dc: <http://purl.org/dc/elements/1.1/> .@prefix dcterms: <http://purl.org/dc/terms/> .@prefix geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> .@prefix census: <tag:govshare.info,2005:rdf/census/> .@prefix usgovt: <tag:govshare.info,2005:rdf/usgovt/> .<http://www.rdfabout.com/rdf/usgov/geo/us/ny> rdf:type usgovt:State ; usgovt:censusStateCode "21" ; usgovt:fipsStateCode "36" ; usgovt:uspsStateCode "NY" ; dc:title "New York" ; dcterms:isPartOf <http://www.rdfabout.com/rdf/usgov/geo/us> ; geo:lat 42.155127 ; geo:long -75.164667 ; census:population 18976457 ; census:households 7679307 ; census:landArea "122283145776 m^2" ; census:waterArea "19016249880 m^2" ; census:details<http://www.rdfabout.com/rdf/usgov/geo/us/ny/censustables> .
  • 55. @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .@prefix dc: <http://purl.org/dc/elements/1.1/> .@prefix dcterms: <http://purl.org/dc/terms/> .@prefix geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> .@prefix census: <tag:govshare.info,2005:rdf/census/> .@prefix usgovt: <tag:govshare.info,2005:rdf/usgovt/> .<http://www.rdfabout.com/rdf/usgov/geo/us/ny> rdf:type usgovt:State ; usgovt:censusStateCode "21" ; usgovt:fipsStateCode "36" ; usgovt:uspsStateCode "NY" ; dc:title "New York" ; dcterms:isPartOf <http://www.rdfabout.com/rdf/usgov/geo/us> ; geo:lat 42.155127 ; geo:long -75.164667 ; census:population 18976457 ; census:households 7679307 ; census:landArea "122283145776 m^2" ; census:waterArea "19016249880 m^2" ; census:details<http://www.rdfabout.com/rdf/usgov/geo/us/ny/censustables> .
  • 56. Statistical “Cube” Data. Este grupo producirá unvocabulario, compatible con SDMX, para expresaralgunos tipos de datos estadísticos. Éste no espreciso que sea tan expresivo como todo el SDMX,sino que puede proporcionar un subconjunto, como en el RDF DataCube Vocabulary.
  • 57. 5 procesables por máquinas Los datos están razonablemente estructurados para permitir el procesamiento automatizado. Formato Formato7 no propietarios Los datos son ofrecidos en un formato sobre el cual ninguna entidad tiene un control exclusivo. Licencia Licencia8 libres de licencia Los datos no están sujetos a ningún copyright, patente, marca registrada o regulación de secreto comercial.
  • 58. Licencia8 libres de licencia Los datos no están sujetos a ningún copyright, patente, marca registrada o regulación de secreto comercial.
  • 59. participar (comunidad): Comunicacióncolaborar, compartir digital ¿©? All rights reserved? ¿Todos los derechos reservados? Algunos derechos reservados Creative Commons (CC) creativecommons.org, es.creativecommons.org “Share, reuse, and remix — legally”
  • 60. Jeremy Keith
  • 61. Remezcla obras(propiedad intelectual)
  • 62. Remezcla obras(propiedad intelectual) no datos
  • 63. Muchas de las licencias ampliamente reconocidas ni estándestinadas ni son adecuadas para ser aplicadas a datos o acolecciones de datos. Aquí se describen un abanico de renunciasy licencias que se han diseñado y adecuado al tratamiento de losdatos. Las licencias de Creative Commons (excepto de CCZero),la GFDL, la GPL, la BSD… NO son adecuadas para los datos y sedesaconseja DECIDIDAMENTE su uso.
  • 64. ¿Es válida en Europa?
  • 65. Modeloformatos catálogo temas
  • 66. ¿Aumento del quantum de datos abiertos?
  • 67. sells
  • 68. ¿Aumento del quantum de datos abiertos?Laxitud del concepto “conjunto de datos”
  • 69. ¿Aumento del quantum de datos abiertos?Laxitud del concepto “conjunto de datos”No todos los datos incluidos son “abiertos”(en el sentido de los 8 principios, sí según W3C)
  • 70. ¿Aumento del quantum de datos abiertos?Laxitud del concepto “conjunto de datos”No todos los datos incluidos son “abiertos”(en el sentido de los 8 principios)Licencias no siempre adecuadas
  • 71. ¿Aumento del quantum de datos abiertos?Laxitud del concepto “conjunto de datos”No todos los datos incluidos son “abiertos”(en el sentido de los 8 principios)Licencias no siempre adecuadasUn modelo basado sobre todo en descargas
  • 72. infomediarios (al por mayor)Administración
  • 73. automatizar el tratamiento de la información pero también el acceso (al por mayor) Administración
  • 74. ¿Aumento del quantum de datos abiertos?Laxitud del concepto “conjunto de datos”No todos los datos incluidos son “abiertos”(en el sentido de los 8 principios)Licencias no siempre adecuadasUn modelo basado sobre todo en descargas¿Escalabilidad?
  • 75. dataset datasetdataset dataset dataset dataset dataset dataset catálogo datasetdataset dataset dataset dataset dataset dataset dataset dataset
  • 76. dataset datasetdataset dataset dataset dataset dataset dataset catálogo datasetdataset dataset dataset dataset dataset dataset dataset dataset
  • 77. catálogo catálogocatálogo catálogo catálogocatálogo catálogo catálogo catálogo catálogo catálogo catálogo
  • 78. http://spec.datacatalogs.org/
  • 79. ¿Balance?
  • 80. Los catálogos de datos abiertos y las oficinas estadísticas
  • 81. Principal proveedory las oficinas estadísticas
  • 82. Ley 4/1989,de 12 de Principal proveedor y las oficinas estadísticasdiciembre,de Estadísticade la Comunidad Autónoma de Andalucía(Artículo 30. Competencias y funciones)f. Crear, mantener y gestionar bases de datos de interés estadístico para la Comunidad Autónoma.k. Difundir los resultados estadísticos obtenidos por el Instituto.
  • 83. Ley 4/1989, Consultables librementede 12 dediciembre, + descargablesde Estadísticade la Comunidad Autónoma de Andalucía en un formato abierto(Artículo 30. Competencias y funciones) (¿5 estrellas W3C: RDF Data Cube Vocabulary?)f. Crear, mantener y gestionar bases de datos de interés estadístico para la Comunidad Autónoma.k. Difundir los resultados estadísticos obtenidos por el Instituto.
  • 84. P O C PE - EX A NC X C DE I S OL S V C
  • 85. P C -H A HT X C TM I SML S V L
  • 86. Ley 4/1989, Consultables librementede 12 dediciembre, + descargablesde Estadísticade la Comunidad Autónoma de Andalucía en un formato abierto(Artículo 30. Competencias y funciones) (W3C: RDF Data Cube)f. Crear, mantener y gestionar bases de datos de No sólo tablas de resultados interés estadístico para la Comunidad Autónoma.k. Difundir los resultados estadísticos obtenidos por el Instituto.
  • 87. 2 De la estadísticaa la apertura de datos
  • 88. ESTADÍSTICAPTOLEMAICA
  • 89. ESTADÍSTICA GobiernoPTOLEMAICA
  • 90. ¿Cliente?El Gobierno
  • 91. ¿Cliente?El Gobierno, los partido políticos, la prensa,las universidades, los centros de investigación,las empresas de investigación de mercado...
  • 92. I.II.III.
  • 93. I. Un medio controlado por el usuarioII.III.
  • 94. Producción Distribución Consumo
  • 95. Producción Distribución Consumo
  • 96. Producción Distribución Consumo
  • 97. Producción Distribución Prosumidor
  • 98. Producción Distribución Prosumidorpúblicos datos brutos
  • 99. I. Un medio controlado por el usuarioII. Una red de intermediariosIII.
  • 100. Larry Page & Sergey Brin
  • 101. Search Engine Optimization Larry Page & Sergey Brin
  • 102. Larry Page & Sergey Brin
  • 103. usuarios directosusuarios finales Larry Page & Sergey Brin
  • 104. I. Un medio controlado por el usuarioII. Una red de intermediariosIII. Un entorno diverso
  • 105. Andrew Savikas
  • 106. ARhttp://www.youtube.com/watch?v=U2uH-jrsSxs
  • 107. AR
  • 108. I. Un medio controlado por el usuarioII. Una red de intermediariosIII. Un entorno diverso
  • 109. ?
  • 110. Conjunto de métodos que permiten a los programas de terceros solicitar los datos que necesiten
  • 111. Para humanos
  • 112. Para humanos (desnudos)
  • 113. Para humanos (desnudos)(accedida y leída por humanos)
  • 114. Para humanos (desnudos)(accedida y leída por humanos)
  • 115. Para humanos con máquinas(accedida por humanos,pero leída por máquinas) Para humanos (desnudos) (accedida y leída por humanos)
  • 116. Para máquinasconstruidas por humanos
  • 117. Para máquinasconstruidas por humanos(accedida y leída por máquinas)
  • 118. APIs
  • 119. APIs = libertad
  • 120. del sitio web originalpara externalizar APIs = libertad
  • 121. http://www.statsilk.com/maps/statplanet-world-bank-open-data
  • 122. del sitio web originalpara externalizarpara mezclar APIs = libertad
  • 123. http://twittervision.com
  • 124. http://trendsmap.com
  • 125. del sitio web original del navegadorpara externalizar para mejorarlopara mezclar APIs = libertad
  • 126. del sitio web original del navegadorpara externalizar para mejorarlopara mezclar para evitarlo APIs = libertad
  • 127. How I stopped worrying about mywebsite and learned to love the wholeInternet Matt McAlister Director of Digital Strategy Guardian Media Group
  • 128. De la estadísticacomo producto ciudadanos empresas infomediariosa la estadística como infraestructura
  • 129. De la estadísticacomo producto construir la infraestructura estadística de la sociedada la estadística como infraestructura
  • 130. “Apps” depropósito generalestadística como plataforma “S.O.”
  • 131. “Apps” depropósito general“Apps” de tercerosque resuelvennecesidades específicasestadística como plataforma “S.O.”
  • 132. Métrica de éxito
  • 133. Modelo de negocio Métrica de éxito
  • 134. Modelo de negocio Métrica de éxito
  • 135. No operamos en el mercado de ojosModelo de negocio Métrica de éxito
  • 136. No operamos en el mercado de ojos sino en el de la referenciaModelo de negocio Métrica de éxito
  • 137. máxima exposición y alcance de los datosreferencia
  • 138. máxima exposición y alcance de los datos preservación de la exactitudreferencia
  • 139. máxima exposición y alcance de los datos preservación de la exactitudreferencia reconocimiento de la marca
  • 140. Estadísticaen la nube
  • 141. Estadística ubicua
  • 142. Gracias
  • 143. Diapositiva 1: Wonder Wheel por Paulo Carrillo (CC BY-NC-SA)Diapositiva 3 y ss: UNIVAC por Xavier Badosa (CC BY)Diapositiva 18 y ss: Cubierta del libro Big Data Glossary de O’Reilly MediaDiapositiva 22: Cubierta de la revista ScienceDiapositva 42: Cubierta de dos ediciones de Here Comes Everybody (Penguin)Diapositiva 43: Máquina expendedora por Dominic Alves (CC BY)Diapositiva 43: Carretera por Niamor83 (CC BY-NC-SA)Diapositiva 45: Calle Google en Mountain View por Xavier Badosa (CC BY)Diapositiva 71: “I have a dream” por Lushbunny (CC BY-NC-ND)Diapositiva 72: Linked data por Richard Cyganiak (CC BY-NC)Diapositiva 88: DJ por Xavier Badosa (CC BY)Diapositiva 90: Andy en el Vehicle Assemply Building de Cabo Cañaveral por Jeremy Keith (CC BY)Diapositiva 91: The Iron Man © Marvel Studios, Fairview Entertainment y Paramount PicturesDiapositiva 120: Diapositiva presentada en Share-PSI workshop 2011 por Richard Swetenham de la Comisión EuropeaDiapositiva 184 y ss: El sistema ptolemaico por Johannes van Loon (en el dominio público)Diapositiva 186: Tipos móviles por Willi Heidelbach (CC BY-SA)Diapositiva 187 y ss: Períodicos por ShironekoEuro (CC BY)Diapositiva 187 y ss: Tractatus Georgii Peurbachii super propositiones Ptolemaei de sinubus & chordis (1541 ed.) by Georg von Peurbach & Joannes Regiomontanus, © Mark RichardsDiapositiva 189 y ss: Ceros y unos por Josh Bancroft (CC BY-NC)
  • 144. Diapositiva 190: Página web de Mosaic en 1993 © Board of Trustees of the University of IllinoisDiapositiva 199: Larry Page & Sergey Brin, autor desconocido (fotografía oficial de Google)Diapositiva 204: PC por Boffy b (CC BY-SA)Diapositiva 204: PSP por Dan Taylor (CC BY)Diapositiva 205 y ss: Uomo Vitruviano por Leonardo da Vinci (en el dominio público)Diapositiva 213 y ss: Botella por Prizmatic (CC BY-NC)Diapositiva 215 y ss: Espermatozoides por autor desconocidoDiapositiva 222 y ss: Homo erectus tomado de recursos.cnice.mec.es donde no constaba autor.Diapositiva 225: Homo sapiens neanderthalis tomado de vanedf11.blogspot.com donde no constaba autor.Diapositiva 226: Asimo por AZAdam (CC BY-SA)Diapositiva 245: Imagen de la película Dr. Strangelove or: How I Learned to Stop Worrying and Love the Bomb de Stanley Kubrick © Columbia PicturesDiapositiva 260 y ss: Desierto de Mohave por Xavier Badosa (CC BY)Diapositiva 264 y ss: Diana por Jacob Vance (CC BY-NC)Diapositiva 265 y ss: Dólares por Daniel Borman (CC BY)Diapositiva 266: Ojo de Mick ㋡rlosky (CC BY-NC)Diapositiva 279: Nubes por Xavier Badosa (CC BY)Diapositiva 290: Planeta Tierra por la NASA (en el dominio público)