Barcelona Activa - Curs 1.5. Procés Publicació de dades
1. Hola hola hola
Hola hola hola
Hola hola hola hola
hola hola hola hola hola
Procés de Publicació
de Dades
Dijous 13 de Juliol de 2017
INICIATIVA BARCELONA OPEN
DATA
EL VALOR D’OBRIR LES DADES
Docent: Enric Montia
2. 2
Publicació de Dades Obertes
1. Identificar les tasques prèvies que forman part d´un procés
de publicació de dades obertes.
2. Descriure el que i el perquè de les tasques relacionades a un
procés de publicació de dades obertes.
3. Aplicar tot allò après a casos concrets per ser capaç de
protagonitzar casos d'èxit.
Objectiu de la sessió de publicació de Dades
Obertes
3. 3
Publicació de Dades Obertes
1. Seleccionar les dades
2. Generar un Dataset
3. Publicar
4. Promocionar
Passos per a la publicació de Dades Obertes
4. 4
Publicació de Dades Obertes
1.
Començ
ar amb
un pla
5.Manten
ir-lo
2.
Selecció
de les
dades
4.
Publicaci
ó
3.
Creació
d’un
Dataset
Procés
de les
Dades
Obertes
6. 6
Publicació de Dades Obertes
Pla de Dades Obertes
Tenir un Objectiu
Avaluar la
Publicació i els
usos actuals
Aconseguir Suport
Demostrar el
valors
7. 7
Publicació de Dades Obertes
1. Clarificar els objectius : Que vull aconseguir?
2. Establir un pla de publicació: per on vull començar?
3. No oblidar temes de LOPD i nou GRDP
Pla de Dades Obertes
8. 8
Publicació de Dades Obertes
Abans de decidir quines dades es publiquen com dades obertes,
les entitats públiques han de tenir una visió general de les dades
que es gestionen en l'actualitat, i per tant podrien incloure bases
de dades, registres, recollides de dades i enquestes, conjunts de
dades geoespacials etc.
Estat de l’art
Pla de Dades Obertes
9. 9
Publicació de Dades Obertes
● Clarificar els objectius : Que vull aconseguir?
● Establir un pla de publicació: per on vull començar?
● Guia “Com fer un cas de negoci amb open data”
http://theodi.org/guides/how-make-business-case-open-data
Pla de Dades Obertes
10. 10
Publicació de Dades Obertes
● Buscar lideratge i suport: Directius, Open Data Evangelists,
TIC compartint informació sobre els objectius i els resultats del
pla.
● Capturar evidències que les dades obertes estan aportant
valor: consultes, impacte, etc.
Pla de Dades Obertes
11. 11
Publicació de Dades Obertes
Escollir les Dades
Identificar les dades que tens
Seleccionar les dades
obertes que vols publicar
Desenvolupar un Pla de
Publicació de Dades
Obertes
12. 12
Publicació de Dades Obertes
● Hi ha tres principals vies per seleccionar quines dades es
publiquen:
1. Actualització de les dades que ja estan en el domini
públic.
2. Seguir les millors pràctiques internacionals.
3. Les demandes a la unitat.
Escollir les Dades
14. 14
Publicació de Dades Obertes
Crear els Datasets
Aplicar un format
obert
Capturar els
metadades
Aplicar una
llicència oberta
Revisar els
datasets
15. 15
Publicació de Dades Obertes
Després de seleccionar la informació que es desitja publicar és
necessari organitzar les dades de manera que es puguin posar a
disposició per a baixar en formats llegibles per les màquines i tenir
en compte si existeixen o no estàndards internacionals (INSPIRE,
els 8 principis del OPEN GOVERNMENT DATA).
Crear Datasets
16. 16
Publicació de Dades Obertes
● Identificar Metadades: informació descriptiva sobre les dades.
● Pot descriure elements com el contingut, el formats etc.
● Unes bones metadades poden permetre la interoperabilitat
amb altres data sets.
Metadades
17. 17
Publicació de Dades Obertes
● Hi ha tres tipus principals de metadades:
○ Les metadades descriptives (títol, autor)
○ Les metadades estructurals (pg x capítol)
○ Les metadades administratives (format)
Metadades
18. 18
Publicació de Dades Obertes
● La neteja de dades és l'acte de descobriment i correcció o
eliminació de registres de dades errònies d'una taula o base
de dades.
● El procés de neteja de dades permet identificar dades
incompletes, incorrectes, inexactes, no pertinents, etc. i
després substituir, modificar o eliminar aquestes dades bruts.
● Després de la neteja, la base de dades podrà ser compatible
amb altres bases de dades similars en el sistema.
Neteja de les Dades
19. Activitat
Buscar a quines hores, en el
primer trimestre de 2016, es van
posar les multes més cares a
Madrid.
http://bit.ly/2knppBX
19
Reutilització de Dades Obertes
20. Activitat
És un bon portal de dades
obertes el portal de l’Ajuntament
de Madrid ?
20
Reutilització de Dades Obertes
23. 23
Publicació de Dades Obertes
● Si les dades estan netes, és més fàcil de combinar diferents
conjunts de dades i obtenir una visió més profunda.
● Hi ha una sèrie d'errors comuns en les dades que hauríem de
tenir en compte en qualsevol conjunt de dades que està
treballant.
Neteja de les Dades
24. 24
Publicació de Dades Obertes
● Errors en el format de les dates: L'error més comú és l'ús mixt
de formats americans (MM/DD/AAAA) i europeus
(DD/MM/AAAA).
● Les persones sovint tracten d'estalviar temps en introduir
dades abreujant termes. Si aquestes abreviatures no són
consistents, pot causar errors en el conjunt de dades.
Neteja de les Dades
25. 25
Publicació de Dades Obertes
● Un registre duplicat és quan s'ha introduït la mateixa peça de
dades més d'una vegada. Sovint es produeixen quan els
conjunts de dades s'han combinat o perquè no se sabia que ja
existia una entrada.
● Les dades redundats son qualsevol cosa que no sigui rellevant
per al seu treball amb el conjunt de dades.
Neteja de les Dades
26. 26
Publicació de Dades Obertes
● Els valors numèrics en els conjunts de dades sovint utilitzen
diferents escales perquè sigui més fàcil per a un ésser humà
al llegir. No obstant, això per a una màquina provoca errors.
● Els errors d'ortografia.
Neteja de les Dades
27. 27
Publicació de Dades Obertes
El Sector Públic sovint externalitza serveis, es fa necessari
explicitar en els contractes de servei que les dades vinculades a
l´activitat del contracte estaran subjectes al Open Data i podran
ser consultades per tothom de forma gratuïta.
Llicències
28. 28
Publicació de Dades Obertes
Hi ha mètodes diferents per facilitar l'accés a dades obertes: com
dades en bloc (dadesdump), a través d'una interfície de
programació d'aplicacions (API), com alimentació, a través d'un
punt final SPARQL, etc. El mètode més utilitzat i útil és dades en
bloc, el que significa que el conjunt complet de dades ha d'estar
disponible en format descarregable.
Llicències
29. 29
Publicació de Dades Obertes
● Hem de decidir on publiquem les dades:
○ Web corporativa.
○ Portal de dades Obertes.
Publicació de Dades
30. 30
Publicació de Dades Obertes
Un catàleg de dades proporciona un registre o llista de tots els
conjunts de dades existents i un punter (URL) a on es pot accedir
a les dades. Un catàleg de dades de tots els conjunts de dades
obertes de dades disponibles és generalment el component clau
d'un portal de dades obertes, a més de socials, notícies i els
elements de la comunitat.
Publicació de Dades
31. 31
Publicació de Dades Obertes
● Que la gent sàpiga que has obert alguns conjunts de dades.
● Si hi ha un cert grup de persones al que voleu arribar, pensar
quina seria la millor manera d'aconseguir el missatge per a
ells?
● És necessària per animar-los a utilitzar les seves dades.
Promoció
33. 33
Publicació de Dades Obertes
● Vegem com de propers estem a les dades no-estructurades.
● Maneres d’estructurar dades no estructurades ?
● Vegem un exemple:
https://www.youtube.com/watch?v=OiskE1Jsr6A
De dades no estructurades a dades estructurades
34. 34
Publicació de Dades Obertes
● Extraiem el so del vídeo usant: www.vidtomp3.com
● Comprovem que l’àudio estigui ben descarregat en el nostre
ordinador.
● Canviem el format fent servir:
http://audio.online-convert.com/es/convertir-a-wav
De dades no estructurades a dades estructurades
35. 35
Publicació de Dades Obertes
● Ara anem a: https://speech-to-text-demo.mybluemix.net
● Pugem l’arxiu .wav i esperem la conversió a text (5 min)
● Copieu el text en un arxiu .txt i guardeu-lo.
De dades no estructurades a dades estructurades
36. 36
Publicació de Dades Obertes
● Visitem el web: http://www.online-utility.org/text/analyzer.jsp
● Copiem el text i busquem a les estadístiques.
● Fem una fulla de càlcul amb les frases més usades de tres
paraules i la guardem com a CSV.
De dades no estructurades a dades estructurades
37. 37
Publicació de Dades Obertes
● Pugem la informació a http://demo.ckan.org
● Revisar que la informació estigui disponible online.
De dades no estructurades a dades estructurades