• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Relazione
 

Relazione

on

  • 612 views

 

Statistics

Views

Total Views
612
Views on SlideShare
223
Embed Views
389

Actions

Likes
0
Downloads
0
Comments
0

2 Embeds 389

http://socialmediaunive2013.wordpress.com 385
http://fritturamista.wordpress.com 4

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Relazione Relazione Document Transcript

    • OPEN DATARossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data1
    • Indice1. Cosa sono gli Open Data?2. Perchè gli open data?3. Filosofia4. Caratteristiche5. Vantaggi & svantaggi6. Aspetti giuridici7. Aspetti tecnici8. Formati di dati aperti9. Possibili applicazioni10.Open data in Italia11.Un esempio pratico12.FontiRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data2
    • 1) Cosa sono gli Open Data?Gli open data sono una tipologia di dati liberamente accessibili da tutti, non hannobrevetti, sono liberamente riproducibili e non hanno altre restrizioni che ne potrebberolimitare l’uso, al massimo potrebbe essere richiesto di citare la fonte e di condividerlicon la stessa licenza con la quale sono stati distribuiti. Essi possono essere utili avalorizzare il patrimonio informativo pubblico per permettere la creazione di nuoviservizi. Infatti il settore pubblico dispone di enormi quantità di dati e sarebbe unospreco non utilizzarli, e anche se non si trova un possibile utilizzo è giusto pubblicarliper permettere ai cittadini di trovare il modo migliore per usarli.Essi si possono suddividere in:● Open Data ­ sono una tipologia di dati aperti che possono essere utilizzati perqualsiasi scopo● Open Government Data ­ sono degli Open Data prodotti dal governo, raccoltinel corso dell’attività governativa. In particolare sono prodotti dalle pubblicheamministrazioni e sono prodotti nel rispetto della privacy dei cittadini.2) Perchè gli Open Data?Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data3
    • Gli Open Data sono un’immensa risorsa che attualmente non è ancora utilizzata e igoverni di ogni paese producono enormi quantità di dati che non sempre vengonoutilizzate. Questi dati per legge sono pubblici e dovrebbero essere resi aperti edisponibili all’uso da parte del pubblico, il quale può utilizzarli a piacere in quanto li hagià pagati con le tasse versate al proprio Stato.I dati aperti portano benefici a tutti, sia ai governi che alle organizzazioni che aicittadini e non è possibile prevedere in che modo verranno utilizzati e quindi di fattoverrà creata innovazione.Ad esempio i dati aperti stanno già creando valore nelle seguenti aree:● trasparenza e controllo democratico● accrescimento della propria influenza nella discussione pubblica● miglioramento o creazione di nuovi servizi privati● innovazione● miglioramento di efficienza ed efficacia dei servizi pubblici● estrazione di nuova conoscenza dalla combinazione di diverse fonti di dati(dataset)3) FilosofiaSecondo i sostenitori del movimento Open Data, i dati dovrebbero essere un benecomune e trattati come tali, in quanto possono essere utili all’umanità in diversi campi.Questi dati infatti sono stati prodotti da esseri umani e quindi appartengono al genereumano, come ad esempio i dati sul genoma, dati ambientali, meteorologici, datiriguardanti la ricerca e scienza medica (più dati sono accessibili e più facile saràprogredire nella ricerca e quindi produzione di altri dati) e altro.Altri dati sono riguardanti la pubblica amministrazione: essi sono prodotti utilizzandodenaro pubblico ed è giusto che i contribuenti possano consultarli in quanto sono statifinanziati da loro.I dati non dovrebbero avere restrizioni riguardanti il loro uso perchè si limitano i variutilizzi da parte della comunità.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data4
    • 4) Caratteristiche● Disponibilità: i dati devono essere disponibili nel loro complesso, a un prezzoirrisorio oppure non superiore al costo di riproduzione.● Accesso: i dati devono essere disponibili in un formato aperto, standardizzatoe leggibile da una maggiore quantità di applicazioni possibili. I formati chiusinon aiutano perchè spesso richiedono l’utilizzo di software specifici (a voltepossono anche essere a pagamento), e soprattutto non devono richiedere unasottoscrizione a pagamento per la loro consultazione e utilizzo.● Riutilizzo e ridistribuzione: i dati devono essere resi disponibili a condizionitali da permettere di essere riutilizzati e ridistribuiti e quindi non dovrebberoavere licenze che impediscono queste azioni.● Partecipazione universale: tutti devono essere in grado di poter leggere outilizzare i dati e non devono quindi esistere discriminazioni sia per quantoriguarda i soggetti ai quali i dati sono rivolti sia i vari utilizzi in quanto non sipuò restringerne l’utilizzo ad alcuni scopi (ad esempio se i dati non possonoessere utilizzati per scopi commerciali o destinati esclusivamente a scopieducativi)● Permanenza: devono essere disponibili anche con il passare del tempo equindi vanno archiviati in qualche modo.● Catalogazione: i dati dovrebbero essere raccolti in una specie di catalogo perfacilitarne la consultazione e favorirne la ricerca da parte dei motori di ricerca● Aggiornati: i dati devono essere aggiornati più spesso possibile (in base altipo di dato) e possibilmente in modo automatico per non richiedere laRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data5
    • presenza di personale che si occupi dell’aggiornamento e quindi gravareulteriormente sul costo.5) Vantaggi e svantaggiVantaggi:● Più dati per tutti: chiunque può utilizzare i dati liberamente● Trasparenza: nei paesi dove è presente la corruzione, i cittadini possonorendersi conto di quello che sta succedendo e hanno la possibilità di farequalcosa per migliorare la situazione● Creazione posti di lavoro: permette alle imprese di creare nuovi modelli dibusiness utilizzando i dati per creare servizi. Il pubblico può utilizzare i dati perfornire nuovi servizi, creando di conseguenza nuovi posti di lavoro● Innovazione: i dati sono messi a disposizione del pubblico ma non è possibileprevedere l’uso che ne verrà fatto, quindi di fatto essi verranno utilizzati in modinuovi e inaspettatiRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data6
    • Per quanto riguarda gli svantaggi, non ne esistono di veri e propriSvantaggi:● Possibile violazione della privacy: i dati prodotti dal governo non soffrono diquesto problema, ma i dati prodotti da altre fonti potrebbero non seguire glistessi principi e rischiano di violare la riservatezza dei soggetti ma questo vienerisolto pubblicandoli in forma anonima. Questo problema ovviamente non riguarda idati non personali come ad esermpio dati relativi alle cartografie, datimetereologici, o qualsiasi altro tipo di dato che non coinvolga soggetti.● Vantaggi non immediati: una volta che i dati vengono pubblicati, essi nonverranno immediatamente utilizzati per produrre innovazione e servizi mabisogna dare il tempo agli utenti di utilizzarli in qualche modo e forse  questo èuno degli aspetti che limitano il passaggio alla filosofia di “dato aperto” inquanto molte organizzazioni pensano ad avere un riscontro economicoimmediato e se esso non arriva allora il progetto viene scartato.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data7
    • 6) Aspetti giuridiciE’ diffusa l’opinione che gli open data possano creare problemi dal punto di vistagiuridico, riguardanti più che altro la questione della privacy,del copyright e normativesulla trasparenza e queste ragioni vengono utilizzate come alibi per impedire laproduzione di dati aperti (accade specialmente in Italia). In particolare per evitare ilproblema del copyright si utilizzano delle licenze il più possibile open che permettanoil riuso dei dati per renderli Open data a tutti gli effetti. Quindi bisogna essere piùtrasparenti possibile, come dice la legge n. 241/1990,ma questa legge prevede lapossibilità di accedere ai dati esclusivamente alle persone alle quali avevano unospecifico interesse. Ma in questi tempi e con l’introduzione dell’informativa nel settorepubblico, questa legge inizia a diventare un pò troppo “stretta” e non è più sufficientee quindi è stata modificata per permettere l’accessibilità totale e la fruibilità in formatodigitale.Licenze per pubblicazione dei dati pubbliciEsistono due macrotipologie di licenze software: open e closed.Le licenze di tipo closed permettono di riservare tutti i diritti al titolare del copyright,quindi nel caso un utente voglia modificare, utilizzare e ripubblicare i dati, l’utentedovrà rivolgersi al titolare del copyright per richiederne il consenso; in caso esso siarifiutato non si potranno utilizzare i dati.Le licenze di tipo open seguono la filosofia inversa, cioè cercano di garantire unaserie di diritti a chi utilizzerà i dati, tutelando anche l’autore.In ItaliaIn Italia la Pubblica Amministrazione utilizza la IODL (Italian Open Data Licence):essa permette di consultare,estrarre,scaricare,copiare,pubblicare,distribuire etrasmettere le informazioni. Inoltre è possibile utilizzare i dati e combinarli con altreinformazioni oppure sviluppare un’applicazione che li utilizzi.7) Aspetti tecniciFormato degli open data: i dati devono essere pubblicati in un formatopossibilmente open per permetterne la massima diffusione e favorirne il riuso, quindipreferibilmente viene usato un formato grezzo, non formattato.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data8
    • Esistono delle metriche da utilizzare per avere dei dati più aperti possibile. Questemetriche sono state proposte da Tim Berners Lee e prevedono una scala divalutazione da 1 a 5:1. i dati sono disponibili dal web in qualsiasi formato, ma con una licenzaaperta,utile per riutilizzarli più spesso.2. disponibilità in formato strutturato e leggibile possibilmente da software opencome ad esempio excel e software equivalenti3. disponibilità in formato strutturato accessibile in modo più semplice, come adesempio il formato CVS (Comma Separated Value, valori separati da unavirgola) che può essere facilmente ricondotto a formati simili ad excel4. disponibilità sia in formato excel che CVS e utilizzando le specifiche W3C peridentificare la destinazione dei dati e capire a cosa si riferiscono perpermettere agli utenti di linkarli5. collegare i dati ad altri dati per permettere di produrre contenuti più ampiNel caso ci si trovi di fronte a dei dati rilasciati in formato “chiuso” come ad esempionel caso del formato PDF, per ottenere i dati si deve effettuare il data scraping ,cioèconvertire il documento in un formato un pò più aperto ed estrapolare le informazioniRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data9
    • per convertirle in un formato di dati più aperto.Un insieme di dati pronti per il riuso e magari aventi alcune caratteristiche in comuneè detto dataset, il quale accompagnato da una licenza che permetta il riuso epubblicato sul web è anch’esso Open Data.Dati connessi (Linked Open Data)Le licenze di tipo open favoriscono la combinazione di dati proveniente da datasetdiversi (oppure anche combinazioni di diversi dataset). I dati se vengono pubblicati erestano isolati ma non hanno molta utilità. Ma se vengono inclusi in dataset più ampi eche possono essere collegati con altri dataset allora acquistano molta più utilitàperchè permettono di creare una quantità pressochè illimitata di applicazioni. Se idataset non fossero collegati tra di loro si avrebbero enormi difficoltà a collegarliautomaticamente e ciò ne impedisce il riuso.Pubblicazione di Open DataPer pubblicare i dataset è sufficiente aggiungere un link al download in una paginaweb. Per aumentarne la diffusione e favorirne l’indicizzazione è buona praticapubblicare una descrizione del dataset su CKAN, il quale si può considerare come unvero e proprio catalogo per accedere ai dati in maniera semplice e rapida (http://ckan.org/ )8) Formati di dati apertiGeneralmente tutti i formati di dati vanno più che bene purchè siano leggibili dallamaggior parte delle applicazioni per ottenere un punteggio più elevato secondo lascala di valutazione proposta da Tim Berners Lee. In realtà è preferibile utilizzareformati “strutturati” basati su comuni file di testo che sono facilmente accessibili daqualsiasi elaboratore.Ecco una panoramica sui formati più utilizzati● JSON: è un formato di file basato su testo molto semplice da leggere sia daparte dell’elaboratore (per quanto riguarda la questione di compatibilità) equindi facilmente utilizzabile se lo si deve trattare utilizzando dei linguaggi diprogrammazione, sia per quanto riguarda la lettura diretta da parte dell’uomo.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data10
    • Solitamente questo formato è più semplice da elaborare rispetto al formatoXML.● XML: è un formato spesso usato per lo scambio di dati tra vari sistemi perchèpermette di mantenere in modo semplice l’organizzazione e struttura dei datioriginali per per,metterne la comunicazione a un altro sistema.● RDF: è un formato raccomandato dal W3C e permette di rappresentare i datiin una forma che rende facilmente integrabili i dati provenienti da fonti diverse.In realtà non è un vero e proprio formato in quanto i dati possono essere salvatiin altri formati come ad esempio XML o JSON, ma permette il collegamento trapiù fonti utilizzando degli URL integrati che permettono di far funzionare il tuttoin modo molto simile a come funzionano le pagine web.● Fogli di calcolo (XLS e simili): molte autorità hanno informazioni salvate infogli di calcolo. Questi dati hanno il vantaggio di poter essere immediatamentevisualizzati e utilizzati. Di contro però è possibile che nel documento sianoincluse formule e macro che potrebbero complicare il lavoro all’utente finale,inoltre dal punto di vista dell’utilizzo via programmazione ci sarebbero nonpochi problemi.● CVS: (Comma Separated Value): è un formato di dati basato su file di testo nelquale è presente una lista di valori e ogni valore è racchiuso da un separatoreche in questo caso è la virgola (ma volendo si possono utilizzare altriseparatori). Il vantaggio è che i dati sono accessibili senza alcuna difficoltà, losvantaggio è che possono risultare difficili da interpretare perchè non vengonoben documentati, cioè non è sempre possibile capire ogni valore a cosacorrisponda.● Documenti di testo: sono i file .txt. Questo tipo di file è molto semplcie daleggere da parte di un computer ma non contengono alcunaformattazione/struttura/documentazione con la conseguenza che per ogni filevanno scritte delle particolare istruzioni di codice che permettono di fare unparsing del documento.● Immagine scannerizzata: di gran lunga il peggior metodo per lo scambio didati in quanto sono difficilmente interpretabili da un computer (in alcuni formatiRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data11
    • di immagine è possibile aggiungere dei dettagli che descrivono cosa èvisualizzato ma non basta)● HTML: è un buon formato da utilizzare in attesa di passare a un formatomigliore, le pagine html a volte sono difficili da gestire oppure da scaricare e leinformazioni non sono sempre facilmente accessibili.Formati proprietari: alcuni sistemi hanno la possibilità di importare ed esportare datima il lato negativo è il fatto che è difficile garantire la compatibilità da un sistemaall’altro. Nel peggiore dei casi invece l’unico modo per poter leggere questo tipo didati è acquistare software a pagamento e questo è decisamente contrario alla filosofiadi Open Data.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data12
    • 9) Possibili applicazioniGli open data possono potenzialmente fornire una quantità limitata di possibiliapplicazioni, eccone qualche esempio:Trasparenza.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data13
    • In finlandia e Gran Bretagna esistono dei progetti simili che permettono ai cittadini dicapire in che modo vengono impiegati i soldi delle proprie tasse e in questo modoverificare se tutto sta andando per il verso corretto oppure se ci sono sprechi (eperchè no, verificare se i soldi arrivano a destinazione)Vita privataI dati aperti possono aiutarci nella vita di tutti i giorni: ad esempio in Olanda il serviziovervuilingsalarm.nl serve ad avvisare quando la qualità dell’aria del quartiere in cui sivive raggiunge una soglia critica definita dall’utente. Oppure a New York esiste unservizio che permette di capire dove portare a spasso il cane ed eventualmentetrovare altre persone che utilizzano lo stesso parco.10) Open Data in ItaliaIn Italia solo recentemente si sta diffondendo la pubblicazione di dati aperti, maattualmente com’è la situazione?Secondo il sito dati.gov.it, da marzo 2012 a febbraio 2013 sono stato pubblicati quasi5000 dataset. Per rendere l’idea, la Gran Bretagna circa un anno fa aveva giàpubblicato la stessa quantità di dati (ed è una delle nazioni in prima linea nellaproduzione di dati aperti) e questo dimostra che siamo indietro di un anno ma un pòalla volta si sta recuperando il terreno perduto. Inoltre i dati pubblicati in Italia sonostati catalogati come “buoni” secondo la scala di valutazione proposta da Tim BernersLee.Ma i principali produttori di dati aperti non sono i comuni (come ci si potrebbeaspettare) ma dalle istituzioni come ad esempio l’Istat e questa situazione devecambiare visto che in Italia abbiamo circa 13000 comuni che potenzialmentepotrebbero pubblicare una elevata quantità di materiale.Oltre al problema dell’origine dei dati, esiste anche un problema geografico: lePubbliche Amministrazioni che pubblicano dati sono concentrate nelle regioni delcentro­nord mentre nel sud, a parte qualche piccola eccezione, si registra unasituazione di desolazione.I fattori limitanti alla pubblicazione dei dati aperti riguardano alcuni aspetti● pulizia del dato: a volte i dati sono troppo grezzi e vanno ripuliti prima di esserepubblicati e questo lavoro può a volte essere lungo e noioso (e costoso)Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data14
    • ● risultati immediati: a volte le pubbliche amministrazioni o i comuni nonritengono che i dati aperti siano utili perchè non forniscono un ritornoeconomico immediato e quindi non conviene pubblicarliRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data15
    • Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data16
    • 11) Un esempio praticoPer un esame universitario mi è capitato di dover lavorare con degli Open Data, e inparticolare ho dovuto realizzare un’applicazione Android che utilizzi gli Open Dataprovenienti dal comune di Torino che si può dire sia uno dei comuni italiani piùall’avanguardia da questo punto di vista. E’ stato quindi scelto di utilizzare i datiriguardanti la disponibilità dei parcheggi nel comune di Torino reperibili al seguenteindirizzo http://opendata.5t.torino.it/get_pk.Questi dati sono in formato XML e vengono aggiornati molto frequentemente (ogni 5minuti circa) e quindi riescono a fornire un quadro completo della situazione.Open Data nel dettaglioIntestazioneContiene le informazioni relative al documento riguardanti il contenuto e il momento incui il documento è stato generato.<td:traffic_data xsi:schemaLocation="http://www.5t.torino.it/simone/ns/traffic_datahttp://www.5t.torino.it/simone/ns/traffic_data.xsd" datatype="misura"generation_time="2013­06­04T10:52:49+02:00"start_time="2013­06­04T10:47:49+02:00" end_time="2013­06­04T10:52:49+02:00"source="5T.PARK">Il campo datatype specifica il tipo di dati rappresentato nell’XML,generation_timespecifica il momento in cui sono stati generati questi dati e i campi start_time e ilcampo end_time specificano la durata dei dati precedenti.ElementiOgni elemento contiene le informazioni relative al singolo parcheggio<td:PK_data Name="ARBARELLO" ID="1" status="1" Total="147" Free="41"tendence="­1" lat="45.07243" lng="7.67480"/>Il campo Name specifica il nome del parcheggio, il campo ID contiene l’ID delparcheggio, lat e lng specificano le coordinate geografiche del parcheggio.Ma ben più interessanti sono i campi status (indica se il parcheggio è aperto oRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data17
    • chiuso), Total (capienza massima del parcheggio), Free(quantità di parcheggi liberi)e tendence (indica se la tendenza del parcheggio è di svuotarsi oppure riempirsi).schermata di riepilogo: visualizza la situazione generale dei parcheggiRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data18
    • mappa: utilizzando le informazioni di posizionamento incluse nei dati forniti, permettedi visualizzare una panoramica dei parcheggi e della loro posizione.Rossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data19
    • statistiche: utilizzando lo storico dei dati è possibile ricostruire la situazione e fornireuna previsione dell’occupazione di un singolo parcheggio.Queste informazioni permettono agli utenti di avere una situazione aggiornata quasi intempo reale e quindi permettono di evitare di girare troppo tempo in macchina,migliorando sicuramente il livello di stress del povero automobilista e permettendo unrisparmio in termini di tempo e carburante.12) Fontihttps://it.wikipedia.org/wiki/Open_datahttp://en.wikipedia.org/wiki/Open_datahttp://segnalazionit.org/2012/03/istat­e­open­data/http://blog.3dgis.it/222­i­vantaggi­dei­dati­liberi­open­datahttp://opendatahandbook.org/it/what­is­open­data/http://opendatahandbook.org/it/http://blog.okfn.org/2012/10/05/the­benefits­of­open­data­evidence­from­economic­research/http://www.scribd.com/doc/55159307/Come­Si­Fa­Opendata­Ver­2http://opendataitalia.wordpress.com/http://www.agendadigitale.eu/egov/256_open­data­provaci­ancora­italia.htmRossetto Matteo ­ 835134 ­ Social Media & Smart Apps : Open Data20