Your SlideShare is downloading. ×
Sod 14 ppp_27
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Sod 14 ppp_27

148
views

Published on

Sessione su google refine, python e l'anagrafe delle scuole italiane durante il SOD14 a Bologna

Sessione su google refine, python e l'anagrafe delle scuole italiane durante il SOD14 a Bologna

Published in: Internet

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
148
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 1- SIC 2- BB_UU 3- VISUALIZZAZIONI 4- LOD , RDF, IPA 27/03/2014 1SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 2. 1-SIC • APRILE -OTTOBRE 2012 RILASCIO DATI MIUR • I DATI VENGONO ANALIZZATI , PRIMI PROBLEMI (dati mancanti e incompleti). • CICLO - ANALISI DATI , CREAZIONE DATI DA VISUALIZZARE, DATAVIZ. 27/03/2014 2SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 3. Campo Descrizione Tipo codice_scuola Codice scuola chiave DENOMINAZIONE Denominazione dell'istituto attributo DES_TIPO_SCUOLA Tipologia istituto - denominazione attributo INDIRIZZO Indirizzo (Via + numero civico) attributo COMUNE Indirizzo (Comune) - denominazione attributo CAP Indirizzo (CAP) attributo TELEFONO telefono attributo FAX Fax attributo EMAIL email attributo 1-SIC 27/03/2014 3SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 4. Campo Descrizione Tipo PEC email - PEC attributo SITO_WEB sito web attributo COD_ISTITUTO_PRI Istituto principale di riferimento (sede direzione) attributo LATITUDINE Coordinata latitudine attributo LONGITUDINE Coordinata longitudine attributo 1-SIC 27/03/2014 4SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 5. ALLA RICERCA DEI DATI • MIUR SITO NAZIONALE • USR UFFICIO MIUR REGIONALE • USR UFFICIO MIUR PROVINCIALE • UFFICIO REGIONALE ASSESSORATO SCOLASTICO • OGNUNO DI QUESTI UFFICI PRODUCE UN ELENCO DELLE SCUOLE REGIONALI CON FORMATI E CONTENUTI DIVERSI 1-SIC 27/03/2014 5SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 6. ALLA RICERCA DEI DATI CI SONO DATI SULLE SCUOLE A LIVELLO NAZIONALE AGGIORNATI ANNUALMENTE ? DATI IN FORMATO CSV ,RDF , CON LICENZA OPEN , AGGIORNATI PERIODICAMENTE ? LA RISPOSTA NON E’ COMPLETAMENTE NEGATIVA. 1-SIC 27/03/2014 6SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 7. Primo Risultato • TRASFERIMENTO DOCENTI E PERSONALE ATA • SCARICARE UNO O PIU’ FILE DAL SITO DEL MINISTERO • FARE DOMANDA A UNA O PIU’ SEDI SCOLASTICHE 2-BB_UU 27/03/2014 7SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 8. 2-BB_UU FRAA000VF6 PROVINCIA DI FROSINONE • FRAA035ZL6 DISTRETTO 035 • FRAAL398S7 COMUNE DI TREVI NEL LAZIO • FRAA80703V TREVI NEL LAZIO CAPOLUOGO (ASSOC. I. C. FRIC80700X) • "CAPOLUOGO" • FRAA050ZF0 DISTRETTO 050 • FRAAA054G7 COMUNE DI ACUTO • FRAA83602T ACUTO CAPOLUOGO (ASSOC. I. C. FRIC83600X) • VIA G. GERMINI LOC. CAPOLUOGO • FRAAA269G4 COMUNE DI ANAGNI • FRAA84401Q ANAGNI CAPOLUOGO (ASSOC. I. C. FRIC84400V) • VIA REGINA MARGHERITA LOC. CAPOLUOGO VIA R. MARG • FRAA84502L ANAGNI MAD. DI TUFANO (ASSOC. I. C. FRIC84500P) • VIA MADONNA DI TUFANO • FRAA84501G ANAGNI PANTANELLO (ASSOC. I. C. FRIC84500P) • VIA FOSSO DEL LUPO • FRAA84402R ANAGNI PRATO (ASSOC. I. C. FRIC84400V) • CONTRADA S. FILIPPO • FRAA84404V ANAGNI S. BARTOLOMEO (ASSOC. I. C. FRIC84400V) • CONTRADA COLLE S. BARTOLOMEO • FRAA84403T ANAGNI S. CESAREO (ASSOC. I. C. FRIC84400V) • CONTRADA S. CESAREO • FRAA84503N ANAGNI S. GIORGETTO (ASSOC. I. C. FRIC84500P) • VIA S. GIORGETTO • FRAA84400P I. C. 1^ ANAGNI (ASSOC. I. C. FRIC84400V) 27/03/2014 8SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 9. • E’ VERO. I FILES SONO DOCUMENTI WORD (RTF) • CHE FARE? LASCIAR STARE. • COSTRUIRE UN “PARSER” IN PYTHON. • UTILIZZO DI GOOGLE REFINE PER UN CONTINUO FEEDBACK SUI RISULTATI PRODOTTI DEL PARSER. 2-BB_UU 27/03/2014 9SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 10. COSTRUZIONE DEL PARSER • COSTRUZIONE LISTA FILES DA SCARICARE • TRAFORMAZIONE FILE RTF IN UN UNICO FILE • ESTRAZIONE DAL FILE DI UN TABELLA CONTENENTE DATI DELLE SEDI SCOLASTICHE • PULIZIA DEI DATI (DUPLICAZIONI ) .FEEDBACK DA GOOGLE - REFINE 2-BB_UU 27/03/2014 10SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 11. 2-BB_UU Geocoficica in Google_ Refine 27/03/2014 11SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 12. 2-BB_UU Preparazione estrazione RDF 27/03/2014 12SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 13. 2-BB_UU Estrazione in RDF 27/03/2014 13SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 14. 2-BB_UU Estrazione scuole in RDF 27/03/2014 14SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 15. 2-BB_UU Estrazione scuole in RDF 27/03/2014 15SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 16. 3-VISUALIZZAZIONI 27/03/2014 16SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 17. 3-VISUALIZZAZIONI 27/03/2014 17SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 18. 3-VISUALIZZAZIONI 27/03/2014 18SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 19. 3-VISUALIZZAZIONI 27/03/2014 19SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 20. 3-VISUALIZZAZIONI 27/03/2014 20SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 21. 3-VISUALIZZAZIONI 27/03/2014 21SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 22. 3-VISUALIZZAZIONI 27/03/2014 22SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 23. 3-VISUALIZZAZIONI 27/03/2014 23SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 24. 4- LOD , RDF , IPA • Nel frattempo : •12 ENDPOINT DELLA NUVOLA LOD ITALIANA •DATI RDF REGIONE PIEMONTE •SCUOLE ITALIANE LINKEDOPENDATA •IPA INDICE P. A. IN RDF 27/03/2014 24SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 25. 4- LOD , RDF , IPA ##id-dati.piemonte Scuole Piemonte @prefix :dc="http://purl.org/dc/elements/1.1/" @prefix :rdfs="http://www.w3.org/2000/01/rdf-schema#" @prefix :rponto="http://id- dati.piemonte.it/ontology/v1/rponto.owl#" @prefix :rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> #linkedopendata @prefix gn: <http://www.geonames.org/ontology#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix edu: <http://purl.org/net7/vocab/scuole/v1#> . @prefix skos: <http://www.w3.org/2004/02/skos/core#exactMatch> . @prefix vcard: <http://www.w3.org/2006/vcard/ns#> . 27/03/2014 25SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 26. 4- LOD , RDF , IPA #spcdata.digitpa.gov.it IPA @prefix spcdata: <http://spcdata.digitpa.gov.it/> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix geonames: <http://www.geonames.org/ontology#> . @prefix org: <http://www.w3.org/ns/org#> . @prefix locn: <http://www.w3.org/ns/locn#> . @prefix rov: <http://www.w3.org/ns/regorg#> . @prefix adms: <http://www.w3.org/ns/adms#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . 27/03/2014 26SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 27. 4- LOD , RDF , IPA Elenco file IPA 27/03/2014 27SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 28. 4- LOD , RDF , IPA SEMPLICI QUERY Local e remote data 27/03/2014 28SOD14- A.Martinez;F.Luzio;G.Trimboli Jena Sparql Processor arq --data amm.ttl --query search.rq prefix spcdata: <http://spcdata.digitpa.gov.it/> SELECT ?S_titolo WHERE { ?S_titolo spcdata:titolo "Dirigente Scolastico" .} LIMIT 10 search.rq arq amm.ttl search.rq TTL CSV RDF HTML
  • 29. 4- LOD , RDF , IPA SEMPLICI QUERY SPCDATA ENDPOINT prefix spcdata: <http://spcdata.digitpa.gov.it/> SELECT ?S_titolo WHERE { ?S_titolo spcdata:titolo "Dirigente Scolastico" .} LIMIT 10 S_titolo http://spcdata.digitpa.gov.it/Responsabile/adan_063 http://spcdata.digitpa.gov.it/Responsabile/aggi http://spcdata.digitpa.gov.it/Responsabile/aic_063 http://spcdata.digitpa.gov.it/Responsabile/ava_061 http://spcdata.digitpa.gov.it/Responsabile/C http://spcdata.digitpa.gov.it/Responsabile/cdcd_075 27/03/2014 29SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 30. 4- LOD , RDF , IPA SEMPLICI QUERY SPCDATA ENDPOINT prefix spcdata: <http://spcdata.digitpa.gov.it/> prefix org: <http://www.w3.org/ns/org#> SELECT ?S_titolo ?O_headOf WHERE {?S_titolo spcdata:titolo "Dirigente Scolastico" . ?S_titolo org:headOf ?O_headOf .} LIMIT 10 S_titolo O_headOf http://spcdata.digitpa.gov.it/R esponsabile/adan_063 http://spcdata.digitpa.gov.it/A mministrazione/adan_063 http://spcdata.digitpa.gov.it/R esponsabile/aggi http://spcdata.digitpa.gov.it/A mministrazione/aggi http://spcdata.digitpa.gov.it/R esponsabile/aic_063 http://spcdata.digitpa.gov.it/A mministrazione/aic_063 27/03/2014 30SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 31. 4- LOD , RDF , IPA SEMPLICI QUERY SPCDATA ENDPOINT prefix spcdata: <http://spcdata.digitpa.gov.it/> prefix org: <http://www.w3.org/ns/org#> prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> SELECT ?S_titolo ?O_headOf ?O_label WHERE {?S_titolo spcdata:titolo "Dirigente Scolastico" . ?S_titolo org:headOf ?O_headOf . ?O_headOf rdfs:label ?O_label.} LIMIT 10 S_titolo O_headOf O_label http://spcdata.digit pa.gov.it/Responsa bile/adan_063 http://spcdata.digit pa.gov.it/Amministr azione/adan_063 Istituto Comprensivo 4 D'Auria - Nosengo di Arzano http://spcdata.digit pa.gov.it/Responsa bile/aggi http://spcdata.digit pa.gov.it/Amministr azione/aggi Scuola Media Antonio Gramsci- Giuseppe Impastato di Giugliano27/03/2014 31SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 32. 4- LOD , RDF , IPA CONSTRUCT “output a graph pattern” prefix geonames: <http://www.geonames.org/ontology#> prefix org: <http://www.w3.org/ns/org#> prefix locn: <http://www.w3.org/ns/locn#> prefix rov: <http://www.w3.org/ns/regorg#> prefix adms: <http://www.w3.org/ns/adms#> prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> prefix xsd: <http://www.w3.org/2001/XMLSchema#> prefix owl: <http://www.w3.org/2002/07/owl#> prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> prefix skos: <http://www.w3.org/2004/02/skos/core#> CONSTRUCT { ?S_who org:headOf ?O_headOf . ?O_headOf rdfs:label ?o_label. ?O_headOf spcdata:PEC ?o_PEC. ?O_headOf geonames:locatedIn ?O_located. ?O_headOf locn:address ?O_address. ?O_headOf org:classification ?O_classific. ?O_headOf org:identifier ?o_identif. ?O_headOf foaf:homepage ?o_homepage. ?O_headOf foaf:mbox ?o_mbox.} WHERE{ ?S_who spcdata:titolo "Dirigente Scolastico" . ?S_who org:headOf ?O_headOf . OPTIONAL {?O_headOf rdfs:label ?o_label.} OPTIONAL {?O_headOf spcdata:PEC ?o_PEC.} OPTIONAL {?O_headOf geonames:locatedIn ?O_located.} OPTIONAL {?O_headOf locn:address ?O_address.} OPTIONAL {?O_headOf org:classification ?O_classific.} OPTIONAL {?O_headOf org:identifier ?o_identif.} OPTIONAL {?O_headOf foaf:homepage ?o_homepage.} OPTIONAL {?O_headOf foaf:mbox ?o_mbox.}} ORDER BY ?O_headOf 27/03/2014 32SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 33. 4- LOD , RDF , IPA CONSTRUCT “the graph pattern” @prefix adms: <http://www.w3.org/ns/adms#> .@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix spcdata: <http://spcdata.digitpa.gov.it/> .@prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix geonames: <http://www.geonames.org/ontology#> . @prefix org: <http://www.w3.org/ns/org#> . @prefix locn: <http://www.w3.org/ns/locn#> . @prefix rov: <http://www.w3.org/ns/regorg#> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . <http://spcdata.digitpa.gov.it/Responsabile/istsc_toee09800g> org:headOf <http://spcdata.digitpa.gov.it/Amministrazione/istsc_toee09800g>. <http://spcdata.digitpa.gov.it/Responsabile/istsc_taic80500g> org:headOf <http://spcdata.digitpa.gov.it/Amministrazione/istsc_taic80500g> . <http://spcdata.digitpa.gov.it/Responsabile/istsc_tais023009> org:headOf <http://spcdata.digitpa.gov.it/Amministrazione/istsc_tais023009> . <http://spcdata.digitpa.gov.it/Responsabile/istsc_miic84700l> org:headOf <http://spcdata.digitpa.gov.it/Amministrazione/istsc_miic84700l> . <http://spcdata.digitpa.gov.it/Amministrazione/istsc_imic80200r> rdfs:label "ISTITUTO COMPRENSIVO - IC DELLA VAL NERVIA" ; spcdata:PEC "imic80200r@pec.istruzione.it" ; geonames:locatedIn <http://spcdata.digitpa.gov.it/Comune/B559> ; locn:address <http://spcdata.digitpa.gov.it/Indirizzo/istsc_imic80200r> ; org:classification <http://spcdata.digitpa.gov.it/CategoriaAmministrazione/70> ; org:identifier "90057210081" ; foaf:homepage "www.scuolevalnervia.org" ; foaf:mbox "IMIC80200R@istruzione.it" . 27/03/2014 33SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 34. RIFERIMENTI : I DATI A.S. 2013-2014 27/03/2014 34SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 35. RIFERIMENTI : I DATI A.S. 2013-2014 27/03/2014 35SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 36. RIFERIMENTI : I DATI A.S. 2013-2014 27/03/2014 36SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 37. LINKS SIC 2012-1013 Scuola in chiaro BB_UU Elenco Sedi Scolastiche per domande di trasferimento docenti e personale ATA. http://hubmiur.pMobilità personale della scuola Anno Scolastico 2013/2014 http://archivio.pubblica.istruzione.it/mobilita/bollettino/2014/index.html Repository parser python dati regione Lazio https://github.com/scarimp/BB_UU_PYPA Risorse RDF esistenti: http://www.linkedopendata.it/datasets/scuole non è manutenuto . Ha usato i dati SIC. Si può usare come Sparql Endpoint. http://www.dati.piemonte.it/rdf.html dati pioneristici della Regione Piemonte sulle scuole Piemontesi. E’ descritta anche una semplicissima ontologia . Si può scaricare il modello RDF. http://spcdata.digitpa.gov.it/dataIPA.html Indice della pubblica Amministrazione. Contiene vari dataset dell’anagrafica delle pubbliche amministrazioni incluse le Scuole Pubblche (ISA); è continuamente aggiornato e sarà usato nell’ambito dell’agenda digitale Italia , nella Fatturazione Elettronica dal prossimo giugno. SPCDATA Endpoint http://spcdata.digitpa.gov.it:8899/sparql 27/03/2014 37SOD14- A.Martinez;F.Luzio;G.Trimboli
  • 38. LINKS JOINUP Modello per un’ontologia delle Scuole. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data- models-rdf-schemas 27/03/2014 38SOD14- A.Martinez;F.Luzio;G.Trimboli