Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Big Data - Rapporto del Gruppo Miur

Rapporto del Gruppo di lavoro sui Big Data - Presentato il 28 luglio 2016 presso la Sala della Comunicazione del Miur

Big Data - Rapporto del Gruppo Miur

  1. 1. 1
  2. 2. Il compito del gruppo di lavoro • mappare, in chiave anche comparata a livello europeo e internazionale, i principali centri, universitari e non, che operano nel settore dei “Big Data” con riferimento alla formazione e costruzione di competenze; • identificare le possibili misure che il sistema formativo italiano dovrebbe adottare per essere in linea con le migliori prassi internazionali valorizzando le proprie specificità e, ove possibile, assumere un ruolo guida in questo settore in rapida evoluzione; • effettuare la ricognizione delle banche dati del Ministero, relative al settore dell’istruzione scolastica, dell’università e dell’alta formazione artistica e musicale, nonché della ricerca scientifica, e proporre azioni che il Ministero potrebbe intraprendere per valorizzare le stesse e renderle strumento utile all’elaborazione di scelte di policy strategiche.
  3. 3. I componenti del gruppo Fabio BELTRAM SNS Sabrina BONO MIUR Francesco CASTANÒ ISTAT Davide D’AMICO MIUR Luca DE BIASE Nòva24 Letizia MELINA MIUR Donatella SOLDA MIUR Roberto TORRINI Banca d’Italia
  4. 4. La modalità di lavoro • ascolto della comunità nazionale con inviti diretti e autosegnalazioni; • tre incontri con gruppi di esperti nel campo della formazione e della ricerca; • richiesti contributi specifici da parte di esperti; • analizzata la struttura delle basi di dati del MIUR; • analizzate le policy europee e internazionali; • beneficiato del contributo continuo di altri sia interni sia esterni al MIUR.
  5. 5. Caratteristiche dei big data VOLUME VELOCITÀ VARIETÀ VALORE
  6. 6. VOLUME Caratteristiche dei big data
  7. 7. VELOCITÀ e VARIETÀ rilevazioni meteo sensori pagamenti POS data warehouse bilanci aziendali social network video- sorveglianza documenti di testo dati sanitari email destrutturati struttura ricerca scientifica mercati finanziari strutturati temporeale velocità statici Caratteristiche dei big data
  8. 8. VALORE Caratteristiche dei big data
  9. 9. Un esempio
  10. 10. Un esempio Data-driven rating
  11. 11. Un esempio strategie economiche/ policy Data-driven rating
  12. 12. Un esempio strategie economiche/ policy valutazione model free Data-driven rating
  13. 13. strategie economiche/ policy valutazione model free Real time DATA DRIVEN RATING Una visione sistemica per misurare il rischio di credito
  14. 14. Competenze e dati economia matematica informatica statistica rischio di credito teoria delle reti text mining sentiment analysis significatività bilanci default mercato social network machine learning rete di pagamenti rete di ownership CORPORATE RATING visione sistemica
  15. 15. società α bilancio crediti mercato società β società λ società ξ società ε società δsocietà θ Da singolo a sistema
  16. 16. società α bilancio crediti mercato società β società λ società ξ società ε società δsocietà θ Da singolo a sistema
  17. 17. Accesso a risorse di calcolo Rapporto pubblico privato Multi- disciplinarietà Repereribilità dei dati Sfide ppp
  18. 18. La formazione e i big data ANALISI PROPOSTE • Sviluppo di competenze digitali nella scuola • Modifiche al sistema formativo, valutativo, di monitoraggio • Alta formazione: laurea, laurea magistrale, PhD, master
  19. 19. Censimento dell’offerta Università L LM Master Offerta in altri cdl Bologna I L, LM Firenze I, II L, LM Genova ⚫ ⚫¹ D L'Aquila ⚫¹ MI Bicocca I MI Bocconi ⚫¹ PoliMI ⚫¹ Molise I Padova ⚫² Pisa ⚫ II Università L LM Master Offerta in altri cdl Luiss I Roma - Sapienza ⚫ II L, LM Roma – Tor Vergata ⚫¹ II Siena ⚫¹² Torino ⚫ II PoliTO II³ LM Trieste - SISSA II Venezia ⚫¹ ⚫¹
  20. 20. Università Bolzano LM Cassino LM Ferrara L, LM, D Insubria D Lucca – IMT D Messina L, LM Milano - Statale LM, D Napoli – Federico II LM Università Padova L, LM Palermo LM Pavia LM Politecnico delle Marche LM Roma TRE LM Salerno LM Trento LM Censimento dell’offerta
  21. 21. La formazione universitaria è il livello ottimale per fornire gli strumenti richiesti dal fenomeno emergente dei Big Data. Inserire moduli di data science in tutti i corsi di studio, a partire dalle lauree triennali, per esporre gli studenti al cambio di paradigma che investe tutte le discipline spingendo verso un approccio scientifico data driven, con la scoperta di che emergono dalle grandi masse di dati disponibili: esperimenti sui dati visti non solo come validazione di teorie e modelli, ma anche come scoperta di pattern emergenti che suggeriscono agli scienziati nuove teorie e nuovi modelli, in grado di spiegare più a fondo la complessità dei fenomeni sociali, economici, biologici, tecnologici, culturali Alta formazione: laurea, laurea magistrale, PhD, Master
  22. 22. • Inserire moduli di data science in tutti i corsi di studio • aggiornamento paradigmi formativi e della distribuzione dei crediti • finanziamento di progetti comuni tra data scientists ed esperti di settore (sanità, economia, scienze sociali e umane…) • programma di reclutamento dei docenti • centri di ateneo capaci di fornire i crediti in ambito big data CORSI DI LAUREA (TRIENNALI) Alta formazione: laurea, laurea magistrale, PhD, Master
  23. 23. Servizi 27,01% Informatica 18,80% Manifattura 12,79% Grande distribuzione 9,57% Rifiuti 8,16% Finanza e Assicurazioni 8,09% Vendita all'ingrosso 5,67% Educazione 3,03% Altri servizi (no PA) 1,70% Turismo 1,21% Sanità 1,04% Immobiliare 0,76% Edilizia 0,62% Trasporti 0,46% PA 0,42% Management 0,28% Arte e Cultura 0,18% Estrazione materie prime 0,11% Utenze 0,11% Altro % La richiesta di competenze BD nel mercato del lavoro (USA, 2014)
  24. 24. LAUREA MAGISTRALE Elementi di data science sono necessari all’interno dell’offerta di tutti i percorsi, ma qui si colloca il livello ideale per la formazione di specialisti in data science. Aspetto centrale della programmazione di questi percorsi di laurea è la necessità di renderli adatti ad accogliere laureati provenienti da background diversi per formare degli specialisti di settore capaci di utilizzare in maniera avanzata e indipendente i nuovi strumenti del mondo dei Big Data in specifici settori scientifici e professionali. Alta formazione: laurea, laurea magistrale, PhD, Master
  25. 25. LAUREA MAGISTRALE • Inserire moduli di data science in tutti i corsi di studio • percorsi di laurea magistrale focalizzati potrebbero in molti casi essere inseriti in una varietà di classi disciplinari distinte a seconda dello specifico settore nel quale il data scientist svolgerà la sua attività (ad es. settore biomedico, scienze sociali e umane) • La collocazione in diverse classi disciplinari a seconda dello specifico settore è utile a evitare ostacoli in ingresso e barriere disciplinari per il prosieguo della vita accademica/professionale degli studenti. Alta formazione: laurea, laurea magistrale, PhD, Master
  26. 26. PhD Considerazioni simili alle LM, rafforzate, si applicano alla possibilità di attivare percorsi di formazione dottorale, inoltre: • necessità di una documentata capacità di ricerca dell’ateneo ospite • nuovi dottorati potrebbero gemmare da esperienze di successo in dottorati esistenti attraverso il coinvolgimento di competenze delle nuove metodologie • specifico piano di finanziamento di borse dottorali • limitato numero di dottorati focalizzati sulla figura del data scientist, ma spazio anche a borse riservate a candidati con un background specifico da inserire all’interno di percorsi più “convenzionali” (economia, farmacologia, etc.). Alta formazione: laurea, laurea magistrale, PhD, Master
  27. 27. MASTER Offerta esiste, ma è poco omogenea. Opportuno introdurre processi di accreditamento. • Finalità principale di questi percorsi professionalizzanti dovrebbero essere formazione continua e aggiornamento professionale, anche in collaborazione con le imprese • Si raccomanda l’introduzione di percorsi intensivi sull’utilizzo delle nuove metodologie riservati agli esperti di determinati settori disciplinari/professionali. Esempi: master aperti a economisti, scienziati politici, farmacologi, epidemiologi... Alta formazione: laurea, laurea magistrale, PhD, Master
  28. 28. Scuola: sviluppo delle competenze digitali, aggiornamento dell’approccio formativo • raccordo con il Piano Nazionale per la Scuola Digitale per trasformare i digital native da consumatori a consumatori critici e produttori di contenuti digitali Il PNSD, lanciato nell’Ottobre 2015, è il documento strategico con cui il MIUR ha definito il posizionamento del sistema scolastico nell’era digitale • formazione al “valore del dato” come parte di un processo di alfabetizzazione digitale
  29. 29. Scuola: sviluppo delle competenze digitali, aggiornamento dell’approccio formativo UN’ESPERIENZA BIG DATA PER OGNI STUDENTE/SSA Tra le azioni del PNSD più direttamente riferibili al tema dei Big Data: Azione #15: dal prossimo anno scolastico, il MIUR finanzierà 25 curricula didattici applicabili a tutta la scuola, con due specifici percorsi dedicati ai dati (Big e Open Data); Azione #20: Girls in Tech & Science, per orientare, rafforzare e accelerare le competenze delle ragazze
  30. 30. • Big data sono stimolo per l’adozione di metodologie didattiche innovative basate su ambienti digitali • questi metodi rendono possibile il riuso dei materiali per valutazione (a tutti i livelli e in tempo quasi reale), monitoraggio e ricerca didattica • questi processi devono essere trasparenti: il personale della scuola, gli studenti e i loro genitori, tutti gli utilizzatori delle piattaforme di apprendimento devono essere consapevoli dell’uso che viene fatto dei dati generati dalle interazioni sulle piattaforme didattiche digitali Scuola: sviluppo delle competenze digitali, aggiornamento dell’approccio formativo
  31. 31. TITOLO • Il rapporto ha mappato il sistema informativo del MIUR, organizzato nei tre sottosistemi dell’ISTRUZIONE dell’UNIVERSITÀ e della RICERCA, le loro macro-aree e i processi e dati connessi. • Il patrimonio di informazioni del MIUR può essere classificato sulla base dei soggetti a cui le stesse si riferiscono. Si possono individuare tre principali categorie: 1. singole istituzioni (scuole, università, enti di ricerca e altre istituzioni di alta formazione): informazioni sulle strutture, sull’offerta formativa, sulle risorse economiche e umane, sulla produzione scientifica e quelle derivanti dalle attività di autovalutazione e valutazione; 2. studenti: informazioni relative al percorso formativo e ai principali eventi nella carriera scolastica e universitaria; 3. personale docente e amministrativo: informazioni sul percorso professionale e sul trattamento economico, ma anche, in maniera eterogenea per le diverse carriere, sulla produzione scientifica, sugli incarichi ricoperti e la formazione. Struttura e fruibilità dei dati MIUR
  32. 32. TITOLO L’autonomia che contraddistingue i diversi comparti ha contribuito allo sviluppo di distinte modalità di gestione delle informazioni, generando un’eterogeneità di repository poco comunicanti tra loro. Le informazioni sono già oggi utilizzate per la formulazione delle politiche e per l’analisi dei sistemi scolastico, universitario e della ricerca. Sono anche in parte a disposizione delle singole istituzioni per le loro scelte gestionali e al più ampio pubblico attraverso dei portali dedicati. Il Ministero è però oggi nelle condizioni di compiere un salto qualitativo in ottica Big Data e implementare una strategia di sistematica valorizzazione e integrazione del proprio patrimonio informativo Struttura e fruibilità dei dati MIUR
  33. 33. Una strategia Big Data per il MIUR • Aumentare la capacità di governare, sia dal punto di vista gestionale sia analitico, queste immense moli di informazioni implementare un ambiente ministeriale (virtualmente) centralizzato di data e content management garantire la interoperabilità dei diversi data base, indipendentemente dai processi amministrativi da cui originano, delle amministrazioni a cui si riferiscono, dei sistemi gestionali adottati consolidare i dati ed eliminare le ridondanze • Integrare/arricchire le informazioni con dati provenienti da altre amministrazioni (Ministero del Lavoro, Istat, Inail, etc.) • Integrare/arricchire le informazioni sfruttando in una logica Big Data anche le informazioni liberamente ricavabili dal web e dai social network • Diffondere in formato aperto i dati, ferma restando l’esigenza di assicurare i necessari profili di privacy
  34. 34. Approccio bottom-up che garantisca risultati a breve termine, rilasciati con continuità e frequenza, convergendo allo stesso tempo su una visione integrata di lungo termine A breve termine: • Interventi di adeguamento di qualità sulle basi di dati esistenti e definizione delle politiche di manutenzione e aggiornamento. • Ricognizione dei dati di altri enti e statistiche internazionali e progetto delle modalità di raccordo e integrazione con le basi dati MIUR. • Definire l’architettura tecnologica e progettare le modalità tecniche di integrazione a livello dati e applicazioni. A medio termine: • Creare un livello semantico di ontologie per integrare tutte le informazioni, sia presenti nelle basi dati ministeriali che ottenute dalle fonti esterne. • Integrare tutti gli archivi integrati e le fonti dati ausiliarie • Valorizzare e connettere le strutture preposte alla gestione e all’analisi dei dati Una strategia Big Data per il MIUR
  35. 35. TITOLO Sulla base delle diverse esigenze conoscitive si possono individuare diversi destinatari: • il decisore politico, nello specifico il Ministero e gli organismi preposti alla valutazione, direttamente coinvolti nella gestione, nella formulazione delle politiche e nella valutazione degli esiti; • le singole amministrazioni governate dal Ministero (le scuole, le università, gli enti di ricerca), che dalla disponibilità di dati sulla propria e sulle altre strutture possono trarre le necessarie indicazioni per le scelte gestionali e di orientamento dell’attività didattica e di ricerca; • il Sistema Statistico Nazionale che utilizza le informazioni statistiche prodotte dalle amministrazioni sui diversi ambiti della società e dell’economia; • il mondo della ricerca, che in maniera indipendente è interessato all’analisi dei percorsi di studio e professionali degli studenti, e all’analisi della governance del sistema scolastico universitario e della ricerca; • i singoli cittadini e le famiglie che hanno interesse ad acquisire informazioni sul sistema scolastico e universitario; • il mondo degli sviluppatori di applicazioni, piattaforme e servizi a contenuto informativo, che possono costruire a partire dalle informazioni pubbliche del Ministero nuove soluzioni a carattere sociale e commerciale. A chi interessano i dati del MIUR?
  36. 36. TITOLOLa piattaforma Scuola in Chiaro assieme alle informazioni diffuse tramite il sito Universitaly renderanno fruibili le informazioni attraverso piattaforme che permettano il pieno accesso ai dati pubblici, con modalità specifiche in relazione ai profili dell’utenza (pubblico non specialista, utenti che intendano riutilizzare i dati per scopi di ricerca o commerciali). Raccomandazioni: il MIUR • si faccia promotore della pubblicazione dei propri dati, adeguatamente documentati e tecnicamente disponibili adottando le più moderne soluzioni, • si coordini con altre basi e flussi di dati pubblici, • attivi politiche di interazione, analisi e partenariato con il settore privato per generare prodotti e servizi ad alta intensità informativa. Il portale unico dei dati della Scuola e Universitaly
  37. 37. TITOLO La disseminazione dei risultati della ricerca migliora le relazioni fra scienza (accademia e ricerca) e società, accrescendo da un lato l’impatto e i benefici della R&S sulla società stessa e dall’altro aumentando consapevolezza e fiducia dei cittadini. Viene così massimizzato il ritorno dell’investimento pubblico in ricerca, in piena ottica di responsabilità sociale della Ricerca e dell’innovazione, rinforzando la relazione tra scienza e società. La circolazione dei risultati della ricerca, permettendone il loro successivo riuso, fa in modo che questi abbiano maggiore impatto I dati della ricerca: l’Open Science
  38. 38. TITOLO Il gruppo raccomanda: • incentivi per i ricercatori, a partire dalle procedure di valutazione MIUR sulla produttività dei ricercatori (VQR), in modo che sia premiato il riutilizzo e la citazione dei dati da loro messi a disposizione; • emanazione di bandi competitivi per il finanziamento di progetti di ricerca che abbiano i Big Data sia come metodo, sia come oggetto di studio; • un piano di sensibilizzazione sul valore della condivisione dei dati da parte dei ricercatori con modalità che tutelino la proprietà intellettuale; • sviluppo di infrastrutture elettroniche di ricerca che siano capaci di ospitare grandi moli di dati per la loro condivisione e conservazione nel tempo. I dati della ricerca: l’Open Science
  39. 39. Conclusioni • Big data sono campo emergente di cui vediamo già le prime ricadute a livello globale, ma soprattutto vediamo il potenziale per un impatto di straordinario rilievo e grandissima pervasività; • l’Italia è nelle condizioni di assumere un ruolo competitivo nello scenario internazionale, ma i diversi attori pubblici e privati devono agire con tempestività; • l’attuazione delle proposte qui delineate consentirà al MIUR non solo di beneficiare degli sviluppi offerti dalla Data Science nello svolgimento delle proprie funzioni, ma anche di proporre un modello di best practice che potrà avere un prezioso effetto traino su altri settori della pubblica amministrazione,

    Be the first to comment

    Login to see the comments

  • felicettomassa1

    Jul. 28, 2016
  • marconibari

    Jul. 28, 2016
  • haribalasubramanianv

    Jul. 29, 2016
  • sanjakozino

    Jul. 29, 2016
  • andreanicolosi11

    Aug. 1, 2016
  • GabriellaTanzi1

    Aug. 2, 2016
  • FrancescoPierantoni

    Aug. 8, 2016

Rapporto del Gruppo di lavoro sui Big Data - Presentato il 28 luglio 2016 presso la Sala della Comunicazione del Miur

Views

Total views

4,907

On Slideshare

0

From embeds

0

Number of embeds

639

Actions

Downloads

140

Shares

0

Comments

0

Likes

7

×