Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Dati della ricerca e bibliotecari

672 views

Published on

  • Be the first to comment

Dati della ricerca e bibliotecari

  1. 1. Paola Gargiulop.gargiulo@cineca.itPresentazione al Ciclo diConferenze «Biblioteche,Libri e Documenti :dallaInformazione alla conoscenza2012-2013SezioneScienze del Libro edel Documento del Dipt diScienze DocumentarieLinguisitico-filologiche eGeografiche-Univ .La Sapienza - Roma19 aprile 2013
  2. 2.  Assistiamo alla produzione in costante crescita di dati dellaricerca in formato digitale in moltissime discipline, non solo nellescienze (astronomia, fisica, climatologia, vulcanologia, medicina,chimica, matematica ecc) ma anche nelle scienze sociali e umane(statistica, economia, psicologia, archeologia, storia dell’arte ecc.) La ricerca diventa, pertanto, sempre più data-intensive La ricerca utilizza pertanto sempre di più tecnologie avanzate dicomunicazione, di informazione e di calcolo, incrementando leforme di collaborazione tra ricercatori facilitate dalla costituzionedi network di macchine sempre più potenti e performanti Parliamo di E-Research/eResearch e di E-Science/eScience e anchedi Science 2.0
  3. 3.  Che cosa si intende per eResearch• Collaborazione tra ricercatori che avviene tramite larete indipendentemente dalla distanza tramite l’uso• risorse di calcolo/computer distribuite per la produzione, elaborazionedati condivisi• strumenti di collaborazione via web dai sw di social bookmarking percondividere bibliografie, report, testi completi, immagini alle video-conference e qualsiasi altra tecnologia di condivisione• Gestione dei dati e condivisione/Data management andsharing• Facilitare l’archiviazione (storage) e la catalogazione di datidella ricerca (data sets) al fine di permettere ai ricercatori dicontinuare ad accedere a questi dati (conservazione a lungotermine) e poterli riutilizzare
  4. 4. • High Performing Computing• sistemi di calcolo molto potenti e performanti distribuitiin rete che grazie alla loro potenza e alla memoria sonoin grado di analizzare grandi quantità di dati (large datasets) di creare modelli di sistemi complessi, di ricercareenormi database e di trovare soluzioni a grossi problemi(in ambiti di applicazione: modelli per i cambiamenticlimatici, allo studio dei social network, ecc)• Visualizzazione• Tecnologie che permettono di visualizzare i datiin modo da comprendere data set complessi econcetti astratti
  5. 5. • E-Science is about global collaboration in key areas ofscience,and the next generatiion of infrastructurethat will enable it• John Taylor- Director General Research Councils- Office ofScience and Technology (2000)• La scienza basata su sistemi di calcolo molto potenti eperformanti distribuiti in rete che grazie alla loro potenza e allamemoria sono in grado di analizzare grandi quantità di dati(large data sets)• L’infrastruttura che sostiene questi sistemi di calcolo è condivisatra scienziati delle varie discipline nel mondo, nessun scienziato,nessun gruppo, nessuna istituzione sarebbe in grado dimantenere/gestire una tale infrastruttura• Esempi di E-Science :• Large Hadron Collider (CERN);• European Grid infrastructure
  6. 6. • si intendono i dati raccolti, osservati, o creati per essereanalizzati e produrre i risultati originali di una ricerca• questi dati, che vengono generati per scopi diversi eattraverso procedure diverse sono divisi in categorie:• Dati risultati da osservazioni (dati catturati in tempo reale,nonriproducibili, per es. dati dei sensori, di indagini, immagineneurologiche ecc)• Dati sperimentali (dati di laboratorio, riproducibili ma costosi ,per es. le sequenze dei geni, ecc)• Dati generati da simulazioni (per es. modelli climatici, modellieconomici)• Dati derivati o compilati (dati riproducibili ma costosi, per es. itest e i dati estratti/text and data mining, modelli 3D• Dati di riferimento o dati di canone (statici e organici) per es. lebanche dati di sequenze di geni, le strutture chimiche, i portalicon dati spaziali MA NON SOLO
  7. 7.  I documenti in word o i fogli excel Appunti di laboratorio, diari Questionari, le trascrizioni, Le registrazioni audio e video Fotografie e i film Le risposte ai test Le presentazioni in ppt, artifatti, Collezioni di oggetti digitali acquisiti egenerati durante un processo di ricerca I file di programmi (data files)
  8. 8.  Database che contengono video, audio,testi, immagini Modelli, algoritmi, programmi sw File di log per l’analisi di sw, sw per lasimulazione, schemi Metodologie e flussi di lavoro Procedure operative standard e protocolli
  9. 9.  Database che contengono video, audio,testi, immagini Modelli, algoritmi, programmi sw File di log per l’analisi di sw, sw per lasimulazione, schemi Metodologie e flussi di lavoro Procedure operative standard e protocolli
  10. 10.  I dati raccolti durante la vita di unprogetto /Research Records i file elettronici di un progetto il bando del progetto I rapporti tecnici I rapporti sulla ricerca
  11. 11. Dati strutturati• Matrici di dati• Dati transazionaliGrafi• Web e Social network• Strutture molecolariDati Ordinati• Dati spaziali• Serie storiche• Sequenze• Sequenze geneticheDati non strutturati• Documenti testuali• Immagini• Audio e VideoCortesy: Roberta Turra – r.turra@cineca.it
  12. 12.  I dati quando vengono processati, organizzati,strutturati o presentati in un contesto che lirenda utili diventano informazione I metadati sono dati strutturati sui dati perrenderne possibile la consultazione, il discovery,il ri-uso, la conservazione a medio e lungotermine, ecc
  13. 13. • La selezione• La gestione• L ’integrità, la sicurezza• Descrizione/metadatazione• I formati• L’archiviazione/storage• L’accesso ai dati• La condivisione, il riuso,• La ridistribuzione• La conservazione a mediolungo termine/preservation• Problematiche connesse con laconservazione a lungo termine dei dati• Definizione del periodo della durata deidati• Migrazione dei dati nei formati più adatti• Migrazioni dei dati sui supporti più adatti• Creazione di metadati per laconservazione e documentazione• La conservazione dei dati
  14. 14.  Oggi si sta affermando sempre di più unanuova figura professionale in UK,negli USA, neipaesi del Nord Europa chiamata il liaisonlibrarian Si tratta di un bibliotecario che lavora astretto contatto con i ricercatori e i gruppi diricerca di un’università o di un ente di ricercae che svolge delle attività attinenti al lorolavoro e ai loro bisogni
  15. 15.  Fornire suggerimenti su fonti di finanziamento per i progetti Fornire un servizio di aggiornamento di notizie di interesse al ricercatoree/o gruppo di ricerca /literature reviews or current awareness alerts Fornire assistenza durante i processi di valutazione dei ricercatori/ su aspettibibliometrici, misura dell’impatto Consulenza sul diritto d’autore Addestramento nell’uso dei sw per la creazione di bibliografie (bibliographicsoftware per es. ReferenceWork, Zotero, Mendeley etc Promozione della disseminazione dei risultati della ricerca (pubblicazioni eanche i dati della ricerca) attraverso le strategie dell’Accesso Aperto: 1.auto-archiviazione degli articoli e dei dati della ricerca nell’archivioistituzionale o archivi disciplinari o archivi dati aperti 2. pubblicazione degliarticoli in riviste ad Accesso Aperto, deposito dei dati della ricerca in archividi dati aperti
  16. 16.  Aumentare la consapevolezza dei ricercatori sulle problematiche connesse allagestione dei dati della ricerca Assistere i ricercatori nella elaborazione del piano di gestione dei dati DataManagement Plan che oggi viene richiesto in diversi paesi dagli enti finanziatoridella ricerca Il piano deve documentare in modo articolato come i dati della ricerca saranno descritti, archiviati,condivisi, resi accessibili, ri-utilizzabili durante la durata del progetto e successivamente Consigliare la scelta dei formati da adottare Consigliare sugli aspetti relativi alla proprietà intellettuale, all’accesso aperto deidati, al riuso de dati Fornire supporto per la citazione dei dati e per l’uso di identificatori persistenti Fornire consulenza su aspetti etici e di privacy Fornire informazioni sugli aspetti relativi all’archiviazione/storage e alla sicurezzadei dati / back-up Offrire consulenza sugli aspetti relativi alla conservazione a lungo tempo Occuparsi della metadatazione dei dati in collaborazione con l’esperto/a didominio/data scientist Occuparsi della gestione del repository/catalogo dei dati o suggerire soluzioni incloud computing
  17. 17. Fonte: DDI Structural Reform Group. “DDI Version 3.0 Conceptual Model." DDI Alliance. 2004.
  18. 18. Fonte: Boston Universities Libraries – Research Data Management – Data Life Cycle
  19. 19. http://www.libereurope.eu/news/ten-recommendations-for-libraries-to-get-started-with-research-data-management1. Offrire assistenza nella gestionedei dati2. Contribuire allo sviluppo deimetadati e standard dei dati efornire servizi di metadatazione3. Creare le figure professionali deidata librarian4. Partecipare attivamente nellecreazione di policy sui dati dellaricerca delle istituzioni5. Collaborare con i ricercatori egruppi di ricerca per la creazione diinfrastruttrure interoperabili perl’accesso ai dati e alla condivisionedei dati6. Sostenere il ciclo di vita dei datifornendo servizi di archiviazione,discovery e accesso permanente7. Promuovere l’utilizzo di identificatoripersistenti per l’accessopermanente ai dati8. Fornire un catalogo dei dati9. Familiarità con la gestione di datinelle varie discipline10.Offrire o mediare l’archiviazionesicura in collaborazione con lestrutture IT o con servizi di cloud-computing2012
  20. 20. http://www.jisc.ac.uk/media/documents/programmes/digitalrepositories/dataskillscareersfinalreport.pdf
  21. 21. • Sono diverse le università al mondo che stanno organizzandoall’interno del sistema bibliotecario un servizio a supporto dellagestione dei dati della ricercaNe portiamo 3 esempiUniversità della California, San DiegoUniversità di MinnesotaUniversità di Cambridge, (UK)
  22. 22. http://libraries.ucsd.edu/services/data-curation/
  23. 23. https://www.lib.umn.edu/datamanagement
  24. 24. http://www.lib.cam.ac.uk/dataman/
  25. 25.  OpenAIRE e OpenAIRE plus un portale perl’accesso ai risultatie ai dati dellaricerca finanziatanel 7° ProgrammaQuadro questionari/follow uphttp://www.openaire.eu/it
  26. 26.  EUDAT: progetto collaborativo europeo perun’infrastruttura comune per i dati evitare unnuovodigital divide:l’Europa deveprocedere allostesso passohttp://www.eudat.eu/
  27. 27. smartData: progettofinanziato dal CINECA pergestire le nuoveproblematiche “BigData” edHPC fornendo, accantoallinfrastruttura per laproduzione, larchiviazione e la fruizione deidati, un servizio di analisi avanzata sui datiprodotti dagli utenti che ne favorisce il riusoanche da parte di altre comunitàscientifiche
  28. 28. MAPPA - MetodologiaApplicate alla Predittivitàdel PotenzialeArcheologico•Il primo open digitalarchaeological archiveitaliano, che rendeaccessibili tutti i datipubblici delle indaginiarcheologiche•Uso di sistemi eprocedure standardizzateper la redazione e lagestione dei datiarcheologicihttp://mappaproject.arch.unipi.it/
  29. 29.  DATACite, progettocollaborativo per ladescrizione standarddei datasets e la lorocitabilità via DOI Per l’Italia: CRUI altri riferimentitecnici: CODATA, http://www.codata.org/ Open Data Commons,http://opendatacommons.org/http://www.datacite.org/
  30. 30. http://www.datacite.org/repolist
  31. 31. http://wiki.openarchives.it/index.php/Bibliografia_e_sitografia_sugli_open_research_data
  32. 32. Per approfondimenti sui temi della Digital Curation in italianoLaura Testoni . Digital curation e content curation: due risposte alla complessitàdellinfosfera digitale che ci circonda, due sfide per i bibliotecari, Bibliotime,,v. 16numero 1 (Marzo 2013)http://www.aib.it/aib/sezioni/emr/bibtime/num-xvi-1/testoni.htm

×