Identificar i gestionar les dades de recerca
Mireia Alcalá
Jornada CCUC 2022: projectes i serveis bibliotecaris cooperatius
15 de novembre de 2022
Sumari
✓ 1. La Ciència Oberta i l’Àrea del CSUC
✓ 2. Les dades de recerca i la seva gestió
• Què són?
• Qui ho promou?
• Perquè són important?
✓ 3. Els instruments que ofereix el CSUC
• CORA.eiNa DMP
• CORA.Repositori de Dades de Recerca
1. Què és la ciència oberta?
Disponibilitat en accés obert
de publicacions i dades
Transferència del
coneixement científic a la
societat
Obertura del procés de recerca, reforçant
la recerca i innovació responsable
✓ Nou enfocament del procés de recerca basat en el treball cooperatiu i les noves formes de
difondre el coneixement utilitzant les tecnologies digitals i les noves eines de col·laboració. Els
resultats de la recerca han de ser accessibles a la societat de manera lliure i gratuïta, per tal
d'aconseguir estendre els principis d'obertura a tot el cicle de vida de recerca i fomentar que es
contribueixi a la difusió i reutilització d'aquests.
1. Què és la ciència oberta?
Disponibilitat en accés obert
de publicacions i dades
Transferència del
coneixement científic a la
societat
Obertura del procés de recerca, reforçant
la recerca i innovació responsable
✓ Nou enfocament del procés de recerca basat en el treball cooperatiu i les noves formes de
difondre el coneixement utilitzant les tecnologies digitals i les noves eines de col·laboració. Els
resultats de la recerca han de ser accessibles a la societat de manera lliure i gratuïta, per tal
d'aconseguir estendre els principis d'obertura a tot el cicle de vida de recerca i fomentar que es
contribueixi a la difusió i reutilització d'aquests.
1. L’Àrea de Ciència Oberta del CSUC
Impuls
ciència
oberta Accés
obert
Repositoris
Portal de la Recerca de
Catalunya
1. L’Àrea de Ciència Oberta del CSUC
Impuls
ciència
oberta Accés
obert
Gestió de dades de recerca
Repositoris
Portal de la Recerca de
Catalunya
1. L’Àrea de Ciència Oberta del CSUC
Impuls
ciència
oberta Accés
obert
Gestió de dades de recerca
Repositoris
Portal de la Recerca de
Catalunya
Sumari
✓ 1. La Ciència Oberta i l’Àrea del CSUC
✓ 2. Les dades de recerca i la seva gestió
• Què són?
• Perquè és important?
✓ 3. Els instruments que ofereix el CSUC
• CORA.eiNa DMP
• CORA.Repositori de Dades de Recerca
2. Què tenen en comú? Recull del percentatge d’abstenció en diferents països europeus
Fotografies d’una excavació
2. Què tenen en comú? Recull del percentatge d’abstenció en diferents països europeus
Fotografies d’una excavació
Guions d’entrevistes
2. Què tenen en comú? Recull del percentatge d’abstenció en diferents països europeus
Fotografies d’una excavació
Làmines d’una intervenció arqueològica
Guions d’entrevistes
2. Què tenen en comú? Recull del percentatge d’abstenció en diferents països europeus
Fotografies d’una excavació
Làmines d’una intervenció arqueològica
Guions d’entrevistes
Mostres de pacients amb càncer de colon
2. Què tenen en comú? Recull del percentatge d’abstenció en diferents països europeus
Fotografies d’una excavació
Làmines d’una intervenció arqueològica
Guions d’entrevistes
Mostres de pacients amb càncer de colon
2. Fins avui (i per anar entrant en matèria)
✓ Tothom reconeix l’autoria a qualsevol publicació clàssica (article, monografia,
tesi...)
• El recercaire, però, ha hagut d’utilitzar/generar dades per arribar al output final
✓ Per tant... Què entenem per dades?
• DADA: ‘qualsevol informació que ha estat recollida, observada,
generada o creada per validar un procés de recerca’
• DADES DE RECERCA EN OBERT: ‘són en línia, sense cost d’ús,
accessibles i que es poden reutilitzar i distribuir sempre que se’n citi la
font de les dades’
• DATASET: ‘conjunt de fitxers (dades, codi, documentació) i metadades
descriptives associades’
(FOSTER)
(FOSTER)
2. Qui ho impulsa?
✓ A nivell europeu: Horizon Europe (i els seus antecessors)
✓ A nivell estatal: Ley de la Ciencia
✓ A nivell català: Estratègia catalana / Llei de la ciència
2. I què es demana?
✓ Generalment, es demana:
• Fer un pla de gestió de dades (data Management plan, DMP) i actualitzar-lo periòdicament
• Dipositar les dades en un repositori de confiança el màxim d’obertes possibles (seguint el principi: “as
open as possible as closed as necessary”)
– Cal incloure documentació per tal de reutilitzar/validar aquelles dades
2. I perquè es demana?
✓ Pel benestar futur
• Cal un canvi de model econòmic
• De societat industrial a una societat basada en el coneixement
✓ Per donar resposta als grans reptes socials del nostre temps
• Més informació, implicació i participació ciutadanes
• Per transparència i control (accountability): utilitat, fiabilitat i replicabilitat de la recerca
✓ Perquè el coneixement científic és un bé públic
• El que és finançat públicament (de forma majoritària) ha de ser públic
✓ Perquè cal deixar treballar les màquines
• Big data
• TDM
• Interoperabilitat
Sumari
✓ 1. La Ciència Oberta i l’Àrea del CSUC
✓ 2. Les dades de recerca i la seva gestió
• Què són?
• Perquè són importants?
✓ 3. Els instruments que ofereix el CSUC
• CORA.eiNa DMP
• CORA.Repositori de Dades de Recerca
Definició
• CORA.eiNa
DMP
Anàlisi i
gestió
• Recursos propis
de la institució
• Servei ofert pel
CSUC
Publicació
• CORA.RDR
• Repositoris
temàtics
Catàleg de
dades
• CORA.Portal de
la Recerca de
Catalunya
3. Els instruments que ofereix el CSUC
Preservació a
llarg termini
Definició
• CORA.eiNa
DMP
Anàlisi i
gestió
• Recursos propis
de la institució
• Servei ofert pel
CSUC
Publicació
• CORA.RDR
• Repositoris
temàtics
Catàleg de
dades
• CORA.Portal de
la Recerca de
Catalunya
3. Els instruments que ofereix el CSUC
Preservació a
llarg termini
Eina en línia gratuïta que permet:
• Crear: respon preguntes i aconsegueix
un DMP FAIR
• Compartir: col·labora amb d’altres
investigadors atorgant-los permisos de
lectura, edició o co-autoria
• Revisar: entre els investigadors del
projecte o la persona responsable a la
institució
• Exportar: converteix el teu document a
DOC, PDF, XML…
3. Què és CORA.eiNa DMP?
Complir amb els requisits institucionals i altres organismes de finançament,
de manera fàcil i a través de plantilles
3. CORA.eiNa DMP - Plantilles disponibles
✓ Les plantilles que actualment hi ha són:
• Horizon Europe (European Commission)
• Horizon 2020 (European Commission)
• European Research Council (European Commission)
• Plan Estatal (Agencia Estatal de Investigación)
• Software Management Plan
• Doctorand
Que recullen els requisits de les agències de finançament i:
– Segueixen els principis FAIR
– Inclouen ajudes, recomanacions i exemples seleccionats de DMPs reals
per a cada apartat
✓ Aquestes plantilles es van ampliant segons les necessitats de les institucions!
✓ Repositori federat per a dades de recerca (datasets)
✓ Multidisciplinar
✓ En obert
✓ Per a PDI i doctorands
✓ Tan obert com sigui possible però tan tancat com sigui
necessari
✓ 10GB per fitxer i 100GB màxim per dataset
✓ Sense límit de datasets
Permet la publicació de conjunts de dades
de recerca en mode FAIR i seguint les directrius de l’EOSC
3. Què és CORA.RDR?
3. CORA.RDR - Què ofereix CORA.RDR?
✓ Compliment dels
requisits de les
agències de
finançament
✓ Augment de la
visibilitat
✓ Gran capacitat
✓ Gestió de dades i
control d’accés
✓ Preservació a llarg
termini de les dades
✓ Llicències
✓ Transformació dels
formats de fitxers
✓ Curació de les dades
3. CORA.RDR - Com s’organitza CORA.RDR?
Instància (o comunitat)
Subinstància
(o subcomunitat)
Dataset
3. CORA.RDR – Com compleix el FAIR?
Citació de les dades amb
identificador persistent (DOI)
Accés als fitxers
Oberts Tancats
Metadades
Condicions d’ús i llicències Versioning
F
A
I
R R