Se pone el acento en los "Planes de Gestión de Datos" de investigación como herramienta clave para organizar mejor ésta y de cara a conseguir proyectos por parte de los investigadores, sobre todo en el ámbito universitario. Por otro lado, las universidades, al igual que otros organismos, deben propiciar el acceso a los datos de investigación en el contexto de la "Universidad abierta" como medio para favorecer el desarrollo científico-social en general.
1. INVESTIGADORES E PROXECTOS DE
INVESTIGACIÓN
A importancia do “Plan de Xestión de Datos” na
investigación e para a consecución de proxectos
1
2. OS DATOS DE INVESTIGACIÓN
Son aqueles materiais xerados ou recopilados ao longo dunha
investigación. Poden ser descriptivos, numéricos ou visuais –
preséntanse en múltiples soportes – e sirven para validar os
resultados publicados da investigación, polo que teñen gran
importancia.
Distinguimos tres tipos:
Observacionais (por exemplo, datos climáticos, barómetros
sociolóxicos e tamén datos utilizados na investigación xurídica ou
noutro ámbito de estudo).
Experimentais (fruto de experimentos).
Computacionais (datos de simulacións).
Sempre que sexa posible débese favorecer o seu acceso. Para
elo, o “plan de xestión de datos” describirá o tratamento que
recibirán os datos de investigación dende que se recollen ou
xeran até que se difunden e preservan para a súa reutilización,
garantindo así dito acceso.
2
3. OS PORQUÉS DO “PLAN DE XESTIÓN DE DATOS” (I)
O están a solicitar os axentes financiadores ligado
ás condicións de financiamento dos proxectos de
investigación.
A Unión Europea, no Programa “Horizonte 2020”¹,
esixe a súa realización na iniciativa “Piloto de
Datos de Investigación en Aberto” (2014/15), e está
a recomendar estes plans no resto de programas a
financiar no futuro.
¹ http://www.eshorizonte2020.es/ (portal español do Programa)
3
4. OS PORQUÉS DO “PLAN DE XESTIÓN DE DATOS” (II)
Fai posible ou cataliza os principios recollidos na
“Declaración sobre Acceso aos Datos de
Investigación con Fondos Públicos”, asinada por
España e outros 33 países no ano 2004.
Axuda a organizar a investigación: detalla que datos
xerará o proxecto, como serán explotados, se serán
accesibles para a súa verificación e reutilización e
como serán conservados e preservados.
4
5. OS PORQUÉS DO “PLAN DE XESTIÓN DE DATOS” (III)
Unha xestión de datos adecuada é clave para o éxito
do proxecto de investigación²:
Permite encontrar e comprender os datos cando se precise
utilizalos.
Garantiza a continuidade do proxecto á marxe dos
investigadores.
Evita duplicacións e tarefas innecesarias.
Posibilita a validación dos resultados, grazas ao
mantenemento dos datos.
Favorece que os datos podan ser compartidos, aumentando
a colaboración e o avance na investigación.
Aumenta a visibilidade dos datos, agora ofrecidos en aberto.
Axuda a prestixiar a investigación, xa que outros
investigadores que utilicen os datos agora poden citalos.
² http://www.consorciomadrono.es/pagoda/faq.php#p-16
5
6. O “PLAN DE XESTIÓN DE DATOS” (I)
O “Data Management Plan” (DMP), na súa versión
anglosaxona, é o documento que describe o
tratamento que recibirán os datos de investigación
recopilados ou xerados no curso do proxecto de
investigación. Forma parte do “Research Data
Management” (RDM), ou “Xestión de Datos de
Investigación” global. Debe conter:
O tipo de datos que se recollerán ou xerarán.
A metodoloxía ou normas a empregar.
A política a seguir de cara a compartir e/ou poñer en
aberto os datos.
Como se conservarán e preservarán estes datos. 6
7. O “PLAN DE XESTIÓN DE DATOS” (II)
A UE aprobou no 2013 unhas “Directrices para a
Xestión de Datos no Horizonte 2020” que indican
como cumprir cós requisitos esixidos en canto a
calidade, intercambio e seguridade dos datos de
investigación.
“PGDonline”, elaborado polo “Digital Curation Centre”
(UK) e adaptado polo Consorcio Madroño
(Bibliotecas Universitarias da C. A. de Madrid), é
unha boa ferramenta en liña de axuda na creación de
plans de xestión de datos. 7
8. RECOMENDACIÓNS TÉCNICAS:
FORMATOS DE FICHEIROS E METADATOS (I)
Débense utilizar, sempre que sexa posible, formatos
“abertos” non propietarios porque garantizan a
continuidade no tempo, por exemplo: PDF/A en vez de
Microsoft Word, CSV por Excel, TIFF por Photoshop, ou
XML (JSON coma alternativa máis simple) en lugar dunha
base de datos.
O formato elexido, que constituirá o “dataset” ou conxunto
de datos informatizado:
Ten que posibilitar a indización, ou selección de termos que
describen os datos, para así poder ser recuperado no futuro.
É preferible que se poida comprimir, porque ocupará menos
espazo de almacenamento.
Debe ser estándar segundo “IANA Media Types” ou estándar de
facto para a comunidade investigadora.
8
9. RECOMENDACIÓNS TÉCNICAS:
FORMATOS DE FICHEIROS E METADATOS (II)
Os metadatos son o conxunto de información estruturada
que debe reflexar a orixe, propósito, referencia temporal e
espacial, creador e condicións de acceso e uso dun
conxunto de datos. Son datos que describen outros datos
(ou o conxunto de características que todo grupo de datos
leva asociado).
A súa calidade é clave para a localización, acceso,
comprensión e reutilización dos datos de investigación.
Existen estándares de metadatos³, coma “DCMI” ou
“DCAT”.
³ Estes estándares adáptanse ás distintas disciplinas científicas:
http://www.dcc.ac.uk/resources/metadata-standards
9
10. RECOMENDACIÓNS TÉCNICAS:
FORMATOS DE FICHEIROS E METADATOS (III)
O conxunto de datos debe asociarse a un identificador
dixital, ou “DOI” (“Digital Object Identifier”), que será
único e persistente, garantindo a verificación, uso,
impacto e acceso aos datos no futuro.
“DataCite” é o servizo internacional que asigna estes
identificadores e arquiva os seus correspondentes
metadatos nunha base de datos pública.
Nestes aspectos técnicos, o asesoramento e a
colaboración prestada polas universidades aos
investigadores deberase ofrecer dende os servizos
informáticos xerais ou de apoio á investigación (no
relacionado sobre todo con formatos e ficheiros) e dende
os servizos bibliotecarios (en relación cós metadatos, por
exemplo).
10
11. OS “PLANS DE XESTIÓN DE DATOS” NAS
UNIVERSIDADES
Pola súa novidade, todavía son poucas as universidades españolas que
contan con servizos de apoio neste campo ou con portais adicados ao
acceso aberto aos datos4.
A realización dos plans de xestión de datos será case obrigatoria para
optar a moitos proxectos de investigación no futuro e as universidades
débense preparar para dar o soporte necesario ao persoal investigador.
No desenrolo destes plans e na política universitaria de datos de
investigación en aberto en xeral, debe involucrarse como mínimo a
Vicerreitoría responsable e os servizos informáticos e bibliotecarios,
ademais dos Departamentos que opten a proxectos. A xestión dos
datos de investigación, seguindo as premisas vistas, deberiase incluir
na planificación estratéxica da universidade.
Modelos internacionais a considerar son os proporcionados, entre
outros, pola University of Southampton (UK) e a Monash University
(Australia).
4 Un bó exemplo é o da Universidade Pablo de Olavide (Sevilla), pioneira en España:
https://datos.upo.gob.es/
11
12. REUTILIZAR OS DATOS E PRESERVALOS (I)
O aproveitamento futuro dos datos de investigación e a
súa preservación deben ser obxectivos primordiais da súa
xestión.
Os “repositorios” son os lugares adecuados para
preservar os datos da investigación. Son depósitos ou
arquivos centralizados onde se almacena e organiza
información dixital, permitindo o seu acceso aberto.
Aínda que a maioría dos repositorios dixitais admiten
arquivo de datos é preferible utilizar repositorios
específicos de datos, que permiten compartir e citar
mellor os datos empregados na investigación.
12
13. REUTILIZAR OS DATOS E PRESERVALOS (II)
Os repositorios ou arquivos de datos deben garantir con
respecto aos datos:
A estabilidade ou seguridade dos datos no futuro.
A facilidade de recuperación.
O acceso doutros investigadores especializados nese
campo, có que se posibilita a reutilización dos datos e a
creación de novo coñecemento.
“Zenodo” é un repositorio público paneuropeo de datos de
investigación de temática xeral de referencia. Existen moitos
outros repositorios tanto privados (“Figshare”) coma
especializados (“GitHub” ou “Dryad”). O investigador pode optar
por arquivar os datos simultáneamente en varios repositorios
(por exemplo, no repositorio institucional da súa universidade5
e noutro coma Zenodo).
5 O repositorio da Universidade da Coruña é o “RUC”: http://ruc.udc.es/
13
14. PARA SABER MÁIS…
http://www.crue.org/TIC/Documents/Haciaunauniversidadabierta.pdf
Documento “vivo” da CRUE-TIC (2012-) onde se establecen as recomendacións
para o sistema universitario español con respecto á política de datos abertos.
http://datos.fundacionctic.org/contacto/
Portal “Open Data” da Fundación CTIC.
http://www.consorciomadrono.es/pagoda/
Portal do plan de xestión de datos das bibliotecas do Consorcio Madroño. Conta
cunhas “FAQs” moi completas.
http://www.oecd.org/sti/sci-tech/38500813.pdf
Principios e directrices da OCDE sobre o acceso aos datos de investigación con
fondos públicos (2007).
http://www.data-archive.ac.uk/create-manage/life-cycle
Portal do “UK Data Archive” (Essex University) onde se describe o ciclo dos datos
de investigación e moitos aspectos relacionados coa xestión de datos.
14