CIAT Workshop: Data Management Community of Practice
CIAT Workshop: Data Management Community
of Practice
www.ciat.cgiar.orgSince 1967 / Science to cultivate change
July 9th 2015 – CIAT HQ, Cali
Leroy Mwanzia
Data & Information Manager
Data Management COP Context
Do you believe CIATs work is important in tackling global
challenges such as hunger and poverty?
¿Cree usted que el trabajo del CIAT es importante para
enfrentar retos globales como el hambre y la pobreza?
Do you believe quality data contributes to the quality of CIAT
research?
¿Cree usted que los datos de buena calidad contribuyen a la
calidad de la investigación del CIAT?
Do you believe good data management contributes to the
quality of data?
¿Cree usted que una buena gestión de los datos contribuye a
la calidad de los datos?
Do you believe data has significant value outside the original
purpose it was collected for?
¿Cree que los datos tienen un valor significativo por fuera
del propósito original por el que fueron recopilados?
Do you believe open data accelerate the impact of CIATs
work?
¿Cree usted que el acceso abierto a los datos acelera el
impacto del trabajo del CIAT?
CIAT Mission / Misión del CIAT
“To reduce hunger and poverty and improve human
nutrition in the tropics through research aimed at
increasing eco-efficiency of agriculture.”
“Reducir el hambre y la pobreza y mejorar la
nutrición humana en los trópicos mediante una
investigación que busca aumentar la eco-eficiencia
en la agricultura”.
Global Demand for Open Research Results
Demanda global de acceso a los resultados de la investigación
Funders of Research want Open Research Outputs
Los donantes desean acceso abierto a los resultados de la
investigación
Funders of Research want Open Research Outputs
Los donantes desean acceso abierto a los resultados de la
investigación
Funders of Research want Open Research Outputs
Los donantes desean acceso abierto a los resultados de la
investigación
1. Public funded research
outputs are a international
public goods
2. Should be preserved and
made available
CGIAR Open Access and Data Management Policy
Política de Acceso Abierto y Gestión de Datos de CGIAR
• CGIAR regards its intellectual assets as International Public
Goods (IPG) – CGIAR considera sus activos intelectuales
como Bienes Públicos Internacionales (BPI)
• Maximize the global accessibility and ensure broadest
possible impact of IPGs – Maximimar la accesibilidad
mundial para asegurar el mayor impacto possible de los BPI
CGIAR Open Access and Data Management Policy
Política de Acceso Abierto y Gestión de Datos de CGIAR
• CGIAR Intellectual assets policy actually is applied to data and other research
outputs – La política de activos intelectuales de CGIAR se aplica a datos y
otros resultados de investigación
• Open Access – Publications, policies, images, videos, toolkits….. (all
information products) – Acceso Abierto – Publicaciones, políticas, imágenes,
videos, kits de herramientas… (todos los productos de información)
• Open Data – Databases, datasets, linked open data – Datos abiertos – Bases
de datos, conjuntos de datos, datos abiertos relacionados
CGIAR OA Policy Milestones
Hitos en la Política de Acceso Abierto de CGIAR
Policy
Funding
Flexible Guidelines
Center/CRP
Implementation
Plans
Center/CRP
Implementation
CG-level metadata
harvesters/
open.cgiar.org
Partner
engagement
Documentation,
Monitoring &
Evaluation
Done. Approved by Consortium
Board and all 15 Centers
In progress. $5M in W1
already from BMGF. FO
reviewing latest version.
In progress. V3
ready for review by
March
Devare, Medha. 'Moving CGIAR Towards Open Access'. 2014. Presentation.
Importance / Importancia
Information Entropy (Michener, William K., et al. "Nongeospatial metadata for the ecological sciences." Ecological Applications 7.1 (1997): 330-342.)
Importance / Importancia
Piwowar, Heather A., Roger S. Day, and Douglas B. Fridsma. "Sharing detailed research data is associated with increased citation rate." PloS one 2.3 (2007): e308.
http://dx.doi.org/10.1371/journal.pone.0000308
Importance / Importancia
• Increases visibility of scientific research / Aumenta la
visibilidad de la investigación científica
• Increases research efficiency / Aumenta la eficiencia de
la investigación
• Ensures re-use of value, uniqueness and importance of
data / Asegura la reutilización, singularidad e
importancia de los datos
• Facilitates science – discoverable and promotes
scientific enquiry and replication / Facilita la ciencia –
descubrible y promueve la consulta científica y la
replicación
Importance / Importancia
• Prevents duplication / Evita la duplicación
• Protects public investment in research and
development / Protege la inversion pública en la
investigación y el desarrollo
• Good management ensures research data is accurate,
complete and reliable / Una buena gestión asegura que
los datos de investigación sean precisos, completos y
confiables
This can only happen with proper research data
management throughout the research life cycle
Esto solo puede suceder con una gestión apropiada de los
datos de investigación durante todo el ciclo de vida de la
investigación
Research Data Management Tenemos
estándares?
Data Acquisition
Shared Workspace and
document collaboration
Data Storage For direct use & data
backup
shorter term Longer term
Metadata and
Documentation
dc.title
dc.description
dc.author
dc.Producer
Analysis
Structured data is always better than unstructured
Tener los datos estructurados siempre es mejor que no
tenerlos estructurados
Archiving and Sharing
Archivar y Compartir
Data
Publishing
Data collections
shared through
online access
service
Archiving
Long term
access and
retention of
data
Storage
For direct use &
data backup
Archiving and Sharing
Data
Publishing
Data collections
shared through
online access
service
Archiving
Long term
access and
retention of
data
Storage
For direct use &
data backup
Need to preserve primary data, you can always aggregate up
but cannot disaggregate down
Se deben preservar los datos primarios. Siempre se pueden
agregar, pero no se pueden desagregar
Prioritize data (in open formats) more than platform or tool.
Technology changes quickly
Priorizar los datos (en formatos abiertos) más que una
plataforma o herramienta
La tecnología cambia rápidamente
Data should be Findable
Data should be Accessible
Data should be Interoperable
Data should be Re-usable.
Disponible
Accessible
Interoperable
Reutilizable
FAIRness of Data
CRP 2.0 Call
Our Role Vs Research
Nuestro rol vs. la investigación
Big data y TICs: Una serie de organizaciones científicas han desarrollado instalaciones
computarizadas de alto desempeño y capacidades analíticas de datos complejos. Existe una
oportunidad importante para que CGIAR potencialice esta inversión en capacidades e
infraestructura para avanzar en la misión de bienes públicos globales de CGIAR.
Data in Research:
Use of big data and high performance computing to answer global
questions.
Datos en la investigación:
Uso de datos complejos y computación de alto desempeño para responder a
interrogantes mundiales.
Our Role Vs Research
Research Data Management:
• Acquiring, caring for, adding value, facilitating access and
preserving research data throughout life cycle.
• Policies, standards, long term preservation, open access
Gestión de Datos de Investigación:
• Adquirir, cuidar, agregar valor, facilitar acceso y preservar los
datos de investigación a lo largo del ciclo de vida
• Políticas, estándares, preservación de largo plazo, acceso abierto