Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Gestion de Datos de Investigacion

596 views

Published on

Gestion de Datos de Investigacion, Fernando López, CAICYT-CONICET (Argentina) - presented at the 4th LEARN RDM Workshop in Santiago, Chile: http://learn-rdm.eu/

Published in: Education
  • Be the first to comment

  • Be the first to like this

Gestion de Datos de Investigacion

  1. 1. Implementación de políticas y estrategias en América Latina y el Caribe IV Taller LEARN de Gestión de Datos de Investigación Santiago, Chile, 27 Fernando Ariel López (CAICYT - CONICET) flopez@caicyt.gov.ar | @fernando__lopez Gestión de Datos de Investigación, una propuesta ARGENTINA
  2. 2. Fernando Ariel López (CAICYT - CONICET, Argentina) •  Coordinador Comunicación y Formación / CAICYT- CONICET •  Director de Biblioteca / UMET •  Co-Fundador y Director / Aprender 3C •  Integra el proyecto de investigación sobre Acceso Abierto / IIGG-UBA •  Docente / UNAL-PO (Paraguay) y IFTS N°13 (GCBA) •  Autor y Coordinador Comunicaciones / InfoTecarios •  Evaluador en diversas revistas científicas y congresos profesionales. Expositor, Consultor y Formador en Acceso Abierto al conocimiento científico (Repositorios y Revistas Digitales), Ciencia Abierta (Datos científicos y Plan de Gestión de Datos), Ciencia 2.0, Web social, Tecnologías de Información y Comunicación, Alfabetización Informacional, Alfabetizador Digital, etc. Más información en about.me/fernandoariellopez
  3. 3. BIG DATA: Redes Sociales, IOT, Smart City, Sensores, Wereables, …
  4. 4. CIENCIA à Ciencia Abierta GOBIERNO à Gobierno Abierto SOCIEDAD à Periodismo de Datos, Hackativismo Cívico, Innovación abierta, etc.
  5. 5. LEGISLACIÓN •  RESOLUCIÓN 538 de JFG (junio 2013) Sistema Nacional de Datos Públicos •  LEY 26.899 (diciembre 2013) Creación de Repositorios Digitales Institucionales de Acceso Abierto, Propios o Compartidos •  DECRETO 117 (enero 2016) Plan de Apertura de Datos •  Ley Acceso a la Información Pública (2016) Acceso a la Información Pública
  6. 6. → hechos, observaciones o experiencias (basado argumento, teoría o prueba) → pueden ser numéricos, descriptivos o visuales. → pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales. → pueden ser abiertos o cerrados ¿Qué son los datos de investigación?¿Qué son los datos de investigación?
  7. 7. ●  Es una colección de datos reunidos durante la ejecución de un proyecto de investigación. ●  Son objetos digitales compuestos y heterogéneos. ●  Constituye la base de la investigación y va asociado a una publicación científica (resultado de la investigación). ●  Se almacena y gestiona en Repositorios Interoperables conforme a estándares internacionales. Es el objeto específico de control, organización, descripción y preservación de datos científicos DATASET
  8. 8. CIENCIA Líneas de Trabajo: 1.  POLÍTICA DE DATOS CIENTÍFICOS 2.  CICLO DE VIDA DE LOS DATOS CIENTÍFICOS 3.  PLAN DE GESTIÓN DE DATOS CIENTÍFICOS 4.  E-INFRAESTRUCTURAS 5.  ROLES, COMPETENCIAS y FORMACIÓN
  9. 9. 1.  Diseño y planificación de la creación/extracción de datos 2.  Creación/Extracción de Datos 3.  Limpieza, Normalización y Descripción de Datos 4.  Almacenamiento y Preservación de Datos 5.  Exploración, Explotación y Visualización de Datos 6.  DataMining & Knowledge Discovery CICLO DE VIDA DE LOS DATOS CIENTÍFICOS
  10. 10. Ciclo de los datos de investigación Fuente: infografía REBIUN - CRUE
  11. 11. ¿Qué es un PGD? Un plan de gestión de datos científicos (Data Management Plan - DMP) es un documento elaborado por el investigador o grupo de investigación donde se define: •  Qué datos van a ser creados y cómo, •  Cómo se van a describir, organizar, almacenar y gestionar los datos •  De qué forma van a ser compartidos, explicando cualquier restricción de uso que pueda ser aplicada. •  Quién o quiénes serán los responsables de realizar cada una de estas actividades. •  de qué forma van a ser compartidos, explicando cualquier restricción de uso que pueda ser aplicada.
  12. 12. DMP Argentina (CAICYT-CONICET) Propuesta para Proyecto de Investigación: •  Bloque de Datos administrativos •  Bloque de Recolección de datos •  Bloque de Documentación y metadatos •  Bloque de Almacenamiento y copias de seguridad •  Bloque de Selección y preservación •  Bloque de Re-uso de Datos
  13. 13. JULIO 2016 LANZAMIENTO DE UN PILOTO PGD CONICET 42 PROYECTOS UE INVITADOS 20 PROYECTOS UE VOLUNTARIOS OBJETIVO Evaluar el contenido del PGD Conocer el tratamiento de los datos Relevar el interés y las necesidades de los investigadores, agencias de investigación y financiadores ALGUNOS RESULTADOS… ENCUESTA DEL PILOTO – PGD CONICET
  14. 14. TIPOS DE DATOS USO DE ESTANDARES ENCUESTA DEL PILOTO – PGD CONICET
  15. 15. VOLUMEN ENCUESTA DEL PILOTO – PGD CONICET
  16. 16. DONDE PONDRÁ ACCESIBLE SUS DATOS ENCUESTA DEL PILOTO – PGD CONICET
  17. 17. 50% REQUIEREN SOPORTE O CAPACITACIÓN 75% CONSIDERA APROPIADA LA ORGANIZACIÓN del CONTENIDO 60% ASUMEN COMO NECESIDAD LA GESTION de un PGD 50% REQUIERE MÁS INFORMACIÓN ACERCA del USO DE ESTÁNDARES Y ESQUEMAS DE METADATOS ENCUESTA DEL PILOTO – PGD CONICET
  18. 18. e-INFRAESTRUCTURAS Repositorio Interoperable de Datos •  Datos Públicos Argentina (CKAN, OKF), •  Zenodo (Invenio, CERN) •  DRYAD, PLICSS, LAGOS (DSpace, MIT & HP), •  Harvard DATAVERSE (Eprints) Plataforma de Trabajo para Investigadores •  OSF, HubZero, MyExperiment.org, etc. Cluster de Almacenamiento y/o Procesamiento
  19. 19. NUEVOS PERFILES
  20. 20. La profesión del futuro. Es el encargado en extraer el conocimiento de los datos. Para ello deber tener sólidos conocimientos estadísticos, poseer destrezas para resolver problemas, hacer preguntas y explicar los resultados obtenidos. Data Scientist / Científicos de Datos
  21. 21. Bibliotecari@ de Datos / Data Librarian Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos. El perfil del bibliotecario de datos requiere: •  Competencias informáticas •  Conocimiento de la disciplina (corpus, prácticas de investigación y flujos de trabajo) •  Gestión de datos: q  adquisición (desarrollo de la colección), q  organización (catalogación y metadatos), q  preservación y conservación a largo plazo q  implementación de servicios adecuados para los usuarios.
  22. 22. NUEVAS COMPETENCIAS
  23. 23. COMPETENCIAS •  Estadística, Algebra y Programación •  Tecnologías y Formatos Abiertos •  XML, PYTHON, R, etc. •  Herramientas de normalización, procesamiento y visualización. •  Comunicación (visual y audiovisual) •  Diseño Centrado en el Usuario (UX)
  24. 24. OPORTUNIDADES Comunidad Científica: •  Acordar estándares de trabajo, normalización y gestión de datos •  Empoderar en Gestión de Datos Científicos •  Contribuir al avance de la ciencia, maximizando la visibilidad y el impacto de la inversión en Investigación •  Financiamiento y Desarrollo de e-infraestructuras para el aprovechamiento de la Big Data Científica •  Encuentro con otras comunidades de Gobierno Abierto, Periodismo de Datos, HackActivismo Cívico, IoT, etc.
  25. 25. MUCHAS GRACIAS Fernando Ariel López (CAICYT - CONICET) flopez@caicyt.gov.ar | @fernando__lopez

×