Successfully reported this slideshow.

Repositorio Datos Ambientales Guayana2008

1,451 views

Published on

Repositorio de datos ambientales

Published in: Technology, Travel
  • Be the first to comment

Repositorio Datos Ambientales Guayana2008

  1. 1. Repositorios de Datos Ambientales en la Web <ul><ul><li>1 er Taller Sensibilización en el uso de redes avanzadas en Venezuela Universidad Nacional Experimental de Guayana Ciudad Guayana Junio 2008 </li></ul></ul>Rodrigo Torréns Zulay Mendez Universidad de Los Andes, Centro de Cálculo Científico, Parque Tecnológico de Mérida
  2. 2. Contenido <ul><li>El problema de la ubicación, preservación y uso de colecciones de datos científicas (en Venezuela y el mundo) </li></ul><ul><li>Tendencias en la colaboración científica </li></ul><ul><li>Herramientas que pueden ayudar a solucionar algunos de los problemas </li></ul><ul><li>Ejemplos de redes de colaboración en el mundo </li></ul><ul><li>Red de Estaciones Bio-climáticas de Mérida y ECORED Venezuela </li></ul>Hablaremos sobre:
  3. 3. Los datos producto de una investigación científica <ul><li>Partamos de las preguntas básicas: </li></ul><ul><li>Los datos que yo necesito… existen? </li></ul><ul><li>Donde están? </li></ul><ul><li>Como los obtengo? </li></ul><ul><li>La mayoria de los científicos se han planteado estas preguntas alguna vez </li></ul>
  4. 4. Problemas-retos a los que nos enfrentamos <ul><li>Tenemos que tener capacidades para… </li></ul><ul><li>Manejar volumen de datos generados actualmente </li></ul><ul><li>Preservarlos </li></ul><ul><li>Encontrarlos </li></ul><ul><li>Compartirlos, distribuirlos </li></ul><ul><li>Usarlos, reusarlos </li></ul>
  5. 5. … Problemas a los que nos enfrentamos Ejemplo de degradación normal de los contenidos de información asociados con datos y metadatos a través del tiempo (Michener, 1997) Momento de publicación Detalles específicos acerca de la recolección de los datos se pierden al pasar el tiempo Retiro o cambio de carrera del científico recolector Accidente puede destruir datos y documentación Muerte del investigador y subsecuente perdida de registros restantes Contenidos de Información Tiempo
  6. 6. Nuevas formas de colaboración científica <ul><li>Ante estos retos, tenemos posibilidades y nuevas maneras de… </li></ul><ul><li>producir datos </li></ul><ul><li>de compartirlos (publicarlos) </li></ul><ul><li>de trabajar colaborativamente </li></ul>
  7. 7. Nuevas formas de colaboración científica Frecuentemente o cada vez más escuchamos y hablamos de… “ ciberinfraestructura” “ e-ciencia” “ e-investigación” “ colaboracion ubicua” “ data-driven Science” “ computación grid” “ computación social” “ acceso abierto al conocimiento” … refiriendose a nuevas formas de producción y diseminación del conocimiento
  8. 8. Ejemplos (actuales): <ul><li>Datos generados por redes nacionales y mundiales de investigación (biología, medicina, física, etc.): </li></ul><ul><li>Datos del LHC generados en el CERN </li></ul><ul><li>Datos generados por las redes mundiales de sensores sísmicos </li></ul><ul><li>Estudios sobre cambios globales (GCMD-NASA) </li></ul><ul><li>Astronomía, los “telescopios virtuales” (Global Internet Telescope) </li></ul><ul><li>Banco de datos de Proteinas (PDB, Protein Data Bank) </li></ul><ul><li>Data Grids </li></ul><ul><li>Bibliotecas Digitales </li></ul><ul><li>Repositorios de datos </li></ul>
  9. 9. … Ejemplos <ul><li>A esto se unen las iniciativas por el uso sin restricciones de la información y datos: </li></ul><ul><li>Iniciativas de Acceso Abierto al Conocimiento (OA, Open Access Initiatives) </li></ul><ul><li>Movimiento Datos Libres (OD, Open Data) </li></ul><ul><li>Repositorios Institucionales y por disciplina </li></ul>
  10. 10. Ejemplos: - CERN LHC
  11. 11. Necesidad de usar tecnologías de información (TICs) <ul><li>Ubicar </li></ul><ul><li>Accesar </li></ul><ul><li>Recuperar </li></ul><ul><li>Compartir </li></ul><ul><li>… datos </li></ul><ul><li>La mayoría usa LA RED para satisfacer estas necesidades </li></ul>Para…
  12. 12. Un objetivo importante Que debemos hacer para lograr el… Uso secundario y a largo plazo de colecciones de datos científicos Se debe… Garantizar permanencia de los datos en el tiempo Poder ubicar y recuperar la información
  13. 13. Herramientas Herramientas organizativas y tecnológicas que pueden hacer esto posible: Uso de metadatos y estándares de intercambio de información Tecnologías de Información y Comunicaciones Formación de Redes de colaboración entre científicos y entre usuarios de información Creación y mantenimiento de repositorios de datos
  14. 14. <ul><li>&quot; Datos sobre los datos &quot; . </li></ul><ul><li>&quot;Nivel superior de la información, o instrucciones que describen el contenido, contexto, calidad, estructura, y accesibilidad de una colección de datos específica&quot; (J.K. Michener 1997). </li></ul>Qué significa la palabra “metadatos”? D M D M1 D M2 Mc D M a) b) c) Metadatos como parte de los datos Metadatos externos al recurso de información Meta-metadatos (colecciones de metadatos)
  15. 15. <ul><li>Preguntas que se deberían poder responder usando metadatos: </li></ul><ul><li>Que datos describe una coleccion de datos científicos? </li></ul><ul><li>Quien produjo la colección? </li></ul><ul><li>Porqué fue creada la colección? </li></ul><ul><li>Como fue creada la colección? </li></ul><ul><li>Que datos componen la colección? </li></ul><ul><li>Cuan confiables son los datos. Que problemas persisten en la colección? </li></ul><ul><li>Como alguien puede obtener una copia de la colección? </li></ul><ul><li>Quien escribio los metadatos? </li></ul>Para qué “metadatos”?
  16. 16. Ejemplos de metadatos y de comunidades que usan metadatos Muestra datos NBII http://www.nbii.gov/ Documentación de datos geoespaciales (estándar FGDC) http://cndg.clearinghouse.gub.uy
  17. 17. Ejemplos de metadatos y de comunidades que usan metadatos Documentación de datos geoespaciales (Interfaz a Clearinghouse FGDC y GCMD Data Documenter)
  18. 18. Algunos de los estándares para metadatos geoespaciales, biológicos y ambientales más usados <ul><li>  </li></ul><ul><li>FGDC-CSDGM. Content Standard for Digital Geospatial Metadata. Federal Geographic Data Committe (1994): Datos geoespaciales. [www.fgdc.gov] </li></ul><ul><li>FGDC-NBII. Perfil Biológico de FGDC. Biología y ciencias naturales. [www.nbii.gov]. </li></ul><ul><li>Global Change Master Directory Interchange Format – DIF. (1993) Ciencias de la Tierra . [gcmd.gsfc.nasa.gov] </li></ul><ul><li>Darwin Core (DwC). Colecciones de Historia Natural. </li></ul><ul><li>Descriptores para Metadatos no-geoespaciales . NCEAS-LTER (1997) Datos ecológicos. Base del estándar EML. [lternet.washington.edu] </li></ul><ul><li>Dublin Core. Estandar general de identificacion de objetos de información en Internet. [www.dublincore.org] </li></ul>
  19. 19. Manejo de colecciones de datos científicos. Algunas experiencias locales Red de Estaciones Ecológicas de Venezuela (ECORED) Red de Estaciones Bioclimáticas del Estado Mérida ( red bc)
  20. 20. Justificación <ul><li>Dificultades que existen en Venezuela para ubicar y usar colecciones de datos bio-climáticos. </li></ul><ul><li>Interés de organizaciones, instituciones y personas que tienen datos históricos los cuales desean preservar o compartir para su uso a largo plazo. </li></ul><ul><li>Necesidad de implementar un repositorio de datos que permita realizar análisis y descubrir correlaciones entre diferentes conjuntos de información, que ayuden a la toma de decisiones e investigación científica. </li></ul>Red de Estaciones Bio-climáticas del Estado Mérida ( red bc )
  21. 21. <ul><li>Manejo, identificación, y preservación en el tiempo , de recursos de información relacionados con la biología y el clima usando estándares internacionales de formato y contenidos. </li></ul><ul><li>Generación de un Sistema de Información a través del Web que permita el facil acceso de investigadores, productores y organizaciones que necesiten la información producida por la red de estaciones. </li></ul>Objetivos principales La Experiencia de la Red de Estaciones Bio-climáticas del Estado Mérida ( red bc )
  22. 22. <ul><li>Mantener en el tiempo las colecciones de datos y desarrollar mecanismos de almacenamiento, catalogación y distribución de la información generada. </li></ul><ul><li>Realizar permanentemente labores de identificación de nuevas fuentes de información que puedan incorporarse a las colecciones existentes. </li></ul><ul><li>Concientizar a los científicos sobre la importancia de la preservación de los datos generados en sus investigaciones. </li></ul>Objetivos secundarios y tareas La Experiencia de la Red de Estaciones Bio-climáticas del Estado Mérida ( red bc )
  23. 23. Estaciones de la red bc <ul><li>Estación La Hechicera, Mérida </li></ul><ul><li>Estación Mucujún, Mérida </li></ul><ul><li>Estación Santa Rosa, Mérida </li></ul><ul><li>Estación San Juan, Mérida </li></ul><ul><li>Estaciones Sur del Lago UNESUR (2 estaciones) </li></ul><ul><li>Estación Pico Espejo-MARS </li></ul><ul><li>Estación INIA-Chama, Sur del Lago de Maracaibo </li></ul><ul><li>Estación Ciplat, Sur del Lago de Maracaibo </li></ul>
  24. 24. <ul><li>Centro Internacional del Plátano (CIPLAT) </li></ul><ul><li>Instituto Nacional de Investigaciones Agrícolas (INIA)- Chama, Sur del Lago </li></ul><ul><li>Instituto de Ciencias Ambientales y Ecológicas de la ULA (ICAE) </li></ul><ul><li>Instituto de Investigaciones Agropecuarlas de la ULA (IIAULA) </li></ul><ul><li>Universidad Nacional Experimental del Sur del Lago (UNESUR) </li></ul><ul><li>  Institut für Meteorologie und Klimaforschung (IMK)  (Institute for Meteorology and Climate Research, U. Karlsruhe, Germany ) </li></ul>Instituciones colaboradoras de la red bc
  25. 25. Funcionamiento de la redbc Sistema de Información Bioclimático basado en el web <ul><li>Ubicación de características de colecciones de datos. </li></ul><ul><li>Utilización de tecnologías Internet-Web, que aceleran y facilitan grandemente el proceso de captura, actualización y difusión de la información bio-climática, permitiendo varios niveles de acceso y recuperación de dicha información. </li></ul><ul><li>Actualmente sólo se proveen datos sin procesar (archivos de datos provenientes de las estaciones meteorológicas) y sus respectivos metadatos. En el futuro se podrá acceder a información previamente procesada (gráficos, tablas, etc). </li></ul><ul><li>Libre acceso a colecciones de datos ( datasets ) producidos por miembros de la red y (en lo posible) por cualquier persona o institución que los necesite </li></ul>
  26. 26. Funcionamiento de la red bc Sistema de manejo de datos: Datos llegan por varias vías (enviados por gerentes locales de información o colaboradores): -E-mail -Web -CD -Entregas personales Gerentes Centrales de información los procesan de ser necesario y los publican en Internet Internet Miembros de la REDBC Servidor (CECALCULA)
  27. 27. Es Ejemplo: Colección de datos Estación Chama Consultando las colecciones de datos
  28. 28. Enlace Ejemplo: Colección de datos Estación Chama <ul><li>Presentación de datos </li></ul><ul><li>Datos originales (sin procesar) </li></ul><ul><li>Datos ordenados (Por año y por mes) </li></ul><ul><li>html </li></ul><ul><li>xml (EML: Ecological Metadata Language) </li></ul><ul><li>txt </li></ul>Formato de metadatos Consultando las colecciones de datos
  29. 29. Metadatos xml (EML) (para intercambio con otros sistemas y procesamiento automático) Ejemplo: Colección de datos Estación Chama Metadatos html (para visualización por Web) Consultando las colecciones de datos
  30. 30. Ejemplo: Colección de datos Estación Chama Interfaces Web: Datos originales Consultando las colecciones de datos
  31. 31. Ejemplo: Colección de datos Estación Chama Datos originales Datos sin procesar, tal como vienen de los instrumentos o científicos que los capturan Consultando las colecciones de datos
  32. 32. Ejemplo: Colección de datos Estación Chama Datos ordenados Datos con algún tipo de procesamiento Consultando las colecciones de datos
  33. 33. Ejemplo: Consulta en KNB Datos enviados a KNB: http://knb.ecoinformatics.org Consultando las colecciones de datos
  34. 34. Afiliarse a la red bc Llenar Planilla de documentación de datos proporcionada por el gerente central de información. Se pueden configurar planillas de diferentes tipos: Web, Word, txt, etc. Documentar los datos <ul><li>Contactar por e-mail o teléfono al Proveedor de metadatos </li></ul>Formas de envío y publicación de metadatos y datos?
  35. 35. <ul><li>Escaso conocimiento de la importancia de la preservación y posibilidades de uso secundario de los datos </li></ul><ul><li>Poca disposición de los científicos para compartir los datos. </li></ul><ul><li>Poca receptividad o disposición para aportar metadatos que documenten las colecciones de datos. </li></ul><ul><li>Confusiones y reservas que tienen que ver con los derechos de propiedad, publicación y uso de los datos. </li></ul><ul><li>Bajo interés por parte de algunos gerentes de información local en publicar sus colecciones de datos (retardo en envío de datos-pérdida de información). </li></ul><ul><li>Dificultades (aún) con la conexión a internet (conectividad, velocidad) </li></ul><ul><li>Costos de los instrumentos de captura de datos </li></ul><ul><li>No existe la figura de “gerente local de información”, o es muy costoso tenerlos </li></ul>Dificultades en el desarrollo de proyectos de este tipo
  36. 36. Estaciones y datos en la red bc .
  37. 37. <ul><li>En realidad hasta ahora ha sido una prueba de concepto (exitosa a nuestro modo de ver) </li></ul><ul><li>Interes y exigencias crecientes </li></ul><ul><li>Volumen creciente de información manejada </li></ul><ul><li>Muchas posibilidades abiertas </li></ul><ul><li>Mucho trabajo por hacer </li></ul>La Experiencia de la Red de Estaciones Bio-climáticas del Estado Mérida ( red bc )
  38. 38. <ul><li>Redes de manejo de conocimientos basadas en datos y metadatos (intención de KNB) </li></ul><ul><li>Acceso a herramientas analíticas &quot;en-línea&quot; para integrar varias herramientas como SAS, MATLAB, etc. con acceso a datos de red de científicos (LTER) </li></ul><ul><li>Herramientas para producir formas alternativas de metadatos que permitan a cualquier sitio participar fácilmente en otras bases de datos internacionales y Clearinghouses de datos (FGDC, GCMD, NBII, etc.) </li></ul><ul><li>Creación de más bancos de datos internacionales o federados perteneciantes a multiples dominios y organizaciones </li></ul><ul><li>Puesta en marcha de la “infraestructura Grid”. Acceso a “Grid de datos” (Datagrids) </li></ul><ul><li>Por último…Comunidades y sociedades del conocimiento </li></ul>El Futuro
  39. 39. La visión de Rick Luce (y de muchos otras personas) El Futuro Construyendo las bases de las comunidades basadas en el conocimiento
  40. 40. Termino con otra reflexión de Rick Luce… “ Debemos hacer mucho más que mejorar y dar acceso a la información científica. Nuestro trabajo ahora es enlazar juntos los cerebros de las personas para que el compartir, el razonamiento y la colaboración se conviertan en parte del trabajo diario.” Rick Luce. Proyecto Biblioteca sin paredes (Library Without Walls). 1998 Reflexión final
  41. 41. <ul><li>Clearinghouse Federal Geographic Data Commite (FGDC,NBII) http://www.fgdc.gov/clearinghouse/ </li></ul><ul><li>Global Change Master Directory (GCMD, DIF) http://gcmd.gsfc.nasa.gov </li></ul><ul><li>Long Term Ecological Research Network (LTER, EML) http://lternet.edu </li></ul><ul><li>Knowledge Network of Biocomplexity </li></ul><ul><li>http://knb.ecoinformatics.org </li></ul><ul><li>National Center for Ecological Analysis and Synthesis www.nceas.gov </li></ul><ul><li>&quot;Open Data&quot; http://en.wikipedia.org/wiki/Open_data </li></ul>Algunas Referencias
  42. 42. www.cecalc.ula.ve/redbc/ [email_address] Gracias por la atención!!

×