2. 2 Ciencia y SIG La actividad científica genera infinidad de datos
3. 3 Los Datos Datos de campo Datos de laboratorio Datos que tienen una representación espacial
4. 4 Guardando los datos Los investigadores y las investigadoras guardamos estos datos de muchas maneras. EN PAPEL DIGITALES
5. 5 Base de Datos Geográfica (BDG) Si guardo los datos como yo quiero…. NO LOS PUEDO COMPARTIR NO FACILITO LA COLABORACIÓN – EL TRABAJO EN GRUPO Lo mejor es usar una BASE DE DATOS GEOGRÁFICA y seguir una serie de estándares.
6. 6 COMPLEJIDAD La experiencia nos dice que trabajar con bases de datos geográficas… ES UN TEMA…… ¡¡¡¡DIFÍCIL!!!!
7. Definición de SIG Un sistema para entrada, almacenamiento, manipulación y salida de información geográfica Un tipo de software Un ejemplo práctico de SIG combina software con hardware, datos, usuarios, etc., para resolver un problema, ayudar a la toma de decisiones, el planeamiento y la gestión “La tecnología SIG es al análisis geográfico lo que el microscopio y los ordenadores han sido para otras ciencias” (Gutiérrez y Gould, 1994, p. 38)
8. Definición de SIG Un sistema de hardware, software y procedimientos elaborados para facilitar la obtención, gestión, manipulación, análisis, modelado, representación y salida de datos espacialmente referenciados, para resolver problemas complejos de planificación y gestión (NCGIA, 1990)
9. ENTRADA DE INFORMACIÓN Conversión / transformación de información geográfica a formato digital Almacenamiento Actualización Recuperación GESTIÓN FUNCIONES DE ANÁLISIS SIG como “máquina de simulación” SALIDA GRÁFICA Y CARTOGRAFICA Funciones de los SIG
10. Tipo de cuestiones que un SIG puede responder LOCALIZACIÓN: ¿Qué hay en…? CONDICIÓN: ¿Dónde se cumple qué…? PATRONES DE DISTRIBUCIÓN TENDENCIAS/ANÁLISIS DE CAMBIOS RUTAS ÓPTIMAS/ANÁLISIS DE REDES MODELOS/SIMULACIONES
11. Etapas de un proyecto SIG Definición de objetivos Recogida de datos existentes Creación de nuevos datos Integración de datos Corrección de errores Manipulación de coordenadas Análisis (espacial, geoestadístico, 3D) Representación Mantenimiento
12. 12 Tipos de Usuarios SIG Usuario instrumental: utilización de un programa o programas para realizar tareas concretas. Analista SIG temático: conocimiento no sólo de los programas, sino de las técnicas SIG en general y/o aplicadas a un campo temático determinado. Los SIG como forma de pensar sobre los datos geográficos. Analista de datos y arquitectura de BDG: capacidad de entender un problema desde una perspectiva territorial y modelar una solución normalizada en una BDG. Arquitectura de IDE: capacidad de creación de Infraestructuras de Datos Espaciales.
15. 15 DATO – INFORMACIÓN - CONOCIMIENTO Las bases de datos juegan un papel trascendental en el proceso que permite transformar un dato en conocimiento. Dato: mediciones y magnitudes, ya sean cualitativas o cuantitativas, que representan atributos de un conjunto de variables observables, mesurables o estimables, de la realidad. E.g.: presencia de una especie en un punto, temperatura en ese punto Información: los datos relacionados y sometidos a análisis producen información. Por ejemplo: presencia media de esa especie en ese paraje; temperatura media anual Conocimiento: la información en acción, la información en movimiento, la información interrelacionada y puesta en práctica para un uso concreto constituye el conocimiento. Nivel máximo de abstracción de los datos, que nos permite intentar crear leyes científicas predictivas y descriptivas de los fenómenos observados. E.g.: se constata que el número de animales de una especie medio en ese punto se redujo al aumentar la temperatura. 41001002301
16. 16 Idea Clave Una base de datos se encarga de ordenar los datos de forma que les podamos hacer preguntas y realizar análisis. Pero para que nos ofrezca las respuestas precisas y los resultados óptimos es fundamental diseñar bien previamente, y eso es lo único que no te enseñan en el curso: se aprende enfrentándote a muchos (cuantos más mejor) de casos.
17. 17 Filosofía de los Seminarios Se hace este seminario porque uno de los miembros del CAESCG asistió al curso… (Carátula del curso de Granada) Cada curso desembocará en 1 seminario Cada nuevo conocimiento adquirido que tenga que ver con las T.I. se trasladará a los G.I. mediante la web (webminarios, tutoriales, blog). CONTAR MOVIDAS
18. 18 Definiciones de Bases de datos El medio computerizado más potente y utilizado para la gestión de la información alfanumérica es la BASE DE DATOS: Una base de datos es la organización de una colección de datos que se interrelacionan, se comparten y se controlan" (G. W. y J. V. Hansen, "Diseño y administración de bases de datos", 1997) "Una base de datos es una colección de datos organizada de forma sistemática, de manera que un programa de ordenador puede consultarlos para ofrecer respuestas" (Wikipedia, 2006) De las definiciones anteriores extraemos que una base de datos debe... albergar datos según una estructura conveniente diseñada de antemano que propicie la interrelación de hechos para producir información; tener control sobre la naturaleza y formato de los datos que se incorporan a ella, de manera que se garantice la calidad de los mismos; controlar el acceso de diferentes perfiles de usuario a sus datos y estructura.
19. 19 ¿Por qué son importantes? Son uno de los sectores de las ciencias de la computación más transversales y con más impacto global en nuestro día a día. Permite la creación de almacenes de datos distribuidos y multiconcurrentes. Propicia la computación distribuida. Enorme flexibilidad ante el planteamiento de problemas complejos. Mímesis de los procesos lógicos que ocurren en la realidad gracias a la modelización de sistemas reales. Últimas depositarias de los datos producto de procesos de recogida que pueden ser extraordinariamente costosos. Se encuentran en la base de la gran mayoría de las aplicaciones informáticas presentes en la administración y en todo tipo de organizaciones, independientemente de su tamaño. Guardan lo más preciado: los datos. Las aplicaciones van y vienen, pero los datos son para siempre.
20. 20 Diseño de la base de datos Coger un PROBLEMA, una REALIDAD COMPLEJA. Por ejemplo, una biblioteca, un trámite administrativo o un proceso de recogida y análisis de muestras de campo. Estudiarla, sistematizarla y modelarla en una abstracción conceptual llamada MODELO DE BASE DE DATOS RELACIONAL Plasmar el MODELO DE BASE DE DATOS RELACIONAL anterior en un MODELO FÍSICO gracias a un programa de ordenador llamado SISTEMA GESTOR DE BASE DE DATOS, que a su vez funciona sobre una COMPUTADORA, para conseguir aprovechar la extrema capacidad de calculo y relación lógica de las computadoras para el almacenamiento, ordenación, gestión y análisis masivo y automático de datos.
21. 21 Tareas del diseñador Son tareas del analista-diseñador: determinar cuales son las variables relevantes para describir la realidad que pretende analizar; determinar cual es el nivel de desagregación relevante para el problema que se tiene entre manos; determinar el formato en el que dichos datos deben ser codificados, para que la codificación de los mismos sea segura, sencilla y eficaz.
22. 22 Un trabajo en equipo Suele ser un equipo multidisciplinar de expertos temáticos e ingenieros de software; Debe entender el problema y tratar con los que lo conocen para extraer toda la información necesaria para crear el modelo; Debe conocer la máquina, para adaptar el problema a un lenguaje que ésta entienda; Debe entender las necesidades de los usuarios finales: qué esperan del sistema y cómo se supone que deben interaccionar con la información. En resumen: debe poner los medios para expresar el problema en el lenguaje de la máquina para que sea entendido en lenguaje humano.
23. 23 ¿Cómo abordamos el diseño? No se puede modelar lo que no se conoce. No existe una solución única para un problema de modelado, tan sólo existen soluciones convenientes. El problema nunca se soluciona a la primera, es un proceso iterativo, reiterativo y evolutivo que puede llegar a ser muy costoso en el tiempo. Se trabaja en el modelo, se somete a prueba, se corrige, se vuelve a probar... iterativamente. El problema ha de ser discutido con especialistas diferentes y visto desde todos los puntos de vista que se consideren necesarios. Es una labor de equipo. No se puede modelar con prisa. Es un proceso que hay que hacer con reposo. Hay que ser ordenado. Hay que darle un nombre bien descriptivo y significativo a los componentes del modelo y documentarlo profusamente. Debe ser elegante, legible y sencillo, hasta donde el problema lo permita, claro.
24. 24 LOS PELIGROS Efecto “POYAQUE” NORMALIZACIÓN Falta de atomización Redundancia
25. 25 ¿Cómo afrontamos el diseño? Existen multitud de metodologías de diseño-modelado. Usaremos un método iterativo de refinamiento por pasos, basado en la metodología de modelado de entidad-relación, en la que aplicaremos una serie de normas. Paso 1: Comprensión del problema: a efectos prácticos, muchas reuniones, mucho pensar y mucho papel garabateado. Paso 2: Identificación de los elementos del sistema y sus relaciones: a partir del paso 1, análisis y planteamiento inicial de los componentes básicos del sistema descrito. Paso 3: Iteraciones de normalización: el sistema es sometido a sucesivos ciclos de estudio, análisis y cambios hasta alcanzar un estado plenamente normalizado en el que todas las necesidades de información son satisfechas.
26. 26 Paso 1: Comprensión del problema Sin comprender el problema no hay nada que modelar. Hay que describir el problema, los procesos y los elementos del sistema lo más detalladamente posible. Una técnica fundamental es escribirlo en papel, descriptivamente, exponiendo literalmente el problema. Esta descripción literal surge de un proceso de discusión con los especialistas temáticos. De este proceso de discusión se obtienen los siguientes productos, llamados en su conjunto Documentos de diseño: una descripción de los elementos, flujos, relaciones entre elementos y procesos que se dan dentro del sistema que se quiere modelar; un documento en el que se perfilan las necesidades de información que debe satisfacer el sistema, es decir, la lista de preguntas mínimas que el sistema debe ser capaz de responder de forma veraz.
27. 27 Objetivos de la base de datos Albergar la información del problema a tratar en una forma conveniente para su tratamiento. Esta forma es un modelo entidad-relación que reproduce los flujos y la estructura de la información del problema real. Controlar la introducción de datos en la base, de forma que la información contenida en ella sea consistente, atómica y no redundante: consistente: la información almacenada no puede ser contradictoria entre sí; atómica: la información debe estar en el nivel de desagregación más conveniente; no redundante: un dato en concreto debe estar recogido en la base de datos una sóla vez, y no varias, so pena de incurrir en inconsistencias. Permitir el análisis y recuperación de datos en condiciones adecuadas y con flexibilidad.
28. 28 ¿Qué hacemos con la base de datos? El diseño desemboca en un modo particular de almacenar y organizar los datos para que puedan ser utilizados con eficacia (base de datos). Para ello usamos un sistema gestor de base de datos (SGBD), un Software especializado en la creación, gestión, administración, utilización y mantenimiento de bases de datos. Ejemplos: PostgreSQL, Oracle, MySQL, OpenOffice Base, SQL Server, Access, etc. En conclusión: utilizamos bases de datos para poner orden allí donde no lo hay y propiciar de esta manera la resolución de preguntas y análisis sobre los datos que se recogen en nuestra actividad científico-técnica diaria.
29. 29 Objetivos del SGBD Plantear la infraestructura software necesaria para apoyar todas las necesidades de uso y gestión de las bases de datos que contiene. Tareas de definición de datos. Creación de las estructuras de datos (modelos) que albergarán la información. Modelado visual. Lenguaje SQL / DDL (Data DefinitionLanguage). Tareas administrativas. Gestión de accesos, permisos, usuarios, cuotas, copias de seguridad, exportaciones, importaciones, encriptación, etc. Lenguaje SQL / DBA (DatabaseAdministration). Tareas de edición de datos. Inserción, modificación y borrado de datos. Control de concurrencia por transacciones. Lenguaje SQL / DML (Data ManipulationLanguage). Tareas de recuperación y consulta de datos. Creación de consultas sobre los datos. Lenguaje SQL / DML. Ordenación (índices) de los datos y recuperación selectiva de los mismos. Tareas programáticas avanzadas. Creación de programas complejos dentro de la base de datos para la manipulación avanzada de datos. Lenguajes como PL/SQL, PL/pgSQL, SQL/PSM, T-SQL, Java, etc..
30. 30 Los SGBD ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente. FOSS: Free and Open Source Software, software libre y abierto.
31. 31 ¿Qué diferencia hay entre una base de datos convencional y una base de datos geográfica? La información geográfica tiene una doble componente: temática y espacial. La vertiente temática caracteriza las propiedades de los objetos geográficos. La vertiente espacial caracteriza la geometría (extensión, forma, orientación, etc.) de los objetos geográficos. El diseñador de bases de datos geográficas debe ser consciente en todo momento de este hecho para explotarlo en beneficio del modelo. Debe siempre cuestionarse la naturaleza geográfica de los componentes del sistema que pretende modelar. “Para trabajar con un SIG es necesario en primer lugar introducir la información geográfica en un sistema de información y realizar una modelización de la realidad” (Lantada y Núñez, 2002).
32. 32 TEMÁTICO propiedades, atributos de los objetos espaciales ESPACIAL elemento del mundo real localizado en el espacio Componentes del datos geográfico en un SIG
33. 33 Tipo de objeto geográfico Línea Punto Polígono La informaciónpuede ser estructuradasegún el tipo de objetogeográficocomopuntos, líneasypolígonos. Puntos – 0 dimensiones, descrito por par de coordenadas x,y Líneas – 1 dimensión, descritas por sucesión de coordenadas puntuales Polígonos - 2 dimensiones, descritos por sucesión cerrada de coordenadas puntuales Volúmenes – 2.5 / 3 dimensiones, descritos por superficie triangulada
34. 34 El concepto de capa Cada una de las variables incorporadas al SIG, que almacena un tipo de objeto espacial (punto, línea, polígono) Todas con el mismo sistema de referencia espacial, lo que permite realizar superposiciones entre capas, cálculo de distancias, etc.
35. 35 En definitiva, los campos y los tipos de datos geométricos, la información que contienen y el uso que se hace de ellos constituyen (entre otras muchas cosas) la marca de identidad de las bases de datos geográficas.
36. 36 Simplificando “De una manera más inmediata un SIG se puede contemplar como un conjunto de mapas de la misma porción del territorio, donde un lugar concreto tiene la misma localización (las mismas coordenadas) en todos los mapas incluidos en el sistema de información. De este modo, resulta posible realizar análisis de sus características espaciales y temáticas para obtener un mejor conocimiento de esa zona” (Bosque, 1997).
37. 37 Topología Las entidades geométricas de los modelos geográficos, sólo por el hecho de existir sobre el territorio, ya comparten una clave primaria común a todas ellas, independiente totalmente de su naturaleza temática: el espacio geográfico. Por lo tanto, los hechos territoriales pueden ser modelados como entidades geométricas en los modelos de bases de datos geográficas que: Tienen una caracterización temática gracias a un conjunto de campos. Poseen uno o varios campos geométricos donde se alberga un conjunto de puntos, líneas y polígonos que describen la realidad física del hecho territorial. La topología es el conjunto de las relaciones espaciales impuestas por la función distancia que se dan entre los objetos que están sobre el espacio geográfico.
38. 38 Interoperabilidad Las BDG son una forma de base de datos extremadamente poderosa puesto que juegan con una clave primaria universal compartida por todas las entidades geométricas existentes en cualquier base de datos geográfica del mundo: EL ESPACIO. Esta clave primaria universal permite conectar información contenida en distintas bases de datos a partir del vínculo topológico que comparten las geometrías en ellas contenidas. Por todo ello, es deber de los diseñadores de BDG aprovechar al máximo las posibilidades que nos brinda el modelado geográfico: haremos nuestros datos mucho más versátiles y por tanto mucho más interoperables con otras bases de datos vecinas, actuales y, sobre todo, futuras.
39. 39 Similitudes y diferencias con las BD no geográficas Básicamente, como idea central, hay que tener claro que: Las BDG son un subconjunto especializado de las BD no geográficas. Por tanto, en esencia son bases de datos relacionales a todos los efectos. Están planteadas, en la mayoría de los casos, como extensiones a los SGBD que incrementan sus capacidades para hacer posible el almacenamiento, edición, manipulación y recuperación de información geométrica, siempre con criterios topológicos. Dicho esto: las bases de datos geográficas son bases de datos relacionales normales en lo que a sus datos alfanuméricos se refieren; se diseñan y se conciben igual que las no geográficas, pero teniendo en cuenta las peculiaridades del modelado geográfico ya comentadas; se gestionan igual que las no geográficas, con las peculiaridades impuestas por el tratamiento de los datos vectoriales; se explotan igual que las no geográficas, con el añadido de poseer SQL espacial; físicamente, se basan en los mismos sistemas de hardware. En cuanto al software, es el mismo, con los añadidos propios destinados a la gestión de las geometrías.
40. 40 Peculiaridades del modelo geográfico En esencia, el modelado geográfico sigue los mismos pasos y fases que el modelado relacional convencional. El diseñador geográfico debe tener en cuenta, sin embargo, que: Las entidades pueden tener campos para albergar atributos geométricos (puntos, líneas, polígonos) con tipos de datos adaptados a la gestión de geometrías. Entre las entidades con atributos geométricos se pueden establecer relaciones topológicas, que pueden llegar a sustituir a relaciones convencionales y/o coexistir con las mismas (aunque se corre el peligro de caer en redundancia). El diseñador geográfico debe tener en cuenta todas las reglas de normalización ya explicadas en el caso del modelado convencional, pero además, debe asegurarse de estudiar y poner las bases para garantizar la integridad topológica de los datos geométricos.
41. 41 ¿Por qué diseñar bases de datos relacionales geográficas? Porque posibilitan la creación de modelos geográficos basados en el paradigma entidad-relación imposibles de realizar con sistemas basados en ficheros con larga tradición en el mundo SIG, como los workspace GRASS y ArcInfo o las shapes. Porque es la mejor manera de conseguir multiconcurrencia a datos geográficos. Porque es el medio ideal para crear sistemas distribuidos de información geográfica. Porque es un componente central en las IDE. Porque posibilita el análisis de los datos mediante SQL tradicional y espacial. Porque existe falta de expertos temáticos con formación en el diseño de bases de datos geográficas: es una actividad crítica y que siempre será necesaria.
43. 43 PostrgreSQL Base de datos FOSS más importante junto a MySQL ACID: Multiconcurrente, control de transacciones, arquitectura cliente - servidor Lenguajes C / C++ Versión actual: 9 Linux, FreeBSD, Solaris, Mac OS, Windows Antecesores tecnológicos: Ingres (1982, Universidad de Berkeley) Lenguajes de programación internos: Pl/pgSQL, Pl/Perl, Pl/Ruby, Pl/Python Front-ends de gestión y administración: PgAdmin3 (Linux, Windows), Kpogre (Linux), phpPgAdmin (web), psql (Linux, Windows) ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente. FOSS: Free and Open Source Software, software libre y abierto.
44. 44 PostGIS Programa adicional (extensión) instalable sobre PostgreSQL para gestionar información geográfica Lenguajes C / C++ Versión actual: 1.4.5 Desarrollo liderado desde 2000 por la empresa canadiense RefractionsResearch Basado en librerías OS adicionales: GEOS: motor topológico Proj4: trabajo con proyecciones cartográficas Extensiones a PostGIS: PgRoute (análisis de redes)
45. 45 PostGIS Características: Gestión y almacenamiento de geometrías vectoriales Gestión de relaciones topológicas entre geometrías (GEOS) Reproyecciones (Proj4) Utilización de varios formatos: WKT (WellKnown Text, OGC), WKB (WellKnownBinary, OGC), GeoJson, GML (Geographic Mark-up Language, OGC), KML (Keyhole Mark-up Language, Google) Clientes: Servidores de información geografica (para IDE): MapServer, GeoServer GIS OS de escritorio: Quantum GIS / GRASS, Kosmo, gvSIG, uDig, OpenJump GIS propietarios de escritorio: ManifoldSystem, MapInfo, ArcGIS (a duras penas, con ZigGIS o ArcServer / ArcSDE)
46. 46 Instalación PostgreSQL: la base de datos sobre la que se asienta PostGIS. PostGIS: extensión espacial. psql: cliente de línea de comando de PostgreSQL. pgAdmin3: cliente GUI de PostgreSQL. QGIS: cliente pesado de escritorio GIS, muy útil para el trabajo con PostGIS. Visual Studio 2008 Express Edition: necesario para compilar ZigGIS. ZigGIS: extensión para ArcGIS para conectar con PostGIS.
49. 49 OGC Open GeospatialConsortium www.geoespatial.org Organización internacional no lucrativa cuyo fin es la definición de estándares abiertos e interoperables dentro de los SIG. Creada en 1994 agrupa a + de 250 organizaciones públicas y privadas Persigue acuerdos entre las diferentes empresas del sector que posibiliten la interoperación de sus sistemas de geoprocesamiento y facilitar el intercambio de información geográfica en beneficio de los usuarios. Estándares más importantes surgidos del OGC: GML (GeographicMarkupLanguage) WMS (Web MapService) WFS (Web FeatureService) WCS (Web CoverageService) Catalogue Service
50. 50 Infraestructura de Datos Espaciales (IDE) Una IDE es un sistema informático integrado por un conjunto de recursos (catálogos, servidores, programas, datos, aplicaciones, páginas Web,...) dedicados a gestionar Información Geográfica (mapas, ortofotos, imágenes de satélite, topónimos,...), disponibles en Internet, que cumplen una serie de condiciones de interoperabilidad (normas, especificaciones, protocolos, interfaces,...) que permiten que un usuario, utilizando un simple navegador, pueda utilizarlos y combinarlos según sus necesidades. Organización de los datos e información. ¿Donde están? ¿Quién los tiene? ¿A quién pertenecen? ¿Cuándo y como se obtuvieron?
51. 51 Componentes de una IDE Datos Datos de referencia: Constituyen el marco de referencia que proporciona el contexto geográfico a cualquier aplicación. Sistema de Coordenadas. - Cuadrículas Geográficas. - Nombres geográficos. Unidades Administrativas. - Redes de Transporte. - Hidrografía. - Lugares Protegidos. Elevación. - Identificadores de Propiedad. - Parcelas Catastrales. - Cubierta Terrestre. Ortoimágenes. Datos temáticos: Incluyen valores cualitativos y cuantitativos que se corresponden con atributos asociados a los datos de referencia como por ejemplo: vegetación, geología, clima, tráfico, contaminación, etc. Metadatos: Hay que diferenciar claramente los datos de los metadatos: los datos describen el mundo real y son un modelo de la realidad; los metadatos describen los datos y se utilizan para tomar decisiones acerca de los mismos. Servicios Servicio de Mapas en Web (WMS) Servicio de Fenómenos en Web (WFS) Servicio de Coberturas en Web (WCS) Servicio de Catálogo en Web
52. 52 Principios Comunes Marco Institucional: Definición de estándares: El establecimiento de normas a las que deberá ajustarse la información geográfica, los intercambios de esta y la interoperación de los sistemas que la manejan. Tecnología: El establecimiento de la red y mecanismos informáticos que permitan: buscar, consultar, encontrar, acceder, suministrar y usar los datos espaciales o geográficos. Como por ejemplo permitir incorporar los metadatos organizados en catálogos y ofrecerlos en la red a través de servidores. Política de datos: El establecimiento de las políticas, alianzas y acuerdos de colaboración necesarios para aumentar la disponibilidad de datos espaciales y compartir los desarrollos tecnológicos.