SlideShare a Scribd company logo
1 of 54
Almacenamiento de Datos Ambientales Hoy Portada Isaac Francés – Balbino Fernández
2 Ciencia y SIG La actividad científica genera infinidad de datos
3 Los Datos Datos de campo Datos de laboratorio Datos que tienen una representación espacial
4 Guardando los datos Los investigadores y las investigadoras guardamos estos datos de muchas maneras. EN PAPEL DIGITALES
5 Base de Datos Geográfica (BDG) Si guardo los datos como yo quiero…. NO LOS PUEDO COMPARTIR NO FACILITO LA COLABORACIÓN – EL TRABAJO EN GRUPO Lo mejor es usar una BASE DE DATOS GEOGRÁFICA y seguir una serie de estándares.
6 COMPLEJIDAD La experiencia nos dice que trabajar con bases de datos geográficas… ES UN TEMA……  ¡¡¡¡DIFÍCIL!!!!
Definición de SIG Un sistema para entrada, almacenamiento, manipulación y salida de información geográfica Un tipo de software Un ejemplo práctico de SIG combina software con hardware, datos, usuarios, etc., para resolver un problema, ayudar a la toma de decisiones, el planeamiento y la gestión “La tecnología SIG es al análisis geográfico lo que el microscopio y los ordenadores han sido para otras ciencias”  (Gutiérrez y Gould, 1994, p. 38)
Definición de SIG Un sistema de hardware, software y procedimientos elaborados para facilitar la obtención, gestión, manipulación, análisis, modelado, representación y salida de datos espacialmente referenciados, para resolver problemas complejos de planificación y gestión (NCGIA, 1990)
ENTRADA DE INFORMACIÓN Conversión / transformación de información geográfica a formato digital Almacenamiento Actualización Recuperación GESTIÓN FUNCIONES DE ANÁLISIS SIG como  “máquina de simulación” SALIDA GRÁFICA Y CARTOGRAFICA Funciones de los SIG
Tipo de cuestiones que un SIG puede responder LOCALIZACIÓN: ¿Qué hay en…? CONDICIÓN: ¿Dónde se cumple qué…? PATRONES DE DISTRIBUCIÓN TENDENCIAS/ANÁLISIS DE CAMBIOS RUTAS ÓPTIMAS/ANÁLISIS DE REDES MODELOS/SIMULACIONES
Etapas de un proyecto SIG Definición de objetivos Recogida de datos existentes Creación de nuevos datos Integración de datos Corrección de errores Manipulación de coordenadas Análisis (espacial, geoestadístico, 3D) Representación Mantenimiento
12 Tipos de Usuarios SIG Usuario instrumental: utilización de un programa o programas para realizar tareas concretas. Analista SIG temático: conocimiento no sólo de los programas, sino de las técnicas SIG en general y/o aplicadas a un campo temático determinado. Los SIG como forma de pensar sobre los datos geográficos. Analista de datos y arquitectura de BDG: capacidad de entender un problema desde una perspectiva territorial y modelar una solución normalizada en una BDG. Arquitectura de IDE: capacidad de creación de Infraestructuras de Datos Espaciales.
13
14 Transmisión del Conocimiento
15 DATO – INFORMACIÓN - CONOCIMIENTO Las bases de datos juegan un papel trascendental en el proceso que permite transformar un dato en conocimiento. Dato: mediciones y magnitudes, ya sean cualitativas o cuantitativas, que representan atributos de un conjunto de variables observables, mesurables o estimables, de la realidad. E.g.: presencia de una especie en un punto, temperatura en ese punto Información: los datos relacionados y sometidos a análisis producen información. Por ejemplo: presencia media de esa especie en ese paraje; temperatura media anual Conocimiento: la información en acción, la información en movimiento, la información interrelacionada y puesta en práctica para un uso concreto constituye el conocimiento. Nivel máximo de abstracción de los datos, que nos permite intentar crear leyes científicas predictivas y descriptivas de los fenómenos observados. E.g.: se constata que el número de animales de una especie medio en ese punto se redujo al aumentar la temperatura. 41001002301
16 Idea Clave Una base de datos se encarga de ordenar los datos de forma que les podamos hacer preguntas y realizar análisis. Pero para que nos ofrezca las respuestas precisas y los resultados óptimos es fundamental diseñar bien previamente, y eso es lo único que no te enseñan en el curso: se aprende enfrentándote a muchos (cuantos más mejor) de casos.
17 Filosofía de los Seminarios Se hace este seminario porque uno de los miembros del CAESCG asistió al curso… (Carátula del curso de Granada) Cada curso desembocará en 1 seminario Cada nuevo conocimiento adquirido que tenga que ver con las T.I. se trasladará a los G.I. mediante la web (webminarios, tutoriales, blog). CONTAR MOVIDAS
18 Definiciones de Bases de datos El medio computerizado más potente y utilizado para la gestión de la información alfanumérica es la BASE DE DATOS: Una base de datos es la organización de una colección de datos que se interrelacionan, se comparten y se controlan" (G. W. y J. V. Hansen, "Diseño y administración de bases de datos", 1997) "Una base de datos es una colección de datos organizada de forma sistemática, de manera que un programa de ordenador puede consultarlos para ofrecer respuestas" (Wikipedia, 2006) De las definiciones anteriores extraemos que una base de datos debe... albergar datos según una estructura conveniente diseñada de antemano que propicie la interrelación de hechos para producir información; tener control sobre la naturaleza y formato de los datos que se incorporan a ella, de manera que se garantice la calidad de los mismos; controlar el acceso de diferentes perfiles de usuario a sus datos y estructura.
19 ¿Por qué son importantes? Son uno de los sectores de las ciencias de la computación más transversales y con más impacto global en nuestro día a día. Permite la creación de almacenes de datos distribuidos y multiconcurrentes. Propicia la computación distribuida. Enorme flexibilidad ante el planteamiento de problemas complejos. Mímesis de los procesos lógicos que ocurren en la realidad gracias a la modelización de sistemas reales. Últimas depositarias de los datos producto de procesos de recogida que pueden ser extraordinariamente costosos. Se encuentran en la base de la gran mayoría de las aplicaciones informáticas presentes en la administración y en todo tipo de organizaciones, independientemente de su tamaño. Guardan lo más preciado: los datos. Las aplicaciones van y vienen, pero los datos son para siempre.
20 Diseño de la base de datos Coger un PROBLEMA, una REALIDAD COMPLEJA. Por ejemplo, una biblioteca, un trámite administrativo o un proceso de recogida y análisis de muestras de campo. Estudiarla, sistematizarla y modelarla en una abstracción conceptual llamada MODELO DE BASE DE DATOS RELACIONAL Plasmar el MODELO DE BASE DE DATOS RELACIONAL anterior en un MODELO FÍSICO gracias a un programa de ordenador llamado SISTEMA GESTOR DE BASE DE DATOS, que a su vez funciona sobre una COMPUTADORA, para conseguir aprovechar la extrema capacidad de calculo y relación lógica de las computadoras para el almacenamiento, ordenación, gestión y análisis masivo y automático de datos.
21 Tareas del diseñador Son tareas del analista-diseñador: determinar cuales son las variables relevantes para describir la realidad que pretende analizar; determinar cual es el nivel de desagregación relevante para el problema que se tiene entre manos; determinar el formato en el que dichos datos deben ser codificados, para que la codificación de los mismos sea segura, sencilla y eficaz.
22 Un trabajo en equipo Suele ser un equipo multidisciplinar de expertos temáticos e ingenieros de software; Debe entender el problema y tratar con los que lo conocen para extraer toda la información necesaria para crear el modelo; Debe conocer la máquina, para adaptar el problema a un lenguaje que ésta entienda; Debe entender las necesidades de los usuarios finales: qué esperan del sistema y cómo se supone que deben interaccionar con la información. En resumen: debe poner los medios para expresar el problema en el lenguaje de la máquina para que sea entendido en lenguaje humano.
23 ¿Cómo abordamos el diseño? No se puede modelar lo que no se conoce.  No existe una solución única para un problema de modelado, tan sólo existen soluciones convenientes. El problema nunca se soluciona a la primera, es un proceso iterativo, reiterativo y evolutivo que puede llegar a ser muy costoso en el tiempo. Se trabaja en el modelo, se somete a prueba, se corrige, se vuelve a probar... iterativamente. El problema ha de ser discutido con especialistas diferentes y visto desde todos los puntos de vista que se consideren necesarios. Es una labor de equipo. No se puede modelar con prisa. Es un proceso que hay que hacer con reposo. Hay que ser ordenado. Hay que darle un nombre bien descriptivo y significativo a los componentes del modelo y documentarlo profusamente. Debe ser elegante, legible y sencillo, hasta donde el problema lo permita, claro.
24 LOS PELIGROS Efecto “POYAQUE” NORMALIZACIÓN Falta de atomización Redundancia
25 ¿Cómo afrontamos el diseño? Existen multitud de metodologías de diseño-modelado. Usaremos un método iterativo de refinamiento por pasos, basado en la metodología de modelado de entidad-relación, en la que aplicaremos una serie de normas. Paso 1: Comprensión del problema: a efectos prácticos, muchas reuniones, mucho pensar y mucho papel garabateado. Paso 2: Identificación de los elementos del sistema y sus relaciones: a partir del paso 1, análisis y planteamiento inicial de los componentes básicos del sistema descrito. Paso 3: Iteraciones de normalización: el sistema es sometido a sucesivos ciclos de estudio, análisis y cambios hasta alcanzar un estado plenamente normalizado en el que todas las necesidades de información son satisfechas.
26 Paso 1: Comprensión del problema Sin comprender el problema no hay nada que modelar. Hay que describir el problema, los procesos y los elementos del sistema lo más detalladamente posible. Una técnica fundamental es escribirlo en papel, descriptivamente, exponiendo literalmente el problema. Esta descripción literal surge de un proceso de discusión con los especialistas temáticos. De este proceso de discusión se obtienen los siguientes productos, llamados en su conjunto Documentos de diseño: una descripción de los elementos, flujos, relaciones entre elementos y procesos que se dan dentro del sistema que se quiere modelar; un documento en el que se perfilan las necesidades de información que debe satisfacer el sistema, es decir, la lista de preguntas mínimas que el sistema debe ser capaz de responder de forma veraz.
27 Objetivos de la base de datos Albergar la información del problema a tratar en una forma conveniente para su tratamiento. Esta forma es un modelo entidad-relación que reproduce los flujos y la estructura de la información del problema real. Controlar la introducción de datos en la base, de forma que la información contenida en ella sea consistente, atómica y no redundante: consistente: la información almacenada no puede ser contradictoria entre sí; atómica: la información debe estar en el nivel de desagregación más conveniente; no redundante: un dato en concreto debe estar recogido en la base de datos una sóla vez, y no varias, so pena de incurrir en inconsistencias. Permitir el análisis y recuperación de datos en condiciones adecuadas y con flexibilidad.
28 ¿Qué hacemos con la base de datos? El diseño desemboca en un modo particular de almacenar y organizar los datos para que puedan ser utilizados con eficacia (base de datos). Para ello usamos un sistema gestor de base de datos (SGBD), un Software especializado en la creación, gestión, administración, utilización y mantenimiento de bases de datos. Ejemplos: PostgreSQL, Oracle, MySQL, OpenOffice Base, SQL Server, Access, etc. En conclusión: utilizamos bases de datos para poner orden allí donde no lo hay y propiciar de esta manera la resolución de preguntas y análisis sobre los datos que se recogen en nuestra actividad científico-técnica diaria.
29 Objetivos del SGBD Plantear la infraestructura software necesaria para apoyar todas las necesidades de uso y gestión de las bases de datos que contiene. Tareas de definición de datos. Creación de las estructuras de datos (modelos) que albergarán la información. Modelado visual. Lenguaje SQL / DDL (Data DefinitionLanguage). Tareas administrativas. Gestión de accesos, permisos, usuarios, cuotas, copias de seguridad, exportaciones, importaciones, encriptación, etc. Lenguaje SQL / DBA (DatabaseAdministration). Tareas de edición de datos. Inserción, modificación y borrado de datos. Control de concurrencia por transacciones. Lenguaje SQL / DML (Data ManipulationLanguage). Tareas de recuperación y consulta de datos. Creación de consultas sobre los datos. Lenguaje SQL / DML. Ordenación (índices) de los datos y recuperación selectiva de los mismos. Tareas programáticas avanzadas. Creación de programas complejos dentro de la base de datos para la manipulación avanzada de datos. Lenguajes como PL/SQL, PL/pgSQL, SQL/PSM, T-SQL, Java, etc..
30 Los SGBD ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente.  FOSS: Free and Open Source Software, software libre y abierto.
31 ¿Qué diferencia hay entre una base de datos convencional y una base de datos geográfica? La información geográfica tiene una doble componente: temática y espacial. La vertiente temática caracteriza las propiedades de los objetos geográficos. La vertiente espacial caracteriza la geometría (extensión, forma, orientación, etc.) de los objetos geográficos. El diseñador de bases de datos geográficas debe ser consciente en todo momento de este hecho para explotarlo en beneficio del modelo. Debe siempre cuestionarse la naturaleza geográfica de los componentes del sistema que pretende modelar.  “Para trabajar con un SIG es necesario en primer lugar introducir la información geográfica en un sistema de información y realizar una modelización de la realidad” (Lantada y Núñez, 2002).
32 TEMÁTICO propiedades, atributos de los objetos espaciales ESPACIAL elemento del mundo real localizado en el espacio Componentes del datos geográfico en un SIG
33 Tipo de objeto geográfico Línea Punto Polígono La informaciónpuede ser estructuradasegún el tipo de objetogeográficocomopuntos, líneasypolígonos. Puntos – 0 dimensiones, descrito por par de coordenadas x,y Líneas – 1 dimensión, descritas por sucesión de coordenadas puntuales Polígonos - 2 dimensiones, descritos por sucesión cerrada de coordenadas puntuales Volúmenes – 2.5 / 3 dimensiones, descritos por superficie triangulada
34 El concepto de capa Cada una de las variables incorporadas al SIG, que almacena un tipo de objeto espacial (punto, línea, polígono) Todas con el mismo sistema de referencia espacial, lo que permite realizar superposiciones entre capas, cálculo de distancias, etc.
35 En definitiva, los campos y los tipos de datos geométricos, la información que contienen y el uso que se hace de ellos constituyen (entre otras muchas cosas) la marca de identidad de las bases de datos geográficas.
36 Simplificando “De una manera más inmediata un SIG se puede contemplar como un conjunto de mapas de la misma porción del territorio, donde un lugar concreto tiene la misma localización (las mismas coordenadas) en todos los mapas incluidos en el sistema de información. De este modo, resulta posible realizar análisis de sus características espaciales y temáticas para obtener un mejor conocimiento de esa zona” (Bosque, 1997).
37 Topología Las entidades geométricas de los modelos geográficos, sólo por el hecho de existir sobre el territorio, ya comparten una clave primaria común a todas ellas, independiente totalmente de su naturaleza temática: el espacio geográfico. Por lo tanto, los hechos territoriales pueden ser modelados como entidades geométricas en los modelos de bases de datos geográficas que: Tienen una caracterización temática gracias a un conjunto de campos. Poseen uno o varios campos geométricos donde se alberga un conjunto de puntos, líneas y polígonos que describen la realidad física del hecho territorial. La topología es el conjunto de las relaciones espaciales impuestas por la función distancia que se dan entre los objetos que están sobre el espacio geográfico.
38 Interoperabilidad Las BDG son una forma de base de datos extremadamente poderosa puesto que juegan con una clave primaria universal compartida por todas las entidades geométricas existentes en cualquier base de datos geográfica del mundo: EL ESPACIO. Esta clave primaria universal permite conectar información contenida en distintas bases de datos a partir del vínculo topológico que comparten las geometrías en ellas contenidas. Por todo ello, es deber de los diseñadores de BDG aprovechar al máximo las posibilidades que nos brinda el modelado geográfico: haremos nuestros datos mucho más versátiles y por tanto mucho más interoperables con otras bases de datos vecinas, actuales y, sobre todo, futuras.
39 Similitudes y diferencias con las BD no geográficas Básicamente, como idea central, hay que tener claro que:  Las BDG son un subconjunto especializado de las BD no geográficas. Por tanto, en esencia son bases de datos relacionales a todos los efectos. Están planteadas, en la mayoría de los casos, como extensiones a los SGBD que incrementan sus capacidades para hacer posible el almacenamiento, edición, manipulación y recuperación de información geométrica, siempre con criterios topológicos. Dicho esto: las bases de datos geográficas son bases de datos relacionales normales en lo que a sus datos alfanuméricos se refieren; se diseñan y se conciben igual que las no geográficas, pero teniendo en cuenta las peculiaridades del modelado geográfico ya comentadas; se gestionan igual que las no geográficas, con las peculiaridades impuestas por el tratamiento de los datos vectoriales; se explotan igual que las no geográficas, con el añadido de poseer SQL espacial; físicamente, se basan en los mismos sistemas de hardware. En cuanto al software, es el mismo, con los añadidos propios destinados a la gestión de las geometrías.
40 Peculiaridades del modelo geográfico En esencia, el modelado geográfico sigue los mismos pasos y fases que el modelado relacional convencional. El diseñador geográfico debe tener en cuenta, sin embargo, que: Las entidades pueden tener campos para albergar atributos geométricos (puntos, líneas, polígonos) con tipos de datos adaptados a la gestión de geometrías. Entre las entidades con atributos geométricos se pueden establecer relaciones topológicas, que pueden llegar a sustituir a relaciones convencionales y/o coexistir con las mismas (aunque se corre el peligro de caer en redundancia). El diseñador geográfico debe tener en cuenta todas las reglas de normalización ya explicadas en el caso del modelado convencional, pero además, debe asegurarse de estudiar y poner las bases para garantizar la integridad topológica de los datos geométricos.
41 ¿Por qué diseñar bases de datos relacionales geográficas? Porque posibilitan la creación de modelos geográficos basados en el paradigma entidad-relación imposibles de realizar con sistemas basados en ficheros con larga tradición en el mundo SIG, como los workspace GRASS y ArcInfo o las shapes. Porque es la mejor manera de conseguir multiconcurrencia a datos geográficos.  Porque es el medio ideal para crear sistemas distribuidos de información geográfica.  Porque es un componente central en las IDE.  Porque posibilita el análisis de los datos mediante SQL tradicional y espacial. Porque existe falta de expertos temáticos con formación en el diseño de bases de datos geográficas: es una actividad crítica y que siempre será necesaria.
42 Algunos sistemas de bases de datos geográficas
43 PostrgreSQL Base de datos FOSS más importante junto a MySQL ACID: Multiconcurrente, control de transacciones,        arquitectura cliente - servidor  Lenguajes C / C++  Versión actual: 9  Linux, FreeBSD, Solaris, Mac OS, Windows  Antecesores tecnológicos: Ingres (1982, Universidad de Berkeley) Lenguajes de programación internos: Pl/pgSQL, Pl/Perl, Pl/Ruby, Pl/Python Front-ends de gestión y administración: PgAdmin3 (Linux, Windows), Kpogre (Linux), phpPgAdmin (web), psql (Linux, Windows) ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente.  FOSS: Free and Open Source Software, software libre y abierto.
44 PostGIS Programa adicional (extensión) instalable sobre PostgreSQL para gestionar información geográfica Lenguajes C / C++  Versión actual: 1.4.5  Desarrollo liderado desde 2000 por la empresa canadiense RefractionsResearch Basado en librerías OS adicionales: GEOS: motor topológico Proj4: trabajo con proyecciones cartográficas  Extensiones a PostGIS: PgRoute (análisis de redes)
45 PostGIS Características: Gestión y almacenamiento de geometrías vectoriales  Gestión de relaciones topológicas entre geometrías (GEOS) Reproyecciones (Proj4) Utilización de varios formatos: WKT (WellKnown Text, OGC), WKB (WellKnownBinary, OGC), GeoJson, GML (Geographic Mark-up Language, OGC), KML (Keyhole Mark-up Language, Google) Clientes: Servidores de información geografica (para IDE): MapServer, GeoServer GIS  OS de escritorio: Quantum GIS / GRASS, Kosmo, gvSIG, uDig, OpenJump GIS propietarios de escritorio: ManifoldSystem, MapInfo, ArcGIS (a duras penas, con ZigGIS o ArcServer / ArcSDE)
46 Instalación PostgreSQL: la base de datos sobre la que se asienta PostGIS.  PostGIS: extensión espacial.  psql: cliente de línea de comando de PostgreSQL.  pgAdmin3: cliente GUI de PostgreSQL. QGIS: cliente pesado de escritorio GIS, muy útil para el trabajo con PostGIS.  Visual Studio 2008 Express Edition: necesario para compilar ZigGIS.  ZigGIS: extensión para ArcGIS para conectar con PostGIS.
47 Funcionamiento
48 Carácter distribuido de la información geográfica
49 OGC Open GeospatialConsortium www.geoespatial.org Organización internacional no lucrativa cuyo fin es la definición de estándares abiertos e interoperables dentro de los SIG. Creada en 1994 agrupa a + de 250 organizaciones públicas y privadas Persigue acuerdos entre las diferentes empresas del sector que posibiliten la interoperación de sus sistemas de geoprocesamiento y facilitar el intercambio de información geográfica en beneficio de los usuarios. Estándares más importantes surgidos del OGC: GML (GeographicMarkupLanguage) WMS (Web MapService) WFS (Web FeatureService) WCS (Web CoverageService) Catalogue Service
50 Infraestructura de Datos Espaciales (IDE) Una IDE es un sistema informático integrado por un conjunto de recursos (catálogos, servidores, programas, datos, aplicaciones, páginas Web,...) dedicados a gestionar Información Geográfica (mapas, ortofotos, imágenes de satélite, topónimos,...), disponibles en Internet, que cumplen una serie de condiciones de interoperabilidad (normas, especificaciones, protocolos, interfaces,...) que permiten que un usuario, utilizando un simple navegador, pueda utilizarlos y combinarlos según sus necesidades. Organización de los datos e información. ¿Donde están?  ¿Quién los tiene?  ¿A quién pertenecen?  ¿Cuándo y como se obtuvieron?
51 Componentes de una IDE Datos Datos de referencia: Constituyen el marco de referencia que proporciona el contexto geográfico a cualquier aplicación. Sistema de Coordenadas. - Cuadrículas Geográficas. - Nombres geográficos. Unidades Administrativas. - Redes de Transporte. - Hidrografía. - Lugares Protegidos. Elevación. - Identificadores de Propiedad. - Parcelas Catastrales. - Cubierta Terrestre. Ortoimágenes. Datos temáticos: Incluyen valores cualitativos y cuantitativos que se corresponden con atributos asociados a los datos de referencia como por ejemplo: vegetación, geología, clima, tráfico, contaminación, etc. Metadatos:  Hay que diferenciar claramente los datos de los metadatos: los datos describen el mundo real y son un modelo de la realidad; los metadatos describen los datos y se utilizan para tomar decisiones acerca de los mismos. Servicios Servicio de Mapas en Web (WMS) Servicio de Fenómenos en Web (WFS) Servicio de Coberturas en Web (WCS) Servicio de Catálogo en Web
52 Principios Comunes Marco Institucional: Definición de estándares: El establecimiento de normas a las que deberá ajustarse la información geográfica, los intercambios de esta y la interoperación de los sistemas que la manejan. Tecnología:  El establecimiento de la red y mecanismos informáticos que permitan: buscar, consultar, encontrar, acceder, suministrar y usar los datos espaciales o geográficos. Como por ejemplo permitir incorporar los metadatos organizados en catálogos y ofrecerlos en la red a través de servidores. Política de datos: El establecimiento de las políticas, alianzas y acuerdos de colaboración necesarios para aumentar la disponibilidad de datos espaciales y compartir los desarrollos tecnológicos.
53 En busca de la interoperabilidad
54 Arquitectura INSPIRE

More Related Content

Viewers also liked (19)

Manual de instalacion de joomla
Manual de instalacion de joomlaManual de instalacion de joomla
Manual de instalacion de joomla
 
MóDulo Ii
MóDulo IiMóDulo Ii
MóDulo Ii
 
subasta Holandesa
subasta Holandesasubasta Holandesa
subasta Holandesa
 
Bases Lpn 008 Y 009 2009 Juguetes 20 Nov09
Bases Lpn 008 Y 009 2009 Juguetes 20 Nov09Bases Lpn 008 Y 009 2009 Juguetes 20 Nov09
Bases Lpn 008 Y 009 2009 Juguetes 20 Nov09
 
Diabetes y Ramadan
Diabetes y RamadanDiabetes y Ramadan
Diabetes y Ramadan
 
Actividad en coordinación
Actividad en coordinaciónActividad en coordinación
Actividad en coordinación
 
El Retorno De David
El Retorno De DavidEl Retorno De David
El Retorno De David
 
09 Diseño De Presentaciones. Edicion Avanzada De Objetos
09 Diseño De Presentaciones. Edicion Avanzada De Objetos09 Diseño De Presentaciones. Edicion Avanzada De Objetos
09 Diseño De Presentaciones. Edicion Avanzada De Objetos
 
Mic Mic 52 (Febrer Juny 09)Reduida
Mic Mic 52 (Febrer Juny 09)ReduidaMic Mic 52 (Febrer Juny 09)Reduida
Mic Mic 52 (Febrer Juny 09)Reduida
 
Cristina Lizardo
Cristina LizardoCristina Lizardo
Cristina Lizardo
 
Ontologías
OntologíasOntologías
Ontologías
 
05 Dibujo Vectorial Con Draw. Texto
05 Dibujo Vectorial Con Draw. Texto05 Dibujo Vectorial Con Draw. Texto
05 Dibujo Vectorial Con Draw. Texto
 
03 Introduccion A Linux. Software Libre
03 Introduccion A Linux. Software Libre03 Introduccion A Linux. Software Libre
03 Introduccion A Linux. Software Libre
 
Web2.0
Web2.0Web2.0
Web2.0
 
Training vs Coaching
Training vs CoachingTraining vs Coaching
Training vs Coaching
 
Manual ASercom
Manual ASercomManual ASercom
Manual ASercom
 
Un Dia Normal by Esan Wilson
Un Dia Normal by Esan WilsonUn Dia Normal by Esan Wilson
Un Dia Normal by Esan Wilson
 
Sarah Beall
Sarah BeallSarah Beall
Sarah Beall
 
Como educar a los hijos en la inteligencia emocional
Como educar a los hijos en la inteligencia emocionalComo educar a los hijos en la inteligencia emocional
Como educar a los hijos en la inteligencia emocional
 

Similar to Seminario Almacenamiento Datos Hoy - 13/12/10

El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataRafael Morales
 
sistemas y tecnologias de la informacion
sistemas y tecnologias de la informacionsistemas y tecnologias de la informacion
sistemas y tecnologias de la informacionharoldobando
 
F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)danioviedo
 
F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)josechica19-94
 
F004 p006-gfpi guia2(1) (1)
F004 p006-gfpi guia2(1) (1)F004 p006-gfpi guia2(1) (1)
F004 p006-gfpi guia2(1) (1)danioviedo
 
Seminario Almacenamiento de Datos Ambientales Hoy
Seminario Almacenamiento de Datos Ambientales HoySeminario Almacenamiento de Datos Ambientales Hoy
Seminario Almacenamiento de Datos Ambientales HoyCAESCG.org
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Diseño logico de una base de datos
Diseño logico de  una base de datosDiseño logico de  una base de datos
Diseño logico de una base de datosRobert Rodriguez
 
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdf
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdfeBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdf
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdfNubiral
 
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.naviwz
 
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.naviwz
 

Similar to Seminario Almacenamiento Datos Hoy - 13/12/10 (20)

Ensayo cientifico
Ensayo cientificoEnsayo cientifico
Ensayo cientifico
 
El ciclo de proyecto en Big Data
El ciclo de proyecto en Big DataEl ciclo de proyecto en Big Data
El ciclo de proyecto en Big Data
 
sistemas y tecnologias de la informacion
sistemas y tecnologias de la informacionsistemas y tecnologias de la informacion
sistemas y tecnologias de la informacion
 
F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)
 
Guia3
Guia3Guia3
Guia3
 
guía de aprendizaje 2
guía de aprendizaje 2guía de aprendizaje 2
guía de aprendizaje 2
 
F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)F004 p006-gfpi guia2(1)
F004 p006-gfpi guia2(1)
 
Guia2
Guia2Guia2
Guia2
 
F004 p006-gfpi guia2(1) (1)
F004 p006-gfpi guia2(1) (1)F004 p006-gfpi guia2(1) (1)
F004 p006-gfpi guia2(1) (1)
 
guía de aprendizaje 2
guía de aprendizaje 2guía de aprendizaje 2
guía de aprendizaje 2
 
Guia 2
Guia 2Guia 2
Guia 2
 
Seminario Almacenamiento de Datos Ambientales Hoy
Seminario Almacenamiento de Datos Ambientales HoySeminario Almacenamiento de Datos Ambientales Hoy
Seminario Almacenamiento de Datos Ambientales Hoy
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Diseño logico de una base de datos
Diseño logico de  una base de datosDiseño logico de  una base de datos
Diseño logico de una base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdf
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdfeBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdf
eBook Nubiral _ DataOps_ cada cual atiende su juego (1).pdf
 
Dialnet unseegsi-4902765 (1)
Dialnet unseegsi-4902765 (1)Dialnet unseegsi-4902765 (1)
Dialnet unseegsi-4902765 (1)
 
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Copia de unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
 
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
Unidad 7 diseã‘o_estructructurado_de_datos_microsoft_access.
 

More from CAESCG.org

Past Climate as the key to understand the future: example from the Mediterran...
Past Climate as the key to understand the future: example from the Mediterran...Past Climate as the key to understand the future: example from the Mediterran...
Past Climate as the key to understand the future: example from the Mediterran...CAESCG.org
 
Glocharid - Subproyecto 6a - Autóctonas
Glocharid - Subproyecto 6a - AutóctonasGlocharid - Subproyecto 6a - Autóctonas
Glocharid - Subproyecto 6a - AutóctonasCAESCG.org
 
Proyecto Glocharid - Bloque 4 - Ecosistemas y Gestión
Proyecto Glocharid - Bloque 4 - Ecosistemas y GestiónProyecto Glocharid - Bloque 4 - Ecosistemas y Gestión
Proyecto Glocharid - Bloque 4 - Ecosistemas y GestiónCAESCG.org
 
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)CAESCG.org
 
Proyecto Glohcarid - Bloque 2 - Agua
Proyecto Glohcarid - Bloque 2 - AguaProyecto Glohcarid - Bloque 2 - Agua
Proyecto Glohcarid - Bloque 2 - AguaCAESCG.org
 
Proyecto Glocharid - Bloque 1 - Medio Físico
Proyecto Glocharid - Bloque 1 - Medio FísicoProyecto Glocharid - Bloque 1 - Medio Físico
Proyecto Glocharid - Bloque 1 - Medio FísicoCAESCG.org
 
Glocharid - Subproyecto 7b - Reptiles
Glocharid - Subproyecto 7b - ReptilesGlocharid - Subproyecto 7b - Reptiles
Glocharid - Subproyecto 7b - ReptilesCAESCG.org
 
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierras
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierrasGlocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierras
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierrasCAESCG.org
 
Glocharid - Subproyecto 8 - Hábitat y ecosistemas
Glocharid - Subproyecto 8 - Hábitat y ecosistemasGlocharid - Subproyecto 8 - Hábitat y ecosistemas
Glocharid - Subproyecto 8 - Hábitat y ecosistemasCAESCG.org
 
Glocharid - Subproyecto 10 - Servicios ecosistémicos
Glocharid - Subproyecto 10 - Servicios ecosistémicosGlocharid - Subproyecto 10 - Servicios ecosistémicos
Glocharid - Subproyecto 10 - Servicios ecosistémicosCAESCG.org
 
Glocharid - Subproyecto 5 - Calidad de aguas
Glocharid - Subproyecto 5 - Calidad de aguasGlocharid - Subproyecto 5 - Calidad de aguas
Glocharid - Subproyecto 5 - Calidad de aguasCAESCG.org
 
Glocharid - Subproyecto 7c - Aves
Glocharid - Subproyecto 7c - AvesGlocharid - Subproyecto 7c - Aves
Glocharid - Subproyecto 7c - AvesCAESCG.org
 
Glocharid - Subproyecto 7b - Anfibios
Glocharid - Subproyecto 7b - AnfibiosGlocharid - Subproyecto 7b - Anfibios
Glocharid - Subproyecto 7b - AnfibiosCAESCG.org
 
Glocharid - Subproyecto 7a - Mamíferos
Glocharid - Subproyecto 7a - MamíferosGlocharid - Subproyecto 7a - Mamíferos
Glocharid - Subproyecto 7a - MamíferosCAESCG.org
 
Glocharid - Subproyecto 6b - Plantas Invasoras
Glocharid - Subproyecto 6b - Plantas InvasorasGlocharid - Subproyecto 6b - Plantas Invasoras
Glocharid - Subproyecto 6b - Plantas InvasorasCAESCG.org
 
Glocharid - Subproyecto 4 - Cauces Fluviales
Glocharid - Subproyecto 4 - Cauces FluvialesGlocharid - Subproyecto 4 - Cauces Fluviales
Glocharid - Subproyecto 4 - Cauces FluvialesCAESCG.org
 
Glocharid - Subproyecto 3 - Medios Subterráneos
Glocharid - Subproyecto 3 - Medios SubterráneosGlocharid - Subproyecto 3 - Medios Subterráneos
Glocharid - Subproyecto 3 - Medios SubterráneosCAESCG.org
 
Glocharid - Subproyecto 2 - Atmósfera
Glocharid - Subproyecto 2 - AtmósferaGlocharid - Subproyecto 2 - Atmósfera
Glocharid - Subproyecto 2 - AtmósferaCAESCG.org
 
Glocharid - Subproyecto 1 - Clima
Glocharid - Subproyecto 1 - ClimaGlocharid - Subproyecto 1 - Clima
Glocharid - Subproyecto 1 - ClimaCAESCG.org
 

More from CAESCG.org (20)

Past Climate as the key to understand the future: example from the Mediterran...
Past Climate as the key to understand the future: example from the Mediterran...Past Climate as the key to understand the future: example from the Mediterran...
Past Climate as the key to understand the future: example from the Mediterran...
 
Glocharid - Subproyecto 6a - Autóctonas
Glocharid - Subproyecto 6a - AutóctonasGlocharid - Subproyecto 6a - Autóctonas
Glocharid - Subproyecto 6a - Autóctonas
 
Proyecto Glocharid - Bloque 4 - Ecosistemas y Gestión
Proyecto Glocharid - Bloque 4 - Ecosistemas y GestiónProyecto Glocharid - Bloque 4 - Ecosistemas y Gestión
Proyecto Glocharid - Bloque 4 - Ecosistemas y Gestión
 
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)
Proyecto Glocharid - Bloque 3 - Medio Biológico (Flora y Fauna)
 
Proyecto Glohcarid - Bloque 2 - Agua
Proyecto Glohcarid - Bloque 2 - AguaProyecto Glohcarid - Bloque 2 - Agua
Proyecto Glohcarid - Bloque 2 - Agua
 
Proyecto Glocharid - Bloque 1 - Medio Físico
Proyecto Glocharid - Bloque 1 - Medio FísicoProyecto Glocharid - Bloque 1 - Medio Físico
Proyecto Glocharid - Bloque 1 - Medio Físico
 
Glocharid - Subproyecto 7b - Reptiles
Glocharid - Subproyecto 7b - ReptilesGlocharid - Subproyecto 7b - Reptiles
Glocharid - Subproyecto 7b - Reptiles
 
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierras
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierrasGlocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierras
Glocharid - Subproyecto 9 - Cambios de uso del suelo y abandono de tierras
 
Glocharid - Subproyecto 8 - Hábitat y ecosistemas
Glocharid - Subproyecto 8 - Hábitat y ecosistemasGlocharid - Subproyecto 8 - Hábitat y ecosistemas
Glocharid - Subproyecto 8 - Hábitat y ecosistemas
 
Glocharid - Subproyecto 10 - Servicios ecosistémicos
Glocharid - Subproyecto 10 - Servicios ecosistémicosGlocharid - Subproyecto 10 - Servicios ecosistémicos
Glocharid - Subproyecto 10 - Servicios ecosistémicos
 
Glocharid - Subproyecto 5 - Calidad de aguas
Glocharid - Subproyecto 5 - Calidad de aguasGlocharid - Subproyecto 5 - Calidad de aguas
Glocharid - Subproyecto 5 - Calidad de aguas
 
Glocharid - Subproyecto 7c - Aves
Glocharid - Subproyecto 7c - AvesGlocharid - Subproyecto 7c - Aves
Glocharid - Subproyecto 7c - Aves
 
Glocharid - Subproyecto 7b - Anfibios
Glocharid - Subproyecto 7b - AnfibiosGlocharid - Subproyecto 7b - Anfibios
Glocharid - Subproyecto 7b - Anfibios
 
Glocharid - Subproyecto 7a - Mamíferos
Glocharid - Subproyecto 7a - MamíferosGlocharid - Subproyecto 7a - Mamíferos
Glocharid - Subproyecto 7a - Mamíferos
 
Glocharid - Subproyecto 6b - Plantas Invasoras
Glocharid - Subproyecto 6b - Plantas InvasorasGlocharid - Subproyecto 6b - Plantas Invasoras
Glocharid - Subproyecto 6b - Plantas Invasoras
 
Glocharid - Subproyecto 4 - Cauces Fluviales
Glocharid - Subproyecto 4 - Cauces FluvialesGlocharid - Subproyecto 4 - Cauces Fluviales
Glocharid - Subproyecto 4 - Cauces Fluviales
 
Glocharid - Subproyecto 3 - Medios Subterráneos
Glocharid - Subproyecto 3 - Medios SubterráneosGlocharid - Subproyecto 3 - Medios Subterráneos
Glocharid - Subproyecto 3 - Medios Subterráneos
 
Glocharid - Subproyecto 2 - Atmósfera
Glocharid - Subproyecto 2 - AtmósferaGlocharid - Subproyecto 2 - Atmósfera
Glocharid - Subproyecto 2 - Atmósfera
 
Glocharid - Subproyecto 1 - Clima
Glocharid - Subproyecto 1 - ClimaGlocharid - Subproyecto 1 - Clima
Glocharid - Subproyecto 1 - Clima
 
CAESCG.org
CAESCG.orgCAESCG.org
CAESCG.org
 

Seminario Almacenamiento Datos Hoy - 13/12/10

  • 1. Almacenamiento de Datos Ambientales Hoy Portada Isaac Francés – Balbino Fernández
  • 2. 2 Ciencia y SIG La actividad científica genera infinidad de datos
  • 3. 3 Los Datos Datos de campo Datos de laboratorio Datos que tienen una representación espacial
  • 4. 4 Guardando los datos Los investigadores y las investigadoras guardamos estos datos de muchas maneras. EN PAPEL DIGITALES
  • 5. 5 Base de Datos Geográfica (BDG) Si guardo los datos como yo quiero…. NO LOS PUEDO COMPARTIR NO FACILITO LA COLABORACIÓN – EL TRABAJO EN GRUPO Lo mejor es usar una BASE DE DATOS GEOGRÁFICA y seguir una serie de estándares.
  • 6. 6 COMPLEJIDAD La experiencia nos dice que trabajar con bases de datos geográficas… ES UN TEMA…… ¡¡¡¡DIFÍCIL!!!!
  • 7. Definición de SIG Un sistema para entrada, almacenamiento, manipulación y salida de información geográfica Un tipo de software Un ejemplo práctico de SIG combina software con hardware, datos, usuarios, etc., para resolver un problema, ayudar a la toma de decisiones, el planeamiento y la gestión “La tecnología SIG es al análisis geográfico lo que el microscopio y los ordenadores han sido para otras ciencias” (Gutiérrez y Gould, 1994, p. 38)
  • 8. Definición de SIG Un sistema de hardware, software y procedimientos elaborados para facilitar la obtención, gestión, manipulación, análisis, modelado, representación y salida de datos espacialmente referenciados, para resolver problemas complejos de planificación y gestión (NCGIA, 1990)
  • 9. ENTRADA DE INFORMACIÓN Conversión / transformación de información geográfica a formato digital Almacenamiento Actualización Recuperación GESTIÓN FUNCIONES DE ANÁLISIS SIG como “máquina de simulación” SALIDA GRÁFICA Y CARTOGRAFICA Funciones de los SIG
  • 10. Tipo de cuestiones que un SIG puede responder LOCALIZACIÓN: ¿Qué hay en…? CONDICIÓN: ¿Dónde se cumple qué…? PATRONES DE DISTRIBUCIÓN TENDENCIAS/ANÁLISIS DE CAMBIOS RUTAS ÓPTIMAS/ANÁLISIS DE REDES MODELOS/SIMULACIONES
  • 11. Etapas de un proyecto SIG Definición de objetivos Recogida de datos existentes Creación de nuevos datos Integración de datos Corrección de errores Manipulación de coordenadas Análisis (espacial, geoestadístico, 3D) Representación Mantenimiento
  • 12. 12 Tipos de Usuarios SIG Usuario instrumental: utilización de un programa o programas para realizar tareas concretas. Analista SIG temático: conocimiento no sólo de los programas, sino de las técnicas SIG en general y/o aplicadas a un campo temático determinado. Los SIG como forma de pensar sobre los datos geográficos. Analista de datos y arquitectura de BDG: capacidad de entender un problema desde una perspectiva territorial y modelar una solución normalizada en una BDG. Arquitectura de IDE: capacidad de creación de Infraestructuras de Datos Espaciales.
  • 13. 13
  • 14. 14 Transmisión del Conocimiento
  • 15. 15 DATO – INFORMACIÓN - CONOCIMIENTO Las bases de datos juegan un papel trascendental en el proceso que permite transformar un dato en conocimiento. Dato: mediciones y magnitudes, ya sean cualitativas o cuantitativas, que representan atributos de un conjunto de variables observables, mesurables o estimables, de la realidad. E.g.: presencia de una especie en un punto, temperatura en ese punto Información: los datos relacionados y sometidos a análisis producen información. Por ejemplo: presencia media de esa especie en ese paraje; temperatura media anual Conocimiento: la información en acción, la información en movimiento, la información interrelacionada y puesta en práctica para un uso concreto constituye el conocimiento. Nivel máximo de abstracción de los datos, que nos permite intentar crear leyes científicas predictivas y descriptivas de los fenómenos observados. E.g.: se constata que el número de animales de una especie medio en ese punto se redujo al aumentar la temperatura. 41001002301
  • 16. 16 Idea Clave Una base de datos se encarga de ordenar los datos de forma que les podamos hacer preguntas y realizar análisis. Pero para que nos ofrezca las respuestas precisas y los resultados óptimos es fundamental diseñar bien previamente, y eso es lo único que no te enseñan en el curso: se aprende enfrentándote a muchos (cuantos más mejor) de casos.
  • 17. 17 Filosofía de los Seminarios Se hace este seminario porque uno de los miembros del CAESCG asistió al curso… (Carátula del curso de Granada) Cada curso desembocará en 1 seminario Cada nuevo conocimiento adquirido que tenga que ver con las T.I. se trasladará a los G.I. mediante la web (webminarios, tutoriales, blog). CONTAR MOVIDAS
  • 18. 18 Definiciones de Bases de datos El medio computerizado más potente y utilizado para la gestión de la información alfanumérica es la BASE DE DATOS: Una base de datos es la organización de una colección de datos que se interrelacionan, se comparten y se controlan" (G. W. y J. V. Hansen, "Diseño y administración de bases de datos", 1997) "Una base de datos es una colección de datos organizada de forma sistemática, de manera que un programa de ordenador puede consultarlos para ofrecer respuestas" (Wikipedia, 2006) De las definiciones anteriores extraemos que una base de datos debe... albergar datos según una estructura conveniente diseñada de antemano que propicie la interrelación de hechos para producir información; tener control sobre la naturaleza y formato de los datos que se incorporan a ella, de manera que se garantice la calidad de los mismos; controlar el acceso de diferentes perfiles de usuario a sus datos y estructura.
  • 19. 19 ¿Por qué son importantes? Son uno de los sectores de las ciencias de la computación más transversales y con más impacto global en nuestro día a día. Permite la creación de almacenes de datos distribuidos y multiconcurrentes. Propicia la computación distribuida. Enorme flexibilidad ante el planteamiento de problemas complejos. Mímesis de los procesos lógicos que ocurren en la realidad gracias a la modelización de sistemas reales. Últimas depositarias de los datos producto de procesos de recogida que pueden ser extraordinariamente costosos. Se encuentran en la base de la gran mayoría de las aplicaciones informáticas presentes en la administración y en todo tipo de organizaciones, independientemente de su tamaño. Guardan lo más preciado: los datos. Las aplicaciones van y vienen, pero los datos son para siempre.
  • 20. 20 Diseño de la base de datos Coger un PROBLEMA, una REALIDAD COMPLEJA. Por ejemplo, una biblioteca, un trámite administrativo o un proceso de recogida y análisis de muestras de campo. Estudiarla, sistematizarla y modelarla en una abstracción conceptual llamada MODELO DE BASE DE DATOS RELACIONAL Plasmar el MODELO DE BASE DE DATOS RELACIONAL anterior en un MODELO FÍSICO gracias a un programa de ordenador llamado SISTEMA GESTOR DE BASE DE DATOS, que a su vez funciona sobre una COMPUTADORA, para conseguir aprovechar la extrema capacidad de calculo y relación lógica de las computadoras para el almacenamiento, ordenación, gestión y análisis masivo y automático de datos.
  • 21. 21 Tareas del diseñador Son tareas del analista-diseñador: determinar cuales son las variables relevantes para describir la realidad que pretende analizar; determinar cual es el nivel de desagregación relevante para el problema que se tiene entre manos; determinar el formato en el que dichos datos deben ser codificados, para que la codificación de los mismos sea segura, sencilla y eficaz.
  • 22. 22 Un trabajo en equipo Suele ser un equipo multidisciplinar de expertos temáticos e ingenieros de software; Debe entender el problema y tratar con los que lo conocen para extraer toda la información necesaria para crear el modelo; Debe conocer la máquina, para adaptar el problema a un lenguaje que ésta entienda; Debe entender las necesidades de los usuarios finales: qué esperan del sistema y cómo se supone que deben interaccionar con la información. En resumen: debe poner los medios para expresar el problema en el lenguaje de la máquina para que sea entendido en lenguaje humano.
  • 23. 23 ¿Cómo abordamos el diseño? No se puede modelar lo que no se conoce. No existe una solución única para un problema de modelado, tan sólo existen soluciones convenientes. El problema nunca se soluciona a la primera, es un proceso iterativo, reiterativo y evolutivo que puede llegar a ser muy costoso en el tiempo. Se trabaja en el modelo, se somete a prueba, se corrige, se vuelve a probar... iterativamente. El problema ha de ser discutido con especialistas diferentes y visto desde todos los puntos de vista que se consideren necesarios. Es una labor de equipo. No se puede modelar con prisa. Es un proceso que hay que hacer con reposo. Hay que ser ordenado. Hay que darle un nombre bien descriptivo y significativo a los componentes del modelo y documentarlo profusamente. Debe ser elegante, legible y sencillo, hasta donde el problema lo permita, claro.
  • 24. 24 LOS PELIGROS Efecto “POYAQUE” NORMALIZACIÓN Falta de atomización Redundancia
  • 25. 25 ¿Cómo afrontamos el diseño? Existen multitud de metodologías de diseño-modelado. Usaremos un método iterativo de refinamiento por pasos, basado en la metodología de modelado de entidad-relación, en la que aplicaremos una serie de normas. Paso 1: Comprensión del problema: a efectos prácticos, muchas reuniones, mucho pensar y mucho papel garabateado. Paso 2: Identificación de los elementos del sistema y sus relaciones: a partir del paso 1, análisis y planteamiento inicial de los componentes básicos del sistema descrito. Paso 3: Iteraciones de normalización: el sistema es sometido a sucesivos ciclos de estudio, análisis y cambios hasta alcanzar un estado plenamente normalizado en el que todas las necesidades de información son satisfechas.
  • 26. 26 Paso 1: Comprensión del problema Sin comprender el problema no hay nada que modelar. Hay que describir el problema, los procesos y los elementos del sistema lo más detalladamente posible. Una técnica fundamental es escribirlo en papel, descriptivamente, exponiendo literalmente el problema. Esta descripción literal surge de un proceso de discusión con los especialistas temáticos. De este proceso de discusión se obtienen los siguientes productos, llamados en su conjunto Documentos de diseño: una descripción de los elementos, flujos, relaciones entre elementos y procesos que se dan dentro del sistema que se quiere modelar; un documento en el que se perfilan las necesidades de información que debe satisfacer el sistema, es decir, la lista de preguntas mínimas que el sistema debe ser capaz de responder de forma veraz.
  • 27. 27 Objetivos de la base de datos Albergar la información del problema a tratar en una forma conveniente para su tratamiento. Esta forma es un modelo entidad-relación que reproduce los flujos y la estructura de la información del problema real. Controlar la introducción de datos en la base, de forma que la información contenida en ella sea consistente, atómica y no redundante: consistente: la información almacenada no puede ser contradictoria entre sí; atómica: la información debe estar en el nivel de desagregación más conveniente; no redundante: un dato en concreto debe estar recogido en la base de datos una sóla vez, y no varias, so pena de incurrir en inconsistencias. Permitir el análisis y recuperación de datos en condiciones adecuadas y con flexibilidad.
  • 28. 28 ¿Qué hacemos con la base de datos? El diseño desemboca en un modo particular de almacenar y organizar los datos para que puedan ser utilizados con eficacia (base de datos). Para ello usamos un sistema gestor de base de datos (SGBD), un Software especializado en la creación, gestión, administración, utilización y mantenimiento de bases de datos. Ejemplos: PostgreSQL, Oracle, MySQL, OpenOffice Base, SQL Server, Access, etc. En conclusión: utilizamos bases de datos para poner orden allí donde no lo hay y propiciar de esta manera la resolución de preguntas y análisis sobre los datos que se recogen en nuestra actividad científico-técnica diaria.
  • 29. 29 Objetivos del SGBD Plantear la infraestructura software necesaria para apoyar todas las necesidades de uso y gestión de las bases de datos que contiene. Tareas de definición de datos. Creación de las estructuras de datos (modelos) que albergarán la información. Modelado visual. Lenguaje SQL / DDL (Data DefinitionLanguage). Tareas administrativas. Gestión de accesos, permisos, usuarios, cuotas, copias de seguridad, exportaciones, importaciones, encriptación, etc. Lenguaje SQL / DBA (DatabaseAdministration). Tareas de edición de datos. Inserción, modificación y borrado de datos. Control de concurrencia por transacciones. Lenguaje SQL / DML (Data ManipulationLanguage). Tareas de recuperación y consulta de datos. Creación de consultas sobre los datos. Lenguaje SQL / DML. Ordenación (índices) de los datos y recuperación selectiva de los mismos. Tareas programáticas avanzadas. Creación de programas complejos dentro de la base de datos para la manipulación avanzada de datos. Lenguajes como PL/SQL, PL/pgSQL, SQL/PSM, T-SQL, Java, etc..
  • 30. 30 Los SGBD ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente. FOSS: Free and Open Source Software, software libre y abierto.
  • 31. 31 ¿Qué diferencia hay entre una base de datos convencional y una base de datos geográfica? La información geográfica tiene una doble componente: temática y espacial. La vertiente temática caracteriza las propiedades de los objetos geográficos. La vertiente espacial caracteriza la geometría (extensión, forma, orientación, etc.) de los objetos geográficos. El diseñador de bases de datos geográficas debe ser consciente en todo momento de este hecho para explotarlo en beneficio del modelo. Debe siempre cuestionarse la naturaleza geográfica de los componentes del sistema que pretende modelar. “Para trabajar con un SIG es necesario en primer lugar introducir la información geográfica en un sistema de información y realizar una modelización de la realidad” (Lantada y Núñez, 2002).
  • 32. 32 TEMÁTICO propiedades, atributos de los objetos espaciales ESPACIAL elemento del mundo real localizado en el espacio Componentes del datos geográfico en un SIG
  • 33. 33 Tipo de objeto geográfico Línea Punto Polígono La informaciónpuede ser estructuradasegún el tipo de objetogeográficocomopuntos, líneasypolígonos. Puntos – 0 dimensiones, descrito por par de coordenadas x,y Líneas – 1 dimensión, descritas por sucesión de coordenadas puntuales Polígonos - 2 dimensiones, descritos por sucesión cerrada de coordenadas puntuales Volúmenes – 2.5 / 3 dimensiones, descritos por superficie triangulada
  • 34. 34 El concepto de capa Cada una de las variables incorporadas al SIG, que almacena un tipo de objeto espacial (punto, línea, polígono) Todas con el mismo sistema de referencia espacial, lo que permite realizar superposiciones entre capas, cálculo de distancias, etc.
  • 35. 35 En definitiva, los campos y los tipos de datos geométricos, la información que contienen y el uso que se hace de ellos constituyen (entre otras muchas cosas) la marca de identidad de las bases de datos geográficas.
  • 36. 36 Simplificando “De una manera más inmediata un SIG se puede contemplar como un conjunto de mapas de la misma porción del territorio, donde un lugar concreto tiene la misma localización (las mismas coordenadas) en todos los mapas incluidos en el sistema de información. De este modo, resulta posible realizar análisis de sus características espaciales y temáticas para obtener un mejor conocimiento de esa zona” (Bosque, 1997).
  • 37. 37 Topología Las entidades geométricas de los modelos geográficos, sólo por el hecho de existir sobre el territorio, ya comparten una clave primaria común a todas ellas, independiente totalmente de su naturaleza temática: el espacio geográfico. Por lo tanto, los hechos territoriales pueden ser modelados como entidades geométricas en los modelos de bases de datos geográficas que: Tienen una caracterización temática gracias a un conjunto de campos. Poseen uno o varios campos geométricos donde se alberga un conjunto de puntos, líneas y polígonos que describen la realidad física del hecho territorial. La topología es el conjunto de las relaciones espaciales impuestas por la función distancia que se dan entre los objetos que están sobre el espacio geográfico.
  • 38. 38 Interoperabilidad Las BDG son una forma de base de datos extremadamente poderosa puesto que juegan con una clave primaria universal compartida por todas las entidades geométricas existentes en cualquier base de datos geográfica del mundo: EL ESPACIO. Esta clave primaria universal permite conectar información contenida en distintas bases de datos a partir del vínculo topológico que comparten las geometrías en ellas contenidas. Por todo ello, es deber de los diseñadores de BDG aprovechar al máximo las posibilidades que nos brinda el modelado geográfico: haremos nuestros datos mucho más versátiles y por tanto mucho más interoperables con otras bases de datos vecinas, actuales y, sobre todo, futuras.
  • 39. 39 Similitudes y diferencias con las BD no geográficas Básicamente, como idea central, hay que tener claro que: Las BDG son un subconjunto especializado de las BD no geográficas. Por tanto, en esencia son bases de datos relacionales a todos los efectos. Están planteadas, en la mayoría de los casos, como extensiones a los SGBD que incrementan sus capacidades para hacer posible el almacenamiento, edición, manipulación y recuperación de información geométrica, siempre con criterios topológicos. Dicho esto: las bases de datos geográficas son bases de datos relacionales normales en lo que a sus datos alfanuméricos se refieren; se diseñan y se conciben igual que las no geográficas, pero teniendo en cuenta las peculiaridades del modelado geográfico ya comentadas; se gestionan igual que las no geográficas, con las peculiaridades impuestas por el tratamiento de los datos vectoriales; se explotan igual que las no geográficas, con el añadido de poseer SQL espacial; físicamente, se basan en los mismos sistemas de hardware. En cuanto al software, es el mismo, con los añadidos propios destinados a la gestión de las geometrías.
  • 40. 40 Peculiaridades del modelo geográfico En esencia, el modelado geográfico sigue los mismos pasos y fases que el modelado relacional convencional. El diseñador geográfico debe tener en cuenta, sin embargo, que: Las entidades pueden tener campos para albergar atributos geométricos (puntos, líneas, polígonos) con tipos de datos adaptados a la gestión de geometrías. Entre las entidades con atributos geométricos se pueden establecer relaciones topológicas, que pueden llegar a sustituir a relaciones convencionales y/o coexistir con las mismas (aunque se corre el peligro de caer en redundancia). El diseñador geográfico debe tener en cuenta todas las reglas de normalización ya explicadas en el caso del modelado convencional, pero además, debe asegurarse de estudiar y poner las bases para garantizar la integridad topológica de los datos geométricos.
  • 41. 41 ¿Por qué diseñar bases de datos relacionales geográficas? Porque posibilitan la creación de modelos geográficos basados en el paradigma entidad-relación imposibles de realizar con sistemas basados en ficheros con larga tradición en el mundo SIG, como los workspace GRASS y ArcInfo o las shapes. Porque es la mejor manera de conseguir multiconcurrencia a datos geográficos. Porque es el medio ideal para crear sistemas distribuidos de información geográfica. Porque es un componente central en las IDE. Porque posibilita el análisis de los datos mediante SQL tradicional y espacial. Porque existe falta de expertos temáticos con formación en el diseño de bases de datos geográficas: es una actividad crítica y que siempre será necesaria.
  • 42. 42 Algunos sistemas de bases de datos geográficas
  • 43. 43 PostrgreSQL Base de datos FOSS más importante junto a MySQL ACID: Multiconcurrente, control de transacciones, arquitectura cliente - servidor Lenguajes C / C++ Versión actual: 9 Linux, FreeBSD, Solaris, Mac OS, Windows Antecesores tecnológicos: Ingres (1982, Universidad de Berkeley) Lenguajes de programación internos: Pl/pgSQL, Pl/Perl, Pl/Ruby, Pl/Python Front-ends de gestión y administración: PgAdmin3 (Linux, Windows), Kpogre (Linux), phpPgAdmin (web), psql (Linux, Windows) ACID: Atomicity, Consistency, Isolation, Durability. La base de datos tiene un control de transacciones correcto, por lo que es multiconcurrente. FOSS: Free and Open Source Software, software libre y abierto.
  • 44. 44 PostGIS Programa adicional (extensión) instalable sobre PostgreSQL para gestionar información geográfica Lenguajes C / C++ Versión actual: 1.4.5 Desarrollo liderado desde 2000 por la empresa canadiense RefractionsResearch Basado en librerías OS adicionales: GEOS: motor topológico Proj4: trabajo con proyecciones cartográficas Extensiones a PostGIS: PgRoute (análisis de redes)
  • 45. 45 PostGIS Características: Gestión y almacenamiento de geometrías vectoriales Gestión de relaciones topológicas entre geometrías (GEOS) Reproyecciones (Proj4) Utilización de varios formatos: WKT (WellKnown Text, OGC), WKB (WellKnownBinary, OGC), GeoJson, GML (Geographic Mark-up Language, OGC), KML (Keyhole Mark-up Language, Google) Clientes: Servidores de información geografica (para IDE): MapServer, GeoServer GIS OS de escritorio: Quantum GIS / GRASS, Kosmo, gvSIG, uDig, OpenJump GIS propietarios de escritorio: ManifoldSystem, MapInfo, ArcGIS (a duras penas, con ZigGIS o ArcServer / ArcSDE)
  • 46. 46 Instalación PostgreSQL: la base de datos sobre la que se asienta PostGIS. PostGIS: extensión espacial. psql: cliente de línea de comando de PostgreSQL. pgAdmin3: cliente GUI de PostgreSQL. QGIS: cliente pesado de escritorio GIS, muy útil para el trabajo con PostGIS. Visual Studio 2008 Express Edition: necesario para compilar ZigGIS. ZigGIS: extensión para ArcGIS para conectar con PostGIS.
  • 48. 48 Carácter distribuido de la información geográfica
  • 49. 49 OGC Open GeospatialConsortium www.geoespatial.org Organización internacional no lucrativa cuyo fin es la definición de estándares abiertos e interoperables dentro de los SIG. Creada en 1994 agrupa a + de 250 organizaciones públicas y privadas Persigue acuerdos entre las diferentes empresas del sector que posibiliten la interoperación de sus sistemas de geoprocesamiento y facilitar el intercambio de información geográfica en beneficio de los usuarios. Estándares más importantes surgidos del OGC: GML (GeographicMarkupLanguage) WMS (Web MapService) WFS (Web FeatureService) WCS (Web CoverageService) Catalogue Service
  • 50. 50 Infraestructura de Datos Espaciales (IDE) Una IDE es un sistema informático integrado por un conjunto de recursos (catálogos, servidores, programas, datos, aplicaciones, páginas Web,...) dedicados a gestionar Información Geográfica (mapas, ortofotos, imágenes de satélite, topónimos,...), disponibles en Internet, que cumplen una serie de condiciones de interoperabilidad (normas, especificaciones, protocolos, interfaces,...) que permiten que un usuario, utilizando un simple navegador, pueda utilizarlos y combinarlos según sus necesidades. Organización de los datos e información. ¿Donde están? ¿Quién los tiene? ¿A quién pertenecen? ¿Cuándo y como se obtuvieron?
  • 51. 51 Componentes de una IDE Datos Datos de referencia: Constituyen el marco de referencia que proporciona el contexto geográfico a cualquier aplicación. Sistema de Coordenadas. - Cuadrículas Geográficas. - Nombres geográficos. Unidades Administrativas. - Redes de Transporte. - Hidrografía. - Lugares Protegidos. Elevación. - Identificadores de Propiedad. - Parcelas Catastrales. - Cubierta Terrestre. Ortoimágenes. Datos temáticos: Incluyen valores cualitativos y cuantitativos que se corresponden con atributos asociados a los datos de referencia como por ejemplo: vegetación, geología, clima, tráfico, contaminación, etc. Metadatos: Hay que diferenciar claramente los datos de los metadatos: los datos describen el mundo real y son un modelo de la realidad; los metadatos describen los datos y se utilizan para tomar decisiones acerca de los mismos. Servicios Servicio de Mapas en Web (WMS) Servicio de Fenómenos en Web (WFS) Servicio de Coberturas en Web (WCS) Servicio de Catálogo en Web
  • 52. 52 Principios Comunes Marco Institucional: Definición de estándares: El establecimiento de normas a las que deberá ajustarse la información geográfica, los intercambios de esta y la interoperación de los sistemas que la manejan. Tecnología: El establecimiento de la red y mecanismos informáticos que permitan: buscar, consultar, encontrar, acceder, suministrar y usar los datos espaciales o geográficos. Como por ejemplo permitir incorporar los metadatos organizados en catálogos y ofrecerlos en la red a través de servidores. Política de datos: El establecimiento de las políticas, alianzas y acuerdos de colaboración necesarios para aumentar la disponibilidad de datos espaciales y compartir los desarrollos tecnológicos.
  • 53. 53 En busca de la interoperabilidad