Trabajo fin de máster, lucas sevilla garcía, Modelo climático en lenguaje R

3,356 views

Published on

Trabajo sobre el desarrollo de un modelo climático para estimar la precipitación utilizando el lenguaje de programación R.

Published in: Education
1 Comment
0 Likes
Statistics
Notes
  • Be the first to like this

No Downloads
Views
Total views
3,356
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
72
Comments
1
Likes
0
Embeds 0
No embeds

No notes for slide

Trabajo fin de máster, lucas sevilla garcía, Modelo climático en lenguaje R

  1. 1. TRABAJO FIN DE MÁSTER MODELIZACIÓN DE VARIABLES CLIMÁTICAS E INTEGRACIÓN CON INFORMACIÓN AMBIENTAL Lucas Sevilla GarcíaMáster Universitario en Tecnologías de la información geográfica para la ordenación del territorio: sistemas de información geográfica y teledetección Noviembre de 2009 Departamento de Geografía y Ordenación del Territorio UNIVERSIDAD DE ZARAGOZA
  2. 2. ResumenLos procesos de desertización pueden identificarse mediante una pérdida de capacidad de los ecosistemas paraproducir biomasa. El presente trabajo es una contribución al sistema de monitoreo de la eficiencia con la que lavegetación usa la precipitación para producir biomasa. Este indicador puede utilizarse dentro de sistemas deseguimiento de áreas protegidas semiáridas para identificar procesos de desertización. En concreto, este trabajopersigue automatizar la asimilación y procesamiento de datos climáticos mensuales para generar mapas climáticosa partir de una red de estaciones meteorológicas alrededor del Parque Natural de Cabo de Gata-Níjar (Almería).El método consiste, en primer lugar, en una depuración y homogeneización de los datos climáticos y, acontinuación, en interpolaciones espaciales de los datos homogeneizados. Los datos de entrada necesarios son lasseries temporales de las estaciones meteorológicas presentes en el área de influencia del parque y un modelo digitalde elevaciones. El modelo utiliza regresiones múltiples y métodos de interpolación espacial de forma automáticamediante el lenguaje R de programación estadística. Como resultado, se obtienen una serie temporal de mapasmensuales de precipitación y temperatura. No obstante, se identificaron pasos en los que se podría mejorar aunmás el proceso de automatización y aun es necesario acoplarlo con las series temporales de imágenes deproductividad primaria del parque natural.Palabras clave: Cabo de Gata; interpolación; automatización; lenguaje R; mapa mensual de precipitación. AbstractDesertification processes can be identified in an ecosystem by its dimished ability to produce biomass. Thefollowing work is a contribution to the monitoring system that measures the efficiency of the vegetation in usingrainfall to produce biomass. This indicator can be included in monitoring systems in protected semi-arid areas tospot desertification processes. This work aims to automate the acquisition and processing of monthly climate data togenerate climate maps from a network of weather stations surrounding the Cabo de Gata-Níjar Nature reserve(Almería). The method comprises the following: firstly, the climate data are purged and homogenised and, secondlythe homogenised data are spatially interpolated. The required input data come from the temporal sequencesrecorded by weather stations located within the influence area of the reserve and a digital elevation model. As aresult, a temporal sequence of monthly precipitation and temperature maps is obtained. Nevertheless, the steps inwhich the automation process could be improved were identified and the temporal sequences of primaryproductivity images from the nature reserve are yet to be coupled with the system.Key words: Cabo de Gata; interpolation; automation; R language; monthly precipitation map.
  3. 3. Índice1. Introducción ........................................................................................................... pág. 12. Documentación....................................................................................................... pág. 2 2.1. Área de estudio.............................................................................................. pág. 2 2.2. Monitorización: Concepto y aplicación ........................................................ pág. 5 2.3. Eficiencia en el uso de agua de lluvia (RUE)................................................ pág. 73. Objetivos ................................................................................................................ pág. 84. Material .................................................................................................................. pág. 105. Metodología ........................................................................................................... pág. 11 5.1. Datos climáticos ............................................................................................ pág. 11 5.2. Homogeneización de datos............................................................................ pág. 14 5.2.1. Escala temporal ................................................................................. pág. 14 5.2.2. Inicio y final de la serie temporal...................................................... pág. 15 5.2.3. Ausencia de datos.............................................................................. pág. 15 5.3. Estructura base de datos climáticos............................................................... pág. 18 5.4. Modelización de variables climáticas ........................................................... pág. 19 5.4.1. Variables dependientes...................................................................... pág. 20 5.4.2. Variables independientes................................................................... pág. 20 5.4.3. Métodos de interpolación .................................................................. pág. 21 5.5. Automatización del modelo climático........................................................... pág. 25 5.5.1. Estructura del proceso de automatización......................................... pág. 25 5.5.2. Automatización en la importación de datos ...................................... pág. 26 5.5.3. Automatización en el proceso de interpolación ................................ pág. 27 5.5.3. Automatización en la exportación de mapas climáticos ................... pág. 376. Resultados .............................................................................................................. pág. 387. Conclusiones .......................................................................................................... pág. 448. Bibliografía............................................................................................................. pág. 499. Anexo ..................................................................................................................... pág. 51
  4. 4. 1. INTRODUCCIÓN La protección de los ecosistemas del planeta es un tema que en las últimas décadas ha idoadquiriendo un mayor protagonismo por parte de la sociedad. Hoy en día, en cualquier toma dedecisión o acción se tiene en cuenta al medio ambiente, no solo por el impacto que producirásobre este, sino por que cualquier acción sobre el medio ambiente genera una respuesta por suparte que afecta a la sociedad. El mayor conocimiento del planeta, en concreto de sus distintosecosistemas, ha descubierto la dependencia que existe entre hombre y el planeta. Los servicios yrecursos que generan los ecosistemas son los que condicionan la calidad de vida humana y el maluso o aprovechamiento de estos sistemas y recursos, genera un efecto cadena que deteriora lacalidad del planeta y de la sociedad. Es por ello que preservar la variedad de ecosistemas del planeta resulta importante paraasegurar que generaciones futuras puedan hacer uso de los servicios y recursos del planeta. Lasdistintas figuras de protección establecidas en todos los países van encaminadas a conseguirmantener un equilibrio entre hombre y naturaleza, sin embargo, delimitar determinadas zonas delplaneta con una etiqueta de protección no es suficiente para que estos ecosistemas sobrevivan. Yes que, los ecosistemas no actúan como unidades independientes, sino que, como un tejido vivo,esta conectado a otros ecosistemas y por lo tanto, se ve alterado por cualquier influencia externa.Así, la comunidad científica, en las últimas décadas, realiza un gran esfuerzo con el fin deobtener un mayor y mejor conocimiento del medio natural. A mayor información y compresióndel funcionamiento de los ecosistemas, mejor y más eficiente será la forma de actuar sobre losecosistemas. Así, el seguimiento de las áreas protegidas resulta imprescindible si se desea quelos ecosistemas de la tierra perseveren en el futuro y mantengan su calidad. Los sistemas de seguimiento que existen en la actualidad son de todo tipo pero todospersiguen el mismo objetivo, que es el de profundizar en el conocimiento del engranaje delfuncionamiento de los ecosistemas. La eficacia de muchos de estos sistemas de seguimientoradica en el uso de herramientas de gran potencial como son los sistemas de informacióngeográfica (a partir de ahora SIG) y una ciencia como es la teledetección. El uso de imágenes desatélite acompañadas de SIG y teledetección ha facilitado el trabajo de la comunidad científicaen numerosos campos, ya que permite ajustar la escala espacial y temporal según la necesidaddel trabajo, lo que, por ejemplo en casos de seguimiento de grandes extensiones ha sido esencial.La importancia que ha adquirido la teledetección y SIG en el conocimiento del planeta es tal, quese ha convertido en un pilar básico a la hora de desarrollar cualquier plan de seguimiento yactuación, ya que por la información que proporcionan las imágenes de satélite, ya no solopermiten una mejor comprensión de cómo actúan los ecosistemas, si no que además, facilita latoma de decisiones, de tal forma que cualquier actuación sobre los ecosistemas sea lo más eficazposible evitando repercusiones negativas. El trabajo presente en esta memoria es un ejemplo del uso de los Sistemas de InformaciónGeográfica y la teledetección como herramientas de seguimientos de áreas protegidas con elobjetivo de construir un sistema sencillo y económico que se encargue de almacenar variadainformación sobre el área protegida del Parque Natural del Cabo de Gata-Níjar y mediantemodelos de estimación de variables e índices analice la información de entrada, proporcionandouna serie de resultados que serán útiles a la hora de crear un plan de conservación o actuaciónsobre este área protegida. 1
  5. 5. 2. DOCUMENTACIÓN2.1. Área de estudio El Parque Natural Marítimo-Terrestre de Cabo de Gata-Níjar, es un espacio protegidosituado en la costa este de la provincia de Almería. El buen estado de conservación del espacioterrestre (37.500 hectáreas) y sus extraordinarias características naturales, tanto geológicas comobiológicas, hicieron que Cabo de Gata fuese declarado Parque Natural en 1987, por la Junta deAndalucía. En 1995, la secretaría General de Pesca Marítima (SGPM), del Ministerio deAgricultura, Pesca y Alimentación (MAPA), declaró la zona como Reserva Marina. En 1997 laUNESCO declaró el espacio como Reserva de la Biosfera y en 2001, dentro del Convenio deBarcelona, su parte marina ha sido incluida dentro del listado de Zonas Especialmente Protegidasde Importancia para el Mediterráneo (ZEPIM) (Moreno Lampreave, 2001). En el año 2003 seclasificó como Zona de Especial Protección para Aves (ZEPA) y en el año 2006 fue declaradoGeoparque Europeo y Geoparque Mundial de la UNESCO. Ha recibido también la mención deLugar de Interés Comunitario de la Red Natura 2000. Todas estas distinciones ponen demanifiesto el alto valor de su patrimonio natural (Mendoza, 2008). Figura 1. Localización del Parque Natural del Cabo de Gata-Níjar (Almería). 2
  6. 6. En cuanto a su condición de espacio marino protegido, se trata del más extenso delcontinente europeo declarado sobre la costa continental. El área marina protegida como ParqueNatural de Cabo de Gata-Níjar tiene más de 60 Km. de longitud, con una anchura de una milladesde la costa, y una superficie total de 12.000 hectáreas (ha) (Moreno Lampreave, 2001). Es un territorio afectado por un vulcanismo neógeno que se desarrolló en la franja litoralque va desde el Cabo de Gata (Almería) hasta el cabo de Palos (Murcia), y por una falla dedesgarre a nivel cristal conocida como “accidente de Carboneras”. El parque presenta dos zonas bien diferenciadas: una montañosa, en forma de alineacióncostera de dirección SO-NE, denominada sierra del Cabo de Gata, y otra constituida por colinasy llanuras que recibe el nombre de Campos de Najar (Ferre & Senciales, 2001).Climatología El levante de la provincia de Almería se caracteriza por ser una de las zonas más áridas deEspaña. La ubicación de la provincia en el ámbito meridional de la Zona Templada del OesteEuropeo, implica un régimen térmico bastante dulcificado, unos totales pluviométricos bastantebajos y una alternancia climática estacional bastante contrastada. Por otro lado, la posición de laprovincia de Almería en el borde oriental de las Cordilleras Béticas, le sitúa a sotavento de laCirculación Zonal de Poniente, recibiendo de forma muy débil las precipitaciones procedentesdel Atlántico (Capel, 1990). El clima es de tipo mediterráneo, con acusada sequía estival y, frecuentemente invernal. Lasprecipitaciones registradas rondan en una media de 200 mm. al año; lo que se refleja en unpaisaje ocre que da un aspecto semidesértico al territorio. A pesar de esta escasez de precipitaciones, hay que tener en cuenta las criptoprecipitaciones(condensación por nieblas fundamentalmente, y el hecho de que la elevada humedad ambientalpuede hacer descender la evapotranspiración, por lo que la disponibilidad de agua para lasplantas es mucho mayor que lo que aparenta (Martínez Lirola et al, 1997). Las lluvias, aparte de ser escasas, son en forma de aguaceros violentos; lo que conlleva auna escorrentía hídrica superficial espasmódica con temidas crecidas y acusados estiajes, siendoesto un elemento fundamental en el modelado del relieve y del paisaje de la región. El contacto directo de la provincia con el Mediterráneo a lo largo de un frente costero demás de 200 Km., incide en la dulcificación de las temperaturas a través del mecanismo de brisasy en la configuración estacional del régimen de precipitaciones, con sus máximos durante el finaldel verano, otoño y primavera. La temperatura media anual muestra valores uniformes y altos en el litoral, oscilando entre17º y 21º. Las temperaturas mínimas ronda los 14º y las temperaturas máximas medias rondanlos 21º (Capel, 1990). 3
  7. 7. Geología y Edafología Geológicamente la región es parte integrante de las cordilleras béticas. La zona del ParqueNatural presente una gran extensión de afloramientos de rocas volcánicas limitados por unsistema de fracturas NE-SW. La composición litológica del Parque Natural se caracteriza por una presencia dominante derocas volcánicas. Este tipo de rocas pertenecen al volcanismo post-orogénico. Se trata,principalmente, de un volcanismo calcoalcalino, aunque hay algo de volcanismo potásico ybasáltico. Se data entre el mioceno medio y el plioceno inferior. Los tipos principales de rocasson predominantemente sódicas. Otros materiales presentes en el área son arenas, areniscas y margas y en menor medidaformaciones conglomeráticas, que pueden ser de tres tipos: - Conglomerados, arcillas y limos, de carácter continental, con espesores de 15 a 40 metros. - Conglomerados, arenas y limos con canales discordantes de los primeros y potencia de la formación de 400 a 500 metros. - Depósitos continentales de conglomerados y arenas poco cementados, con elementos angulosos y heterómetricos, y con potencia desde 80 hasta unos pocos metros. La diversidad litológica no siempre se corresponde con la edafológica. La aridez disminuyeel lavado de sales en tal medida, que muchos suelos originados sobre rocas silíceas sonfrancamente básicos, mientras que muchos otros sufren acusados procesos de salinización. Lossuelos dominantes en el Parque Natural son litosoles, xerosoles lúvicos, cálcicos, fluvisolescalcáreos e inclusiones de regosoles calcáreos y fluvisoles calcáreos (Martínez Lirola et al,1997).Flora En el ámbito del Parque, y en lo que al medio terrestre se refiere, se han citado alrededor de1.000 taxones vegetales cormofíticos, a los que hay que añadir un número considerable detalófitos reconocidos. En el medio marino existen tres especies fanerógamas y unas 260 de algas(Martínez Lirola et al, 1997). Las condiciones de extrema aridez y falta de precipitaciones, un sustrato predominantentevolcánico, y una influencia marina notable, han hecho de la flora de Cabo de Gata una de las másnotables de Europa. La vegetación, carente de estrato arbóreo de forma natural, se caracteriza porla dominancia de palmitos (Chamaerops humilis) y de arbustos con fuertes adaptaciones a laxericidad, como la cornicabra (Periploca laevigata). Por otra parte existen numerosos ejemplosde especies de origen africano que en esta zona encuentran las únicas o las mejores poblacioneseuropeas, como el azufaifo (Ziziphus lotus), gran arbusto pinchoso de las costas bajas y arenosas,y por otra numerosos endemismos, algunos de ellos exclusivos, como el dragoncillo del Cabo(Antirrhinum charidemi). Los fondos marinos están dominados por fondos blandos, ya sean dearena, ya sean de praderas de fanerógamas marinas. La especie característica de estos fondos esla Posidonia oceanica (Moreno Lampreave, 2001). 4
  8. 8. Fauna Hasta el momento se ha descrito alrededor de 1.600 especies de invertebrados. Hay una ricaavifauna donde destacan aves migratorias como son el flamenco rosado (Phoenicopterus ruber),o aves propias de la zona como es el halcón peregrino (Falco Peregrinus). En el medio marino se conocen más de 1.350 especies marinas. Se encuentran algunosgrupos con una buena representación general, como en las algas, poliquetos, los moluscos y losdecápodos, mientras que en otros grupos es muy baja, como en distintos grupos de gusanos, enpequeños crustáceos y en briozoos. Entre los vertebrados, los peces forman el grupo más numeroso y diversificado; se hancitado unas 150 especies, donde destacan el salmonete de roca (Mullus surmulletus), la lecha(Seriola dumerilii) y al mero (Epinephelus marginatus). En reptiles, sólo se conocen dos especies, la tortuga boba (Caretta caretta) y la tortuga laúd(Dermochelys coriacea). Entre los cetáceos, destacan por su abundancia el delfín común (Delphinus delphis), eldelfín listado (Stenella coeruleoalba) y el delfín mular (Tursiops truncatus) (MorenoLampreave, 2001).2.2. Monitorización: Concepto y aplicación El monitoreo es una serie intermitente (regular o irregular) de observaciones en el tiempo,llevado a cabo para mostrar la extensión de conformidad entre una formulación estándar o gradode desviación y una norma esperada (Hellawell, 1991). Esta definición de monitorización expone lo que se pretende conseguir en el caso particulardel Parque Natural Cabo de Gata. La monitorización del Parque Natural Cabo de Gata, es unproyecto propuesto por la Oficina del Parque Natural Cabo de Gata-Níjar (Almería), laConsejería de Medio Ambiente de la Junta de Andalucía y la Universidad de Almería en elConvenio de Cooperación “Desarrollo rural y la sostenibilidad ambiental: diseño y ejecución deprogramas de seguimiento”. Este sistema persigue como objetivo obtener información sobre elparque en cuanto a su situación actual, variación en el tiempo y estado de sus ecosistemas,mediante un seguimiento con imágenes de satélite, que permitan vigilar el parque y en caso deactuar, facilitar la toma de decisiones (Oyonarte et al, 2008). Como muestra la figura 2, la estructura de este proceso es sencilla, y se divide en tresniveles. El primer nivel, que constituye la base del sistema es la recopilación de información endistintos campos, como son la cartografía del parque, imágenes de satélite y datos climáticos(precipitación o temperatura entre otras variables). A destacar en este paso, la informaciónprocedente de las imágenes de satélite, que proporcionan información sobre la ProductividadPrimaria Neta (PPN) en forma de índice verde de vegetación. 5
  9. 9. Figura 2. Estructura del sistema. Se muestran los 3 niveles en los que se ha diseñado el sistema de monitoreo. Un primer nivel de adquisición de datos de distintas fuentes. Un segundo nivel de almacenamiento de datos y un último nivel de análisis de resultados. El segundo nivel consiste en almacenar los datos obtenidos en bases de datos. Las bases dedatos son almacenes que registran los datos, ofreciendo una estructura y presentación de fácilcompresión, de tal forma, que cualquier persona que acceda a una base de datos, sea capaz deinterpretar y hacer uso de estos datos. El paso intermedio entre el segundo y tercer nivel, es un proceso reservado para lageneración de modelos, que a partir de los datos iniciales, permitan realizar estimaciones,tendencias de los datos o encontrar anomalías. Estos resultados de los modelos se recogen en elúltimo nivel. Este nivel se encarga de analizar los resultados ofrecidos por los modelos con el finde facilitar la toma de decisiones. Sin duda la información más importante dentro del sistema de monitoreo son las imágenesde satélite, su origen y tratamiento resultan ser aspectos importantes en este paso. Las imágenesproceden del sensor MODIS (Moderate Resolution Imaging Spectroradiometer), que seencuentra en el satélite Terra. De los productos ofertados, se utiliza la serie temporal del EVI(Enhanced Vegetation Index), que es un índice de vegetación obtenido de las imágenes desatélite. La resolución que ofrecen las imágenes MODIS son suficientes para el trabajo que sepretende llevar a cabo, pero sin duda, el hecho de que se puedan obtener las imágenes de formagratuita desde un servidor, favorece aún más esta elección, ya que uno de los objetivos delsistemas monitoreo es que sea económico. El índice EVI es uno de los más comunes calculados a partir de observaciones satelitalespara el seguimiento de la vegetación, y está directamente relacionado con el índice de área foliaral basarse en la propiedad espectral de la vegetación verde de absorber diferencialmente laradiación fotosintéticamente activa. 6
  10. 10. El sensor MODIS combina una resolución espacial media (tamaño de píxel <6 ha) y unaalta resolución temporal (frecuencia de observación prácticamente diaria), con procesos degeoreferenciación, correcciones atmosféricas y detección de nubosidad notablemente mejoradosrespecto a los utilizados anteriormente por otros sensores (Oyonarte et al, 2008). Otro aspecto a destacar en este sistema es la automatización en los procesos de obtención ycálculo de información. Lo que se busca con la automatización, es hacer aún más sencillo yeconómico este sistema de monitoreo, en donde un mínimo número de personas seríannecesarias para controlar este sistema. La automatización estará presente en los dos primerosniveles, desde la adquisición y depuración de datos hasta la presentación de resultados, dejandoel último nivel a un personal encargado de analizar los resultados arrojados por el sistema. En el caso de las imágenes de satélite, la automatización va encaminada a la obtención yalmacenamiento de estas imágenes. Por ello, se ha construido un modelo usando el softwareENVI, el cual se encarga de descargar las imágenes, a las que posteriormente aplica un filtro decalidad, seleccionando aquellas imágenes que mejor calidad presenten. Finalmente, las imágenesseleccionadas son almacenadas en una base de datos para su posterior uso.2.3. Eficiencia en la utilización del agua de lluvia (RUE) Aunque la tendencia de la degradación de suelos en zonas áridas no ha sido evaluada de unaforma local, recientemente han surgido metodologías que permiten estudiar, a un nivel local,como se ven afectados los suelos por la degradación sobre todo en zonas áridas. El mayorobstáculo para conocer la tendencia de la productividad de un suelo en zonas áridas, es la fuertedependencia de la productividad primaria neta sobre la lluvia, junto con la irregularidad deprecipitaciones anuales que presentan estas zonas en concreto. Estas metodologías pretendendiferenciar los cambios producidos en la productividad primaria neta entre la actividad delhombre y la lluvia. Un simple método para controlar el efecto de la lluvia es usando el índiceRUE (Rain Use Efficiency) y seguir su comportamiento a través de un periodo de tiempo. Este índice relaciona la producción primaria neta (PPN) y la precipitación anual. LeHouérou, in 1984, fue quien propuso este indicador como una forma útil de medir laproductividad de un ecosistema mediante un uso eficiente del agua en zonas áridas. En general, el índice RUE tiende a decrecer espacialmente al aumentar la aridez y alaumentar la evapotranspiración potencial (ETo), ambos parámetros están relacionados con elbalance hídrico de un ecosistema. Para un ecosistema dado, varios estudios han demostrado un descenso del índice RUE alproducirse un aumento de la precipitación anual. Además, estos estudios sugieren que el índiceRUE se ve afectado por varios factores incluyendo la composición de la vegetación, la condicióndel suelo y limitaciones biogeoquímicas (Yongfei Bai et al, 2008): 7
  11. 11.  Aquellas comunidades con una mayor diversidad en especies vegetales y en grupos funcionales presentan un mayor índice RUE a través de un aumento de la productividad primaria neta (PPN) y una menor variabilidad temporal a través de una combinación de factores de selección (comunidades con mayor diversidad de especies tienden a tener mayor probabilidad de tener especies que sean más productivas) y factores complementarios (comunidades más diversas tienden a ser más productivas ya que hay un mayor uso de recursos y una mayor interacción sinérgica entre especies.  La convivencia con especies de plantas y grupos funcionales dominantes puede afectar tanto a la productividad primaria neta como al índice RUE de forma importante. Por ejemplo, las praderas dominadas por especies mesofíticas son más productivas y menos variables que aquellas praderas dominadas por especies xerofíticas o arbustos.  La productividad primaria neta en ecosistemas áridos y semiáridos esta limitada por la disponibilidad de nitrógeno, factor limitante junto con la disponibilidad de agua en estás regiones. Es más, características del suelo como la textura, permeabilidad o grosor tienen efectos importantes en el índice RUE. Aunque la metodología basada en la RUE resulta bastante útil para valorar la productividadde un ecosistema y también relacionad, la desertificación, este índice está limitado por otrosaspectos que no han recibido suficiente atención hasta el momento (Verón et al, 2006):  Por un lado esta la falta de un área de referencia. La desertificación es el resultado de la comparación de una situación pasada con una situación actual. Sin una referencia pasada que permita comparar la situación actual de una zona, los resultados referentes a la desertificación pueden no ser correctos. Así pues, los cambios en la RUE en un determinado sitio pueden ser indicadores para medir la desertización siempre que el área de referencia no haya cambiado su estado. Por lo tanto, seleccionar un área de referencia es un aspecto importante a tener en cuenta, como es el caso de áreas comparables a Parques Naturales o áreas protegidas.  La desertificación no implica necesariamente una reducción en la Productividad Primaria Neta. Algunos casos de desertificación no conllevan una reducción en la Productividad Primaria Neta, lo cual convertiría la RUE en un indicador muy pobre. El uso de este indicador en el Parque Natural de Cabo de Gata-Níjar, resulta ideal sitenemos en cuenta las condiciones de aridez en las que se encuentra el Parque. La disponibilidadde información de precipitación y PPN a una adecuada escala temporal y espacial permiteanalizar y valorar el estado en el que se encuentran muchos ecosistemas. Con la informaciónrecogida en las bases de datos, es posible construir el índice RUE para todo el Parque (Verón etal, 2006).3. OBJETIVOS El objetivo de estas prácticas es llevar a cabo el diseño de un sistema de automatización que,a partir de un información de entrada, lleve a cabo el cálculo del índice RUE (Rain UseEfficiency) con el fin de analizar la productividad de los ecosistemas presentes en el Parque. 8
  12. 12. Se pretende así estudiar la tendencia de la RUE en los últimos años con el fin de conocercomo evolucionan los ecosistemas del Parque Natural y como se ven afectados por la acción delhombre en los límites de este espacio protegido. Como muestra la figura 3, el desarrollo de este trabajo se ha establecido por niveles, en losque durante el periodo de prácticas, se pretende ir abordando y completando cada nivel. Por lotanto, el objetivo final de este periodo de prácticas no es el de obtener unos resultados definitivoscon este proyecto, si no el de desarrollar un proceso automático dentro del sistema de monitoreodel Parque, con ayuda de conocimientos adquiridos en Sistemas de Información geográfica yteledetección. El índice RUE es una relación entre la productividad primaria neta y la precipitación anual.En el caso de la productividad primaria neta, la información viene proporcionada por lasimágenes de satélite ofrecidas por el sensor MODIS en forma de índices de vegetación. Laprecipitación anual viene proporcionada por las estaciones meteorológicas situadas dentro o enlas proximidades del Parque Natural. Por un lado, se desea automatizar un proceso que seencargue de extraer la información de índice verde de las imágenes de satélite. Por otro lado, elproceso de automatización se debe encargar extraer los datos de precipitación, depurarlos yconvertirlos de datos puntuales a datos continuos, obteniendo mapas de precipitación para elParque. Finalmente, se superpondrán las imágenes de satélite y los mapas de precipitación, de talforma que se obtenga un mapa resultante donde en cada celda se recoja un valor RUE resultantede la relación entre índice verde y precipitación. Para que la superposición de ambos mapas (índice verde y precipitación) encaje de formaadecuada, hay que tener en cuenta la escala en la que se encuentran ambos mapas. Las imágenesde satélite del sensor MODIS presentan una resolución espacial de 250 metros y una resolucióntemporal de 16 días. Los mapas de precipitación se construyen usando un modelo digital deelevaciones que posee una resolución espacial de 20 metros. Por otro lado, la escala temporal delas estaciones meteorológicas es mensual. Por lo tanto, se ajustará la escala espacial a 250 metrosy la temporal a mensual. Aunque para el cálculo del índice RUE es necesario la variable climática de precipitación, elproceso de automatización generará mapas también de otras variables climáticas (Temperaturamedia, temperatura máxima, etc.), ya que pueden ser útiles en el análisis de otros índices deestudio. Sin embargo, dado que esta fase del proyecto esta aún en desarrollo, en principio se hará usode una sola variable climática, la precipitación, y de esta forma se observara que resultados seobtienen en cada nivel de sistema. Una vez desarrollado un proceso definitivo de automatizaciónpara cada nivel del sistema, que se encargue de la homogeneización y modelización de los datos,entonces se incluirán las restantes variables climáticas. 9
  13. 13. Figura 3. Diagrama con el diseño del proceso de obtención de mapas del índice RUE.4. MATERIAL En el plano práctico de este trabajo, se destaca el uso de distintos programas software pararealizar distintas tareas a lo largo del diseño del proceso de automatización. El software utilizadoes el siguiente: EXCEL – Herramienta de cálculo cuyo uso se da principalmente en el proceso dehomogeneización de datos y con el que se ha llevado a cabo una depuración, ordenación yalmacenamiento de datos climáticos. 10
  14. 14. SPSS – Potente programa estadístico con el que se ha llevado a cabo el análisis de modelosde regresión calculados para toda la serie temporal del estudio, el análisis de los índicesestadísticos correspondientes a cada modelo de regresión y el cálculo de matrices de correlaciónpara el proceso de homogeneización de datos de entrada. ARCGIS – Como herramienta de análisis espacial, su uso ha permitido analizar el modelodigital de elevaciones del área de estudio y realizar estimaciones climáticas mediante mapasclimáticos con modelos de regresión generados con el software SPSS. ENVI – Herramienta para el procesamiento de imágenes. Gracias a este software es posiblevisualizar y analizar los mapas climáticos generados en el proceso de interpolación climática. R – lenguaje de programación dedicado al cálculo estadístico. Destaca por su sencillez,robustez y amplia variedad de recursos en distintas temáticas científicas. Gracias a este lenguajeha sido posible desarrollar un proceso de automatización que toma datos climáticos y genera,mediante método de interpolación, mapas climáticos. El uso de librerías es esencial para poderllevar a cabo un trabajo de este estilo. Las librerías utilizadas han sido las siguientes:  Librería “MASS” – Permite llevar a cabo operaciones estadísticas complejas como por ejemplo regresión por pasos (o también conocida como Stepwise) mediante la orden stepAIC usando como criterio para discriminar variables el criterio de Akaike.  Librería “rgdal” – Lleva a cabo operaciones de proyección y transformación. Puede asignar una proyección espacial a puntos o matrices y de esta forma conocer su posición mediante coordenadas.  Librería “qpcR” – Realiza ajuste de modelos y selección de modelos más adecuados. Dentro de las diferentes funciones, posee la función para obtener el índice estadístico R cuadrado ajustado.  Librería “gstat” – Esta librería ha sido seleccionada por llevar a cabo modelos geoestadísticos. Entre sus funciones están la modelización de variogramas, o la posibilidad de aplicar distintos tipos de krigeado (simple, ordinario o universal).  Librería “caTools” – Entre sus funciones, las que son de interés en este trabajo son la de importar y/o exportar los datos calculados en el proceso de automatización a archivos que puede ser visualizados en el software ENVI.  Librería “matlab” – Esta librería permite emular el código MATLAB y de esta forma realizar operaciones con matrices y generar gráficos.5. METODOLOGÍA5.1. Datos climáticos El punto de partida de este trabajo son los datos procedentes de las estacionesmeteorológicas. El trabajo con este tipo de datos es el paso más importante ya que establece lasbases de la estructura de todo el trabajo en conjunto. Sin el correcto tratamiento de los datos enesta fase, no servirá de nada continuar en el trabajo ya que los resultados que se obtendrán seránerróneos. 11
  15. 15. En primer lugar, es necesario conocer las estaciones meteorológicas disponibles dentro delParque Natural o próximas a los límites de éste y que puedan aportar datos climáticos en unregistro temporal lo suficientemente amplio como para poder conocer la tendencia de los datosen el tiempo. Como muestra la figura 4, contamos con un total de 10 estaciones que cumplen elrequisito de localización. Hay que indicar que las estaciones pertenecen a distintas instituciones,por lo que es algo a tener en cuenta, ya que aunque todas registran las mismas variablesclimáticas, lo hacen en distintas escalas temporales, por lo que es algo que es necesario conocerantes de recoger los datos. Figura 4. Localización de las estaciones meteorológicas de partida. Las estaciones vienen recogidas en tablas donde cada columna corresponde a unacaracterística de la estación (WMO, 2003): Nombre – Nombre de la estación. Hace referencia a la ciudad o municipio donde seencuentra. El nombre debe ser claro y no dejar duda a sitio pertenece. Si hay más de una estaciónen la ciudad o municipio, es necesario incluir una referencia para indicar a donde pertenece enconcreto (por ejemplo “Almería Aeropuerto”). En otros casos, se puede utilizar los puntoscardinales. Código – Es el código o número de la estación. La Organización Mundial de Meteorología(WMO) identifica aquellas estaciones que intercambian información a nivel internacional con uncódigo de 5 dígitos. Los dos primeros dígitos hacen referencia a la región en el planeta y el paísdonde se encuentra la estación. Sin embargo, no todas las estaciones meteorológicas tienen uncódigo asignado por la Organización Mundial de Meteorología. Estas estaciones presentan uncódigo que las identifican a un nivel nacional, regional o provincial. 12
  16. 16. Altitud – Indica la elevación sobre el nivel del mar. Coordenadas X e Y – Hacen referencia a la longitud y latitud. Se puede presentar en formade minutos y segundos o en formato decimal. La precisión de la localización debe ser tal que seencuentre en un radio de unos varios cientos de metros. Por último, con el fin de aclarar lalocalización de la estación en caso de exportar la información a observadores que no conocen laestación, se debe indicar el hemisferio donde se encuentra la estación, así como indicar lalongitud norte o sur y las latitudes este u oeste. En este caso, las coordenadas se presentan enformato decimal, georreferenciadas al sistema de coordenadas UTM 30N y transformadas aldatum ED50. Provincia – Nombre de la provincia a la que pertenecen las estaciones.La clasificación de las estaciones es la siguiente:- Estaciones meteorológicas del Instituto Nacional de Meteorología (INM). Como se apreciaen la tabla 1, son 6 estaciones y recogen los datos de cada variable climática de forma mensual.Tiene un código asignado por la Organización Mundial de Meteorología (WMO). Tabla 1. Características de las estaciones del Instituto Nacional de Meteorología. Nombre Código Altitud (metros) Coord. X Coord. Y Provincia Almería 6325O 20 554563 4077703 Almería Aeropuerto Níjar 6327 356 570795 4091537 Almería Michelín 6328N 50 571059 4074743 Almería Cabo de Gata 6329 41 572307 4064892 Almería Mesa Roldán 6332 202 597535 4088967 Almería Carboneras 6332I 41 597706 4093438 AlmeríaLas variables recogidas por estas estaciones son:  Precipitación total mensual, Precipitación máxima diaria mensual, Primer día de la precipitación máxima, Días de lluvia, días de tormenta, Días de rocío, Días de precipitación apreciable, Días con precipitación mayor o igual a 10 décimas, Días con precipitación mayor o igual a 100 décimas, Días con precipitación mayor o igual 300 décimas.  Temperatura máxima absoluta mensual, Primer día de la temperatura máxima absoluta, Media mensual de la temperatura máxima diaria, Temperatura máxima de las mínimas, Días de temperatura máxima >=25°C, Días de temperatura máxima >=30°C, Temperatura mínima absoluta mensual, Primer día de la temperatura mínima absoluta, Media mensual de la temperatura mínima diaria, Temperatura mínima de las máximas, Días de temperatura mínima <=0°C (días de helada), Días de temperatura mínima >=20°C (noches tropicales), Temperatura media mensual. - Estación de la Consejería de agricultura y pesca de la Junta de Andalucía. En estecaso, se dispone de una única estación (tabla 2). Estas estaciones recogen los datos de formadiaria. 13
  17. 17. Tabla 2. Características de la estación de la Consejería de agricultura. Nombre Código Altitud (metros) Coord.X Coord.Y Provincia Níjar CAP - 183 575091 4089921 Almería Las variables recogidas por esta estación son:  Precipitación total mensual, Precipitación máxima diaria mensual, Precipitación mayor o igual a 10 décimas, Días de precipitación. Evapotranspiración potencial.  Media mensual de la temperatura máxima diaria, Temperatura máxima absoluta, Día del mes con temperatura máxima, Temperatura máxima de las mínimas, Días de temperatura máxima >=25°C, Días de temperatura máxima >=30°C, Media mensual de la temperatura mínima diaria, Temperatura mínima absoluta, Día del mes con temperatura mínima, Días de temperatura mínima <=0°C, Días de temperatura mínima >=20°C, Temperatura media mensual, Radiación neta. - Estaciones de la Universidad de Almería. Son 3 estaciones, localizadas dentro delParque Natural. Recogen los datos cada media hora. Estas estaciones, de tipo experimental,carecen de código. Tabla 3. Características de las estaciones de la Universidad de Almería. Nombre Código Altitud Coord. X Coord. Y Provincia (metros) Cuenca Paraíso - 266 582488 4076687 Almería Balsablanca - 200 586118 4088863 Almería Amoladeras - 59 566860 4076797 Almería Las variables recogidas por estas estaciones son:  Temperatura media, Humedad relativa, Velocidad del viento, Dirección del viento, Precipitación media, Radiación global, Radiación neta, Radiación fotosinteticamente activa.5.2. Homogeneización de los datos Una vez que disponemos de los datos de todas las estaciones, hay que analizar los registrospara conocer las fechas de inicio y final de registro de datos, periodicidad con que se registranlos datos o ausencia de datos en el registro. Antes de comenzar con este tratamiento dehomogeneización de datos, conviene establecer una serie de criterios de calidad con el fin deobtener una buena corrección de los datos.5.2.1. Escala temporal Como ya se ha comentado, cada institución ha programado sus estaciones para que registrenlos datos a distinta escala temporal. Las estaciones del Instituto Nacional de Meteorología (INM)presentan un registro mensual de los datos. Dado que no conviene en este caso reducir la escalatemporal, ya que los datos resultantes no serian correctos, la escala temporal de un mes será conla que se trabajará. 14
  18. 18. La transformación para el resto de las estaciones será la siguiente:  Para las estaciones de la Consejería de agricultura y pesca de la Junta de Andalucía, se transformarán los datos de día a mes.  Para las estaciones de la universidad de Almería, se transformarán los datos registrados cada media hora a día. Una vez hecho, se hará una segunda transformación de los datos de día a mes.5.2.2. Inicio y final de la serie temporal El siguiente paso es el de conocer la serie temporal con la que se trabajará. El final deregistro será la fecha en la que todas las estaciones hayan registrado los datos, en este caso seráMayo del año 2009. En el caso del comienzo de registro, no es tan claro, ya que algunasestaciones llevan operativas décadas mientras que otras comenzaron a registrar datos hace menosde un década. Así pues, se estableció como inicio de la serie temporal Enero del año 2004, yaque a partir de ese año, todas las estaciones han hecho un registro de los datos. Por otro lado, será necesario actualizar los datos de aquellas estaciones para las que no setengan registros de los últimos años. En el caso de las estaciones del Instituto Nacional deMeteorología, los datos del último registro corresponden al año 2006, por lo que se incluirán losdatos climáticos para los años 2007, 2008 y 2009. Para las estaciones de la Consejería deagricultura y pesca se actualizarán los datos desde el año 2007 hasta el año 2009.5.2.3. Ausencia de datos Por diversas razones, las estaciones pueden dejar de registrar dando lugar a vacíos en losdatos de registro. Esta falta de operatividad de las estaciones puede deberse a distintos motivoscomo puede ser la relocalización de una estación a otro punto o bien por encontrarse expuestoslos instrumentos de medida al medio externo pueden quedar inutilizados. En otros casos, aúnfuncionando de forma correcta el instrumento de medida, la lectura no es correcta. Esto puededarse por ejemplo en días donde la precipitación es muy débil y por lo tanto el pluviómetro no escapaz de registrar la cantidad de lluvia para ese día. En cualquier caso, es necesario conocercomo tratar estos datos ausentes ya que se trata de un problema bastante común (WMO, 2003). Para poder completar aquellos huecos presentes en toda la serie temporal es necesarioconocer cual es el nivel de ausencia de datos en cada estación. Si la ausencia de datos es bajapara una estación, es posible completar los registros vacíos con ayuda de las estaciones vecinas.Pero si, la ausencia de datos es muy grande, de ninguna forma se podrá hacer una estimación conayuda de estaciones vecinas, ya que en estos casos no se obtendrían datos fiables deprecipitación. Así pues, si la ausencia de datos en una estación es menor al 30%, se hará unaestimación de la precipitación para los datos ausentes. Aquellas estaciones con una ausencia dedatos mayor al 30% se desechan y no se tienen en cuenta. Como se puede observar en el anexo, se recogen los datos mensuales de precipitación decada estación meteorológica para toda la serie temporal, desde el año 2004 hasta el año 2009.Las estaciones experimentales de la Universidad de Almería (Cuenca Paraíso, Balsablanca yAmoladeras) no registraron valores de precipitación en casi todos los meses de toda la serietemporal. Esto supone una ausencia de datos superior al 30%, por lo que se descartaron estas tresestaciones. Por otro lado, las otras 7 estaciones, solo presentan ausencia de datos a partir del año 15
  19. 19. 2007 y sólo en algunos meses, por lo que en este caso si es posible hacer un tratamiento paracompletar los datos ausentes con ayuda de las estaciones vecinas. El método utilizado para completar los datos ausentes es mediante una matriz decorrelación. Una matriz de correlación es una tabla de doble entrada con una lista multivariablehorizontal y la misma lista en disposición vertical. En cada celda se muestra el coeficiente decorrelación r, indicando dependencia entre pareja de variables. El intervalo en el que se mueveel valor de r es entre 0 y 1, por lo que, cuanto mayor sea el coeficiente de correlación, mayor serála correlación entre las variables. Tomando como ejemplo el dato ausente en el mes de enero en el año 2007 para la estaciónde Carboneras, como se aprecia en la tabla 4. Tabla 4. Datos de precipitación para el mes de enero en el año 2007. Ausencia de registro de precipitación para la estación de Carboneras. Estación Precipitación Enero Carboneras - Mesa Roldán 35,2 Cabo de Gata 14 Michelín 33,5 Níjar 55,5 Almería Aeropuerto 35,2 Níjar CAP 53,6 La matriz de correlación se recoge en la tabla 5. Como se aprecia, hay una doble entrada,por un lado se encuentra la estación de Carboneras en disposición horizontal. En disposiciónvertical se encuentran las restantes estaciones meteorológicas con sus respectivos valores decorrelación con respecto a la estación de Carboneras. Tabla 5. Matriz de correlación entre la estación de Carboneras y las restantes estaciones. Carboneras Carboneras - Mesa Roldán 0.785 Cabo de Gata 0.669 Michelín 0.712 Níjar 0.803 Almería “Aeropuerto” 0.744 Níjar CAP -0.146 En este caso Níjar es la estación con mayor correlación con la estación de Carboneras. Laestimación del dato de precipitación para la estación de Carboneras se hace mediante unaecuación lineal de tipo “Y = a*X + b” donde “Y” es la variable dependiente (la estación deCarboneras en este caso). “X” es la variable independiente (la estación de Níjar), “a” es lapendiente y “b” la constante. A partir del valor de precipitación de la estación de Níjar se estimael valor de precipitación para la estación de Carboneras como se muestra en la tabla 6. 16
  20. 20. Tabla 6. Datos de precipitación para todas las estaciones, incluida Carboneras, a la que se ha obtenido su valor tras aplicar la matriz de correlación. Estación Precipitación Enero Carboneras 31,5 Mesa Roldán 35,2 Cabo De Gata 14 Michelín 33,5 Níjar 55,5 Almería Aeropuerto 35,2 Níjar CAP 53,6 Este método se repetirá para todos aquellos meses que no tienen registrado un valor deprecipitación. Tras aplicar todos los criterios de homogeneización, el volumen inicial de datos con el quese cuenta, se reduce drásticamente. Se reduce la serie temporal, contando con datos desde el año2004 hasta el año 2009, se reduce el número de variables climáticas, contando únicamente con laprecipitación y se reduce el número de estaciones, de las 10 estaciones iniciales a las 7 estacionesfinales. La tabla 7 muestra las características de las estaciones que se utilizarán a partir de ahoray la figura 5 muestra la localización de cada estación. Sin embargo, hay que matizar que a partir del año 2008, solo se contará con 6 estaciones yaque, la estación de Carboneras dejó de ser operativa para ese año. Para evitar trabajar con tanpocas estaciones, se pretende recuperar las estaciones experimentales de la universidad deAlmería en un periodo de tiempo a corto plazo con el objetivo que proporcionen datosclimáticos a la serie temporal y sustituyan a la estación de Carboneras. Por otro lado, la presenciade estas estaciones favorecería la distribución espacial de los datos puntuales. A continuación semuestran los datos de las estaciones que se utilizarán en el siguiente nivel. Tabla 7. Estaciones meteorológicas resultantes tras el proceso de homogeneización. Nombre Código Altitud (metros) Coord. X Coord. Y Provincia Almería 6325O 20 554563 4077703 Almería Aeropuerto Níjar 6327 356 570795 4091537 Almería Michelín 6328N 50 571059 4074743 AlmeríaCabo de Gata 6329 41 572307 4064892 AlmeríaMesa Roldán 6332 202 597535 4088967 Almería Carboneras 6332I 41 597706 4093438 Almería Níjar CAP - 183 575091 4089921 Almería 17
  21. 21. Los datos de precipitación obtenidos tras el proceso de homogeneización se muestran en elanexo. Figura 5. Localización de las estaciones tras el proceso de homogeneización.5.3. Estructura base de datos climáticos Una vez depurada la información inicial y obtener los datos útiles con los que se va atrabajar, hay que diseñar la estructura de la base de datos donde se almacenarán estos datosdepurados. Hay que tener en cuenta que el sistema de seguimiento va a estar automatizado, porlo que todos los niveles deben encajarse de forma perfecta, y en este caso, esa conexión entre elnivel de almacenamiento de información en base de datos e nivel de modelización de los datos,implica que la estructura de la base de datos sea sencilla y clara, ya que el modelo necesitaráimportar los datos desde estas bases de datos para poder ejecutarse de forma correcta. Dado que el diseño de cada fase no es aún definitivo, en principio se tomará como base dedatos el software EXCEL. La base de datos consistirá en un archivo EXCEL, donde cada hoja corresponde a un año,así pues, habrá 6 hojas, desde el año 2004 hasta el año 2009 (figura 6). 18
  22. 22. Figura 6. Estructura de la base de datos. Dentro de cada hoja, los datos se estructuran por columnas. Las primeras 5 columnascontienen información referente a la identificación y localización de las estacionesmeteorológicas. Código Estación Longitud Latitud Altitud Donde la columna de “Código” hace referencia al código de identificación de la estaciónmeteorológica y la columna “Estación” contiene el nombre de la estación. Las siguientes columnas contienen datos de precipitación para cada mes, desde el mes deEnero hasta el mes de Diciembre. Hay una última columna que contiene los datos anuales deprecipitación. Enero Febrero Marzo ... Noviembre Diciembre Anual5.4. Modelización de variables climáticas Un modelo se define como la representación gráfica, matemática, física, verbal o unaversión simplificada de un concepto, fenómeno, relación, estructura, sistema o aspecto delmundo real. Los objetivos de un modelo incluyen: (1) facilitar la comprensión de lo que sepretende modelizar eliminando los componentes innecesarios, (2) ayudar en la toma dedecisiones con escenarios simulados, (3) explicar, controlar y predecir los eventos en base deobservaciones pasadas. Ya que muchos objetos y fenómenos son muy complicados (al estarcompuestos de muchas partes) y demasiado complejos (al estar esas partes intercomunicadas)para comprenderlos en su totalidad, un modelo contiene solo aquellas características que deprimaria importancia para el propósito al que esta diseñado el modelo. Modelizar una variable climática reporta una gran cantidad de información para proyecto enel que se trabaje, sin embargo, es necesario tratar una serie de aspectos si se desea que losresultados obtenidos de la estimación de una variable climática sean coherentes. Por un lado, estael problema de la disponibilidad de información climática en una zona determinada. Esto se debea la distribución espacial de carácter heterogéneo de las estaciones meteorológicas. Las zonasllanas o de carácter agrícola suelen presentar más estaciones que las zonas de montaña. Por otrolado, los datos proporcionados por las estaciones meteorológicas son de carácter puntual, por loque es importante que las series de datos proporcionados por las estaciones meteorológicas sean 19
  23. 23. depuradas antes de aplicar técnicas de interpolación para plasmar la variable climática en elespacio. La escala de trabajo en estos casos es otro aspecto importante a tener en cuenta. El clima esel resultado de un conjunto de variables, pero dependiendo a la escala que nos encontremos notodas las variables tendrán el mismo peso. Por ejemplo, una variable como es la distancia amares y océanos, a una escala regional tendrá más peso y explicará mejor el comportamiento delclima que a una escala local donde un área pequeña como un parque natural no sería suficientepara abarcar una variable climática de esa magnitud. Es por ello que, es necesario conocer lazona de trabajo y comprobar que variables climáticas tienen una mayor influencia.5.4.1. Variables dependientes El objetivo principal en este nivel del sistema es desarrollar una serie de mapas medianteinterpolación que tenga en cuenta las variables climáticas geográficas y que permitan modelarvariables como temperatura máxima, mínima o la precipitación. Sin embargo, dado que esta fasese encuentra en desarrollo, el análisis y diseño del modelo estará basado en una sola variable queserá la precipitación. Por lo tanto, la precipitación será la variable dependiente y a partir de losdatos depurados en el nivel anterior, se modelizará la precipitación mensual y anual.5.4.2. Variables independientes Las variables seleccionadas en este caso son la Latitud, Longitud y Altitud. Seleccionarestas variables viene dado por varias razones. El uso de modelos climáticos para estudiar ypronosticar el comportamiento del clima en la península ibérica ha demostrado que estas tresvariables explican de una forma importante la distribución espacial del clima, sobre todo laaltitud y la longitud como indican Ninyerola y Pons (2000) en su trabajo sobre la modelizaciónde variables climáticas. En el caso de la altitud, esta demostrado que es una variable directamente relacionada con ladistribución de las lluvias. La altitud respecto al nivel del mar influye en el mayor o menorcalentamiento de las masas de aire. Un aumento de la altitud favorece el enfriamiento de lasmasas de aire, favoreciendo la precipitación. Por lo que hay una relación directa entre laprecipitación y la altitud. La longitud explica el comportamiento de la precipitación debido a la disposición SW-NEde la orografía andaluza. Esta disposición del relieve determina que haya una gran influencia delocéano atlántico que encuentra su entrada por el valle del Guadalquivir, canalizándose al interiorcon ayuda de los vientos W y SW. La trascendencia biogeográfica de las alineacionestopográficas (Sistema Ibérico y Cordilleras Béticas), en su sector oriental, se deja sentirnegativamente con respecto a los flujos húmedos superficiales procedentes del océano,sometiéndolos a un intenso efecto “foehn”, lo que se traduce en un debilitamiento de lainfluencia atlántica con lluvias débiles en la provincia de Almería (Pita, 2003). Por el contrario,La influencia mediterránea queda reducida a un ámbito costero pero en el caso de Almeríaalcanza un cierto desarrollo y amplitud en la zona de levante de la provincia. Los vientos delevante originarios del Mediterráneo, actúan en este flanco oriental con ascensionalidad,detención y precipitaciones (Capel, 1995). 20
  24. 24. La latitud determina la localización de los centros de acción que dan origen a los vientos:anticiclones (centros de altas presiones) y ciclones (áreas de baja presión o depresiones). Losanticiclones son áreas de alta presión, donde el aire desciende de cierta altura por ser frío y seco(el aire frío y seco es más pesado que el cálido y húmedo). Esto tendrá una importanciasignificativa en la precipitación del área de estudio. La latitud nos aproxima a la variabilidadgenerada por la circulación atmosférica (Ninyerola & Pons, 2000). Otra razón por la que se tienen en cuenta estas tres variables es su disponibilidad. Portratarse de un área no muy extensa, con tan pocas estaciones, es difícil obtener datos de variablescomo podrían ser la orientación o la nubosidad. Sin embargo, un modelo digital de elevacionesrecoge datos para la longitud, latitud y altitud para toda el área sin importar la escala de trabajo.Así pues, los datos para las tres variables independientes vienen dados por el modelo digital deelevaciones que proporciona la Consejería de Medio Ambiente de la Junta de Andalucía (figura7). Este modelo digital de elevación presenta una resolución espacial de 20 metros. Lasdimensiones del modelo digital de elevaciones son: 2190 filas y 2282 columnas. Figura 7. Vista general del modelo digital de elevaciones del Parque Natural del Cabo de Gata-Níjar (Almería).5.4.3. Métodos de interpolación La interpolación es una conversión que transforma datos puntuales a superficies continuas através de estimación de valores en puntos espaciales donde no hay datos medidos de una variableclimática. La interpolación se trata así de un proceso estadístico conocido como estadísticaespacial. 21
  25. 25. La interpolación toma información procedente de puntos que quedan fuera del área deestudio previamente definida, ampliando el área donde pondremos en práctica los métodos deinterpolación elegidos con objeto de mejorar la calidad final de la cartografía de nuestra área deestudio. Obviamente, cuanto mayor sea el número de datos puntuales, mejor será la transformación auna superficie continúa. Sin embargo, en este proyecto, se cuenta únicamente con 7 estacionesmeteorológicas para todo el Parque Natural. Además la distribución de las estaciones no es muypropicia ya que encontramos una concentración de estaciones al oeste del Parque Natural y otraconcentración al Este (figura 8). Esta concentración puede afectar a la estimación de los datos deprecipitación, favoreciendo la estimación para la zona este y oeste del Parque Natural, mientrasque la zona central del parque presentaría una peor estimación. Estos dos aspectos limitan elproceso de interpolación, por lo que habrá que ver los resultados de la interpolación paracomprobar si los resultados son coherentes. Figura 8. Como se aprecia en la imagen, la distribución no es homogénea por todo el Parque Natural,sino que se pueden apreciar agrupaciones que pueden afectar al proceso de interpolación en la zona oeste y este del Parque Natural. Se utilizarán dos métodos de interpolación: Modelos de regresión y métodos geoestadísticos(krigeado). El método de interpolación principal será el modelo de regresión ya que por el reducidonúmero de estaciones con el que trabajamos, el modelo de regresión ofrece una mejor estimaciónde la precipitación que el krigeado. 22
  26. 26. El modelo de regresión se construye a partir de las tres variables independientes (Latitud,Longitud y Altitud), generando una ecuación que se ajusta a los datos de precipitación y de estaforma permite generar mapas de precipitación mensuales y anuales. No en todos los casos lastres variables independientes tienen la misma influencia en el reparto espacial de lasprecipitaciones. Por lo tanto, hay que elegir las variables que mejor estimen la precipitación. Una vez que se tiene la ecuación del modelo de regresión, se aplicará al modelo digital deelevaciones de tal forma que se podrá hacer una estimación de la precipitación para cadacoordenada del mapa. Dado que el modelo digital de elevaciones, es simplemente una matriz enla que cada celda contiene valores de longitud, latitud y altitud, la interpolación consistirá endesplazar la ecuación a cada celda con el fin de calcular el valor de precipitación en cada celda.Debido a las características del modelo digital de elevaciones, hay celdas de la matriz que nocontienen valores de las tres variables. En estos casos, no se producirá un valor de precipitaciónen estas celdas (figura 9). Figura 9. El modelo digital de elevaciones (MDE) es una matriz de 2190 filas y 2282 columnas. Lasceldas pertenecientes al MDE contienen valores de las variables de latitud, longitud y altitud. Las celdas de la matriz que no corresponden al MDE no contienen valores. En aquellos casos en los que las tres variables no sean capaces de ofrecer un buen ajuste alos datos, se descartará usar una ecuación de regresión múltiple para interpolar y se utilizará elmétodo de interpolación krigeado. El krigeado es un método de regresión aplicado en la estimación/interpolación de datosespacialmente localizados o correlacionados. Hay una serie de características que separa estemétodo de otros relacionados como son las superficies de tendencia o técnicas más clásicas. Enprimer lugar, las localizaciones de las muestras reflejan información importante o una aparentecorrelación espacial cuantificable en términos de distancia y dirección. Las muestras que se 23
  27. 27. encuentran más próximas se esperan que sean más parecidas que las que se encuentran másalejadas. El volumen o área de la muestra es igualmente un aspecto importante y muestra laexistencia de un pequeño intervalo sin homogeneidad (Myers, 1992). El krigeado consiste en tres pasos: (1) un examen de la covarianza de los datos dependiendode sus distancias; (2) ajuste teórico de los datos; y (3) uso de estos modelos para calcular lospesos para un conjunto de puntos vecinos y así determinar el valor interpolado. El primer paso serealiza mediante el cálculo de un semivariograma. Todos los posibles pares de puntos sonexaminados, los pares son agrupados por distancia y por último se representan los datosgráficamente donde el eje Y muestra la varianza de los diferentes valores mientras que el eje Xmuestra la distancia. En el segundo paso, se ajusta el variograma a los puntos consideradosmediante varias técnicas pero la mejor es mediante un método de validación cruzada. En elúltimo paso, este modelo generado determina los pesos utilizados por cada punto para calcularlos valores interpolados (Phillips et al, 1991). Figura 10. Ejemplo de un gráfico un variograma. El gráfico representa la varianza estimada para cada punto frente a la distancia estimada entre los puntos. Dentro del krigeado existe distintos tipos: ordinario, simple, universal y cokriging. Ladiferencia entre estos métodos radica en como se calculan los pesos, que se asignan a los puntosmuestrales, necesarios para realizar la interpolación. Hay que tener cuenta que la complejidad de la distribución de la precipitación debido a laorografía puede traducirse en heterogeneidad y anisotropía, lo que puede ser un inconveniente ala hora de representar mediante un krigeado ordinario. Por último, comentar que en regiones con una densidad pobre de datos, para cualquiermétodo de interpolación, incluso para un método tan sofisticado como es el krigeado, puedensufrir pérdida de información (Prudhomme & Reed, 1999) y la estimación no es tan precisacomo se espera. 24
  28. 28. 5.5. Automatización del modelo de interpolación de variables climáticas Uno de los aspectos que se persigue con el sistema de monitoreo es que sea capaz derealizar todo el proceso, desde la adquisición de información y su tratamiento hasta laexportación de resultados de forma automática. En el caso de la interpolación de los datosclimáticos, dado que se trata de una serie temporal, el proceso es repetitivo, es decir, se va aaplicar una transformación de datos puntuales a datos continuos a cada mes de cada año. Deforma manual, este proceso puede resultar muy tedioso, dado que sería generar muchosresultados y significaría mucho tiempo. Por eso, la automatización por un lado busca evitar latarea realizara por operadores humanos y por otro lado se busca reducir el tiempo en la obtenciónde resultados.5.5.1. Estructura del proceso de automatización A la hora de diseñar un proceso de automatización hay que tener presente que debe serrápido y eficaz, proporcionando la información que se necesita. Por ello, es necesario analizar ydiseñar una estructura básica del proceso. Como se puede apreciar en la figura 10, el proceso se divide a grandes rasgos en tresniveles. El primer nivel, empieza con una importación de los datos climáticos. Una vez depuradolos datos climáticos y almacenados en la base de datos, el proceso de automatización debeimportar las tablas de toda la serie temporal de la base de datos. A continuación, se llevará acabo, con los datos importados, una interpolación climática usando los dos métodos comentadosanteriormente: modelos de regresión múltiple y métodos geoestadísticos, entre los que seencuentran el krigeado. Por último, una vez obtenidos los mapas de interpolación de una variableclimática, estos se exportan a otra base de datos. Figura 10. Diseño inicial del proceso de automatización. 25
  29. 29. 5.5.2. Automatización en la importación de datos climáticos Ya se ha comentado que la base de datos de las variables climáticas (en este caso, demomento solo tratamos una sola variable climática que es la precipitación), es un archivoEXCEL, formado por 6 hojas. Cada hoja corresponde a un año de la serie temporal 2004-2009, ydentro de cada hoja se encuentra información sobre la localización de las estacionesmeteorológicas y los datos de precipitación mensual y anual registrados por cada estación. Por lotanto, el proceso de automatización debe ser capaz de reconocer una base de datos de este tipo.El objetivo en este nivel es el de analizar cada hoja de la base de datos. Como se aprecia en el diagrama de la figura 11, este análisis se lleva a cabo mediante dosbucles. Un primer bucle se encargará de identificar cada año de la serie temporal. Una vezidentificado un año, empezará otro bucle que se encargará de leer los datos de precipitaciónmensual y anual para ese año en cuestión. Figura 11. Diagrama del funcionamiento de la importación de datos. Como se aprecia en la figura 12 en forma de pseudocódigo, la implementación de estosbucles en el lenguaje de programación R, será mediante bucles “For”. Los bucles de tipo “For”se caracterizan por ser más rápidos, en los cálculos de tipo repetitivo, que otros bucles de tarearepetitiva como pueden ser los bucles “while”. Figura 12. Pseudocódigo para la lectura de los datos de precipitación en la base de datos. 26
  30. 30. 5.5.3. Automatización en el proceso de interpolación climática Una vez que se tienen los datos de precipitación comienza la segunda fase en la que setransformarán los datos puntuales de precipitación a datos de tipo continuo en forma de mapa.Este nivel es probablemente el más complejo, en donde se incluyen una serie de subnivelesencargados de hacer tareas específicas dentro del proceso de automatización. Estos subnivelesson:  Subnivel 1: Cálculo de un modelo inicial de regresión múltiple con las tres variables independientes (latitud, longitud y altitud), y cálculo de índices estadísticos.  Subnivel 2: Clasificación del tipo de interpolación según un criterio basado en un índice estadístico y aplicación de una regresión por pasos para obtener un segundo modelo con mejor ajuste.  Subnivel 3: Almacenamiento de los coeficientes asociados a las variables asociadas al segundo modelo.  Subnivel 4: Interpolación de los datos climáticos usando el segundo modelo.Subnivel 1 – Cálculo de un modelo inicial de regresión múltiple Una vez obtenidos los datos de precipitación para un mes determinado, se lleva a cabo unaregresión múltiple. En esta ecuación de regresión múltiple, la variable dependiente es laprecipitación mensual o precipitación anual, mientras que las variables independientes son lalongitud, latitud y altitud. La ecuación obtenida en esta regresión múltiple no es definitiva, enrealidad, su cálculo va destinado a obtener una serie de índices estadísticos. Estos índices son:  Valor P de la ecuación de regresión.  R cuadrado ajustada de la ecuación de regresión.  F estadístico de la ecuación de regresión. La figura 12 muestra como se comporta el subnivel 1 y como conecta con el subnivel 2. Figura 12. Diagrama subnivel 1, en el que se muestra el proceso de importación de datos climáticos y obtención de una ecuación de regresión a partir de los datos importados. 27
  31. 31. En lenguaje R, la función “lm” (linear mode) permite aplicar una regresión usando más dedos variables independientes. A partir de la ecuación obtenida se pueden obtener los índicesestadísticos deseados, sin embargo, es necesario usar paquetes estadísticos que contienen lasfunciones para calcular estos índices específicos (figura 13). Figura 13. Pseudocódigo Subnivel 1. Por último, dentro de este subnivel, hay que hacer mención a aquellos casos especiales enlos que no es posible obtener los índices deseados. Estos casos especiales son aquellos meses enlos que ninguna estación ha registrado un valor de precipitación, es decir, todos los registros deprecipitación son cero. Para estos casos, obviamente, el mapa resultante de precipitación es el deuna malla en la que todas las posiciones presentan el valor cero. En estos casos, no es posibledeterminar los índices Valor-P y Estadístico F, por lo que directamente se considerará que estosmeses poseen un Valor-P igual a 1 y método de interpolación asignado será el krigeado.Subnivel 2 – Clasificación del modelo de regresión y obtención de un segundo modelo deregresión Una vez obtenidos los tres índices en el subnivel 1, entra en juego el subnivel 2 en donde,según el nivel de significación obtenido en el subnivel 1, se indicará el camino que ha de tomarel proceso bien para obtener una ecuación de una, dos o tres variables (ya que en principio setrabaja con 3 variables independientes) que ofrezcan un mejor ajuste de los datos y hacer unaregresión por pasos o bien llevar a cabo una interpolación mediante un krigeado y en este casosolo es necesario tener en cuenta los datos de precipitación registrados por las estaciones y lasvariables de longitud y latitud. En los casos en que se aplica una regresión por pasos la selecciónde la ecuación con mejor ajuste se hará mediante dos índices: R cuadrado ajustado y Festadístico. La presencia de todas las variables independientes en una ecuación no implica siempre elmejor ajuste, en muchos casos, eliminar alguna variable de la ecuación, mejora el nivel designificación de la ecuación. La regresión por pasos se encarga de analizar que conjunto devariables son las que ofrecen un mejor ajuste a los datos. 28
  32. 32. Este tipo de regresión actúa en dos direcciones: Regresión hacia atrás – a partir de la sustracción de variables comprueba como varía el nivel de significación de la ecuación Regresión adelante – a partir de la adición de variables comprueba como varía el nivel de significación de la ecuación.Por lo tanto, los criterios para la clasificación serán los siguientes (figura 14): Si Valor-P es menor o igual a 0.05 (Valor-P <= 0.05), se esta tratando con un modelo inicial que tiene muy buen ajuste y si se realiza una regresión por pasos es para comprobar si es posible, variando el número de variables, mejorar aún más ese ajuste. Se utilizará el índice R cuadrado estadístico para obtener la ecuación con mejor ajuste. Se elegirá aquella ecuación que tenga mayor R cuadrado ajustado. El método de interpolación a utilizar en este caso será el modelo de regresión obtenido en la regresión por pasos. Si Valor-P es mayor a 0.05 y menor a 0.1 y R cuadrado ajustada es mayor o igual a 0.6 (0.05 <= Valor-P < 0.1 y R >= 0.6), en este caso el modelo inicial presenta un ajuste no tan bueno como el primer criterio. Se practica una regresión por pasos con el fin de aproximar el modelo a un nivel de significación de 0.05. Se utilizará el índice F estadístico para obtener la ecuación con mejor ajuste ya que este índice es más “sensible” para diferenciar modelos y ofrecer el mejor. Así, se elegirá aquella ecuación que tenga mayor F estadístico. En estos casos, se aplicará también una interpolación mediante un modelo de regresión. Si Valor-P es mayor a 0.1 o Valor-P es menor a 0.1 y R cuadrado ajustada es menor a 0.6 (Valor-P >= 0.1 o Valor-P < 0.1 y R <0.6), en estos casos, el modelo inicial presenta un ajuste muy pobre a los datos. En estos casos, se realizará regresión múltiple con el fin de obtener un nivel de significación por debajo de 0.1 y un R cuadrado ajustada por encima de 0.6. Si se cumple, entonces se llevará a cabo una interpolación mediante un modelo de regresión y si no se cumple entonces se llevará a cabo una interpolación mediante un krigeado. 29
  33. 33. Figura 14. Diagrama subnivel 2. (*) Para los casos en los que no hay precipitación registrada se consideró que Valor-P sería 1 y por lo tanto el método de interpolación utilizado será el krigeado. Para implementar este subnivel en lenguaje R, se han utilizado condicionantes “if” de estaforma es posible construir los distintos criterios. El proceso comprueba el primer criterio, si secumple entra en el criterio, si no, comprueba el siguiente criterio y así sucesivamente. El procesoencontrará siempre un criterio al que entrar ya que se han descrito todos los casos posibles. Elpseudocódigo muestra la estructura de los condicionantes usados en cada criterio (figura 15). Figura 15. Pseudocódigo subnivel 2. 30
  34. 34. En los casos en los que se ha llevado a cabo una interpolación por un krigeado el proceso nocontinúa por los subniveles 3 y 4. En estos casos, se realiza la interpolación en este subnivel y seobtiene como resultado una matriz de datos de precipitación que terminará exportándose a unformato de salida que permita almacenar esta matriz en una base de datos. Antes de llevar a cabo la interpolación por el krigeado, se crea una matriz con las mismasdimensiones que el modelo digital de elevaciones. Así, la matriz donde se lleva a cabo lainterpolación tiene unas dimensiones de 2190 filas y 2282 columnas, como el modelo digital deelevaciones. A continuación se indica al krigeado que haga la interpolación en los límites de lamatriz creada. La implementación de este proceso en lenguaje R viene dada por la librería “gstat”, la cualpermite llevar a cabo krigeado de tipo ordinario:1 - Tomar datos de precipitación registrados por las estaciones en la variables “mes” y suscorrespondientes posiciones de longitud y latitud con las variables “clima$X” y “clima$Y”.Utiliza la longitud y latitud para crear puntos con coordenadas UTM, con la orden “coordinates”.2 - Crear una matriz de igual dimensión que el modelo digital de elevaciones y con unaresolución espacial de 20 metros. A partir de las coordenadas UTM indicadas en el códigomediante las variables “Left, Rigth, Top, Bottom”, R crea una matriz usando como puntos x,y.Cada punto es una coordenada UTM, de esta forma, es posible localizar los puntos creados en elpunto anterior.3 - A continuación comienza a trabajar la librería “gstat”. Comienza calculando un variogramasimple a partir de los datos de precipitación. Cuando se calcula un variograma simple, se puedeelegir calcular la diferencia de cuadrados para cada par de observaciones u obtener la media de ladiferencias de cuadrados sobre la distancia de los intervalos para un número dado de intervalos(Pebesma & Wessling, 1998). Se introducen los valores de precipitación de las estaciones en la librería.Se calcula el variograma a partir de los valores introducidosEl resultado es una representación de la varianza frente a la distancia de los puntos introducidos(figura 16). Las características de los 4 puntos representados se muestran en la figura 31
  35. 35. Figura 16. Representación gráfica del variograma. Debido a las pocas estaciones con las que se trabaja y que los valores de precipitación sonpróximos a cero, en principio, el ajuste en estos mapas no será del todo bueno y la distribuciónde los puntos será parecida a la de la figura 16, sin embargo, en los meses de verano donde lasprecipitaciones son prácticamente nulas se espera que la estimación de la precipitación en todo elárea sea próxima a cero.4 - En gstat, los modelos de variogramas están definidos como un modelo de un variogramasimple o como la suma de dos o más variogramas simples. Un modelo de un variograma simpleconsiste en un tipo de modelo y un factor de escala para la varianza. Los modelos utilizados sonlineal, esférico, exponencial, Gausiano, circular, pentaesférico y logarítmico. El parámetroreferido al rango puede definirse como una elipse de dos dimensiones o un elipsoide de tresdimensiones (Pebesma & Wessling, 1998). En este caso, debido a la distribución de los puntos, no hay un modelo que se ajuste mejor,por lo que se ha cogido el modelo lineal por defecto. Se ajusta el variograma:5- Por último se lleva a cabo la estimación de la precipitación a partir del modelo obtenido. Lapredicción puede ser global, usando todas las observaciones para cada predicción, o local,usando solo un conjunto de observaciones para un área en concreto. En este caso de predicciónlocal, el conjunto de puntos seleccionados puede ser definido en términos de máxima distancia opor proximidad entre estaciones, o combinación. El criterio de la distancia puede ser biengeográfico (Euclidiano) o tomar la distancia del variograma. El máximo número deobservaciones más próximas puede ser especificado por cuadrante (dos dimensiones) o octante(tres dimensiones) (Pebesma & Wessling, 1998). 32
  36. 36. A partir del modelo obtenido en el variograma y los datos de precipitación se lleva a cabo laestimación: Finalmente, se extraen los datos estimados de precipitación y se introducen en una matriz deigual dimensión que el modelo digital de elevaciones, donde la variable mapa contiene los datosde precipitación estimados y las variables “row” y “column” contienen el número de filas ycolumnas de la matriz.Subnivel 3 - Almacenamiento de coeficientes de las variables de la ecuación de regresión El resultado del subnivel 2 puede ser de dos tipos: Una ecuación de una, dos o tres variablesque se utilizará para llevar a cabo una interpolación mediante un modelo de regresión lineal ouna interpolación mediante el krigeado que hace uso de las tres variables independientes. Elsubnivel 3 se centra en el primer resultado, ya que, al tratarse de una interpolación mediante unmodelo de regresión es necesario conocer los coeficientes asociados a las variablesindependientes, para el posterior cálculo de precipitación. En este apartado, se comprueba el número de variables independientes que contiene laecuación de regresión. Las tres variables con las que trabaja el modelo son latitud, longitud yaltitud. Los criterios de almacenamientos son los siguientes (figura 17):  Si el número de variables es uno, almacena el coeficiente de la única variable con la que trabajo. En primer lugar, se identifica la variable de la ecuación (latitud, longitud o altitud) y a continuación se almacena su coeficiente.  Si el número de variables es dos, almacena los coeficientes de cada variable. En este caso es necesario identificar las dos variables. Dado que trabajamos con tres variables, la identificación se hace mediante la comprobación de las siguientes combinaciones de dos variables:  Latitud y longitud.  Latitud y altitud.  Longitud y altitud.  Una vez conocida la combinación, se procede a almacenar los coeficientes.  Si el número de variables es tres, en ese caso no hay que hacer ninguna identificación ya que se conocen las tres variables independientes, por lo que se almacenan correspondientes coeficientes. 33
  37. 37. Figura 17. Diagrama subnivel 3. En función del número de variables que contenga la ecuación, la identificación y almacenamiento de coeficientes tomará un camino distinto en el proceso. La implementación de este subnivel en lenguaje R se ha hecho mediante condicionantes “if”en los que se ha ido comprobando el número de variables que presenta la ecuación. Acontinuación se almacenan los coeficientes en un vector de “n” posiciones, que se usaráposteriormente en el cálculo para la interpolación climática (figura 18). Figura 18. Pseudocódigo subnivel 3. 34
  38. 38. Este vector contiene cuatro posiciones que almacena los coeficientes de las variablesindependientes. Cada posición del vector esta reservado para el coeficiente de una variableindependiente. En caso, de que alguna variable se haya suprimido, se almacenará entonces unvalor de cero en el vector (figura 19).Figura 19. Representación gráfica del almacenamiento de los coeficientes de las variables en un vector.Subnivel 4 – Interpolación de datos climáticos Este último subnivel consiste en el cálculo de la precipitación para el área de estudio. Comose comentó anteriormente, este proceso de interpolación consistirá en desplazar la ecuación, conlas variables que la componga y sus correspondientes coeficientes, por cada celda del modelodigital de elevaciones y de esta forma obtener un dato de precipitación en cada celda. Como se puede apreciar en el diagrama de la figura 20, el proceso comienza con una matrizde entrada que será el modelo digital de elevaciones. Cada celda del modelo digital deelevaciones tiene un valor de longitud, latitud y altitud. El procedimiento consistirá en recorrer lamatriz, celda a celda. Para poder recorrer la matriz, se hará uso de dos bucles. Un primer bucle seencargará de leer las filas de la matriz y un segundo bucle leerá las columnas de la matriz. Elprimer bucle lee la fila “m” de la matriz de entrada. A continuación, comienza un segundo bucleque lee la columna “n”. De esta forma, el segundo bucle lee todas las celdas de la fila “m”.Cuando termina de leer todas las celdas de la fila “m”, pasa a la siguiente fila “m+1”, y asísucesivamente hasta completar toda la matriz. 35
  39. 39. Figura 20. Diagrama subnivel 4. Proceso de estimación de la precipitación tomando valores de una matriz de entrada y a partir de la ecuación de regresión calcula y exporta los valores a una matriz de salida. Cuando el proceso se encuentra en la celda (m,n), extrae los valores de longitud, latitud yaltitud y los introduce en la ecuación siguiente: Los valores de cada variable, son multiplicados por los coeficientes que se obtuvieron en elsubnivel 3 y que se almacenaron en un vector. La ecuación toma los coeficientes de la posiciónindica en el vector: En aquellos casos en los que el modelo esta formado por una o dos variables, el vectoralmacena un valor de cero para aquellas variables suprimidas. De esta forma, la variablesuprimida se multiplica por cero y no se tiene en cuenta en la suma. El valor de precipitación obtenido se almacena en una nueva matriz de salida. La matriz desalida tiene la misma dimensión que la matriz de entrada. En la matriz de salida, el valor deprecipitación se almacenará en la misma posición (m,n), la misma posición que la matriz deentrada. 36
  40. 40. 5.5.4. Automatización en la exportación de los mapas climático La matriz resultante del proceso de interpolación se exporta a formato reconocible por elsoftware ENVI. La librería “CaTools” permite importar y exportar resultados generado en R alsoftware ENVI y de esta forma poder visualizarlos en forma de imagen. La figura 21 muestra el diagrama final con todos los niveles del proceso de automatizaciónunidos, formando una estructura que tiene un comienzo con la importación de los datos deprecipitación del primer mes y del primer año y finaliza cuando ha generado el mapa deprecipitación para el último mes y del último año. Figura 21. Diagrama final del proceso de automatización con todos los niveles ensamblados. 37
  41. 41. 6. RESULTADOS El modelo construido genera un total de 70 mapas, 13 mapas por cada año. De los 13 mapastotales, 12 mapas corresponden a los 12 meses del año (65 mapas de precipitación mensual entotal) y el último mapa corresponde a la precipitación anual (5 mapas de precipitación anual entotal). La tabla 8 muestra la clasificación de los meses según el modelo de interpolaciónutilizado. Tabla 8. Clasificación del total de mapas generados según el modelo de interpolación. Año Mapas precipitación mensual Mapas precipitación anual Modelo de Krigeado Modelo de Krigeado regresión regresión 2004 8 4 1 - 2005 7 5 1 - 2006 4 8 - 1 2007 5 7 1 - 2008 5 7 1 - 2009 3 2 - - Total 32 33 4 1 Ya sea una interpolación por un modelo de regresión o por un krigeado, el mapa resultantetiene una dimensión de 2190 filas y 2282 columnas con un tamaño de celda de 20 metros. Ladiferencia entre los métodos radica en la interpolación. Un modelo de regresión hace unaestimación de la precipitación sobre el polígono proporcionado por el modelo digital deelevaciones, quedando las demás celdas de la matriz sin ningún valor numérico (figura 22). Figura 22. Matriz de precipitación mediante un modelo de regresión. Se puede apreciar el polígonoutilizado que representa el Parque Natural del Cabo de Gata-Níjar (Almería). Dentro de este polígono se incluyen valores de precipitación. Las celdas situadas fuera del polígono no presentan valores y se representan de color negro. 38

×