SlideShare a Scribd company logo
1 of 15
Download to read offline
TESINA
in
ANALISI STATISTICA SPAZIALE
A.A. 2019/2020
Lezzi Mirko
Indice
Introduzione
1. Analisi inferenziale
1.1. Fase esplorativa dei dati
1.1.1. Analisi descrittiva spaziale
1.1.2. Analisi esplorativa elementare
1.2. Analisi strutturale: stima e modellizzazione del semivariogramma
1.3. Stima mediante il Kriging stazionario e commento dei risultati ottenuti
1.3.1. Costruzione della griglia
1.3.2. Applicazione del Kriging stazionario
2. Analisi di simulazione
2.1. Definizione dei campi aleatori
2.2. Simulazione mediante la tecnica di decomposizione di Cholesky
2.2.1. Costruzione della griglia
2.2.2. Applicazione della tecnica di decomposizione di Cholesky
2.3. Analisi strutturale e commento dei risultati ottenuti
Riferimenti bibliografici
~ ~ ~ ~ ~
Introduzione
Lo scopo del presente elaborato è quello di mettere in evidenza due differenti tecniche
geostatistiche attraverso un’applicazione pratica per ciascuna di esse.
È articolato in due capitoli:
• nel primo, si perseguono obiettivi previsivi o inferenziali. Infatti, sfruttando
l’informazione campionaria della variabile in esame sul dominio oggetto d’indagine,
si cercherà di stimare il comportamento di tale variabile in localizzazioni non
campionate. La tecnica di interpolazione stocastica utilizzata sarà quella del kriging
stazionario;
• nel secondo, si perseguono obiettivi di simulazione non condizionata. In particolare, non
disponendo di alcuna informazione campionaria sul dominio, si realizzeranno
diverse mappe, alternative ed equiprobabili, relative all’evoluzione spaziale del
fenomeno analizzato sull’area d’interesse. La tecnica di simulazione stocastica
utilizzata sarà quella della decomposizione di Cholesky.
Al fine di svolgere entrambe le analisi geostatistiche è stata utilizzato il software “SGeMS
beta - Stanford Geostatistical Modeling Software”, programma qualificato ad esaminare,
stimare e rappresentare l’evoluzione spaziale di variabili regionalizzate in un dominio
oggetto d’indagine.
Capitolo 1
Analisi inferenziale
1.1 Fase esplorativa dei dati – 1.1.1 Analisi descrittiva spaziale – 1.1.2 Analisi esplorativa elementare
– 1.2 Analisi strutturale: stima e modellizzazione del semivariogramma – 1.3 Stima mediante il
kriging stazionario e commento dei risultati ottenuti – 1.3.1 Costruzione della griglia – 1.3.2
Applicazione del Kriging stazionario
1.1 Fase esplorativa dei dati
La prima fase dell’analisi inferenziale consiste nel condurre un’indagine esplorativa dei dati
campionari relativi al fenomeno oggetto d’indagine, legato in questo caso la variabile
spaziale V18, e valutarne la loro distribuzione sul dominio considerato. Tale fase
preliminare, risulta molto importante al fine di ottenere subito una visione generale del
fenomeno e, conseguentemente, evitare errori (sistematici o materiali) nelle successive fasi
dell’analisi, influenzando così i risultati finali ottenuti.
È possibile suddividere tale fase nell’analisi descrittiva spaziale e nell’analisi esplorativa
elementare che andremo a trattare di seguito.
1.1.1 Analisi descrittiva spaziale
L’obiettivo di questa analisi è quello di individuare la distribuzione spaziale della variabile
spaziale V18. Andremo, quindi, ad identificare nel dominio oggetto d’indagine le
localizzazioni campionate. A tal proposito, si consideri la seguente mappa di
localizzazione.
Fig. 1: mappa di localizzazione
Come è possibile notare dalla mappa precedente, il campionamento spaziale effettuato è di
tipo aleatorio uniforme, in cui le 50 localizzazioni campionate, ciascuna rappresentata da una
coppia di coordinate espresse in metri, sono disposte in maniera casuale sul dominio.
Parleremo, dunque, di dominio puntuale di tipo irregolare. Inoltre, si noti come,
esclusivamente nella zona Nord-Ovest della mappa vi sia una notevole riduzione della
concentrazione di localizzazioni campionate, a differenza di quanto può essere detto per
tutto il resto del dominio spaziale.
Successivamente, per descrivere e interpretare le caratteristiche spaziali della variabile V18,
si ricorre alla mappa a scala di colore.
Fig. 2: mappa a scala di colore
In tale mappa, ad ogni gradazione di colore corrisponde una differente intensità della
variabile spaziale, come da legenda. Notiamo dalla Fig. 2, che i valori osservati dal
fenomeno nelle localizzazioni campionate si distribuiscono per lo più in maniera irregolare
sul dominio, possiamo affermare che la variabile spaziale presenta un comportamento
eterogeneo nell’area di indagine; tuttavia, si può riferire la presenza di una discreta
concentrazione di valori medio-bassi (dal verde al blu) nella zona Ovest del dominio, e una
moderata concentrazione di valori medio-alti (dal giallo al rosso) nella zona Nord-Est del
dominio stesso. È bene precisare però, che non è in ogni modo ipotizzabile la presenza di
un trend definito, ovvero direzioni privilegiate lungo le quali i valori della variabile spaziale
aumentano o diminuiscono sistematicamente.
Inoltre, esclusivamente per una maggiore conoscenza del fenomeno oggetto di analisi, sono
state messe in evidenza tramite dei cerchi bianchi, le due localizzazioni campionate in cui la
variabile assume il valore più basso pari a 24.46 (in blu scuro) e il valore più alto pari a 44.40
(rosso scuro), ovvero i due estremi presenti sulla scala. L’analisi descrittiva spaziale risulta
così conclusa.
1.1.2 Analisi esplorativa elementare
Complementare all’analisi descrittiva spaziale, quella esplorativa elementare viene
condotta sia tramite una rappresentazione grafica (in forma tabellare) dei dati osservati,
idonea ad esporre i dati in forma sintetica, evidenziandone le caratteristiche principali dei
dati stessi, sia tramite il calcolo di opportuni indici statistici descrittivi.
Si procede, quindi, con la rappresentazione più ricorrente utilizzata in questi casi:
l’istogramma.
Fig. 3: istogramma e alcuni indici di posizione
Tale strumento consente di verificare l’omogeneità delle osservazioni, identificare eventuali
valori anomali e valutare l’asimmetria della distribuzione. Tuttavia, prima di giungere a tali
analisi è opportuno determinare un numero ottimale di classi (anche note come modalità),
ovvero degli intervalli in cui registrare le rispettive osservazioni. Notiamo che sull’asse delle
ascisse sono riportate le varie classi, mentre sull’asse delle ordinate le relative frequenze
relative, calcolate come n° di osservazioni in ciascuna classe in rapporto al n° di osservazioni
totali, cioè 50, le nostre localizzazioni.
In questo caso, riducendo via via il numero di classi, siamo stati in grado di notare
graficamente la presenza di una lieve asimmetria positiva, per cui è stato possibile applicare
la formula di Sturges, al fine di determinare il numero ottimale s delle classi dell’istogramma,
ovvero:
𝑠 = 1 + 3.32 ∗ 𝑙𝑜𝑔10(50) = 6.64 ≈ 7
Costruito con 7 classi, come si nota dalla Fig. 3, l’istogramma della variabile spaziale
presenta una distribuzione unimodale molto simile a quella di una distribuzione Gaussiana.
Inoltre, la minima asimmetria positiva della distribuzione valutata rispetto all’asse
mediano, è confermata dalla seguente relazione, seppur i valori siano assai vicini tra di loro,
come ci si aspettava:
𝑚𝑒𝑑𝑖𝑎 > 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 → 35.04 > 34.56
Possiamo ora soffermarci sull’analisi di alcune statistiche descrittive rilevanti in questo caso.
A tal fine, risulta importante dire che non si notano valori estremamente bassi o
estremamente elevati per la variabile spaziale V18, tali da indurci ad ipotizzare la presenza
di valori anomali, per cui tra gli indici di variabilità assoluta, in particolare tra gli intervalli
di variazione, è consistente valutare il campo di variazione (si ritiene superfluo a questo punto
il calcolo della differenza interquartilica), utilizzando esclusivamente i valori di due
osservazioni già noti precedentemente:
𝐶𝑎𝑚𝑝𝑜 𝑑𝑖 𝑣𝑎𝑟𝑖𝑎𝑧𝑖𝑜𝑛𝑒 = 𝑣𝑎𝑙𝑜𝑟𝑒 𝑚𝑎𝑠𝑠𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑜 = 44.4 − 24.46 = 19.94
Un range che, dati i valori in esame, potremmo considerare notevole. Tra l’altro, anche la
varianza, pari a 22.56, quale indice di dispersione dei dati osservati attorno alla media,
evidenzia un ragionevole livello di variabilità. Questo è confermato anche dallo scarto
quadratico medio, ottenuto come segue:
𝑆𝑐𝑎𝑟𝑡𝑜 𝑞𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑐𝑜 𝑚𝑒𝑑𝑖𝑜 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √22,56 = 4,74
I valori ottenuti, rispecchiano quindi le intuizioni sostenute in sede di analisi descrittiva
spaziale, ovvero quelle relative ad un comportamento abbastanza eterogeno sul dominio
d’indagine. Infine, utile per fini comprativi, essendo un numero pure, adimensionale,
potrebbe essere il coefficiente di variazione:
𝐶𝑜𝑒𝑓𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑖 𝑣𝑎𝑟𝑖𝑎𝑧𝑖𝑜𝑛𝑒 = (
𝑠𝑐𝑎𝑟𝑡𝑜 𝑞𝑢𝑎𝑑. 𝑚𝑒𝑑𝑖𝑜
𝑚𝑒𝑑𝑖𝑎
) ∗ 100 = (
4,74
35,04
) ∗ 100 = 13,52%
In questo modo, si conclude la prima fase dell’analisi inferenziale.
1.2 Analisi strutturale: stima e modellizzazione del
semivariogramma
La seconda fase dell’analisi dell’evoluzione spaziale relativa alla variabile V18, è
rappresentata dall’analisi strutturale, ovvero individuare una misura per la correlazione
spaziale esistente tra le localizzazioni campionate del fenomeno. Questa analisi, si compone,
in prima battuta, della stima del semivariogramma empirico omnidirezionale (mediato su
tutte le direzioni) e dai semivariogrammi empirici direzionali (indicati per valutare la
correlazione spaziale lungo specifiche direzioni). Infine, si procederà alla modellizzazione
del semivariogramma omnidirezionale precedentemente stimato, ricorrendo all’utilizzo di
alcuni modelli standard presenti in letteratura.
Al fine di procedere nell’analisi, è stato fondamentale fare alcune considerazioni di natura
strettamente inferenziale. Dal momento che la stima del semivariogramma è ritenuta
attendibile fino ad una distanza ℎ 𝑚𝑎𝑥, è risultato necessario definire:
• 𝒅 𝒎𝒂𝒙, cioè la distanza massima tra le localizzazioni campionate (tramite la formula
della distanza euclidea), pari a 552.94 metri;
• 𝒉 𝒎𝒂𝒙, cioè la distanza massima per la stima del semivariogramma, pari
approssimativamente a (𝑑 𝑚𝑎𝑥 2⁄ ) = 276.47 metri.
Per cui, in Fig. 4, è riportata la stima del semivariogramma empirico direzionale.
Fig. 4: semivariogramma empirico omnidirezionale
Come è possibile osservare, si è scelto, dopo un’accurata analisi grafica, di stimare il
semivariogramma omnidirezionale su 7 valori del lag h, attribuendo al parametro lag
separation (distanza tra i lags) un valore pari a 24 e conseguentemente al paramento lag
tolerance (tolleranza sulla distanza, utile in particolar modo per i domini di punti irregolari)
un valore pari a 12; inoltre, al parametro tolerance (tolleranza sulla direzione) è stato
attribuito un angolo di rotazione pari a 90° e infine il parametro bandwidth (restringimento
del cono di rotazione) è pari a 92.
La scelta di tali valori, in particolar modo i primi tre, non è stata casuale. Infatti, sono stati
individuati determinati valori che rendessero, dal punto di vista grafico, sia chiaro il
comportamento in prossimità dell’origine del semivariogramma, sia la distanza in prossimità
della quale quest’ultimo tendesse a stabilizzarsi, e quindi individuarne la rispettiva sella
globale. È bene sottolineare che questo procedimento è stato fatto nel pieno rispetto
simultaneo di due regole pratiche:
1. 𝒏° 𝒅𝒊 𝒍𝒂𝒈𝒔 ∗ 𝒍𝒂𝒈 𝒔𝒆𝒑𝒂𝒓𝒂𝒕𝒊𝒐𝒏 ≤ 𝒉 𝒎𝒂𝒙; infatti, come già detto, oltre ad ℎ 𝑚𝑎𝑥 la stima
non sarebbe più attendibile;
2. 𝒏° 𝒅𝒊 𝒄𝒐𝒑𝒑𝒊𝒆 𝒊𝒏𝒅𝒊𝒗𝒊𝒅𝒖𝒂𝒕𝒆 𝒑𝒆𝒓 𝒐𝒈𝒏𝒊 𝒍𝒂𝒈 ≥ 𝟐𝟎 − 𝟑𝟎; infatti, avere un numero
inferiore di coppie individuate in corrispondenza di ciascun lag, anche questo
potrebbe rendere la stima non attendibile.
Risulta chiara, dalla Fig. 4, la verifica di entrambe le regole.
Nella successiva Fig. 5, invece, si riporta la stima dei semivariogrammi empirici
direzionali, in particolare, al variare dell’angolo polare 𝛼 lungo le direzioni 45° e 90°.
Fig. 5: semivariogrammi empirici direzionali
Tale stima è stata ottenuta modificando, rispetto ai parametri precedenti, il valore di
tolerance lungo la direzione, impostando un angolo di rotazione pari a 22,5° in modo tale che
la stima risulti maggiormente indirizzata lungo le direzioni indicate.
Dalla figura precedente cerchiamo di effettuare alcune valutazioni. È possibile notare con
estrema chiarezza che il range dei due semivariogrammi direzionali è uguale in entrambi i
casi. Per quanto riguarda la sella (ultimo lag considerato) notiamo che tende ad essere molto
simile nei due casi, parliamo infatti di una differenza pari solo a 0.60 sull’asse delle ordinate
tra i due punti. Questo ci aiuta nell’affermare che i due semivariogrammi, su una stima di 7
lags, tendono a stabilizzarsi in prossimità di uno stesso valore. Infine, in merito al
comportamento in prossimità dell’origine possiamo escludere che sia di tipo lineare ma che
rifletta maggiormente un comportamento parabolico in entrambi i casi. I due
semivariogrammi direzionali, tendono a seguire una modello di tipo Gaussiano.
Sulla base di queste considerazioni, è possibile affermare che siamo in presenza di isotropia,
ovvero il caso cui la cui variabile regionalizzata V18 sia, appunto, isotropa, e quindi il
fenomeno si manifesti lungo le due differenti direzioni senza variazioni significative.
Infine, per concludere la fase dedicata all’analisi strutturale, si ricorre alla modellizzazione
del semivariogramma empirico omnidirezionale stimato in precedenza, attraverso l’utilizzo
di un modello standard noto in letteratura. Vediamo nella figura successiva il modello
adattato:
Fig. 6: semivariogramma empirico omnidirezionali e relativo modello
Al fine di descrivere la correlazione spaziale nelle localizzazioni campionate relativa alla
variabile V18 oggetto d’analisi, è stato adattato un modello standard di tipo Gaussiano,
caratterizzato da un comportamento parabolico in prossimità dell’origine (tipico di una
variabile regionalizzata continua e differenziabile) e da una sella raggiunta asintoticamente.
L’espressione analitica del modello è la seguente:
𝛾(ℎ, 0°) = {
0 ℎ = 0
.
9.7 + 15.1 ∙ 𝐺𝑎𝑢(ℎ; 173) ℎ > 0
Come si può notare, al fine di rendere numericamente e graficamente stabile il modello, è
stato sommato un effetto nugget (un effetto di discontinuità nell’origine) pari a 9.7, è stata
considerata una sill contribution (contributo alla sella) pari a 15.1 (da cui il valore della sella
globale 9.7+15.1 = 24.8) ed infine un range effettivo (distanza oltre la quale il semivariogramma
si stabilizza) pari a 173 metri.
Conclusa la seconda fase, è possibile procedere con la fase successiva, quella relativa alla
stima.
1.3 Stima mediante il Kriging stazionario e commento dei risultati
ottenuti
Il punto conclusivo dell’analisi inferenziale, è quello di stimare la distribuzione spaziale
della variabile V18 oggetto d’indagine nelle localizzazioni non campionate del nostro
dominio. Per fare questo, utilizzeremo la tecnica del kriging stazionario, che possiamo
applicare proprio grazie all’aver adattato un modello idoneo a descrivere la correlazione
spaziale del fenomeno nelle localizzazioni campionate.
1.3.1 Costruzione della griglia
Dapprima, si è ritenuto necessario adattare una griglia idonea a ricoprire l’area d’interesse.
In particolare, è stata fissata una griglia quadrata di dimensioni 90 x 90, con incremento pari
a 4.5 sull’asse delle ascisse e di 4.3 sull’asse delle ordinate. In seguito alla definizione della
seguente griglia, sono state individuate tutte le localizzazioni non campionate, ovvero tutti
i singoli nodi, in cui, per ciascuno di essi, si stimerà attraverso il sistema del kriging
stazionario.
Successivamente, in corrispondenza di ogni nodo della griglia, è stato definito un intorno
di ricerca (search ellipsoid) in grado di considerare, all’interno del sistema del kriging, parte
dell’informazione campionaria circostante. Più in dettaglio, l’intorno è caratterizzato da min
= 1 e max = 6 punti che devono rientrare nello stesso, e da un raggio pari a 110 metri.
Chiaramente, la scelta di questi valori, non è stata casuale, ma è stata dettata dalla specifica
distribuzione geografica della variabile spaziale V18 e dalla distanza tra le localizzazioni
campionate. In particolare, il numero minimo di punti è stato influenzato dal fatto che, come
già detto nel paragrafo 1.1.1, nella zona Nord-Ovest vi è una notevole riduzione di
localizzazioni campionate, per cui si è ritenuto necessario abbassare tale soglia. Per quanto
riguarda il raggio dell’intorno, è stato fissato in modo tale che non eccedesse il range
stabilito nel modello di semivariogramma, oltre il quale, come sappiamo, non vi è più
correlazione spaziale1.
1.3.2 Applicazione del Kriging stazionario
Avendo tutte le informazioni disponibili, è stato possibile effettuare la stima dei valori della
variabile in esame in ciascun nodo della griglia, come da Fig. 7.
Fig. 7: mappa delle stime del Kriging stazionario
1 In un caso di isotropia come il nostro, l’intorno di ricerca è una circonferenza ed il raggio dello stesso non deve mai essere
superiore al range del modello di variogramma adattato.
VALIDAZIONE DELLA MAPPA. Una volta ottenute le stime, bisogna valutarne
l’affidabilità analizzando la mappa ottenuta. Anzitutto, è possibile affermare che risulta
chiara ed evidente la distribuzione spaziale della variabile V18, che, tra l’altro, conferma
quelle che erano state le nostre intuizioni iniziali, puramente grafiche, relative alla mappa a
scala di colore (Fig. 2). Infatti, sovrapponendo quest’ultima alla mappa delle stime, è
possibile notare come i colori, e quindi i valori osservati della variabile, nelle localizzazioni
campionate, siano quasi del tutto identici ai valori stimati tramite la tecnica del kriging.
Quasi del tutto, perché, la nostra distribuzione, come è stato già detto, è caratterizzata da
una notevole eterogeneità dei valori osservati, ciò nonostante soltanto in pochissime
localizzazioni è stato difficile per il kriging stimarne il valore.
Tuttavia, le altre ragioni che ci hanno portato a ritenere affidabili le stime ottenute sono le
seguenti.
In primis, il valore di minimo stimato dal kriging pari a 28.73 e quello di massimo pari a
41.65 sono comunque vicini a quelli inizialmente osservati. Inoltre, essendo i primi compresi
nel range dei valori delle localizzazioni campionate, è possibile osservare che tutti i pesi
calcolati tramite il sistema del kriging stazionario sono positivi (e compresi tra 0 e 1), per cui
non essendoci pesi negativi in corrispondenza di una localizzazione campionata, non si ha
la presenza di effetto schermo2.
Come seconda motivazione, si valuti la seguente Fig. 8.
Fig. 8: mappa della varianza dell’errore di stima
VALIDAZIONE DELLA MAPPA. La Fig. 8 consente di valutare, dal punto di vista grafico,
l’incertezza relativa alle stime della variabile V18 ottenute attraverso il kriging stazionario.
Come si può notare, quasi tutto il dominio è caratterizzato da un colore blu scuro, vale a
dire, come da legenda, la minima varianza dell’errore di stima possibile. Esclusivamente
nelle zone in cui non vi sono localizzazioni campionate, la varianza dell’errore tende ad
aumentare leggermente, ma questo è assolutamente ragionevole. In tal modo, è stato
2 Presenza di localizzazioni campionate che si posizionano tra il punto non campionato e la localizzazione considerata.
trovato un compromesso giusto al fine di ottenere sia una buona mappa delle stime, sia una
buona mappa della varianza dell’errore.
In conclusione, è possibile garantire l’efficacia della tecnica di interpolazione utilizzata, il
kriging stazionario, che per costruzione è uno stimatore non distorto ed anche un
interpolatore esatto; nonché garantire l’attendibilità delle stime ottenute della variabile
spaziale V18.
~ ~ ~ ~ ~
Capitolo 2
Analisi di simulazione
1.1 Definizione dei campi aleatori – 1.2 Simulazione mediante la tecnica di decomposizione di
Cholesky – 1.2.1 Costruzione della griglia – 1.2.2 Applicazione della tecnica di decomposizione di
Cholesky – 1.3 Analisi strutturale e commento dei risultati ottenuti
1.1 Definizione dei campi aleatori
La prima fase dell’analisi di simulazione, consiste nel definire i differenti campi aleatori
grazie ai quali, come vedremo nei paragrafi successivi, sarà possibile procedere nella
realizzazione delle mappe simulate alternative ed equiprobabili.
In particolare, consideriamo i seguenti campi aleatori (𝑍1, 𝑍2, 𝑍3), definiti in seguito, di cui
è noto il modello di correlazione spaziale, ovvero il modello di semivariogramma, idoneo a
caratterizzare la distribuzione della variabile in esame sul dominio di riferimento. Si noti,
inoltre, la sella globale sempre pari ad 1, essendo la tecnica di decomposizione di Cholesky
applicata nel prossimo paragrafo, una tecnica di simulazione di campi aleatori gaussiani.
𝑠𝑓𝑒𝑟𝑖𝑐𝑜 𝑍1 ∶ 𝛾1(ℎ) = {
0 ℎ = 0
.
0.23 + 0.77 ∙ 𝑆𝑝ℎ(ℎ; 18) ℎ > 0
𝑒𝑠𝑝𝑜𝑛𝑒𝑛𝑧𝑖𝑎𝑙𝑒 𝑍2 ∶ 𝛾2(ℎ) = {
0 ℎ = 0
.
0.23 + 0.77 ∙ 𝐸𝑥𝑝(ℎ; 18) ℎ > 0
𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑜 𝑍3 ∶ 𝛾3(ℎ) = {
0 ℎ = 0
.
0.23 + 0.77 ∙ 𝐺𝑎𝑢(ℎ; 18) ℎ > 0
1.2 Simulazione mediante la tecnica di decomposizione di
Cholesky
Una volta definiti i campi aleatori e le loro rispettive caratteristiche, è possibile procedere
alla costruzione delle differenti realizzazioni alternative ed equiprobabili. È opportuno fare
una breve, ma opportuna, precisazione. La seguente tecnica di simulazione stocastica verrà
applicata nel caso non condizionato, ovvero nel caso in cui non c’è alcuna dipendenza delle
simulazioni ottenute rispetto all’informazione campionaria osservata nelle localizzazioni
sul dominio, sia che si disponga di tale informazione o meno. Si richiede, esclusivamente, la
conoscenza del modello di correlazione spaziale.
1.2.1 Costruzione della griglia
Al fine di rendere possibili le simulazioni, è necessario definire in maniera chiara il dominio
entro cui simulare, per cui, anche in questo caso si ricorre alla costruzione di una griglia.
Questo deve essere effettuato nel rispetto della prima condizione richiesta dal metodo di
decomposizione di Cholesky, ovvero che il numero N di localizzazioni non campionate (o
nodi), in cui ottenere la simulazione, risulti essere non elevato, con precisione (𝑁 ≤ 103
).
In questo caso, è stata fissata una griglia di dimensioni 28 × 28, con un incremento unitario
sull’asse delle ascisse così come sull’asse delle ordinate, per cui il numero di nodi ottenuti,
784, rispetta la prima condizione.
1.2.2 Applicazione della tecnica di decomposizione di Cholesky
La seconda condizione richiesta per l’applicazione di tale metodo, anche noto come metodo
Lower Upper, consiste nel produrre un numero sufficientemente elevato di realizzazioni. In
questa analisi, sono state effettuate 3 realizzazioni simulate non condizionate per ognuno
dei 3 differenti campi aleatori (𝑍1, 𝑍2, 𝑍3) considerati, come da Fig. 1.
Fig. 1: mappe simulate non condizionate per i campi aleatori (𝑍1, 𝑍2, 𝑍3)
Come è possibile notare dalle mappe precedenti, in quelle relative al campo aleatorio 𝑍3, il
cui modello di correlazione spaziale è di tipo Gaussiano, vi è una maggiore concentrazione
di colori simili; dal punto di vista grafico, infatti, possiamo affermare che vi è “meno rumore”,
una minore dispersione della distribuzione del fenomeno spaziale.
Il motivo di ciò, da un punto di vista più teorico, risiede nel fatto che il modello Gaussiano è
l’unico a garantire maggiore continuità spaziale rispetto alle mappe simulate per i campi
aleatori caratterizzati dai modelli di semivariogramma sferico ed esponenziale, questo
perché il comportamento parabolico in prossimità dell’origine di un modello Gaussiano è
tipico di una variabile regionalizzata continua e differenziabile.
1.3 Analisi strutturale e commento dei risultati ottenuti
L’ultima fondamentale fase della presente analisi consiste nel garantire che il processo
simulato rispetti le caratteristiche globali fissate inizialmente, vale a dire i momenti del 1° e
2° ordine e quindi i modelli di semivariogramma definiti nel paragrafo 1.1.
Al fine di verificare empiricamente tale proprietà, è stata condotta un’analisi strutturale
stimando i semivariogrammi sperimentali per ogni realizzazione dei campi aleatori (𝑍1, 𝑍2,
𝑍3), adattandone i rispettivi modelli.
Prima, tuttavia, si è ritenuto utile fare alcuni semplici calcoli a ritroso di alcuni parametri
già noti dall’analisi inferenziale, motivo per cui non si approfondisce ulteriormente il
significato in questa sede:
• 𝒅 𝒎𝒂𝒙 = √282 + 282 = √784 + 784 = √1568 = 39.59 ≈ 39.6 ;
• 𝒉 𝒎𝒂𝒙 =
𝑑 𝑚𝑎𝑥
2⁄ = 19.8 ;
• 𝒍𝒂𝒈 𝒔𝒆𝒑𝒂𝒓𝒂𝒕𝒊𝒐𝒏 = √12 + 12 = 1.414, in questo caso tale parametro rappresenta la
lunghezza del vettore di coordinate (1 ; 1) dal momento che ci troviamo su un dominio
di punti regolare, ovvero la nostra griglia, costituita da 28 celle in ascissa e 28 celle in
ordinata;
• 𝒏° 𝒅𝒊 𝒍𝒂𝒈𝒔 =
ℎ 𝑚𝑎𝑥
𝑙𝑎𝑔 𝑠𝑒𝑝𝑎𝑟𝑎𝑡𝑖𝑜𝑛
=
19.8
1.414
= 14, cioè il numero massimo di lags su cui è
possibile effettuare la stima.
Di conseguenza, si rappresentano in Fig. 2, le stime dei semivariogrammi empirici ed i
rispettivi modelli adattati, per ciascun campo aleatorio, relative ad un n° di lags ritenuto
idoneo pari ad 8.
Fig. 2: semivariogrammi e rispettivi modelli delle mappe simulate per i campi aleatori (𝑍1, 𝑍2, 𝑍3)
Dall’analisi della figura precedente, dopo aver opportunamente impostato l’asse delle
ordinate, si può affermare che, soprattutto in merito al comportamento in prossimità
dell’origine e più in generale per i primi lags (in cui è più importante un’adeguata misura
della correlazione spaziale per brevi distanze) i modelli adattati si adattano bene ai
semivariogrammi empirici stimati sulle mappe simulate, non risulta esserci un eccessivo
scostamento.
Possiamo concludere la seguente analisi confermando che il processo simulato per i
differenti campi aleatori (𝑍1, 𝑍2, 𝑍3) è stato eseguito nel rispetto delle caratteristiche globali
fissate inizialmente.
Riferimenti bibliografici
Donato Posa, Sandra De Iaco; Geostatistica: teoria ed applicazioni, Giappichelli Editore, 2009.

More Related Content

What's hot

Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"
Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"
Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"Constantina Kotsari
 
Rock Physics: Basic Concepts
Rock Physics: Basic ConceptsRock Physics: Basic Concepts
Rock Physics: Basic ConceptsAli Osman Öncel
 
ελατηριο μαζα νημα ταλαντωση
ελατηριο μαζα νημα ταλαντωσηελατηριο μαζα νημα ταλαντωση
ελατηριο μαζα νημα ταλαντωσηΜαυρουδης Μακης
 
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολής
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολήςδιαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολής
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολήςΒιώνης Παναγιώτης
 
Introduction to Rock Physics
Introduction to Rock PhysicsIntroduction to Rock Physics
Introduction to Rock Physicsdinomasch
 

What's hot (6)

Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"
Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"
Σενάριο "γραμματα" - Χελωνόκοσμος "Αβάκιο"
 
Rock Physics: Basic Concepts
Rock Physics: Basic ConceptsRock Physics: Basic Concepts
Rock Physics: Basic Concepts
 
Convolution and deconvolution
Convolution and deconvolution Convolution and deconvolution
Convolution and deconvolution
 
ελατηριο μαζα νημα ταλαντωση
ελατηριο μαζα νημα ταλαντωσηελατηριο μαζα νημα ταλαντωση
ελατηριο μαζα νημα ταλαντωση
 
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολής
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολήςδιαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολής
διαγώνισμα γ προσανατολισμού μέχρι ρυθμό μεταβολής
 
Introduction to Rock Physics
Introduction to Rock PhysicsIntroduction to Rock Physics
Introduction to Rock Physics
 

Similar to Analisi statistica spaziale

1 alberti-prima parte - Metodi di Interpolazione
1 alberti-prima parte - Metodi di Interpolazione1 alberti-prima parte - Metodi di Interpolazione
1 alberti-prima parte - Metodi di InterpolazioneRiccardo Rigon
 
Le misure di variabilità
Le misure di variabilitàLe misure di variabilità
Le misure di variabilitàVispo Srl
 
Metodo dei minimi quadrati
Metodo dei minimi quadratiMetodo dei minimi quadrati
Metodo dei minimi quadratiLuigi Pasini
 
EC_: mio dispensario_calcolo_semiprobabilistico
EC_: mio dispensario_calcolo_semiprobabilisticoEC_: mio dispensario_calcolo_semiprobabilistico
EC_: mio dispensario_calcolo_semiprobabilisticogiovanni Colombo
 
Analisi delle serie storiche
Analisi delle serie storicheAnalisi delle serie storiche
Analisi delle serie storicheMirkoLezzi
 
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologia
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologiaEC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologia
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologiagiovanni Colombo
 
Gli indici di posizione
Gli indici di posizioneGli indici di posizione
Gli indici di posizioneVispo Srl
 
3 alberti-seconda parte - About Spatial Correlation
3 alberti-seconda parte - About Spatial Correlation3 alberti-seconda parte - About Spatial Correlation
3 alberti-seconda parte - About Spatial CorrelationRiccardo Rigon
 
La correlazione lineare fra due variabili statistiche
La correlazione lineare fra due variabili statisticheLa correlazione lineare fra due variabili statistiche
La correlazione lineare fra due variabili statisticheLuigi Pasini
 
Studio sulle condizioni di validità del criterio di Barkhausen - Tesi
Studio sulle condizioni di validità del criterio di Barkhausen - TesiStudio sulle condizioni di validità del criterio di Barkhausen - Tesi
Studio sulle condizioni di validità del criterio di Barkhausen - TesiMatteo Smaila
 
Inferenza statistica
Inferenza statisticaInferenza statistica
Inferenza statisticaVispo Srl
 
Introduzione alla Gascromatografia
Introduzione alla GascromatografiaIntroduzione alla Gascromatografia
Introduzione alla GascromatografiaDavide Facciabene
 
Fse 08b - control charts
Fse   08b - control chartsFse   08b - control charts
Fse 08b - control chartsLuca Vecchiato
 
Vorticita ottiche in astronomia
Vorticita ottiche in astronomiaVorticita ottiche in astronomia
Vorticita ottiche in astronomiaIgnazio Licata
 
X-Ray Stress Analisys - Tensioni Residue
X-Ray Stress Analisys - Tensioni ResidueX-Ray Stress Analisys - Tensioni Residue
X-Ray Stress Analisys - Tensioni ResidueDavide Occello
 
I fenomeni bivariati
I fenomeni bivariatiI fenomeni bivariati
I fenomeni bivariatiVispo Srl
 

Similar to Analisi statistica spaziale (20)

1 alberti-prima parte - Metodi di Interpolazione
1 alberti-prima parte - Metodi di Interpolazione1 alberti-prima parte - Metodi di Interpolazione
1 alberti-prima parte - Metodi di Interpolazione
 
Le misure di variabilità
Le misure di variabilitàLe misure di variabilità
Le misure di variabilità
 
Metodo dei minimi quadrati
Metodo dei minimi quadratiMetodo dei minimi quadrati
Metodo dei minimi quadrati
 
EC_: mio dispensario_calcolo_semiprobabilistico
EC_: mio dispensario_calcolo_semiprobabilisticoEC_: mio dispensario_calcolo_semiprobabilistico
EC_: mio dispensario_calcolo_semiprobabilistico
 
Analisi delle serie storiche
Analisi delle serie storicheAnalisi delle serie storiche
Analisi delle serie storiche
 
Il modello Logistico
Il modello LogisticoIl modello Logistico
Il modello Logistico
 
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologia
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologiaEC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologia
EC_: mio articolo_ing._calcolo_semiprobabilistico_in neurologia
 
Gli indici di posizione
Gli indici di posizioneGli indici di posizione
Gli indici di posizione
 
8 Statistica
8 Statistica8 Statistica
8 Statistica
 
3 alberti-seconda parte - About Spatial Correlation
3 alberti-seconda parte - About Spatial Correlation3 alberti-seconda parte - About Spatial Correlation
3 alberti-seconda parte - About Spatial Correlation
 
La correlazione lineare fra due variabili statistiche
La correlazione lineare fra due variabili statisticheLa correlazione lineare fra due variabili statistiche
La correlazione lineare fra due variabili statistiche
 
Studio sulle condizioni di validità del criterio di Barkhausen - Tesi
Studio sulle condizioni di validità del criterio di Barkhausen - TesiStudio sulle condizioni di validità del criterio di Barkhausen - Tesi
Studio sulle condizioni di validità del criterio di Barkhausen - Tesi
 
Inferenza statistica
Inferenza statisticaInferenza statistica
Inferenza statistica
 
nicolettibell
nicolettibellnicolettibell
nicolettibell
 
Introduzione alla Gascromatografia
Introduzione alla GascromatografiaIntroduzione alla Gascromatografia
Introduzione alla Gascromatografia
 
5 Control Charts
5 Control Charts5 Control Charts
5 Control Charts
 
Fse 08b - control charts
Fse   08b - control chartsFse   08b - control charts
Fse 08b - control charts
 
Vorticita ottiche in astronomia
Vorticita ottiche in astronomiaVorticita ottiche in astronomia
Vorticita ottiche in astronomia
 
X-Ray Stress Analisys - Tensioni Residue
X-Ray Stress Analisys - Tensioni ResidueX-Ray Stress Analisys - Tensioni Residue
X-Ray Stress Analisys - Tensioni Residue
 
I fenomeni bivariati
I fenomeni bivariatiI fenomeni bivariati
I fenomeni bivariati
 

Analisi statistica spaziale

  • 2. Indice Introduzione 1. Analisi inferenziale 1.1. Fase esplorativa dei dati 1.1.1. Analisi descrittiva spaziale 1.1.2. Analisi esplorativa elementare 1.2. Analisi strutturale: stima e modellizzazione del semivariogramma 1.3. Stima mediante il Kriging stazionario e commento dei risultati ottenuti 1.3.1. Costruzione della griglia 1.3.2. Applicazione del Kriging stazionario 2. Analisi di simulazione 2.1. Definizione dei campi aleatori 2.2. Simulazione mediante la tecnica di decomposizione di Cholesky 2.2.1. Costruzione della griglia 2.2.2. Applicazione della tecnica di decomposizione di Cholesky 2.3. Analisi strutturale e commento dei risultati ottenuti Riferimenti bibliografici ~ ~ ~ ~ ~ Introduzione Lo scopo del presente elaborato è quello di mettere in evidenza due differenti tecniche geostatistiche attraverso un’applicazione pratica per ciascuna di esse. È articolato in due capitoli: • nel primo, si perseguono obiettivi previsivi o inferenziali. Infatti, sfruttando l’informazione campionaria della variabile in esame sul dominio oggetto d’indagine, si cercherà di stimare il comportamento di tale variabile in localizzazioni non campionate. La tecnica di interpolazione stocastica utilizzata sarà quella del kriging stazionario; • nel secondo, si perseguono obiettivi di simulazione non condizionata. In particolare, non disponendo di alcuna informazione campionaria sul dominio, si realizzeranno diverse mappe, alternative ed equiprobabili, relative all’evoluzione spaziale del fenomeno analizzato sull’area d’interesse. La tecnica di simulazione stocastica utilizzata sarà quella della decomposizione di Cholesky. Al fine di svolgere entrambe le analisi geostatistiche è stata utilizzato il software “SGeMS beta - Stanford Geostatistical Modeling Software”, programma qualificato ad esaminare, stimare e rappresentare l’evoluzione spaziale di variabili regionalizzate in un dominio oggetto d’indagine.
  • 3. Capitolo 1 Analisi inferenziale 1.1 Fase esplorativa dei dati – 1.1.1 Analisi descrittiva spaziale – 1.1.2 Analisi esplorativa elementare – 1.2 Analisi strutturale: stima e modellizzazione del semivariogramma – 1.3 Stima mediante il kriging stazionario e commento dei risultati ottenuti – 1.3.1 Costruzione della griglia – 1.3.2 Applicazione del Kriging stazionario 1.1 Fase esplorativa dei dati La prima fase dell’analisi inferenziale consiste nel condurre un’indagine esplorativa dei dati campionari relativi al fenomeno oggetto d’indagine, legato in questo caso la variabile spaziale V18, e valutarne la loro distribuzione sul dominio considerato. Tale fase preliminare, risulta molto importante al fine di ottenere subito una visione generale del fenomeno e, conseguentemente, evitare errori (sistematici o materiali) nelle successive fasi dell’analisi, influenzando così i risultati finali ottenuti. È possibile suddividere tale fase nell’analisi descrittiva spaziale e nell’analisi esplorativa elementare che andremo a trattare di seguito. 1.1.1 Analisi descrittiva spaziale L’obiettivo di questa analisi è quello di individuare la distribuzione spaziale della variabile spaziale V18. Andremo, quindi, ad identificare nel dominio oggetto d’indagine le localizzazioni campionate. A tal proposito, si consideri la seguente mappa di localizzazione. Fig. 1: mappa di localizzazione
  • 4. Come è possibile notare dalla mappa precedente, il campionamento spaziale effettuato è di tipo aleatorio uniforme, in cui le 50 localizzazioni campionate, ciascuna rappresentata da una coppia di coordinate espresse in metri, sono disposte in maniera casuale sul dominio. Parleremo, dunque, di dominio puntuale di tipo irregolare. Inoltre, si noti come, esclusivamente nella zona Nord-Ovest della mappa vi sia una notevole riduzione della concentrazione di localizzazioni campionate, a differenza di quanto può essere detto per tutto il resto del dominio spaziale. Successivamente, per descrivere e interpretare le caratteristiche spaziali della variabile V18, si ricorre alla mappa a scala di colore. Fig. 2: mappa a scala di colore In tale mappa, ad ogni gradazione di colore corrisponde una differente intensità della variabile spaziale, come da legenda. Notiamo dalla Fig. 2, che i valori osservati dal fenomeno nelle localizzazioni campionate si distribuiscono per lo più in maniera irregolare sul dominio, possiamo affermare che la variabile spaziale presenta un comportamento eterogeneo nell’area di indagine; tuttavia, si può riferire la presenza di una discreta concentrazione di valori medio-bassi (dal verde al blu) nella zona Ovest del dominio, e una moderata concentrazione di valori medio-alti (dal giallo al rosso) nella zona Nord-Est del dominio stesso. È bene precisare però, che non è in ogni modo ipotizzabile la presenza di un trend definito, ovvero direzioni privilegiate lungo le quali i valori della variabile spaziale aumentano o diminuiscono sistematicamente. Inoltre, esclusivamente per una maggiore conoscenza del fenomeno oggetto di analisi, sono state messe in evidenza tramite dei cerchi bianchi, le due localizzazioni campionate in cui la variabile assume il valore più basso pari a 24.46 (in blu scuro) e il valore più alto pari a 44.40
  • 5. (rosso scuro), ovvero i due estremi presenti sulla scala. L’analisi descrittiva spaziale risulta così conclusa. 1.1.2 Analisi esplorativa elementare Complementare all’analisi descrittiva spaziale, quella esplorativa elementare viene condotta sia tramite una rappresentazione grafica (in forma tabellare) dei dati osservati, idonea ad esporre i dati in forma sintetica, evidenziandone le caratteristiche principali dei dati stessi, sia tramite il calcolo di opportuni indici statistici descrittivi. Si procede, quindi, con la rappresentazione più ricorrente utilizzata in questi casi: l’istogramma. Fig. 3: istogramma e alcuni indici di posizione Tale strumento consente di verificare l’omogeneità delle osservazioni, identificare eventuali valori anomali e valutare l’asimmetria della distribuzione. Tuttavia, prima di giungere a tali analisi è opportuno determinare un numero ottimale di classi (anche note come modalità), ovvero degli intervalli in cui registrare le rispettive osservazioni. Notiamo che sull’asse delle ascisse sono riportate le varie classi, mentre sull’asse delle ordinate le relative frequenze relative, calcolate come n° di osservazioni in ciascuna classe in rapporto al n° di osservazioni totali, cioè 50, le nostre localizzazioni. In questo caso, riducendo via via il numero di classi, siamo stati in grado di notare graficamente la presenza di una lieve asimmetria positiva, per cui è stato possibile applicare la formula di Sturges, al fine di determinare il numero ottimale s delle classi dell’istogramma, ovvero: 𝑠 = 1 + 3.32 ∗ 𝑙𝑜𝑔10(50) = 6.64 ≈ 7
  • 6. Costruito con 7 classi, come si nota dalla Fig. 3, l’istogramma della variabile spaziale presenta una distribuzione unimodale molto simile a quella di una distribuzione Gaussiana. Inoltre, la minima asimmetria positiva della distribuzione valutata rispetto all’asse mediano, è confermata dalla seguente relazione, seppur i valori siano assai vicini tra di loro, come ci si aspettava: 𝑚𝑒𝑑𝑖𝑎 > 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 → 35.04 > 34.56 Possiamo ora soffermarci sull’analisi di alcune statistiche descrittive rilevanti in questo caso. A tal fine, risulta importante dire che non si notano valori estremamente bassi o estremamente elevati per la variabile spaziale V18, tali da indurci ad ipotizzare la presenza di valori anomali, per cui tra gli indici di variabilità assoluta, in particolare tra gli intervalli di variazione, è consistente valutare il campo di variazione (si ritiene superfluo a questo punto il calcolo della differenza interquartilica), utilizzando esclusivamente i valori di due osservazioni già noti precedentemente: 𝐶𝑎𝑚𝑝𝑜 𝑑𝑖 𝑣𝑎𝑟𝑖𝑎𝑧𝑖𝑜𝑛𝑒 = 𝑣𝑎𝑙𝑜𝑟𝑒 𝑚𝑎𝑠𝑠𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑜 = 44.4 − 24.46 = 19.94 Un range che, dati i valori in esame, potremmo considerare notevole. Tra l’altro, anche la varianza, pari a 22.56, quale indice di dispersione dei dati osservati attorno alla media, evidenzia un ragionevole livello di variabilità. Questo è confermato anche dallo scarto quadratico medio, ottenuto come segue: 𝑆𝑐𝑎𝑟𝑡𝑜 𝑞𝑢𝑎𝑑𝑟𝑎𝑡𝑖𝑐𝑜 𝑚𝑒𝑑𝑖𝑜 = √𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 = √22,56 = 4,74 I valori ottenuti, rispecchiano quindi le intuizioni sostenute in sede di analisi descrittiva spaziale, ovvero quelle relative ad un comportamento abbastanza eterogeno sul dominio d’indagine. Infine, utile per fini comprativi, essendo un numero pure, adimensionale, potrebbe essere il coefficiente di variazione: 𝐶𝑜𝑒𝑓𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑖 𝑣𝑎𝑟𝑖𝑎𝑧𝑖𝑜𝑛𝑒 = ( 𝑠𝑐𝑎𝑟𝑡𝑜 𝑞𝑢𝑎𝑑. 𝑚𝑒𝑑𝑖𝑜 𝑚𝑒𝑑𝑖𝑎 ) ∗ 100 = ( 4,74 35,04 ) ∗ 100 = 13,52% In questo modo, si conclude la prima fase dell’analisi inferenziale. 1.2 Analisi strutturale: stima e modellizzazione del semivariogramma La seconda fase dell’analisi dell’evoluzione spaziale relativa alla variabile V18, è rappresentata dall’analisi strutturale, ovvero individuare una misura per la correlazione spaziale esistente tra le localizzazioni campionate del fenomeno. Questa analisi, si compone, in prima battuta, della stima del semivariogramma empirico omnidirezionale (mediato su tutte le direzioni) e dai semivariogrammi empirici direzionali (indicati per valutare la correlazione spaziale lungo specifiche direzioni). Infine, si procederà alla modellizzazione del semivariogramma omnidirezionale precedentemente stimato, ricorrendo all’utilizzo di alcuni modelli standard presenti in letteratura.
  • 7. Al fine di procedere nell’analisi, è stato fondamentale fare alcune considerazioni di natura strettamente inferenziale. Dal momento che la stima del semivariogramma è ritenuta attendibile fino ad una distanza ℎ 𝑚𝑎𝑥, è risultato necessario definire: • 𝒅 𝒎𝒂𝒙, cioè la distanza massima tra le localizzazioni campionate (tramite la formula della distanza euclidea), pari a 552.94 metri; • 𝒉 𝒎𝒂𝒙, cioè la distanza massima per la stima del semivariogramma, pari approssimativamente a (𝑑 𝑚𝑎𝑥 2⁄ ) = 276.47 metri. Per cui, in Fig. 4, è riportata la stima del semivariogramma empirico direzionale. Fig. 4: semivariogramma empirico omnidirezionale Come è possibile osservare, si è scelto, dopo un’accurata analisi grafica, di stimare il semivariogramma omnidirezionale su 7 valori del lag h, attribuendo al parametro lag separation (distanza tra i lags) un valore pari a 24 e conseguentemente al paramento lag tolerance (tolleranza sulla distanza, utile in particolar modo per i domini di punti irregolari) un valore pari a 12; inoltre, al parametro tolerance (tolleranza sulla direzione) è stato attribuito un angolo di rotazione pari a 90° e infine il parametro bandwidth (restringimento del cono di rotazione) è pari a 92. La scelta di tali valori, in particolar modo i primi tre, non è stata casuale. Infatti, sono stati individuati determinati valori che rendessero, dal punto di vista grafico, sia chiaro il comportamento in prossimità dell’origine del semivariogramma, sia la distanza in prossimità della quale quest’ultimo tendesse a stabilizzarsi, e quindi individuarne la rispettiva sella globale. È bene sottolineare che questo procedimento è stato fatto nel pieno rispetto simultaneo di due regole pratiche: 1. 𝒏° 𝒅𝒊 𝒍𝒂𝒈𝒔 ∗ 𝒍𝒂𝒈 𝒔𝒆𝒑𝒂𝒓𝒂𝒕𝒊𝒐𝒏 ≤ 𝒉 𝒎𝒂𝒙; infatti, come già detto, oltre ad ℎ 𝑚𝑎𝑥 la stima non sarebbe più attendibile;
  • 8. 2. 𝒏° 𝒅𝒊 𝒄𝒐𝒑𝒑𝒊𝒆 𝒊𝒏𝒅𝒊𝒗𝒊𝒅𝒖𝒂𝒕𝒆 𝒑𝒆𝒓 𝒐𝒈𝒏𝒊 𝒍𝒂𝒈 ≥ 𝟐𝟎 − 𝟑𝟎; infatti, avere un numero inferiore di coppie individuate in corrispondenza di ciascun lag, anche questo potrebbe rendere la stima non attendibile. Risulta chiara, dalla Fig. 4, la verifica di entrambe le regole. Nella successiva Fig. 5, invece, si riporta la stima dei semivariogrammi empirici direzionali, in particolare, al variare dell’angolo polare 𝛼 lungo le direzioni 45° e 90°. Fig. 5: semivariogrammi empirici direzionali Tale stima è stata ottenuta modificando, rispetto ai parametri precedenti, il valore di tolerance lungo la direzione, impostando un angolo di rotazione pari a 22,5° in modo tale che la stima risulti maggiormente indirizzata lungo le direzioni indicate. Dalla figura precedente cerchiamo di effettuare alcune valutazioni. È possibile notare con estrema chiarezza che il range dei due semivariogrammi direzionali è uguale in entrambi i casi. Per quanto riguarda la sella (ultimo lag considerato) notiamo che tende ad essere molto simile nei due casi, parliamo infatti di una differenza pari solo a 0.60 sull’asse delle ordinate tra i due punti. Questo ci aiuta nell’affermare che i due semivariogrammi, su una stima di 7 lags, tendono a stabilizzarsi in prossimità di uno stesso valore. Infine, in merito al comportamento in prossimità dell’origine possiamo escludere che sia di tipo lineare ma che rifletta maggiormente un comportamento parabolico in entrambi i casi. I due semivariogrammi direzionali, tendono a seguire una modello di tipo Gaussiano. Sulla base di queste considerazioni, è possibile affermare che siamo in presenza di isotropia, ovvero il caso cui la cui variabile regionalizzata V18 sia, appunto, isotropa, e quindi il fenomeno si manifesti lungo le due differenti direzioni senza variazioni significative. Infine, per concludere la fase dedicata all’analisi strutturale, si ricorre alla modellizzazione del semivariogramma empirico omnidirezionale stimato in precedenza, attraverso l’utilizzo di un modello standard noto in letteratura. Vediamo nella figura successiva il modello adattato:
  • 9. Fig. 6: semivariogramma empirico omnidirezionali e relativo modello Al fine di descrivere la correlazione spaziale nelle localizzazioni campionate relativa alla variabile V18 oggetto d’analisi, è stato adattato un modello standard di tipo Gaussiano, caratterizzato da un comportamento parabolico in prossimità dell’origine (tipico di una variabile regionalizzata continua e differenziabile) e da una sella raggiunta asintoticamente. L’espressione analitica del modello è la seguente: 𝛾(ℎ, 0°) = { 0 ℎ = 0 . 9.7 + 15.1 ∙ 𝐺𝑎𝑢(ℎ; 173) ℎ > 0 Come si può notare, al fine di rendere numericamente e graficamente stabile il modello, è stato sommato un effetto nugget (un effetto di discontinuità nell’origine) pari a 9.7, è stata considerata una sill contribution (contributo alla sella) pari a 15.1 (da cui il valore della sella globale 9.7+15.1 = 24.8) ed infine un range effettivo (distanza oltre la quale il semivariogramma si stabilizza) pari a 173 metri. Conclusa la seconda fase, è possibile procedere con la fase successiva, quella relativa alla stima. 1.3 Stima mediante il Kriging stazionario e commento dei risultati ottenuti Il punto conclusivo dell’analisi inferenziale, è quello di stimare la distribuzione spaziale della variabile V18 oggetto d’indagine nelle localizzazioni non campionate del nostro dominio. Per fare questo, utilizzeremo la tecnica del kriging stazionario, che possiamo applicare proprio grazie all’aver adattato un modello idoneo a descrivere la correlazione spaziale del fenomeno nelle localizzazioni campionate.
  • 10. 1.3.1 Costruzione della griglia Dapprima, si è ritenuto necessario adattare una griglia idonea a ricoprire l’area d’interesse. In particolare, è stata fissata una griglia quadrata di dimensioni 90 x 90, con incremento pari a 4.5 sull’asse delle ascisse e di 4.3 sull’asse delle ordinate. In seguito alla definizione della seguente griglia, sono state individuate tutte le localizzazioni non campionate, ovvero tutti i singoli nodi, in cui, per ciascuno di essi, si stimerà attraverso il sistema del kriging stazionario. Successivamente, in corrispondenza di ogni nodo della griglia, è stato definito un intorno di ricerca (search ellipsoid) in grado di considerare, all’interno del sistema del kriging, parte dell’informazione campionaria circostante. Più in dettaglio, l’intorno è caratterizzato da min = 1 e max = 6 punti che devono rientrare nello stesso, e da un raggio pari a 110 metri. Chiaramente, la scelta di questi valori, non è stata casuale, ma è stata dettata dalla specifica distribuzione geografica della variabile spaziale V18 e dalla distanza tra le localizzazioni campionate. In particolare, il numero minimo di punti è stato influenzato dal fatto che, come già detto nel paragrafo 1.1.1, nella zona Nord-Ovest vi è una notevole riduzione di localizzazioni campionate, per cui si è ritenuto necessario abbassare tale soglia. Per quanto riguarda il raggio dell’intorno, è stato fissato in modo tale che non eccedesse il range stabilito nel modello di semivariogramma, oltre il quale, come sappiamo, non vi è più correlazione spaziale1. 1.3.2 Applicazione del Kriging stazionario Avendo tutte le informazioni disponibili, è stato possibile effettuare la stima dei valori della variabile in esame in ciascun nodo della griglia, come da Fig. 7. Fig. 7: mappa delle stime del Kriging stazionario 1 In un caso di isotropia come il nostro, l’intorno di ricerca è una circonferenza ed il raggio dello stesso non deve mai essere superiore al range del modello di variogramma adattato.
  • 11. VALIDAZIONE DELLA MAPPA. Una volta ottenute le stime, bisogna valutarne l’affidabilità analizzando la mappa ottenuta. Anzitutto, è possibile affermare che risulta chiara ed evidente la distribuzione spaziale della variabile V18, che, tra l’altro, conferma quelle che erano state le nostre intuizioni iniziali, puramente grafiche, relative alla mappa a scala di colore (Fig. 2). Infatti, sovrapponendo quest’ultima alla mappa delle stime, è possibile notare come i colori, e quindi i valori osservati della variabile, nelle localizzazioni campionate, siano quasi del tutto identici ai valori stimati tramite la tecnica del kriging. Quasi del tutto, perché, la nostra distribuzione, come è stato già detto, è caratterizzata da una notevole eterogeneità dei valori osservati, ciò nonostante soltanto in pochissime localizzazioni è stato difficile per il kriging stimarne il valore. Tuttavia, le altre ragioni che ci hanno portato a ritenere affidabili le stime ottenute sono le seguenti. In primis, il valore di minimo stimato dal kriging pari a 28.73 e quello di massimo pari a 41.65 sono comunque vicini a quelli inizialmente osservati. Inoltre, essendo i primi compresi nel range dei valori delle localizzazioni campionate, è possibile osservare che tutti i pesi calcolati tramite il sistema del kriging stazionario sono positivi (e compresi tra 0 e 1), per cui non essendoci pesi negativi in corrispondenza di una localizzazione campionata, non si ha la presenza di effetto schermo2. Come seconda motivazione, si valuti la seguente Fig. 8. Fig. 8: mappa della varianza dell’errore di stima VALIDAZIONE DELLA MAPPA. La Fig. 8 consente di valutare, dal punto di vista grafico, l’incertezza relativa alle stime della variabile V18 ottenute attraverso il kriging stazionario. Come si può notare, quasi tutto il dominio è caratterizzato da un colore blu scuro, vale a dire, come da legenda, la minima varianza dell’errore di stima possibile. Esclusivamente nelle zone in cui non vi sono localizzazioni campionate, la varianza dell’errore tende ad aumentare leggermente, ma questo è assolutamente ragionevole. In tal modo, è stato 2 Presenza di localizzazioni campionate che si posizionano tra il punto non campionato e la localizzazione considerata.
  • 12. trovato un compromesso giusto al fine di ottenere sia una buona mappa delle stime, sia una buona mappa della varianza dell’errore. In conclusione, è possibile garantire l’efficacia della tecnica di interpolazione utilizzata, il kriging stazionario, che per costruzione è uno stimatore non distorto ed anche un interpolatore esatto; nonché garantire l’attendibilità delle stime ottenute della variabile spaziale V18. ~ ~ ~ ~ ~ Capitolo 2 Analisi di simulazione 1.1 Definizione dei campi aleatori – 1.2 Simulazione mediante la tecnica di decomposizione di Cholesky – 1.2.1 Costruzione della griglia – 1.2.2 Applicazione della tecnica di decomposizione di Cholesky – 1.3 Analisi strutturale e commento dei risultati ottenuti 1.1 Definizione dei campi aleatori La prima fase dell’analisi di simulazione, consiste nel definire i differenti campi aleatori grazie ai quali, come vedremo nei paragrafi successivi, sarà possibile procedere nella realizzazione delle mappe simulate alternative ed equiprobabili. In particolare, consideriamo i seguenti campi aleatori (𝑍1, 𝑍2, 𝑍3), definiti in seguito, di cui è noto il modello di correlazione spaziale, ovvero il modello di semivariogramma, idoneo a caratterizzare la distribuzione della variabile in esame sul dominio di riferimento. Si noti, inoltre, la sella globale sempre pari ad 1, essendo la tecnica di decomposizione di Cholesky applicata nel prossimo paragrafo, una tecnica di simulazione di campi aleatori gaussiani. 𝑠𝑓𝑒𝑟𝑖𝑐𝑜 𝑍1 ∶ 𝛾1(ℎ) = { 0 ℎ = 0 . 0.23 + 0.77 ∙ 𝑆𝑝ℎ(ℎ; 18) ℎ > 0 𝑒𝑠𝑝𝑜𝑛𝑒𝑛𝑧𝑖𝑎𝑙𝑒 𝑍2 ∶ 𝛾2(ℎ) = { 0 ℎ = 0 . 0.23 + 0.77 ∙ 𝐸𝑥𝑝(ℎ; 18) ℎ > 0 𝑔𝑎𝑢𝑠𝑠𝑖𝑎𝑛𝑜 𝑍3 ∶ 𝛾3(ℎ) = { 0 ℎ = 0 . 0.23 + 0.77 ∙ 𝐺𝑎𝑢(ℎ; 18) ℎ > 0 1.2 Simulazione mediante la tecnica di decomposizione di Cholesky Una volta definiti i campi aleatori e le loro rispettive caratteristiche, è possibile procedere alla costruzione delle differenti realizzazioni alternative ed equiprobabili. È opportuno fare una breve, ma opportuna, precisazione. La seguente tecnica di simulazione stocastica verrà
  • 13. applicata nel caso non condizionato, ovvero nel caso in cui non c’è alcuna dipendenza delle simulazioni ottenute rispetto all’informazione campionaria osservata nelle localizzazioni sul dominio, sia che si disponga di tale informazione o meno. Si richiede, esclusivamente, la conoscenza del modello di correlazione spaziale. 1.2.1 Costruzione della griglia Al fine di rendere possibili le simulazioni, è necessario definire in maniera chiara il dominio entro cui simulare, per cui, anche in questo caso si ricorre alla costruzione di una griglia. Questo deve essere effettuato nel rispetto della prima condizione richiesta dal metodo di decomposizione di Cholesky, ovvero che il numero N di localizzazioni non campionate (o nodi), in cui ottenere la simulazione, risulti essere non elevato, con precisione (𝑁 ≤ 103 ). In questo caso, è stata fissata una griglia di dimensioni 28 × 28, con un incremento unitario sull’asse delle ascisse così come sull’asse delle ordinate, per cui il numero di nodi ottenuti, 784, rispetta la prima condizione. 1.2.2 Applicazione della tecnica di decomposizione di Cholesky La seconda condizione richiesta per l’applicazione di tale metodo, anche noto come metodo Lower Upper, consiste nel produrre un numero sufficientemente elevato di realizzazioni. In questa analisi, sono state effettuate 3 realizzazioni simulate non condizionate per ognuno dei 3 differenti campi aleatori (𝑍1, 𝑍2, 𝑍3) considerati, come da Fig. 1. Fig. 1: mappe simulate non condizionate per i campi aleatori (𝑍1, 𝑍2, 𝑍3)
  • 14. Come è possibile notare dalle mappe precedenti, in quelle relative al campo aleatorio 𝑍3, il cui modello di correlazione spaziale è di tipo Gaussiano, vi è una maggiore concentrazione di colori simili; dal punto di vista grafico, infatti, possiamo affermare che vi è “meno rumore”, una minore dispersione della distribuzione del fenomeno spaziale. Il motivo di ciò, da un punto di vista più teorico, risiede nel fatto che il modello Gaussiano è l’unico a garantire maggiore continuità spaziale rispetto alle mappe simulate per i campi aleatori caratterizzati dai modelli di semivariogramma sferico ed esponenziale, questo perché il comportamento parabolico in prossimità dell’origine di un modello Gaussiano è tipico di una variabile regionalizzata continua e differenziabile. 1.3 Analisi strutturale e commento dei risultati ottenuti L’ultima fondamentale fase della presente analisi consiste nel garantire che il processo simulato rispetti le caratteristiche globali fissate inizialmente, vale a dire i momenti del 1° e 2° ordine e quindi i modelli di semivariogramma definiti nel paragrafo 1.1. Al fine di verificare empiricamente tale proprietà, è stata condotta un’analisi strutturale stimando i semivariogrammi sperimentali per ogni realizzazione dei campi aleatori (𝑍1, 𝑍2, 𝑍3), adattandone i rispettivi modelli. Prima, tuttavia, si è ritenuto utile fare alcuni semplici calcoli a ritroso di alcuni parametri già noti dall’analisi inferenziale, motivo per cui non si approfondisce ulteriormente il significato in questa sede: • 𝒅 𝒎𝒂𝒙 = √282 + 282 = √784 + 784 = √1568 = 39.59 ≈ 39.6 ; • 𝒉 𝒎𝒂𝒙 = 𝑑 𝑚𝑎𝑥 2⁄ = 19.8 ; • 𝒍𝒂𝒈 𝒔𝒆𝒑𝒂𝒓𝒂𝒕𝒊𝒐𝒏 = √12 + 12 = 1.414, in questo caso tale parametro rappresenta la lunghezza del vettore di coordinate (1 ; 1) dal momento che ci troviamo su un dominio di punti regolare, ovvero la nostra griglia, costituita da 28 celle in ascissa e 28 celle in ordinata; • 𝒏° 𝒅𝒊 𝒍𝒂𝒈𝒔 = ℎ 𝑚𝑎𝑥 𝑙𝑎𝑔 𝑠𝑒𝑝𝑎𝑟𝑎𝑡𝑖𝑜𝑛 = 19.8 1.414 = 14, cioè il numero massimo di lags su cui è possibile effettuare la stima. Di conseguenza, si rappresentano in Fig. 2, le stime dei semivariogrammi empirici ed i rispettivi modelli adattati, per ciascun campo aleatorio, relative ad un n° di lags ritenuto idoneo pari ad 8.
  • 15. Fig. 2: semivariogrammi e rispettivi modelli delle mappe simulate per i campi aleatori (𝑍1, 𝑍2, 𝑍3) Dall’analisi della figura precedente, dopo aver opportunamente impostato l’asse delle ordinate, si può affermare che, soprattutto in merito al comportamento in prossimità dell’origine e più in generale per i primi lags (in cui è più importante un’adeguata misura della correlazione spaziale per brevi distanze) i modelli adattati si adattano bene ai semivariogrammi empirici stimati sulle mappe simulate, non risulta esserci un eccessivo scostamento. Possiamo concludere la seguente analisi confermando che il processo simulato per i differenti campi aleatori (𝑍1, 𝑍2, 𝑍3) è stato eseguito nel rispetto delle caratteristiche globali fissate inizialmente. Riferimenti bibliografici Donato Posa, Sandra De Iaco; Geostatistica: teoria ed applicazioni, Giappichelli Editore, 2009.