Aula de Informática Aplicada ao Planejamento Territorial - IPT, UFABC, 4 de novembro de 2016.
Apresentação disponível em: https://youtu.be/-Jf9OFglDiI
Bases de dados disponíveis em: https://app.box.com/s/0v7yjizlgacyyjcturb4s9yu1kzormgb
Aula de Informática Aplicada ao Planejamento Territorial - IPT, UFABC, 4 de novembro de 2016.
Apresentação disponível em: https://youtu.be/-Jf9OFglDiI
Bases de dados disponíveis em: https://app.box.com/s/0v7yjizlgacyyjcturb4s9yu1kzormgb
Cartography is the art, science and technology of map making.
Maps are used as research tools and as sources of information.
Maps have existed since the time of the Egyptian, Mesopotamian and Chinese civilizations, with the latter maps dating back to 6000 years.
This document help you to prepare Triangulation Network (TIN), Hillshade Map, Slope map, interpolation and Digital Elevation Model (DEM) in a area and how to interpret them.
Disciplina de Uso de Dados Espaciais nos Estudos Ambientais. Pós-Graduação em Ciência e Tecnologia Ambiental. UFABC, Santo André, abril de 2019.
Dados de aula disponíveis em: https://app.box.com/s/i4ka2t08gf8t1er8542jfvhyhhovmpf1
Gravação de aula disponível em: https://youtu.be/O1hiz-7FmmI
Lo scopo del presente elaborato è quello di mettere in evidenza due differenti tecniche geostatistiche attraverso un’applicazione pratica per ciascuna di esse.
È articolato in due capitoli:
• nel primo, si perseguono obiettivi previsivi o inferenziali. Infatti, sfruttando l’informazione campionaria della variabile in esame sul dominio oggetto d’indagine, si cercherà di stimare il comportamento di tale variabile in localizzazioni non campionate. La tecnica di interpolazione stocastica utilizzata sarà quella del kriging stazionario;
• nel secondo, si perseguono obiettivi di simulazione non condizionata. In particolare, non disponendo di alcuna informazione campionaria sul dominio, si realizzeranno diverse mappe, alternative ed equiprobabili, relative all’evoluzione spaziale del fenomeno analizzato sull’area d’interesse. La tecnica di simulazione stocastica utilizzata sarà quella della decomposizione di Cholesky.
Al fine di svolgere entrambe le analisi geostatistiche è stata utilizzato il software “SGeMS beta - Stanford Geostatistical Modeling Software”, programma qualificato ad esaminare, stimare e rappresentare l’evoluzione spaziale di variabili regionalizzate in un dominio oggetto d’indagine.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
Cartography is the art, science and technology of map making.
Maps are used as research tools and as sources of information.
Maps have existed since the time of the Egyptian, Mesopotamian and Chinese civilizations, with the latter maps dating back to 6000 years.
This document help you to prepare Triangulation Network (TIN), Hillshade Map, Slope map, interpolation and Digital Elevation Model (DEM) in a area and how to interpret them.
Disciplina de Uso de Dados Espaciais nos Estudos Ambientais. Pós-Graduação em Ciência e Tecnologia Ambiental. UFABC, Santo André, abril de 2019.
Dados de aula disponíveis em: https://app.box.com/s/i4ka2t08gf8t1er8542jfvhyhhovmpf1
Gravação de aula disponível em: https://youtu.be/O1hiz-7FmmI
Lo scopo del presente elaborato è quello di mettere in evidenza due differenti tecniche geostatistiche attraverso un’applicazione pratica per ciascuna di esse.
È articolato in due capitoli:
• nel primo, si perseguono obiettivi previsivi o inferenziali. Infatti, sfruttando l’informazione campionaria della variabile in esame sul dominio oggetto d’indagine, si cercherà di stimare il comportamento di tale variabile in localizzazioni non campionate. La tecnica di interpolazione stocastica utilizzata sarà quella del kriging stazionario;
• nel secondo, si perseguono obiettivi di simulazione non condizionata. In particolare, non disponendo di alcuna informazione campionaria sul dominio, si realizzeranno diverse mappe, alternative ed equiprobabili, relative all’evoluzione spaziale del fenomeno analizzato sull’area d’interesse. La tecnica di simulazione stocastica utilizzata sarà quella della decomposizione di Cholesky.
Al fine di svolgere entrambe le analisi geostatistiche è stata utilizzato il software “SGeMS beta - Stanford Geostatistical Modeling Software”, programma qualificato ad esaminare, stimare e rappresentare l’evoluzione spaziale di variabili regionalizzate in un dominio oggetto d’indagine.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
Applicazioni di Matlab all'analisi di immagini telerilevateMarco Palazzo
Applicazioni di Matlab all'analisi di immagini telerilevate
Marco Palazzo & Lorenzo Vasanelli Presentazione al Convegno "Matematica senza Frontiere" 5-8 Marzo 2003, Lecce
3 alberti-seconda parte - About Spatial CorrelationRiccardo Rigon
By Matteo Alberti. More information and figures about Variograms and semivariograms. Related to the other material on interpolation of the course of Hydrology @ unitn
SNACK! La migliore app sul cibo- Esperimento di PsicofisicaMonica Pennati
L’ esperimento che abbiamo deciso di proporre ha cercato di identificare quale fosse la homepage di app per smartphone con la struttura più gradita. In particolare ci si è limitati ad app che vertono sul tema cucina e che quindi necessitano di presentare fotografie di cibo nella propria pagina iniziale.Per fare ciò si è deciso di utilizzare il Metodo del confronto a coppie di Thurstone.
Ci si è quindi identificati con una ipotetica azienda che volesse lanciare sul mercato un applicazione sul tema food e che quindi sarebbe interessata. a identificare la struttura della presentazione fotografica preferita dagli utenti.Per fare ciò si è andati a cercare 5 strutture diverse di 5 applicazioni esistenti per smartphone sul tema.
Una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:
MEDIA
MODA
MEDIANA
Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di un campione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campione all’intera popolazione.
Similar to 1 alberti-prima parte - Metodi di Interpolazione (12)
This is the lecture with which I usually conclude my class in hydrology. It talks about the impact of climate change on hydrology. Wit some specific on the Alpine areas.
Introduzione all'uso della Console di OMS e di QGIS (per le analisi del corso...Riccardo Rigon
Le slides contengono una descrizione della Console di OMS e di alcuni comandi elementari di QGIS per gestire i dati spaziali che saranno utilizzati nel corso di Idrologia dell'Università di Trento (2017).
It contains the description of the Solar radiation relation with the astronomical movements of both Earth and sun. Used in the class of Hydrology at the University of Trento
2. “Campi” di variabili
Fenomeni naturali rappresentabili come campi:
• Topografia
• Batimetria
• Concentrazioni di composti chimici
• Etc.
Grid(raster)
Grid(raster)
Punti
Punti
Isolinee
Isolinee
Come si strutturano i
valori di un campo?
Da Terrengmodellering - Gaute Aarbakke
Solaas, Geodata
3. Interpolazione spaziale di campi scalari
Da Mitas & Mitasova, 2005.
Dati gli N valori di un fenomeno scalare studiato zj, j = 1, .., N, misurato in punti discreti rj =
(xj
[1]
, xj
[2]
, …., xj
[d
]), situati all’interno di una regione specificata di uno spazio d-dimensionale,
occorre determinare una funzione F(rj) che passi attraverso i punti (o li approssimi):
F(rj) = zj , j = 1, …, N
Da Geospatial Analysis and Modeling: Lecture notes. Helena Mitasova, NCSU MEAS
4. Interpolazione spaziale di campi scalari
-Ogni set di criteri particolari definisce un particolare metodo di interpolazione.
- Non esiste a priori nessun metodo più “vero” degli altri.
- Per scegliere un particolare metodo fra i numerosi proposti, dobbiamo disporre di
informazioni addizionali, cioè hard data – misure oggettive - o soft data –
conoscenze o ipotesi soggettive - sul fenomeno studiato.
-A seconda del tipo di fenomeno modellato possono essere preferiti metodi di
interpolazione differenti.
Esiste un numero infinito di funzioni che soddisfano
questa funzione -> sono necessari criteri addizionali
devono essere aggiunti per rendere la soluzione unica.
5. Tipi di interpolatori
Interpolatori esatti
metodi di interpolazione che per
i punti misurati stimano valori
uguali a quelli effettivamente
osservati.
Interpolatori non-esatti
metodi che non interpolano
precisamente i valori osservati
nei punti di misura.
Da Lecture5Week7SpatialInterpolation.ppt
6. Tipi di interpolatori
Interpolatori globali
Utilizzano tutte le osservazioni disponibili per
derivare la superficie continua.
Interpolazioni globali sono in generale usate
per rimuovere un trend dai valori osservati, ed
analizzare i residuali delle osservazioni.
Interpolatori locali
Utilizzano le sole osservazioni situate
nella immediata prossimità del punto
dal interpolare.
Da Longley et al., 2001, fig. 13.21.
7. Su quale supporto si misura?
Da Armstrong, 1998, Table 6-1.
Supporto: area o volume del
campione fisico sul quale viene
effettuata la misura.
Le misure reali si dovrebbero
basare sempre su una estensione
areale o volumetrica costante in
tutta la zona investigata, perché i
valori misurati e le loro proprietà
statistiche dipendono dalla
estensione effettivamente utilizzata.
L’uso di due differenti supporti di
misura produce valori differenti per le
singole celle
8. Interpolatori globali
Si utilizzano superfici definite da polinomiali che approssimano i punti
osservati -> interpolatore non-esatto
Piano grigio trend surface→
Trend surface analysis (global polynomials)
Da Terrengmodellering - Gaute Aarbakke
Solaas, Geodata
9. Trend surface analysis
Da Sullivan & Unwin, 2003, fig. 9.4.
I coefficienti delle
equazioni vengono
determinati
minimizzando la
somma degli errori
quadratici (differenza
tra valore interpolato e
valore osservato) per i
punti misurati.
10. Trend surface analysis
Il grado delle equazioni polinomiali
generalmente utilizzato può andare da 1
(piano) sino a 4-5-6.
Es.
z = ax + by +c
z = ax2
+ bxy + cy2
+ dx + ey + f
11. Da Davis, 1973, figg. 6.11.
Trend Surface Analysis
L’entità dei residuali
diminuisce con
l’aumentare del grado
delle equazioni
utilizzate ma non
necessariamente
aumenta l’accuratezza
dei valori interpolati.
12. Tecniche di stima locale
Esistono numerosi metodi. Fra gli altri:
• Poligoni di Thiessen
• IDW
• Radial basis functions
• Kriging
Da Terrengmodellering - Gaute Aarbakke
Solaas, Geodata
13. Scelta osservazioni prossime
Raggio fisso
(fixed-radius)
http://www.quantdec.com/SYSEN597/GTKAV/section9/chapter_29b.htm
Numero fisso di punti
(fixed-neighbours number)
R = 100
Dati noti = 4
R = 100
Dati noti = 1
R = 20
Dati noti = 4
R = 160
Dati noti = 4
14. Barriere
Le barriere sono brusche variazioni nella superficie da
interpolare, indotte p.e. da faglie e scarpate.
Alcune tecniche di interpolazione
permettono di definire barriere
prima dell’esecuzione
dell’interpolazione, in maniera
tale che nella stima di un
punto che ricade da un lato
della barriera vengono usati i
soli dati misurati dallo stesso
lato.
Fig. da Spatial Analyst Lesson 4.ppt
15. Da Sullivan & Unwin, 2003, fig. 8.6
Poligoni di influenza
Proximity polygons
Poligoni di Thiessen o di Voronoï o di Dirichlet.
Principio base: la miglior informazione
su un sito non misurato è fornita dalla
misura nel sito più vicino. Accettabile con
variabili categoriali, sconsigliato per variabili
continui.
Poligoni di influenza: ogni poligono
contiene tutti i punti che sono più vicini
all’osservazione interna -> gradiente di
elevazione nullo + barriera
16. All’interno di un singolo poligono il valore interpolato rimane
costante.
La varianza dell’intera distribuzione ottenuta tramite questo metodo
è esattamente uguale a quella delle osservazioni di partenza.
Poligoni di influenza
Osservazioni addensate: poligoni di limitate dimensioni.
Osservazioni isolate: p. di notevoli dimensioni.
Osservazioni disposte su griglia regolare con spaziatura costante:
poligoni di Thiessen quadrati.
17. Le dimensioni e la forma dei poligoni
dipendono dalla configurazione dei punti
campionati.Questo è evidente soprattutto
ai bordi della zona esaminata.
• Al passaggio da un poligono all’altro
possono essere presenti brusche
discontinuità: questo non crea problemi
nel caso di variabili categoriali/nominali,
ma rimane comunque un artefatto senza
alcuna giustificazione fisica sia per dati
categoriali sia per quelli continui.
• Il valore di un punto non campionato è
stimato basandosi su un solo valore,
quello noto più prossimo: questo non
permette di formarsi un’idea sul margine
di incertezza nella stima.
Poligoni di influenza
Svantaggi
Da Geospatial Analysis and Modeling:
Lecture notes. Helena Mitasova, NCSU
MEAS
18. Natural neighbour
Metodo proposto da Sibson (1981).
Utilizza i dati più vicini al punto da interpolare
Interpolato un nuovo valore in base alla media pesata dei dati noti.
• Viene creato un reticolato di Thiessen
(poligoni bianchi in figura) usando la
localizzazione dei dati noti
• In corrispondenza del punto col valore
da interpolare (cerchio nero) si crea un
nuovo poligono di Thiessen (blu)
• Ad ogni dato noto viene attribuito un
peso proporzionale al rapporto tra l'area
del suo poligono ricoperta da quello del
punto da interpolare e l'area di
quest'ultimo (peso rappresentato dai
cerchi verdi). Markluffel, Wikipedia - CC
19. Triangolazioni
Le triangolazioni suddividono lo spazio campionato in triangoli con i lati
contigui, ed aventi come vertici i punti campionati.
Esistono varie tecniche per creare i lati tra i triangoli.
La più nota è quella di Delaunay: ha la proprietà che i triangoli derivati sono i
più equilaterali possibili. Questo è utile per la rappresentazione di modelli del
terreno basandosi su punti quotati.
Da Sullivan & Unwin, 2003, fig. 2.5
E’ collegata ai POLIGONI DI
INFLUENZA: tre punti formano un
triangolo se essi condividono un
vertice comune del POLIGONO DI
INFLUENZA.
20. Inverse Distance Weighting (IDW)
Metodo proposto da Shepard (1968).
Interpolatore esatto nella versione originale, in versioni più recenti
è definibile un fattore di smoothing che lo rende inesatto.
Applicazione di una media pesata
in base alla distanza dei punti
rispetto al punto di osservazione.
Generalmente viene usato un
raggio di ricerca per limitare il
numero di punti utilizzati.
Da Longley et al., 2001, fig. 13.21.
21. Inverse Distance Weighting (IDW)
ż = ∑n
i=1
wi
zi
/ ∑n
i=1
wi
Formula
ż: valore interpolato della variabile
n: numero di osservazioni usate per il calcolo del
valore interpolato
wi : peso attribuito ad ogni singola osservazione
22. Inverse Distance Weighting (IDW)
wi
= 1 / di
n
Peso wi applicato alle osservazioni
d: distanza tra osservazione e punto con valore
interpolato
n: esponente definito dall’utilizzatore
23. Inverse Distance Weighting (IDW)
In generale il valore utilizzato per l’esponente n è di 2 (valore arbitrario).
Tanto maggiore è l'esponente applicato a d, tanto maggiore è l'influenza del
valore della distanza sul risultato e viceversa.
Se l'esponente è 0, allora tutti i punti entro il “raggio” di ricerca sono “pesati”
ugualmente, e ricadremo nel caso della media mobile semplice.
Se l’esponente tende ad infinito, il peso viene attribuito per intero
all’osservazione più prossima al punto interpolato, e si ricade nel caso del
poligoni di influenza.
24. IDW - problematiche
In alcuni casi le
interpolazioni potranno
non essere del tutto
soddisfacenti per la
caratteristica dell’IDW di
essere una media
pesata, quindi con
tendenza dei risultati a
regredire verso la media
locale.
Da Longley etal., 2001, fig. 13-23.
In quanto rappresenta una media con pesi sempre positivi, la varianza
dei valori interpolati sarà minore di quella del data set di partenza.
25. IDW - problematiche
Un artefatto tipico
dell’IDW è la creazione
dei cosiddetti “bull
eyes”, strutture
circolari attorno alle
osservazioni disperse.
Difficilmente questi
artefatti trovano
giustificazioni naturali.
26. Radial Basis Functions
Interpolatori basati su polinomiali definite localmente che producono
superfici “morbide”.
Sono definite da una famiglia di funzioni che rendono minimi parametri
legati alla curvatura della superficie da interpolare.
Da Terrengmodellering - Gaute Aarbakke
Solaas, Geodata
27. Radial Basis Functions
Possono essere interpolatori sia esatti (l’interpolazione onora
esattamente i dati misurati) sia inesatti (con un parametro di
smoothing da definire).
Vari metodi proposti, con
successivi miglioramenti:
– Spline: thin-plate s., s. with
tension, completely
regularized s., inverse
multiquadric spline
– Multiquadric function
Da Geospatial Analysis and Modeling:
Lecture notes. Helena Mitasova, NCSU
MEAS
28. Splines
Regularized: controllo delle derivate terze
Tension: controllo delle derivate seconde
2000
3000
4000
Elevation
Distance
Tension
Regularized
Variando il parametro di controllo delle derivate la superficie
risultante tende a diventare più o meno rigida.
29. Regularized spline with tension and smoothing
Una versione avanzata di spline è la “Regularized spline
with tension and smoothing” che consente di applicare
uno smoothing ai dati, trasformando così il metodo
spline da esatto ad inesatto, utile quando i dati originali
contengono errori.
Implementato in Grass.
30. Regularized spline with tension and smoothing
Nella implementazione di Grass, due parametri importanti.
Tensione: valori elevati di tensione tendono a ridurre I gradienti della superficie
interpolata, che presenta quindi valori simili a quelli misurati nel loro intorno.
Valori ridotti di tensione invece permettono una maggiore variabilità dei dati
interpolati rispetto a quelli originari. Si possono così ottenere dei valori che sono
fortemente inferiori o superiori a quelli misurati nel loro intorno, così come i valori
estremi interpolati possono uscire dal range inziale dei dati misurati.
Smoothing: stabilisce quanto la superficie interpolata deve essere prossima ai
valori misurati. Un valore nullo indica che la superficie deve passare esattamente
per I valori noti (interpolazione esatta). Valori positivi consentono all'interpolazione
di deviare dai valori misurati in corrispondenza dei punti di osservazione.
31. Metodi e parametri ottimali di interpolazione
Come riconoscere il metodo
che si adatta meglio al tipo di
dati di cui si dispone? E come
definire parametri come per
esempio tensione e smoothing
per il Regularized Spline with
Tension and Smoothing?
Un metodo molto usato è la cross-
validation che permette di stimare
un errore di interpolazione prodotto
dai vari metodi e dai loro parametri
basandosi sui dati misurati. Viene
quindi scelto il metodo o I parametri
che producono I minimi errori di
interpolazione complessivi.
Miglior risultato:
tension=90;
smoothing (w) = 0.1
Regularized spline
with tension
da GRASS
32. Cross-validation
Esistono due versioni: una si basa sulla definizione di un subset di
validazione, che comprende per esempio il 20% dei dati misurati e
che viene escluso dal processo di interpolazione. I dati di
validazione vengono poi confrontati con I corrispondenti valori
interpolati tramite tecniche come il Root Mean Square Error (slide
successiva).
Un altro metodo è il “leave-one-out” (o “jack-knife”), che invece
esclude dall'interpolazione una singola osservazione per volta,
effettua il confronto tra valore interpolato e valore noto escluso, e
applica via via questo processamento a tutti I dati noti.
33. Misure di differenza tra dataset
•Si basano sulla somma delle differenze
(residuali) tra i due valori corrispondenti
nei dataset da confrontare. Queste
differenze possono essere considerare
in valore assoluto - mean absolut error -
o elevate al quadrato – root square error
-.
Nel caso della Root Mean Square Error
(RMSE), la sommatoria delle differenze
al quadrato viene divisa per il numero di
osservazioni e poi ne viene calcolata la
radice quadrata.
( )
n
ZZ
RMSE
n
i
reale
i
erpolato
i
2
1
int
∑=
−
=
Valore interpolato nel punto Pi
reale
iZ Valore reale, misurato, nel punto Pi
erpolato
iZint
Permettono di quantificare la differenza complessiva tra due dataset numerici.
Possono essere usate per riconoscere fra varie superfici interpolate quella che
meglio approssima i dati noti. Il metodo ed i parametri usati per produrre quella
superficie saranno quindi quelli più adatti per il dataset a disposizione.
34. Bordi della zona da interpolare
Può essere utile usare
osservazioni anche
esterne alla zona da
interpolare, per migliorare
la qualità del risultato
finale.
Dopo l’interpolazione la
zona eccedente può
essere ritagliata.
DeMers, 2000, Fig.10-14.