Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di un campione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campione all’intera popolazione.
Quando si fa inferenza si cerca di indurre le caratteristiche sconosciute della popolazione a partire dalle informazioni campionarie. Più precisamente, fare inferenza significa:
Stimare: approssimare un parametro ignoto a partire dai dati campionari.
Testare delle ipotesi: verificare, utilizzando i dati campionari, la significatività statistica di ipotesi sulla distribuzione dei caratteri studiati, cioè sulla forma della distribuzione e sui valori che la qualificano: la media e lo scarto quadratico medio.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Differenze tra variabili, le rappresentazioni grafiche, il calcolo delle frequenze cumulate e la funzione di ripartizione
La probabilità è una misura del grado di incertezza di un evento in un certo esperimento casuale.
E’ ragionevole misurare l’incertezza degli eventi assegnando ad essi un numero compreso tra 0 e 1, detto probabilità di un evento.
Quanto più la probabilità è vicina a zero tanto più l’evento si verifica raramente e quanto più la probabilità è vicina a 1 tanto più l’evento è frequente.
Quando non è conveniente o possibile esaminare l’intera popolazione si ricorre allo studio di un campione rappresentativo di essa, estendendo attraverso l’inferenza, i risultati del campione all’intera popolazione.
Quando si fa inferenza si cerca di indurre le caratteristiche sconosciute della popolazione a partire dalle informazioni campionarie. Più precisamente, fare inferenza significa:
Stimare: approssimare un parametro ignoto a partire dai dati campionari.
Testare delle ipotesi: verificare, utilizzando i dati campionari, la significatività statistica di ipotesi sulla distribuzione dei caratteri studiati, cioè sulla forma della distribuzione e sui valori che la qualificano: la media e lo scarto quadratico medio.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Differenze tra variabili, le rappresentazioni grafiche, il calcolo delle frequenze cumulate e la funzione di ripartizione
La probabilità è una misura del grado di incertezza di un evento in un certo esperimento casuale.
E’ ragionevole misurare l’incertezza degli eventi assegnando ad essi un numero compreso tra 0 e 1, detto probabilità di un evento.
Quanto più la probabilità è vicina a zero tanto più l’evento si verifica raramente e quanto più la probabilità è vicina a 1 tanto più l’evento è frequente.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
In natura si osservano delle distribuzioni empiriche; per studiarle è necessario avere delle distribuzioni teoriche di riferimento. Se si considera un fenomeno discreto, come il lancio dei dadi, la distribuzione teorica può essere assimilata alla distribuzione empirica e questo permette di calcolare le frequenze relative, la media e la deviazione standard.
Se invece il fenomeno è continuo si considera la funzione di densità e da questa, per integrazione, si ricavano le frequenze teoriche.
Una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:
MEDIA
MODA
MEDIANA
Un modo semplice per analizzare dati statistici (siano rappresentativi di frequenze o intensità) consiste nell’istituire un CONFRONTO tra di essi.
La statistica descrittiva si occupa anche di confronti tra dati statistici riferiti:
alle caratteristiche (frequenze o intensità) di parti di uno stesso collettivo;
ad uno stesso fenomeno osservato su collettività diverse;
alla comparazione delle sintesi effettuate sulle distribuzioni riferite ai collettivi (medie, indici di variabilità, ecc.);
a fenomeni diversi tra i quali sussista un nesso logico (“di parte al tutto”, di “causa ed effetto”, ecc.)
Introduzione alla geomorfologia. Dati digitali del terreno. Grandezze primarie: quote, pendenze, curvature. La classificazione del paesaggio in funzione delle curvature.
The document discusses Mikhail Budyko's water balance curve and its use in classifying climate and ecosystems based on a simple mass and energy balance equation. It examines Budyko's analysis of water balance for river basins over annual time scales, where water storage changes and subsurface flows can be neglected. Budyko's curve relates long-term average evapotranspiration to precipitation and available energy, distinguishing between energy-limited and water-limited environments. Several analytical models have since been proposed to represent Budyko's curve.
This contains the description of the class of Hydrology at the Dipartimento di Ingegneria Civile Ambientale e Meccanica dell'Università di Trento. For the year 2017.
Corso di Statistica del Prof. Garau.
Slide a cura di Giorgio Garau e Lucia Schirru.
Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati.
Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).
In natura si osservano delle distribuzioni empiriche; per studiarle è necessario avere delle distribuzioni teoriche di riferimento. Se si considera un fenomeno discreto, come il lancio dei dadi, la distribuzione teorica può essere assimilata alla distribuzione empirica e questo permette di calcolare le frequenze relative, la media e la deviazione standard.
Se invece il fenomeno è continuo si considera la funzione di densità e da questa, per integrazione, si ricavano le frequenze teoriche.
Una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate.
Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti.
Di seguito si esaminano le misure di posizione:
MEDIA
MODA
MEDIANA
Un modo semplice per analizzare dati statistici (siano rappresentativi di frequenze o intensità) consiste nell’istituire un CONFRONTO tra di essi.
La statistica descrittiva si occupa anche di confronti tra dati statistici riferiti:
alle caratteristiche (frequenze o intensità) di parti di uno stesso collettivo;
ad uno stesso fenomeno osservato su collettività diverse;
alla comparazione delle sintesi effettuate sulle distribuzioni riferite ai collettivi (medie, indici di variabilità, ecc.);
a fenomeni diversi tra i quali sussista un nesso logico (“di parte al tutto”, di “causa ed effetto”, ecc.)
Introduzione alla geomorfologia. Dati digitali del terreno. Grandezze primarie: quote, pendenze, curvature. La classificazione del paesaggio in funzione delle curvature.
The document discusses Mikhail Budyko's water balance curve and its use in classifying climate and ecosystems based on a simple mass and energy balance equation. It examines Budyko's analysis of water balance for river basins over annual time scales, where water storage changes and subsurface flows can be neglected. Budyko's curve relates long-term average evapotranspiration to precipitation and available energy, distinguishing between energy-limited and water-limited environments. Several analytical models have since been proposed to represent Budyko's curve.
This contains the description of the class of Hydrology at the Dipartimento di Ingegneria Civile Ambientale e Meccanica dell'Università di Trento. For the year 2017.
This is the lecture with which I usually conclude my class in hydrology. It talks about the impact of climate change on hydrology. Wit some specific on the Alpine areas.
3 alberti-seconda parte - About Spatial CorrelationRiccardo Rigon
By Matteo Alberti. More information and figures about Variograms and semivariograms. Related to the other material on interpolation of the course of Hydrology @ unitn
Introduzione all'uso della Console di OMS e di QGIS (per le analisi del corso...Riccardo Rigon
Le slides contengono una descrizione della Console di OMS e di alcuni comandi elementari di QGIS per gestire i dati spaziali che saranno utilizzati nel corso di Idrologia dell'Università di Trento (2017).
1. The document discusses long wave radiation emitted by the Earth's surface and atmosphere. It describes the Earth as a gray body that emits radiation in the infrared band given its average surface temperature of 288K.
2. It explains that the atmosphere absorbs and re-emits long wave radiation from the Earth's surface, and without this greenhouse effect the average surface temperature would be around -17C instead of 15C.
3. It provides equations to calculate long wave radiation from a surface based on the surface temperature and the atmospheric emissivity and temperature, noting that multiple parameterizations exist to estimate the atmospheric emissivity.
1) The atmosphere is not a perfect absorber of radiation like a blackbody, but rather a "gray body" that absorbs some but not all radiation.
2) Radiation passes through the Earth's atmosphere, with 45-50% of incident radiation reaching the ground. Some radiation is reflected and scattered by the atmosphere.
3) Shortwave radiation that enters the atmosphere is transferred to the ground through reflection, absorption, and transmission. The incoming and outgoing radiation must be in balance.
1) Solar radiation intensity governs seasonal climate changes and local climates due to variations in the sun's apparent height.
2) Incoming solar radiation is not evenly distributed across latitudes, creating heating imbalances between the equator and poles.
3) Calculations of solar radiation incident on Earth's curved surface must account for variables including latitude, time of day, day of year, and Earth's tilted orbit which causes seasons.
It contains the description of the Solar radiation relation with the astronomical movements of both Earth and sun. Used in the class of Hydrology at the University of Trento
1. Stima dei parametri e test di ipotesi
LucioFontana-Expectations(MoMA),1959
Riccardo Rigon
2. R. Rigon
2
A cosa siamo realmente interessati ?
Solitamente, non si è interessati alle statistiche in se, ma a quello
che le statistiche dicono della popolazione.
• Potremmo, as esempio, usare la media delle precipitazioni annuali
misurate in tutte le stazioni idrometeorologiche per stimare la
precipitazione media annuale su tutta la penisola italiana.
• Oppure potremmo usare la media del campione per stabilire se la
precipitazione media annuale sia mutata lungo la durata del campione.
3. R. Rigon
3
Ipotesi Zero (Nulla)
Sui test di ipotesi avremo la possibilità di entrare nel dettaglio in
lezioni successive.
• In genere si ricordi, che è non è possibile provare con certezza
alcunchè. Una ipotesi si può tentare di provare che non sia vera. Sia
H0 l’ipotesi zero da provare.
• Se non si riesce a scartare H0 , allora si può affermare che “sia vera”
con un certo grado di confidenza
4. R. Rigon
4
Un esempio
• Consideriamo una variabile che può assumere solo quattro valori discreti,
N=4
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
• Consideriamo campioni di grandezza due, n=2
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
5. R. Rigon
5
Medie
Se consideriamo estrazioni con rimessa possiamo produrre infinite coppie
di numeri (la popolazione è infinita). Il numero di coppie distinte è però
legato a considerazioni combinatoriche.
Di ogni coppia estratta, posso evidentemente, calcolare la media:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
6. R. Rigon
6
Due Medie
Media della popolazione
Media del campione
Tre distribuzioni
Distribuzione della popolazione
Distribuzione del campione (composto da più estrazioni)
Distribuzione delle medie campionarie
7. R. Rigon
7
La popolazione
La popolazione è infinita, ma, per costruzione, gli elementi distinti sono
quattro e, quindi, la media esatta - il parametro - si può ottenere
esattamente dalla media dei quattro valori. Se ciascuno è estratto con
uguale probabilità:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
e:
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
8. R. Rigon
8
Il campione
Se x1 = 2 e x2 =3 (un campione)
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
Dal calcolo combinatorico segue che possiamo
avere 16 campioni differenti
10. R. Rigon
10
La distribuzione delle medie è la seguente
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
11. R. Rigon
11
La media delle medie
è uguale alla media
Ovvero la media delle medie campionarie (tutte) è uguale alla
media della popolazione
<latexit sha1_base64="tYHCApFiY8slQcKMwQxwGacE74A=">AAAA+3icSyrIySwuMTC4ycjEzMLKxs7BycXNw8XFy8cvEFacX1qUnBqanJ+TXxSRlFicmpOZlxpaklmSkxpRUJSamJuUkxqelO0Mkg8vSy0qzszPCympLEiNzU1Mz8tMy0xOLAEKBcQLKBvoGYCBAibDEMpQZoACoHJDdElMRqiRnpmeQSBCG4e0koahuYNHQGhyStfknfsPQoQZGaHyggyo4BQAVIE48g==</latexit>
12. R. Rigon
12
Supponiamo ora di avere a che fare con una popolazione
molto grande
Di cui non si riesca a calcolare la media esatta
Avendo a disposizione due campioni, avremo come nel
caso precedente due medie diverse.
Come possiamo capire se questi due campioni sono prescelti
dalla stessa popolazione. Come possiamo inferire se le medie
dei due campioni (le statistiche) sono rappresentative della
stessa media ?
13. R. Rigon
13
Un esempio: la media
Per rispondere alla domanda se due campioni hanno la stessa media,
possiamo procedere come segue:
•Determinare teoricamente quale distribuzione hanno le medie
•Assumere che la distribuzione teorica delle medie abbia parametri
determinati dalla prima media - Questa è chiamata ipotesi zero (o
anche nulla, dall’inglese “null” che significa però zero)
•Vedere come la seconda media si collocherebbe nella distribuzione
delle medie parametrizzata dalla prima serie di misure
•Scartare l’ipotesi zero se la collocazione della seconda media nella
distribuzione determinata dall’ipotesi zero è poco probabile.