Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Indagini

340 views

Published on

Published in: Education
  • Be the first to comment

  • Be the first to like this

Indagini

  1. 1. I seminari: La rappresentazione in dati dei fatti sociali La generazione dei dati: le indagini La generazione dei dati: i dati amministrativi I dati accessibili on line Aldo Scarnera, Primo Ricercatore, Istituto Nazionale di Statistica. Ciclo di seminari sulla generazione del dato. Università degli Studi di Bari “Aldo Moro” Corso di Laurea in Sociologia Nevembre-Dicembre 2008
  2. 2. La generazione dei dati: le indagini
  3. 3. <ul><li>Perché si fanno: </li></ul><ul><li>Perché non si dispone di informazioni certe su un determinato fenomeno e non è possibile ricavarne di simili da altre da fonti </li></ul><ul><li>Perché ottenerle in questo modo è relativamente poco costoso rispetto alla qualità e al valore atteso delle stesse </li></ul>
  4. 4. Tre tipi di rilevazione/indagine è sottoposto ad indagine l’intero universo di riferimento rispetto ad uno spazio (politico, sociale, economico) e ad un tempo dato. Questo universo può riferirsi ad una nazione (i censimenti della popolazione e delle abitazioni, dell’agricotura, delle imprese e dei servizi sono indagini di questo tipo) o ad un sotto insieme di un universo più grande (ad esempio tutte le famiglie degli alunni delle -o solo di una- scuole medie statali di quel determinato comune) 1. La rilevazione/indagine totale:
  5. 5. <ul><li>I problemi: </li></ul><ul><li>I costi, i tempi di realizzazione e le difficoltà organizzative sono direttamente proporzionali all’ampiezza dell’universo da indagare </li></ul><ul><li>Quando non sono disponibili elenchi o liste esaustive di soggetti eleggibili, o non si può far ricorso a tecniche sostitutive di tali liste, la sua realizzazione può complicarsi fino a diventare inutile </li></ul><ul><li>Quando si presentano, i problemi di copertura dell’intero universo sono di non facile soluzione </li></ul>
  6. 6. <ul><li>I vantaggi: </li></ul><ul><li>Se ben rilevate le informazioni acquisite non costituiscono una stima più o meno corretta del fenomeno indagato ma lo rappresentano così com’è (rispetto alla strumentazione utilizzata) </li></ul><ul><li>Per universi relativamente piccoli o per finalità relativamente strategiche il rapporto costi/benefici può risultare molto vantaggioso </li></ul>
  7. 7. 2. La rilevazione/indagine campionaria probabilistica: <ul><li>sottopone ad indagine un campione rappresentativo dell’universo di riferimento sempre rispetto ad uno spazio (politico, sociale, economico) e ad un tempo dato. Per ciascuna delle unità entrate a far parte del campione è nota la probabilità di estrazione dall’universo (o di essere inclusa nel campione). </li></ul><ul><li>è sempre disegnata considerando il set di unità da cui sarà estratto il campione (sampling frame) che nella pratica tende ad approssimare l’universo di riferimento e coincide con questo solo in casi ideali. (Se si considera la popolazione riportata nell’elenco telefonico come rappresentativa della popolazione della città cui fa riferimento e lo si usa per estrarre un campione di quella popolazione bisognerà tener presente che il sampling frame comprende solo quegli abitanti della città che: </li></ul><ul><ul><li>hanno un telefono; </li></ul></ul><ul><ul><li>hanno il numero telefonico incluso nell’elenco; </li></ul></ul><ul><ul><li>possono rispondere a telefono negli orari e nei giorni in cui l’intervista si svolge; </li></ul></ul><ul><ul><li>non si rifiutano di rispondere a tutte le interviste telefoniche. </li></ul></ul><ul><ul><li>In questo caso il campione è diverso dalla popolazione di riferimento. Tale differenza può causare errori sistematici nei risultati dell’indagine e nei metodi utilizzati per ottenerli) </li></ul></ul>
  8. 8. Più tipologie di campioni probabilistici <ul><li>Casuale semplice: tutti i soggetti di una popolazione e tutte le combinazioni di soggetti hanno uguale probabilità di essere scelti. I soggetti sono estratti -con reimmissione- casualmente da una lista di soggetti eleggibili. </li></ul><ul><li>Sistematico: può essere assimilato ad un campione casuale semplice, ma l’estrazione dalla lista avviene, partendo da una posizione estratta casualmente, con un passo determinato dal rapporto fra la dimensione dell’universo e quella del campione </li></ul><ul><li>Stratificato: i soggetti presenti nella lista sono raggruppati e classificati rispetto a una o più caratteristiche e dai gruppi così definiti sono estratti casualmente o sistematicamente tanti campioni indipendenti. La probabilità di estrazione potrà essere uguale per tutti i soggetti in tutti i gruppi o pari a quella attesa di individuare nella popolazione un individuo con le caratteristiche del gruppo </li></ul><ul><li>A grappolo: non si estraggono e selezionano i soggetti ma i luoghi fisici o anche sociali (ad es. quartieri, famiglie, comunità) dove possono essere trovati. Selezionati tali luoghi con i criteri probabilistici definiti, si sottopongono ad indagine a tutti i soggetti lì presenti. </li></ul><ul><li>Multistadio: si estraggono e selezionano con i criteri probabilistici definiti più livelli di grappolo e si sottopongono ad indagine tutti gli individui che si trovano nel grappolo più piccolo (ad es. comuni, famiglie dentro i comuni, tutti i soggetti nelle famiglie). Gli elementi degli stadi (grappoli) iniziali possono essere selezionati con stratificazione </li></ul>
  9. 9. I vantaggi dei campioni probabilistici <ul><li>Si basano sulla teoria della probabilità e permettono di utilizzare la statistica inferenziale per calcolare quanto sia verosimile che le caratteristiche del campione rappresentino quelle della popolazion e </li></ul><ul><li>Consentono di calcolare con quale confidenza o con quale errore o scarto il campione e i risultati che se ne traggono rappresentano l’universo cui fanno riferimento </li></ul><ul><li>Consentono di predefinire con buona approssimazione i costi/benefici dell’indagine e di determinarli in relazione al budget a disposizione </li></ul>
  10. 10. I problemi del campione probabilistico Non è sempre certo che il campione selezionato rappresenti con il margine di errore e di confidenza prescelti l’universo di riferimento. Tale margine di incertezza può essere in parte controllato cercando di eliminare il più possibile errori non campionari dovuti al sampling frame, a una cattiva gestione del processo di individuazione e di costruzione delle liste e delle tecniche di selezione del campione
  11. 11. 3. La rilevazione/indagine campionaria non probabilistica: Sottopone ad indagine un campione di soggetti per il quale non è nota la probabilità con cui sono stati estratti o inclusi nel campione, ovvero, un campione che è stato costruito in un modo che non ha dato a ciascun membro della popolazione di riferimento un probabilità nota di essere estratto.
  12. 12. Più tipologie di campioni non probabilistici <ul><li>Accidentale, fortuito, di convenienza: derivato da un gruppo di persone che si suppone possano rappresentare in qualche modo l’universo di riferimento. Rientrano in questa casistica le interviste fatte alla “casalinga”, al “passante”, allo “studente”, al “paziente ospedaliero”, al lavoratore “extracomunitario” condotte di solito in ambito giornalistico </li></ul><ul><li>Finalizzato, di scopo: costituito da un gruppo di soggetti ritenuto importante per gli scopi della rilevazione a causa di alcuni loro tratti caratteristici, del loro lavoro, del fatto di essere esperti in qualche materia, dei luoghi in cui vivono o che frequentano. Rientrano in questa casistica: </li></ul><ul><ul><li>i campionamenti “Modal instance”, si selezionano soggetti -quali l’elettore tipo- ritenuti portatori di caratteristiche modali, tipiche della popolazione di riferimento; </li></ul></ul><ul><ul><li>i “panel” e “delphi di esperti”; </li></ul></ul><ul><ul><li>i “quota sampling”, campioni non casuali di soggetti di cui è stato fissata semplicemente la quantità, non necessariamente proporzionale per caratteristiche alla popolazione di riferimento; </li></ul></ul><ul><ul><li>gli “heterogeneity sampling”, si selezionano i soggetti in modo da garantire massima diversità cercando di ottenere risultati inattesi ; </li></ul></ul><ul><ul><li>gli “snow ball sampling”, utilizzato quando non è possibile disporre di elenchi o di liste ovvero quando la popolazione di riferimento non è facile da raggiungere (soggetti che fanno uso di droghe, homeless …). Il campione si costruisce chiedendo ai già intervistati dove è possibile trovare persone con le loro caratteristiche. </li></ul></ul>
  13. 13. Campioni non probabilistici: istruzioni per l’uso <ul><li>Possono essere utilizzati: </li></ul><ul><li>Quando esistono già gruppi che si ritiene possano rappresentare una popolazione di riferimento </li></ul><ul><li>Quando è impossibile ottenere una lista dei soggetti o raggiungere in qualche modo la popolazione di riferimento (gli homeless ad esempio) </li></ul><ul><li>Quando si fa uno studio esplorativo e non è opportuno individuare preventivamente la popolazione e le caratteristiche di interesse </li></ul><ul><li>In ogni caso va detto che in nessun modo è possibile generalizzare i risultati utilizzando la strumentazione probabilistica. Quei dati rappresentano solo le unità di analisi da cui sono stati estratti. </li></ul>
  14. 14. Il questionario strutturato nell’intervista faccia a faccia. Alcune tipologie di domande <ul><li>Dicotomiche: </li></ul><ul><li>La scorsa settimana ha svolto almeno un’ora di lavoro? Consideri il lavoro da cui ha ricavato un guadagno o il lavoro non pagato solo se effettuato abitualmente presso la ditta di un familiare </li></ul><ul><li>Sì 1|__|(passare a sezione C) </li></ul><ul><li>No 2|__| </li></ul><ul><li>Basate sul livello di misurazione: </li></ul><ul><ul><li>Nominale: </li></ul></ul><ul><ul><li>Le svolge il suo lavoro come: </li></ul></ul><ul><ul><li>Dirigente 1|_| </li></ul></ul><ul><ul><li>Quadro 2|_| </li></ul></ul><ul><ul><li>Impiegato 3|_| </li></ul></ul><ul><ul><li>Operaio 4|_| </li></ul></ul><ul><ul><li>Apprendista 5|_| </li></ul></ul><ul><ul><li>Lavoratore presso il proprio domicilio per conto di un’impresa 6|_| </li></ul></ul>
  15. 15. <ul><li>Basate sul livello di misurazione (segue): </li></ul><ul><ul><li>Ordinato </li></ul></ul>
  16. 16. <ul><li>Basate sul livello di misurazione (segue): </li></ul><ul><ul><li>Intervallo o scala di Likert: </li></ul></ul>
  17. 17. <ul><li>Basate sul livello di misurazione (segue): </li></ul><ul><ul><li>differenziale semantico: </li></ul></ul><ul><ul><li>Può darmi la sua opinione sulle seguenti caratteristiche del Servizio Sanitario Nazionale: </li></ul></ul>Molto d’accordo Abbastanza d’accordo Né d’accordo né contrario Abbastanza d’accordo Molto d’accordo Ha cura degli assistiti Non ha cura degli assistiti È semplice È complesso È utile È inutile
  18. 18. <ul><li>Basate sul livello di misurazione (segue): </li></ul><ul><ul><li>intervallo cumulativo (di Guttman) </li></ul></ul><ul><ul><li>Potrebbe rispondere con un Si o un No alle seguenti domande: </li></ul></ul><ul><ul><li>Permetterebbe ad un immigrato di vivere nel suo Paese ___ </li></ul></ul><ul><ul><li>Permetterebbe ad un immigrato di vivere nella sua città ___ </li></ul></ul><ul><ul><li>Permetterebbe ad un immigrato di vivere nel suo quartiere ___ </li></ul></ul><ul><ul><li>Permetterebbe ad un immigrato di vivere nell’appartamento di fianco al suo ___ </li></ul></ul><ul><ul><li>Permetterebbe che sua figlia sposi un immigrato ___ </li></ul></ul><ul><ul><li>Intervallo continuo (quasi) </li></ul></ul><ul><ul><li>Può indicarmi la sua età in anni compiuti? </li></ul></ul><ul><ul><li>_____ </li></ul></ul>
  19. 19. Il questionario strutturato nell’intervista faccia a faccia. L’articolazione e la struttura <ul><li>L’organizzazione in sezioni omogenee </li></ul><ul><li>I filtri </li></ul><ul><li>Ha mai fumato marijuana? </li></ul><ul><li>1) Si </li></ul><ul><li>2) No </li></ul><ul><ul><li>Se si, quante volte fino ad oggi? </li></ul></ul><ul><ul><li>1) una sola volta </li></ul></ul><ul><ul><li>2) da due a cinque volte </li></ul></ul><ul><ul><li>3) da sei a dieci volte </li></ul></ul><ul><ul><li>4) da undici a venti volte </li></ul></ul><ul><ul><li>5) più di venti volte </li></ul></ul><ul><li>Il wording </li></ul>
  20. 20. Il quesito approccio Può dirmi qual è la sua attuale condizione? Occupato 01|_| Disoccupato in cerca di una nuova occupazione 02|_| In cerca di prima occupazione 03|_| Inizierà un’attività in futuro 04|_| Casalinga/o 05|_| Studente 06|_| Pensionato o Ritirato dal lavoro 07|_| Inabile al lavoro 08|_| In altra condizione 10|_| Vs La scorsa settimana ha svolto almeno un’ora di lavoro? Consideri il lavoro da cui ha ricavato un guadagno o il lavoro non pagato solo se effettuato abitualmente presso la ditta di un familiare Sì 1|__|(passare a sezione C) No 2|__| Il questionario strutturato nell’intervista faccia a faccia. L’articolazione e la struttura (segue)
  21. 21. <ul><li>Le tecniche di somministrazione </li></ul><ul><li>P.A.P.I. </li></ul><ul><ul><li>Necessita di un’intensa attività di spoglio dei dati (codifica e data entry) e di serrati controlli di qualità </li></ul></ul><ul><li>C.A.P.I. </li></ul><ul><li>C.A.W.I. </li></ul><ul><li>C.A.T.I </li></ul><ul><ul><li>Nei tre casi le attività di primo trattamento di codifica e di data entry sono effettuate in automatico dai sistemi già al momento dell’intervista. I controlli di qualità sono limitati perchè già effettuati dai filtri e dai percorsi obbligati del questionario </li></ul></ul>
  22. 22. Le tecniche di selezione casuale del campione La tavola dei numeri casuali Le procedure informatizzate di generazione di numeri casuali

×