PSIHODIAGNOZĂ I
                                          (ZI, ID)
                             Lector univ. drd. Corina B...
Tema 1. ASPECTE GENERALE PRIVIND PSIHODIAGNOZA

Noţiunea de psihodiagnostic
         În sens larg psihodiagnosticul este o...
• Formatul testului: viteză, simplitate, manieră de a răspunde
          • Efecte secvenţale sau de model a unor părţi ant...
-    cât de activ sau pasiv este în relaţiile interpersonale?
        Istoric vorbind, nevoia de teste psihologice a fost ...
raţionamentul, rezolvarea de probleme, limbajul (ex.: “buturuga mică răstoarnă carul
mare”).
b. A încercat pentru prima da...
Folosim aceste teste în mai multe medii:
1.     Mediul clinic – cabinetul individual, spitalele. Ele ne pot furniza inform...
Aspecte fundamentale în măsurare
    Măsurarea este actul prin care se atribuie numere unor “obiecte” psihologice.
    Măr...
Scala de raport sau tip proporţie
        Scalele de raport pornesc de la cuantificarea foarte precisă a punctului de plec...
formulează apoi o serie de afirmaţii referitoare la modul în care se comportă persoanele
care au valori mari ale acestei v...
Pentru aceasta este necesar ca variabila criteriu să ia valori într-o mulţime total ordonată ori
să realizeze o măsurare p...
socială se poate forma o grupă de studenţi cu multiple preocupări extraşcolare şi una cu
studenţi fără asemenea preocupări...
v În interiorul diferitelor categorii de teste de aptitudini putem decela clasificări speciale:
  astfel, pentru testele d...
Adecvarea generală a instrumentului, sau măsura în care este compatibil pentru o
evaluare rutinieră; instrumentele care su...
C. Coeficienţii consistenţei interne - se calculează în cadrul analizei consistenţei
interne, pe baza scorurilor obţinute ...
Un caz particular al metodei formelor paralele îl constituie metoda înjumătăţirii
(split-half). În literatura de specialit...
v Formula spearman – Brown poate fi utilizată pentru a estima de câţi itmei ai
      nevoie pentru a atinge nivelul dorit ...
Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de
fidelitate poate fi mai mic, chiar cuprins î...
îndeplinite două condiţii (Albu, 1995): să se ştie exact ce reprezintă scorurile testului;
măsurările tăcute de test să fi...
validitate, în funcţie de numărul de dimensiuni profesionale (calitatea muncii, disciplina,
categoria profesională etc.) c...
deţine. Un alt dezavantaj este şi faptul că persoanele pe care le avem la dispoziţie
reprezintă numai o parte din eşantion...
face apel la acest proces psihic; itemii unui test care va estima capacitatea de analiză şi
sinteză a unui poliţist, va av...
tradiţional (mediu rural)/primitiv bu există o astfel de cultură numerică – aceşti copii nu vor
avea o inteligenţă matemat...
6. Metoda experimentală – uneori, pentru a valida un test care pretinde că măsoară o
      anumită variabilă, putem provoc...
5. Revizia testului

        Pe scurt, prima etapă a proiectării testului debutează cu definirea conceptului care
se doreş...
Testul pilot este dat spre rezolvare unui număr mic de subiecţi cu scopul de a
determina: populaţia corectă, numărul itemi...
timpul de rezolvare a testului (inclusiv variante privind standardizarea timpului), costurile
administrării testului.

   ...
Analiza capacităţii de discriminare a itemilor
        Discriminarea itemilor se referă la gradul în care un item diferenţ...
2. Dacă toţi subiecţii clasei “U” reuşesc la item şi nici unul dintre subiecţii clasei
           “L” nu reuşeşte, D = 100...
3. relaţia dintre performanţa la item a subiecţilor şi fiecare dintre trăsăturile care au
      legătură cu performanţa po...
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Curs psihodiagnoza-
Upcoming SlideShare
Loading in...5
×

Curs psihodiagnoza-

26,165

Published on

testare,evaluare si psihodiagnostic

Published in: Education
0 Comments
14 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
26,165
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
966
Comments
0
Likes
14
Embeds 0
No embeds

No notes for slide

Curs psihodiagnoza-

  1. 1. PSIHODIAGNOZĂ I (ZI, ID) Lector univ. drd. Corina Bogdan I) Obiective v generale: formarea studenţilor pentru construirea, aplicarea şi interpretarea psihodiagnostică a testelor psihologice; cunoaşterea tipurilor de probe psihologice; v specifice informaţionale: cunoaşterea teoriilor care permit interpretarea diferitelor teste de aptitudini şi de personalitate, cunoaşterea tehnicilor de construire a testelor psihologice; v specifice operaţionale: formarea capacităţii de a utiliza şi construi un test psihologic prin aplicarea cerinţelor privind calităţile testelor (calculul fidelităţii, validităţii, normarea şi analiza de item); capacitatea de a aplica şi interpreta teste de aptitudini şi de personalitate. II) Conţinut TESTAREA INTELECTULUI 1. Aspecte generale ale psihodiagnozei. Funcţii. Istoric al psihodiagnozei. 2. Măsurarea în psihologie. Testul psihologic. 3. Proprietăţi psihometrice: fidelitatea. Tipuri de fidelitate. 4. Proprietăţi psihometrice: validitatea. Tipuri de validitate. 5. Elaborarea şi construirea testelor. Analiza de item. Teorii ale răspunsului la item. 6. Etalonarea şi reetalonarea testului. Normarea. 7. Măsurarea aptitudinilor. 7.1.Taxonomia aptitudinilor. 7.2.Teste de atenţie. 8. Măsurarea aptitudinilor: 8.1.Bateria McQuarrie. 8.2.Teste de memorie. 9. Măsurarea inteligenţei: 9.1.Particularităţi. 9.2.T.A.I. 10. Scalele Wechsler. 10.1.WAIS, 10.2.WISC, 10.3.WPPSI 11. Matricile progresive standard Bibliografie minimală A.Anastasi, Psychological Testing, MacMillan, N.Y., 1988 Albu. M. (1998). Construirea şi utilizarea testelor psihologice. Cluj-Napoca: Clusium. M. Minulescu, 2001, Bazele psihodiagnosticului, Editura Titu Maiorescu, Bucureşti Kulcsar, T. (1980). Lecţii practice de psihodiagnostic. Cluj-Napoca: Litografia UBB. Minulescu, 2003, Teorie şi practică în psihodiagnoză. Testarea intelectului, Editura Fundaţiei România de Mâine, Bucureşti Nicolae Mitrofan, Laurenţiu Mitrofan 2005, Testarea psihologică. Inteligenţa şi aptitudinile, Editura Polirom, Iaşi Ursula Şchiopu, 2004, Introducere în psihodiagnostic, Editura Humanitas, Bucureşti 1
  2. 2. Tema 1. ASPECTE GENERALE PRIVIND PSIHODIAGNOZA Noţiunea de psihodiagnostic În sens larg psihodiagnosticul este o colecţie de tehnici şi strategii constituite pentru a permite o evaluare sistematică şi realistă a condiţiei psihice – procese, dispoziţii, abilităţi şi aptitudini, trăsături de personalitate, structuri tipologice, structuri relaţionale ale unei persoane sau grup de persoane. În sens restrâns: utilizarea testelor psihologice în examinarea psihologică Terminologie Testare psihologică este o procedură folosită în procesul de evaluare; reprezintă procesul de administrare, scorare şi interpretare a testelor psihologice destinat obţinerii unui eşantion de comportament. Evaluare psihologică se referă la strângerea unor date psihologice integrate cu scopul de a realiza o evaluare psihologică. Această strângere de date este realizată prin utilizarea mai multor procedee precum testarea, intervievarea, studiul de caz, observaţia comportamentului şi a unor aparate şi proceduri de măsurare specifice. Testul este o procedură sau un instrument utilizat pentru a măsura variabile psihologice (intrument, probă) În ceea ce priveşte scopul testării, ea, testarea se face doar când există o problemă specifică, suficient de bine definită. Când se face o testare psihologică, se obţin informaţii care să sprijine psihologul în rezolvarea unei probleme prezente (în consiliere, selecţie, psihoterapie, expertiză...) În testarea psihologică este necesar ca examinatorul să aibă capacitatea a traduce informaţia dată de test în prescripţii cu sens, practice şi adecvate, precum şi de a formula recomandări pentru cel testat. Este necesar să se conceapă strategii specifice în funcţie de tipul de beneficiar care poate fi subiectul însuşi, profesor, pacient, consilier, angajator, medic etc. Este necesară evitarea unor pericole ale testării şi evaluării, cum ar fi: 1. Invadarea vieţii private a subiectului, 2. Creşterea nivelului de anxietate pentru subiectul examinat, 3. Interpretările greşite, diagnostice eronate datorate unei tendinţe de autoîndeplinire a perceperii subiective, 4. Decizii pe baza unei singure probe, 5. Imaturitatea şi nesiguranţa emoţională a examinatorului. Personalitatea psihologului examinator; Trăsături de preferat v sănătate şi siguranţă emoţională; umor; flexibilitate; v abilitatea de a intra în legătură cu oamenii; v interes pentru rezolvarea problemelor prin intermediul aplicării rezultatelor conceptuale sau clinice ale testelor (opus interesului exclusiv pentru performanţa cantitativă); v să-şi dezvolte o orientare teoretică compatibilă cu explicarea unui comportament; astfel poate conceptualiza problema prezentă a subiectului într-un mod teoretic care are sens şi consistenţă (nu incoerentă şi bazată pe presupuneri). Rezultatele testării pot fi influenţate de: v Caracteristici ale testului ca stimul şi anume: • Conţinutul testului în sine 2
  3. 3. • Formatul testului: viteză, simplitate, manieră de a răspunde • Efecte secvenţale sau de model a unor părţi anterioare ale testului • Caracteristici care ţin de cultură v Caracteristici ale situaţiei de testare: • Metoda de administrare • Contextul interpersonal; include şi influenţa celui care examinează • Contextul fizic: lumină, zgomot, distractori posibili • Context social: singur, în grup; observat sau nu • Metoda de înregistrare a răspunsurilor v Caracteristici ale persoanei testate: • Scopuri personale pentru care dă testarea • Stil de răspuns: claritate, apărări şi rezistenţe, dezirabilitate socială • Condiţii fiziologice: oboseală, disabilităţi, condiţia de sănătate • Fluctuaţii de atenţie şi / memorie, distractori interni • Abilitatea de a înţelege instrucţiunile la test şi itemii testului; abilitatea de a citi • Probleme psiho-sociale în înţelegerea testului şi a scopurilor sale • “norocul” întâmplător în ghicirea răspunsului sau dorinţa de a ghici • Abilităţi interpersonale şi atribute caracteristice ale personalităţii (trăsături, motive, conflicte etc.) Funcţiile psihodiagnozei v Surprindera corectă a trăsăturilor şi capacităţilor psihice individuale, evidenţierea variabilităţii comportamentale intragrupale: psihodiagnoza diferenţială, individualizată v Evidenţierea cauzelor care au condus la o anume realitate psihocomportamentală (mai ales în cazul unor destructurări: psihodiagnoza cauzală v Formularea unui prognostic, anticiparea evoluţiei psiho-comportamentală a subiectului în anumite condiţii v Utilizarea datelor în consilierea educaţională şi profesională (privind cariera) preum şi în selecţia profesioală v Utilizarea în consilierea psihologică şi în psihoterapie v Evidenţierea cazurilor de abatere în sens pozitiv / negativ de la graficul dezvoltării normale v Evaluarea şi validarea unor programe de învăţare şi formare profesională v Formularea unor capacităţi de cunoaştere şi autocunoaştere Istoric al psihodiagnosticului Testul psihologic este o invenţie a societăţilor industrializate de tip urban şi a apărut din necesitatea de a economisi timp şi efort în cunoaşterea personalităţii individului. Testul psihologic ne oferă o măsura standardizată a anumitor caracteristici ale omului, relevante pentru societate sau pentru el însuşi. Iată o serie de întrebări la care poate răspunde testul psihologic: - cât de inteligent este individul? - cât de stabil sau instabil este emoţional? - cât de rapid este în reacţiile lui? 3
  4. 4. - cât de activ sau pasiv este în relaţiile interpersonale? Istoric vorbind, nevoia de teste psihologice a fost presimţită iniţial în principal în zona educaţională şi clinică. Această nevoie iniţială de a aplica teste se referea mai precis la nevoia unei identificări clare a copiilor cu handicap mental pentru a fi incluşi în clase speciale. Astfel, un medic francez – Esquirol, în 1838, era preocupat în a face distincţia între nebunie şi retardul mental. Nebunia, în sensul clasic al termenului, implică o formă de dezorganizare mintală, cu impact asupra multor planuri de existenţă (maniacul este opus depresivului). Pe de altă parte, retardul mental implică un deficit la nivel intelectual (o întârziere). Esquirol a încercat să găsească nişte criterii prin care să diferenţieze retardul mental faţă de copii normali. Una din concluziile lui Esquirol, care este valabilă şi astăzi, este că folosirea limbajului este cel mai bun criteriu în evaluarea nivelului intelectual. El a încercat să construiască o probă care avea un conţinut verbal. Un alt medic francez, Seguin, în 1848, a lansat ideea că retardul mental al copiilor ar putea fi ameliorat. El a încercat să contribuie la dezvoltarea copiilor cu handicap mental folosind nişte tehnici de discriminare senzorială sau de dezvoltare a controlului motor. Ex.: placa formelor – cutie în care apar diferite forme din metal şi alături o altă cutie cu decupaje în forma pieselor. Tot în seccolul XIX, un biolog englez, Fransis Galton s-a ocupat de diferenţele dintre oameni în ceea ce priveşte anumite caracteristici ale individului. El a măsurat o serie de parametri antropometrici, cum ar fi: înălţimea, greutatea, a studiat diferite forme ale feţei, raportul dintre lungimea capului şi trunchi, rapiditatea reacţiilor ş.a.m.d., interesat fiind să vadă care sunt acele caracteristici pe care le moştenim sau care se modifică de-a lungul vieţii şi nu se transmit. Şi el a realizat nişte teste de discriminare senzorială pentru a-i putea depista pe copii cu retard. De exemplu, el a observat că deficienţele mentale foarte grave sunt asociate cu incapacitatea copilului de a simţi adecvat frigul, durerea sau căldura, adică dacă simţurile unui om nu funcţionează bine înseamnă că nu are un nivel de inteligenţă ridicat. Adevărul este undeva la mijloc. F. Galton mai este cunoscut şi a rămas în istoria psihologiei şi pentru că a fost primul care a încercat să organizeze şi să ordoneze datele măsurătorii pentru a fi semnificative sau pentru a servi unui anumit scop. Un psiholog american, J.M. Cattell a folosit pentru prima oară noţiunea de test mental (mental test) pentru instrumentele pe care le-a conceput pentru a evalua funcţiile intelectuale. La fel ca şi Galton, el considera că putem cunoaşte inteligenţa subiectului dacă ştim cât de bine sau de ascuţite îi sunt simţurile. Ca atare, el a crezut că măsurarea inteligenţei se face folosind tot tehnici de discriminare senzorială sau de timpi de reacţie. O altă etapă în în istoria psihodiagnosticului au fost studiile lui Emil Kraepelin. În 1880 a folosit pentru prima dată în evaluarea psihiatrică anumite probe care să măsoare integritatea funcţiilor psihice. Testul Kraepelin – cifre 1-9; subiectul trebuie să facă următorul lucru: dacă prima cifră este mai mică decât a doua trebuie să le adune, şi invers. Acest test măsoară: atenţia, capacitatea vizuală, memoria şi răbdarea şi rezistenţa la monotonie. În secolul XX, cel care a inventat testul mental în accepţiunea lui modernă, este Alfred Binet, în 1905. Era preocupat şi a fost însărcinat cu discriminarea copiilor cu handicap mental faţă de cei normali. Aspecte prin care Binet se diferenţiază de predecesorii lui: a. A folosit pentru măsurarea inteligenţei nu probe sau nu numai probe senzoriale motorii ci şi probe care se adresau mai direct funcţiilor cognitive superioare, adică judecata, 4
  5. 5. raţionamentul, rezolvarea de probleme, limbajul (ex.: “buturuga mică răstoarnă carul mare”). b. A încercat pentru prima dată să asigure standardizarea şi obiectivitatea măsurătorilor testului. A ajuns la dimensiunea de nivel mental sau vârstă mentală. Vârsta mentală poate fi independentă de cea cronologică a subiectului. Cu alte cuvinte, un copil de 4 ani care rezolvă uşor probe pentru 5 ani este precoce şi are vârsta mentală a celor de 5 ani. Prima variantă a testului realizată de Binet a fost ulterior îmbunătăţită şi revizuită, de un alt psiholog american, Terman care a folosit pentru prima dată termenul de coeficient de inteligenţă (IQ) exprimat ca un raport între vârsta mentală (adică rezultatul la test) şi vârsta cronologică a subiectului. În 1917, un psiholog american, Yerkes a încercat să folosească pentru prima dată un test de inteligenţă de grup în cadrul armatei, pentru a recruta, incorpora sau pentru a promova anumite cadre militare. O variantă a testelor folosite de el se mai foloseşte şi astăzi (cuburile Yerkes – cuburile incomplete – urmăreşte reprezentarea spaţială, pentru a rezolva această sarcină, subiectul trebuie să numere şi cuburile care nu se văd). El a compus două variante de test: 1. army alfa – pentru vorbitorii de limba engleză, deci aveau şi itemi verbali; 2. army beta – pentru analfabeţi sau pentru emigranţii care nu cunoţteau limba engleză (fără itemi verbali). Odată ce probele de inteligenţă s-au răspândit tot mai mult (SUA, America) fiind folosite în scopuri de selecţie profesională, s-a observat că ele nu erau eficiente pentru o bună selecţie pentru că nu vizau decât factorul general inteligenţă sau aptitudine. Atunci au început să apară şi alte categorii de teste suplimentare care să măsoare aptitudinile speciale (de ex.: aptitudini mecanice, aptitudini muzicale /artistice). De-a lungul vremii aceste tipuri de teste s-au dezvoltat foarte mult. Până acum am discutat despre testele de performanţe. Au început să apară, prin anii 1920, şi alte tipuri de teste pe care astăzi le denumim generic teste de personalitate. De exemplu, aceste teste măsoară stările emoţionale, relaţiile interpersonale, diferite tipuri de motivaţie, interese sau atitudini. Unii din precusorii acestor teste este G. Jung. El a construit testul de asociere verbală prin care încerca să detecteze complexele individului (încerca să detecteze care sunt acele zone de conflict din viaţa subiectului). Se prezintă subiectului un cuvânt – cuvânt inductor – şi subiectul trebuia să de-a un raspuns rapid şi foarte logic (dacă nu reacţiona repede sau deloc – G. Jung le interpreta). De exemplu: la cuvântul “spital” mulţi subiecţi se blocau pentru că acest cuvânt evoca o suferinţă dureroasă a subiectului sau a cuiva foarte apropiat. În 1921, a urmat un alt test de personalitate, şi anume testul lui Rorschach. El a elaborat testul petelor de cerneală, un test proiectiv compus din nişte pete de cerneală ambigue (alb/negru şi color). Culoarea este un indicator al reactivităţii emoţionale – de exemplu, daca la roşu subiectul dă răspunsuri bizare, înseamnă că acest stimul l-a atins puternic afectiv. În afara celor două teste menţionate, s-au dezvoltat foarte mult aşa numitele chestionare de personalitate (self report test). Unul dintre aceste teste îi aparţine psihologului american Robert Woodworth şi a fost realizat tot pentru a folosi în cadrul armatei la recrutare, pentru a-i depista pe cei cu probleme psihiatrice. Practic, acest test este compus dintr-o serie de întrebări care vizează o serie de disfuncţii sau simptome ale subiectului. Aceste tipuri de chestionare sunt folosite şi astăzi în unităţile militare în procesele de recrutare, de incorporare. 5
  6. 6. Folosim aceste teste în mai multe medii: 1. Mediul clinic – cabinetul individual, spitalele. Ele ne pot furniza informaţii despre cât de deteriorat mintal este individul sau care este starea lui emoţională, sau ce tipuri de simptome sau disfuncţii prezintă, sau în ce tip de personalitate se încadrează individul. Din acest punct de vedere, testele psihologice sunt folosite de psiholog nu de psihiatru, ca mijloc diferenţial, adică precizarea unei anumite boli (interviul clinic). 2. Mediul educaţional – tot ceea ce înseamnă psihologie şcolară sau educaţională. De exemplu: v identificarea copiilor cu probleme emoţionale sau intelectuale; v identificarea copiilor supradotaţi ca inteligenţă sau ca alt tip de aptitudini; v pentru orientarea şcolară şi vocaţională, deci pentru consilierea în acest sens (aptitudini şi interes); v pentru evaluarea dinamicii grupului de şcolari în scopul ameliorării relaţiilor interpersonale; v cel mai des, pentru evaluarea nivelului de cunoştinţe. Practic, într-un anumit sens, orice examen pe care-l dăm se adresează acestui tip de teste (memorie, inteligenţă, limbaj). 3. În psihologia muncii şi organizaţională – în procesele de selecţie, recrutare de personal, în ce măsură subiectul trebuie pensionat. Atunci când este vorba de grup – potenţialul de leader sau de stilul managerial, sau pot fi folosite testele pentru a evalua impactul condiţiilor de muncă asupra individului. 4. În psihologia judiciară – de exemplu: în studiul personalităţii criminalului; în studiul efectului detenţiei asupra deţinutului. 5. În psihologia militară – în promovare, în orientarea spre arma adecvată. 6. În cercetare în psihologie – de exemplu: dacă vrei să evaluezi efectele unei variabile asupra grupului experimental, de cele mai multe ori se aplică teste (de ex.: cum influenţează anxietatea memoria – se aplică un test de memorie). 7. În consiliere şi psihoterapie clinică în general (în afara spitalului) – se poate evalua eficienţa unei psihoterapii. Tema 2. MĂSURAREA ÎN PSIHODIAGNOZĂ Tipuri de statistici în psihodiagnoză Măsurarea cantitativă în psihologie include trei tipuri de statistici, şi anume: 1. statistici descriptive; 2. statistici inferenţiale; 3. statistici multivariate. Prin statistică se testează un lot sau un eşantion de populaţie considerate a fi reprezantative pentru întregul ei 1. Statisticile descriptive: grafice, modul de prezentare, de manipulare simplă a datelor (media, mediana, frecventa). 2. Statisticile inferenţiale: permit tragerea unor concluzii referitoare la unul sau mai mulţi indivizi, bazându-se pe datele de eşantion, de lot, de grup de indivizi. Acest tip de statistici se referă la corelaţii, varianta comportamentală, capacitatea de a judeca diferenţele dintre indivizi sau dintre grupurile de indivizi. 3. Statisticile multivariate: sunt utilizate atunci când punem în comparaţie două sau mai multe caracteristici măsurate pe un grup de indivizi, relaţiile dintre interese, valori si gradul de diferenţiere dintre diferitele curbe variaţionale, corelaţii multiple, calcularea regresiilor, calcularea de tip factorial. 6
  7. 7. Aspecte fundamentale în măsurare Măsurarea este actul prin care se atribuie numere unor “obiecte” psihologice. Mărimea reflectă proprietăţii ale cantităţii Intervalele egale sunt corelate distanţelor egale dintre două puncte pe o scală Zero absolut apare doar în situaţia când este posibil să măsori lipsa de existenţă Pentru a determina ce tip de măsurare să folosim, trebuie să definim mai întâi nivelul de măsurare, care poate fi: nominal, ordinal, de interval, proporţia. Scalele diferă între ele prin prezenţa sau absenţa a 4 caracteristici: exclusivitatea, ordonarea, echivalenţa, caracterul absolut. Tipuri de scale Nominale: sunt denumite obiectele din cadrul unui grup Ordinale: obiectele sunt rangate în funcţie de mărime De interval: obiectele sunt evaluate în funcţie de mărime şi intervale egale, dar nu există condiţia de zero absolut Raţio: există posibilitatea delimitării situaţiei de zero absolut, non-existenţa Scala de tip nominal Scalele de tip nominal sunt bazale (atribuirea unui număr pentru o cantitate observată, atribuire făcută în mod arbitrar şi care funcţionează ca o codificare). Acest tip de scală are o singură calitate, şi anume exclusivitatea (un număr poate fi atribuit doar o singură dată). Nu se pot folosi nici un fel de proceduri matematice. Numărul atribuit unei caracteristici este distinct de altele în sensul că el reprezintă una şi doar acea caracteristică. De exemplu, o caracteristică nominală este "sexul", care poate fi doar feminin sau masculin. Scala de tip ordinal Scala de tip ordinal reprezintă nivelul ordinal de calcul (înseamnă o anumită rangare în funcţie de o caracteristică). De exemplu, în clinică, severitatea diferitelor simptoame poate fi descrisă, v. DSM IV R, prin ordonare. Această scală este utilizată în mod curent în teste dacă este cerută autoevaluarea (dacă variabila poate fi descrisă prin termenii precum: "foarte puţin", "mediu", "mult" sau "foarte mult"). Se pot folosi matematici primare. Se pot compara cantitativ termenii de "funcţionare slabă" căruia i se atribuie o valoare, cu termenul de "funcţionare superioară", căruia i se atribuie un alt număr. Nu se pot face operări precum adunare, scădere, înmulţire sau împărţire. Putem compara poziţiile relative ale numerelor legate de un anumit grad de variabilitate. Scala de interval Scala de interval: avem distante egale între nivelele fixate în scala de interval (de exemplu, termometrul). Normarea la teste se bazează tocmai pe scala de interval. Normarea la teste se face prin: exclusivitate, ordonare, echivalentă (diferenţele dintre numerele atribuite diferitelor nivele sunt egale) şi calculele matematice ce pot fi utilizate (adunare, înmulţire, împărţire, scădere). În măsurarea de tip interval lipsind valoarea lui 0 absolut nu putem cu adevărat multiplica sau împărţi scorurile la măsurile de tip interval deoarece, de exemplu, un scor de 30 la un chestionar, s-ar putea să nu reflecte jumătate din scorul de 60. 7
  8. 8. Scala de raport sau tip proporţie Scalele de raport pornesc de la cuantificarea foarte precisă a punctului de plecare (punctul zero). Măsurile de tip proporţie sunt relativ rare în ştiinţele comportamentului. Ne putem baza pe zero absolut numai în măsura în care putem constata absenţa absolută a unei caracteristici. Se pot face orice tip de calcule matematice legate de existenta lui zero absolut. Testele psihologice sunt instrumente verificate ale căror principale calităţi metrologice sunt: fidelitatea, validitatea şi standardizarea. Aspecte privind distribuţia Frecvenţa distribuţiei: prezintă frecvenţa distribuţei unui scor de-a lungul unei scale Distribuţie normală: o distribuţie simetrică binominală (curba Gauss, sau Bell) Nivel procentual: indică procentul scorurilor aflate dedesuptul unui anumit scor Rang: procentul de scoruri dedesubtul scorului avut în vedere împărţit la numărul total de scoruri Percentile: indică locul pe scală unde cade un scor particular Curba lui Gauss Rezultatele obţinute de un grup de persoane reprezentative pentru condiţia subiectului testat se repartizează de regulă sub forma curbei lui Gauss ceea ce permite calcularea performanţelor medii şi a dispersiei acestora. Media aritmetică a performanţelor la test este indicele care caracterizează tendinţa centrală a performanţelor acestor persoane, iar studiul variabilităţii rezultatelor (deviaţia standard) permite aprecierea specificului comportamentului acelui grup de persoane (comparativ la un alt grup, cu o aceeaşi medie a performanţelor). Interpretarea deviaţiei standard se realizează în funcţie de proprietăţile distribuţiei normale: 1 deviaţie în plus şi în minus faţă de medie acoperă relativ 68,26% din rezultate; două deviaţii standard, 95,44%; 3 deviaţii standard acoperă virtual totalitatea rezultatelor, 99,72%. Concepte cheie implicate în măsurarea psihologică: construct, domeniu de conţinut, grupe contrastante, criteriu, validitatea de aspect, variabilă moderatoare, variabilă mediatoare Construct Definiţie: un construct este, în genere, o idee construită de experţi pentru a rezuma un grup de fenomene sau de obiecte şi pentru a fi utilizată într-un cadru ştiinţific (teoretic, metodologic sau aplicativ). Este o abstractizare a unor regularităţi din natură; nu este observabil direct, dar poate fi conectat cu entităţi sau evenimente concrete, observabile. Constructele psihologice sunt evidenţiate, direct sau indirect, de comportament sau în urma conducerii unor experimente dedicate măsurării lor. Un construct psihologic, este “o etichetă aplicată unei grupări de comportamente care covariază”. Fiecare construct psihologic este fundamentat pe o teorie, care permite descrierea şi predicţia comportamentelor legate de el, în situaţii specifice. Pentru elaborarea unui test care să îl măsoare, constructului i se asociază o variabilă cantitativă despre care se presupune că se află în relaţie crescătoare cu scorurile testului. Se 8
  9. 9. formulează apoi o serie de afirmaţii referitoare la modul în care se comportă persoanele care au valori mari ale acestei variabile, comparativ cu cele care au valori scăzute. Comportamentele prin care autorul testului consideră că se manifestă constructul pot fi influenţate de diverse variabile, precum vârsta, sexul, educaţia primită etc. Pentru unele dintre acestea legătura cu constructul poate corespunde unei situaţii reale, observată în populaţia căreia i se adresează testul şi acceptată de teoria care stă la baza constructului. Pentru altele, însă, ea denotă că aceste comportamente nu sunt caracteristice constructului. De asemenea, comportamentele prin care este descris constructul măsurat de test se pot asocia cu comportamente prin care se manifestă alte constructe psihologice, evaluate prin teste existente. Domeniul de conţinut al unui test Definiţie: prin domeniu de conţinut al unui test se înţelege “mulţimea tuturor comportamentelor care pot fi utilizate pentru a măsura atributul specific sau caracteristica la care se referă testul”. Definirea domeniului de conţinut este asemănătoare celei de definire a unui construct. Autorul testului, pe baza ideii pe care şi-a format-o despre ceea ce vrea să măsoare, reţine acele comportamente care presupune că ar fi manifestări ale constructului, respectiv, în cazul domeniului de conţinut, expresii ale performanţei sau ale cunoştinţelor subiecţilor. Deosebirea dintre un construct şi un domeniu de conţinut constă numai în gradul de abstractizare implicat şi adesea este dificil de făcut distincţie între ele . Grupele contrastante Definiţie: Grupele contrastante sau grupele extreme, reprezintă două loturi de subiecţi care, printr-o variabilă (sau mai multe) au valori diferite extreme, respectiv un grup are valori foarte mari, celălalt valorile foarte mici. Modul de formare a grupelor contrastante este dependent de numărul variabilelor alese şi de scala pe care acestea sunt măsurate. În cazul unei singure variabile dihotomice, cum este sexul, grupele contrastante corespund celor două valori ale variabilei. Criteriul Definiţie: Prin criteriu se înţelege "o variabilă pe care încercăm să o prevedem în general cu ajutorul testelor", sau "o măsură acceptată a comportamentului evaluat de test". Criteriul, în aprecierea personalului este "o măsură a nivelului de performanţă exprimată în termeni cantitativi, bazată pe o descriere completă a muncii prestate". Variabila criteriu poate fi unidimensională sau poate fi constituită multidimensional, cu valori cantitative sau / şi calitative. De exemplu, în cazul “capacităţii manageriale”, din abilitatea de comunicare, capacitatea de organizare (apreciate prin câte un calificativ) şi din sociabilitate, persuasiune şi ambiţie (măsurate cu ajutorul unor scale, deci având valori numerice). Performanţa în muncă este, de asemenea, un criteriu multidimensional. Condiţii de acceptabilitate Pentru a face posibilă aprecierea corectă a calităţilor testului cercetat, criteriul trebuie să îndeplinească următoarele condiţii: 1. Să fie relevant pentru activitatea sau caracteristica la care se referă, deci ordinea subiecţilor determinată pe baza valorilor criteriului să corespundă ordinii reale a acestora în privinţa succesului obţinut în activitatea respectivă sau a mărimii caracteristicii măsurate. 9
  10. 10. Pentru aceasta este necesar ca variabila criteriu să ia valori într-o mulţime total ordonată ori să realizeze o măsurare pe scală ordinală, de interval sau de raport. De obicei se preferă criteriile cu valori cantitative. 2. Să fie fidel, deci să concorde cu diverse evaluări ale performanţelor la care el se referă, făcute la momente diferite şi / sau cu alte instrumente de măsură, similare lui. Verificarea acestei condiţii se poate face cu ajutorul coeficientului de corelaţie. 3. Să fie practic, deci să nu coste mult şi să fie acceptabil pentru cei care doresc să îl utilizeze la luarea deciziilor. Pentru îndeplinirea acestei condiţii. este important ca în criteriu să fie înglobate principalele aspecte care sunt avute în vedere la aprecierea performanţei sau a mărimii caracteristicii măsurate. Identificarea acestora se poate face apelând la supervizori, respectiv la experţi. 4. Să fie exprimat în aceleaşi unităţi sau în unităţi comparabile pentru toate persoanele. De exemplu, dacă valorile variabilei criteriu sunt dependente de vârsta subiecţilor, atunci aceste valori vor fi transformate în cote standardizate, pentru fiecare persoană fiind utilizate în formula de transformare media şi abaterea standard corespunzătoare grupei de vârstă din care aceasta face parte. Obs. Atunci când criteriul este multidimensional, valoarea criteriului pentru fiecare persoană să reflecte atât importanţa diverselor componente, cât şi nivelul individului la fiecare dintre ele. Tipuri de criterii Anastasi (1954) enumeră câteva criterii utilizate în practica psihologică pentru analizarea validităţii testelor care măsoară constructe. Acestea sunt: 1. Vârsta: se foloseşte drept criteriu pentru testele de inteligenţă, întrucât se consideră că scorurile acestora trebuie să crească pe parcursul copilăriei, până la maturitate. Nu este un criteriu bun pentru testele care măsoară funcţiuni psihice invariabile sau puţin variabile în timp, cum sunt variabilele de personalitate. 2. Cunoştinţele şcolare, exprimate prin note şcolare, rezultate la teste de cunoştinţe ori evaluări făcute de profesori asupra “inteligenţei” elevilor: sunt adesea criterii pentru testele care măsoară aptitudinea şcolară. 3. Performanţele la diverse programe de instruire specială cum sunt cursurile de dactilografie, programare, muzică etc. 4. Performanţa profesională serveşte uneori drept criteriu pentru teste de personalitate. 5. Evaluările făcute de profesori, instructori sau superiori sunt folosite mai mult pentru a obţine informaţii despre alte criterii, cum ar it cunoştinţele şcolare, performanţa la diverse cursuri, reuşita profesională. Au rol de criteriu pentru unele teste care măsoară trăsături psihice, precum anxietatea, onestitatea, originalitatea etc. 6. Rezultatele altor teste se utilizează ca şi criteriu atunci când se urmăreşte să se construiască un test care să măsoare acelaşi lucru ca şi criteriul dar să fie mai uşor de administrat sau - şi de cotat ori să fie mai ieftin. De exemplu, scala Stanford-Binet a servit drept criteriu pentru multe teste de inteligenţă. 7. Grupele contrastante reprezintă de obicei un criteriu multidimensional, care cuprinde aspecte diverse din viaţa zilnică. De exemplu, pentru un test de inteligenţă grupele contrastante pot fi constituite dintr-o clasă de copii proveniţi de la o şcoală de debili mintali şi o clasă de elevi de aceeaşi vârstă dintr-o şcoală obişnuită. Criteriul pe baza căruia s-au format grupele este alcătuit din ansamblul de factori care au determinat cuprinderea copiilor în şcoala ajutătoare. Grupele contrastante se folosesc frecvent ca şi criteriu pentru testele de personalitate. De exemplu, pentru evaluarea unor trăsături legate de activitatea 10
  11. 11. socială se poate forma o grupă de studenţi cu multiple preocupări extraşcolare şi una cu studenţi fără asemenea preocupări. Variabile moderatoare În termeni generali, o variabilă moderatoare este o variabilă calitativă (de exemplu, sexul, rasa, clasa socială) sau cantitativă (de exemplu, vârsta, anxietatea) care afectează direcţia şi/sau tăria relaţiei dintre o variabilă independentă şi o variabilă dependentă. Unii autori înţeleg prin variabilă moderatoare “o interacţiune între mai multe variabile care influenţează corelaţiile uneia dintre variabile cu alte date”. Variabilă mediatoare Definiţie: O variabilă U acţionează ca mediator între variabila independentă X şi cea dependentă Y dacă sunt îndeplinite următoarele condiţii. 1. variaţia valorilor variabilei independente provoacă variaţia valorilor variabilei mediatoare; 2. variaţia valorilor variabilei mediatoare determină variaţia valorilor variabilei dependente; 3. relaţia dintre variabila independentă şi cea dependentă este semnificativă, dar devine slabă sau chiar inexistentă atunci când sunt controlate relaţiile dintre variabila independentă şi cea mediatoare şi dintre variabila mediatoare şi cea dependentă. Procedeul statistic: Procedeul aplicat pentru verificarea existenţei efectului mediator constă în construirea ecuaţiilor de regresie. Testul psihologic Definiţia testului psihologic v 1954, A. Anastasi: "Un test psihologic este în mod esenţial o măsură obiectivă şi standardizată a unui eşantion de comportament“, Psychological Testing. v 1961, A. Anastasi subliniază faptul că: "Valoarea psihodiagnostică şi predictivă a testului psihologic depinde de gradul în care serveşte ca indicator al unei arii relativ largi şi semnificative a comportamentului". v 1966, L.G.Cronbach consideră testul psihologic, sintetic, ca o procedură sistematică de a compara comportamentul a două sau mai multe persoane. v În construirea şi utilizarea testului trebuie respectate anumite principii şi criterii: 1. standardizarea: privind condiţiile de aplicare, administrarea propriu-zisă, cotarea rezultatelor şi interpretarea acestora; 2. obiectivitatea, testul deplin obiectiv este cel în care orice utilizator care ia cunoştinţă de o performanţă la test va ajunge la aceeaşi evaluare. În context subliniază şi importanţa obiectivităţii de procedură, în înregistrarea rezultatelor şi cotării (Essentials of Psychological Testing). Tipuri de teste; clasificare v În funcţie de obiectivul urmărit de test sau de bateria din care face parte, testele se pot clasifica în: teste de achiziţie de cunoştinţe, teste de inteligenţă; teste de aptitudini specifice; teste de atitudini; teste de interese; teste de măsurare a abilităţilor senzorio- motorii; teste de sociabilitate; teste de personalitate; teste de temperament; teste de dezvoltare. Pichot clasifică în două categorii largi: teste de eficienţă (de inteligenţă, aptitudini, cunoştinţe etc.) şi teste de personalitate. 11
  12. 12. v În interiorul diferitelor categorii de teste de aptitudini putem decela clasificări speciale: astfel, pentru testele de inteligenţă, deosebim între testele de inteligenţă generală, testele de inteligenţă tehnică, testele de inteligenţă abstractă; testele de inteligenţă socială etc. v Testele de atenţie se clasifică în funcţie de specificul calităţii urmărite: teste de concentrare; de stabilitate; de mobilitate; de distributivitate. Testele de aptitudini se clasifică în: teste de aptitudini tehnice; artistice; verbale; organizatorice; pedagogice etc. v În funcţie de tipul de activitate implicat, sau natura reacţiei subiectului: teste creion - hârtie, teste de performanţă bazate pe coordonarea psihomotorie şi teste verbale (vs. teste nonverbale). v În funcţie de modul de lucru cu subiectul, teste individuale şi teste colective. v În funcţie de importanţa standardizării timpului de lucru: teste limitate de timp şi teste fără timp impus. v În funcţie de tipul de răspuns: teste cu răspuns la alegere, teste cu răspuns creat de subiect (răspuns liber). v În funcţie de tipul de informaţie rezultat: teste sintetice care oferă un rezultat global (de exemplu cele de Q.I.), teste analitice care permit conturarea profilului psihologic al subiectului conform a diferite dimensiuni. Calităţi ale testului psihologic Factorii care îi determină valoarea practică sunt utilitatea, acceptabilitatea, sensibilitatea, caracterul direct, non-reactivitatea, adecvarea generală. Utilitatea: măsura avantajului practic în utilizarea unui anume instrument. De exemplu, în practica clinică, instrumentul este util în: planificarea intervenţiei, furnizează un feedback adecvat privind eficienţa acesteia. Aspecte ale utilităţii includ: scopul testului, lungimea, abilitatea de a scora, uşurinţa de a realiza interpretări. Acceptabilitatea include: 1. cât este de potrivit conţinutul testului la condiţia intelectuală şi emoţională a persoanei testate (limbaj sofisticat, un nivel de lectură mai elevat, abilitatea de a discrimina între diferite stări emoţionale). 2. dacă scorurile nu sunt o reflectare acurată a problemei persoanei, utilizarea instrumentului este practic nesemnificativă. Persoana testată trebuie să perceapă instrumentul ca acceptabil (Haynes, 1983) (are sens, prea intruziv). Sensibilitatea este capacitatea testului de a sesiza schimbările în timp. De exemplu, în consilierea psihologică, sau în terapie este nevoie de teste care să poată detecta schimbările, progresul persoanei testate de-a lungul timpului între şedinţe. Caracterul direct: capacitatea testului de a reflecta comportamentul real, gândurile sau sentimentele reale ale persoanei. Măsurile directe sunt semne ale problemei, cele indirecte sunt mai ales simboluri ale problemei conducând spre inferenţe indirecte. De exemplu, testele de performanţă sunt considerate directe, în timp ce tehnicile şi testele proiective sunt prin definiţie indirecte. Multe instrumente se situează de-a lungul acestor două extreme, implicând în diferite ponderi caracterul direct. Când examinarea pune accent pe fidelitatea datelor, practic gradul în care instrumentul are capacitatea de a reflecta direct aspectul psihic devine decisiv. Non-reactivitatea este calitatea testului de a nu provoca o anumită reacţie subiectului astfel ca răspunsul la probă să fie influenţat de această reacţie. Este importantă utilizarea acelor instrumente care nu produc o artificializare a răspunsurilor, schimbări reactive. 12
  13. 13. Adecvarea generală a instrumentului, sau măsura în care este compatibil pentru o evaluare rutinieră; instrumentele care sunt lungi sau complicate în sistemul de scorare, deşi pot să furnizeze informaţie utilă nu pot fi utilizate în mod curent, frecvent pentru că cer prea mult timp. Adecvarea se referă de asemeni şi la fidelitatea şi validitatea informaţiei, obiectivitatea datelor pe care se poate întemeia decizia în evaluare Tema 3. PROPRIETĂŢI PSIHOMETRICE: FIDELITATEA Definiţie Fidelitatea se referă la măsurarea lipsită de erori. Ea reflectă acurateţea şi stabilitatea scorurilor la test şi poate fi măsurată statistic prin utilizarea coeficientului de corelaţie. Fidelitatea reprezintă tradiţional: “precizia, consistenţa şi stabilitatea măsurării realizate de test". Termenii de “consistenţă” şi “stabilitate” continuă să fie utilizaţi şi în prezent în legătură cu fidelitatea testelor, având sensul de repetabilitate a rezultatelor măsurării. Standards for Educational and Psychological Tests, 1985, definesc fidelitatea ca fiind “gradul în care scorurile testului sunt consistente sau repetabile, adică gradul în care ele nu sunt afectate de erorile de măsură". Testele încearcă să măsoare o trăsătură sau caracteristică psihologică utilizând o unitate de măsură care este influenţată de surse de eroare. Scopul măsurării este de a găsi scorul real al persoanei şi a reduce eroarea de măsurare. Eroare standard de estimare, SEE – indică cât de mult, în medie, variază scorul unei persoane de la scorul real al acesteia Orice test psihologic este fidel dacă îndeplineşte următoarele cerinţe: • este lipsit de erori de măsură, deci este precis, • orice persoană obţine scoruri egale la test şi la o formă paralelă a acestuia în situaţia când erorile de măsură la cele două teste pentru orice persoană sunt independente. Erorile de măsură sunt aleatoare nu sistematice, deci sunt complet nepredictibile, indiferent de cunoştinţele pe care le avem despre persoanele măsurate sau despre procesul de măsurare. Forme de fidelitate 1. metoda test - retest, 2. metoda analizei consistenţei interne; 3. metoda formelor paralele; 4. coeficienţi de fidelitate inter-evaluatori; Tipuri de coeficienţi conform tipurilor de forme: A. Coeficienţii de stabilitate - se calculează prin metoda test-retest, corelând scorurile obţinute la test şi la retest (acelaşi test aplicat după un interval de timp). Arată cât de stabile sunt scorurile în timp. B. Coeficienţii de echivalenţă - rezultă din metoda formelor paralele, prin corelarea scorurilor obţinute la două teste paralele, administrate aproape în acelaşi timp. Arată cât de asemănătoare sunt cele două instrumente de măsură. 13
  14. 14. C. Coeficienţii consistenţei interne - se calculează în cadrul analizei consistenţei interne, pe baza scorurilor obţinute la un test administrat o singură dată. Din această categorie fac parte coeficientul a al lui Cronbach, coeficientul 3 al lui Guttman şi coeficienţii Kuder- Richardson. Ei indică concordanţa diferitelor părţi ale testului. D. Coeficienţii de fidelitate inter evaluatori - se calculează pentru teste al căror scor este rezultatul aprecierii subiective făcute de evaluator. Ei arată în ce măsură părerile mai multor evaluatori concordă între ele. Fidelitatea test - retest Determină dacă scorurile variază în timp; se măsoară prin testarea persoanei în două momente diferite (interval de timp) şi apoi se corelează scorurile obţinute Problema principală: scorurile sunt influenţate de aspecte are ţin de atât de administare cât şi de persoana testată Ca urmare, procedura tinde să supraestimeze fidelitatea. Este nevoie de un nivel de corelare de .90 (.80 este un nivel “acceptabil” al corelaţiei) Metoda test-retest evaluează gradul în care scorurile obţinute la un test de acelaşi subiect sunt constante de la o administrare la alta. Se procedează astfel: (1) Se administrează testul unui grup de persoane. (2) După un interval de timp se administrează testul, aceloraşi persoane, în aceleaşi condiţii ca şi prima dată. (3) Se calculează coeficientul de corelaţie liniară între scorurile observate în cele două situaţii. Valoarea obţinută se foloseşte pentru estimarea fidelităţii testului, considerându-se că testul este paralel cu el însuşi, ceea ce înseamnă că între cele două administrări ale sale, scorurile reale ale persoanelor nu s-au schimbat. test-retest Coeficientul de corelaţie calculat prin această metodă se numeşte coeficient de stabilitate. Metoda test-retest este utilă atunci când scorurile reale ale testului măsoară caracteristici durabile, generale şi specifice, ale persoanelor. Dezavantajul metodei test-retest constă în faptul că pretinde două administrări ale testului, ceea ce necesită timp şi cheltuieli materiale. Fidelitatea determinată prin utilizarea unor forme paralele/ alternative Utilizează de obicei 2 forme diferite ale aceluiaşi test; ambele forme sunt date tuturor subiecţilor în cadrul aceleiaşi şedinţe, echilibrând administarea ca test prim şi secundar. Dacă nu sunt date în acceaşi zi, se numeşte “forme alternative întârziate”. Sunt corelate cele două scoruri ale aceleiaşi persoane. Metoda formelor paralele constă în administrarea a două teste, care reprezintă instrumente de măsură paralele, la momente foarte apropiate unul de altul şi determinarea coeficientului de corelaţie liniară între scorurile observate ale celor două forme. Valoarea calculată se numeşte coeficient de echivalenţă. Dacă cele două teste sunt paralele şi dacă pentru fiecare persoană erorile de măsură la cele două administrări sunt variabile aleatoare independente, atunci coeficientul de echivalenţă coincide cu coeficientul de fidelitate al fiecărui test. 14
  15. 15. Un caz particular al metodei formelor paralele îl constituie metoda înjumătăţirii (split-half). În literatura de specialitate, aceasta este inclusă uneori în cadrul analizei consistenţei interne. v Metoda înjumătăţirii are următorii paşi: • Se administrează testul unui lot de persoane. • Se împarte testul în două părţi cât mai asemănătoare între ele. • Se calculează coeficientul de corelaţie între scorurile observate la cele două jumătăţi. Metoda formelor paralele este potrivită în cazul când se urmăreşte măsurarea unor caracteristici generale ale persoanelor. Obs. Asemenea caracteristici vor influenţa în acelaşi mod scorurile ambelor teste. Fidelitatea Kuder - Richardson Măsoară statistic consistenţa internă a testului, formula KR estimând care este fidelitatea medie dacă ai administra testul realizând toate tipurile de înjumătăţiri posibile Un tip special este KR – 20, care realizează acelaşi lucru pentru acele teste unde itemii sunt dihotomici. Coeficienţi de consistenţă internă indică măsura în care itemii testului se referă la acelaşi lucru. Metoda analizei consistenţei interne utilizează pentru estimarea fidelităţii unui test dispersiile şi covarianţele scorurilor observate ale itemilor. Se practică o singură administrare a testului. Pe baza scorurilor le itemilor se calculează de obicei unul dintre următorii coeficienţi: • coeficientul Alfa (α) al lui Cronbach; • coeficientul Lambda (λ) al lui Guttman; • coeficientul ρ: r20 sau r21 al lui Kuder-Richardson (dacă itemii testului sunt binari). Aceşti coeficienţi sunt utili pentru calculul fidelităţii testelor care măsoară o caracteristică (trăsătură) unidimensională. Indică caracterul omogen al itemilor testului sau scalei acestuia. Coeficienţi de fidelitate inter-evaluatori În cazul testelor care nu au o cotare obiectivă, cum sunt testele proiective sau cele de creativitate, scorurile subiecţilor sunt influenţate şi de persoana care face evaluarea răspunsurilor. Pentru a verifica în ce măsură scorurile testului sunt dependente de cel care a făcut cotarea, se calculează coeficientul de corelaţie liniară între scorurile atribuite aceloraşi subiecţi de evaluatori diferiţi. Eroarea standard de măsurare v Un indice statistic care exprimă fidelitatea v Indică care este influenţa fidelităţii asupra interpretării scorurilor testului: v Cu cât indicele ESM (SEM) este mai mic cu atît este mai mare fidelitate. Factori care afectează fidelitatea v Numărul de itemi: adăugarea de itemi poate creşte fidelitatea datorită faptului că se lărgeşte reprezentativitatea domeniului 15
  16. 16. v Formula spearman – Brown poate fi utilizată pentru a estima de câţi itmei ai nevoie pentru a atinge nivelul dorit de fidelitate v Itemi buni şi itemi slabi: se realizează o analiză de itemi, respectiv o corelare a fiecăruia dintre itemi şi scorul total al testului, sau modul cum sunt încărcaţi de un factor care este asociat testului (trăsătura ţintă) v Atenuarea, reprezintă gradul de descreştere al fidelităţii datorat erorii de măsurare v Pentru a estima fidelitatea fără nici o eroare de măsurare se poate folosi o statistică denumită “Corectarea pentru atenuare” (de ex., Corelaţia reală dintre variabile) Coeficient de corelaţie v Calcul statistic care reflectă situaţia în care două variabile sunt corelate semnificativ, co-variază; dar chiar şi situaţia unei corelaţii puternice nu ne da dreptul să vorbim despre cauzalitate v Coeficient de corelaţie: reflectă acele puncte care tind sa se grupeze de-a lungul aceleiaşi linii; corelaţia poate fi pozitivă, peste 0, sau negativă, sub zero şi evoluează între + 1 şi – 1 v Nivelul de semnificaţie statistică al unei corelaţii: se caută în tabelul “t” pentru a afla dacă relaţia este determinată de altceva decît şansă, întâmplare... Tipuri de corelaţii: v Coeficientul de corelaţie prin momentul produselor, Pearson: gradul de variaţie al unei variabile care poate fi estimat din cunoaşterea celeilalte variabile v Corelaţia rho a lui Spearman: află asocierea dintre două seturi de ranguri; ambele seturi trebuie să fie dihotomice v Corelaţie biserială: determină relaţia dintre o variabilă continuă şi o variabilă dihotomică v Corelaţie multiplă: când avem 2 predictori pentru acelaşi criteriu Sursele de variaţie ale erorii în funcţie de tipul de fidelitate: v test - retest: eşantionarea timpului v forme alternative (aplicare imediată): eşantionarea conţinutului v forme alternative (la interval mai mare de timp): eşantionare timp şi conţinut v împărţirea în două jumătăţi: eşantionarea conţinutului v Kuder-Richardson: eşantionarea conţinutului şi eterogenitatea acestuia v inter evaluatori: diferenţe de caracteristici ale personalităţii evaluatorilor Interpretarea coeficienţilor de fidelitate Când avem de ales dintr-o mulţime de teste având toate celelalte caracteristici egale, este de preferat testul care are cea mai mare fidelitate. Dar, testul cel mai fidel poate fi cel mai scump sau mai dificil de administrat. Dar, caracteristicile testelor sunt rareori egale. Se vor cere nivele înalte de fidelitate testelor folosite pentru a se lua decizii importante asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor diferenţe relativ mici între ei. În selecţia profesională, de pildă, se vor folosi teste care au coeficienţi de fidelitate mai mari decât 0.90. Se vor accepta nivele scăzute de fidelitate atunci când testele se utilizează pentru a lua decizii preliminare, nu finale, şi în cazul testelor care împart persoanele într-un număr mic de categorii, pe baza unor diferenţe individuale mari. 16
  17. 17. Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de fidelitate poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, testul se foloseşte pentru compararea persoanelor, una cu alta, coeficientul său de fidelitate trebuie să fie mai mare decât 0.85. În practică se folosesc adesea teste care sunt valide pentru populaţia şi situaţia în care sunt administrate, dar care nu au coeficienţi de fidelitate foarte mari Nu este posibil să se specifice un nivel minim care să fie impus coeficienţilor de fidelitate ai tuturor testelor. În practica obişnuită sunt utile următoarele recomandări: 1. Se vor cere nivele înalte de fidelitate testelor folosite pentru a se lua decizii importante asupra persoanelor şi celor care împart indivizii în mai multe categorii pe baza unor diferenţe relativ mici între ei. În selecţia profesională, de pildă, se vor folosi teste care au coeficienţi de fidelitate mai mari decât 0,90. 2. Se vor accepta nivele scăzute de fidelitate atunci când testele se utilizează pentru a lua decizii preliminare, nu finale, şi în cazul testelor care împart persoanele într-un număr mic de categorii, pe baza unor diferenţe individuale mari. 3. Dacă un test serveşte la compararea grupelor de persoane, coeficientul său de fidelitate poate fi mai mic, chiar cuprins între 0.6 şi 0.7. Dacă, însă testul se foloseşte pentru compararea persoanelor, una cu alta, coeficientul său de fidelitate trebuie să fie mai mare decât 0.85. Observaţii practice: v Fidelitatea chestionarelor de personalitate şi a celor de interese tinde să fie mai mică decât cea a testelor cognitive (de cunoştinţe, de inteligenţă, de aptitudini speciale, Aiken, 1994). v În general, se întâlnesc de obicei coeficienţi de fidelitate cuprinşi între 0.70 şi 0.98 (Guilford, 1965). v Testele cotate obiectiv care măsoară aptitudini cognitive pot furniza, în loturi eterogene de persoane, coeficienţi de fidelitate mai mari decât 0.8. v Testele cotate subiectiv care măsoară aptitudini, testele de cunoştinţe şi cele care evaluează performanţe tipice (de exemplu chestionare de personalitate) au, adesea, coeficienţi de fidelitate mai mici decât 0.80 (Traub, 1994). v Testele standardizate de cunoştinţe au, în general, o fidelitate mare spre moderată. v Testele cu alegere multiplă pot avea o fidelitate mai scăzută. Coeficientul lor de fidelitate este apropiat de 0.75. v În practică se folosesc adesea teste care sunt valide pentru populaţia şi situaţia în care sunt administrate, dar care nu au coeficienţi de fidelitate foarte mari. Tema 4. PROPRIETĂŢI PSIHOMETRICE: VALIDITATEA Definiţie Validarea unui test este procesul prin care se investighează gradul de validitate a interpretării propuse de acesta (APA. Standards 1985); gradul în care testul măsoară ceea ce se presupune a măsura Validarea nu se mai referă atât la instrumentul în sine, ci la interpretarea datelor furnizate de el. Dar, pentru o interpretare corectă a scorurilor unui test este necesar să fie 17
  18. 18. îndeplinite două condiţii (Albu, 1995): să se ştie exact ce reprezintă scorurile testului; măsurările tăcute de test să fie corecte. Întrebări la care răspunde validitatea unui test: v Măsoară testul ceea ce pretinde? v Poate fi utilizat în luarea unor decizii corecte? v Cercetăm aspectele avute în vedere de test suficient de echilibrat? S-a pierdut ceva important? v Este structura scorului ales consistentă cu structura domeniului asupra căruia trebuie să producem evaluări sau să facem predicţii? v Ce dovezi există că scorurile noastre semnifică ceea ce interpretăm că ar semnifica şi, în particular, ca reflectări ale unor caracteristici personale ce au implicaţii plauzibile pentru acţiunea educaţională, de selecţia de personal sau terapeutică? Standardele APA (1985) propun patru categorii esenţiale de definire a validităţii denumite cele “patru feţe ale validităţii” şi care în prezent au devenit patru strategii ale validării inferenţelor făcute pe baza scorurilor de test: 1. validitatea conceptuală; 2. validitatea de conţinut; 3. validitatea predictivă; 4. validitatea concurentă. Faţete ale validităţii v Validitate de conţinut: validitatea itemilor specifici ai testului; include şi validitatea de aspect (de faţadă) v Validitatea de construct: gradul în care testul relaţionează cu constructul teoretic subiacent testului v Validitatea de criteriu: abilitatea unui test de a prezice cu acurateţe performanţele subiectului la un criteriu din viaţa reală Standardele APA din 1974, subliniază faptul că “validitatea nu se măsoară, ci se deduce”. Manualul testului trebuie să conţină coeficienţii de validitate, dar în cazul unei aplicări particulare a testului nu se va lua în considerare un singur coeficient ci, prin analiza lor globală, se va aprecia dacă utilizarea testului este “adecvată” sau “nesatisfăcătoare”. Standardele APA din 1985 modifică terminologia utilizată în legătură cu validitatea. Astfel, ele înlocuiesc denumirile - cunoscute ale tipurilor de validitate cu următoarele “etichete” atribuite strategiilor de validare: v “dovezi ale validităţii relative la conţinut”, v “dovezi ale validităţii relative la construct” şi v “dovezi ale validităţii relative la criteriu”. În linii generale, validitatea exprima gradul în care un test măsoară ceea ce îşi propune să măsoare. La această calitate se mai poate adăuga şi o alta, dacă testul poate fi utilizat în luarea unor decizii corecte. Cu alte cuvinte, dacă noi cunoaştem performanţele unei persoane la un test (predictor), cât de precis vom putea estima ce performanţe profesionale va obţine? Validitatea este definită în termeni operaţionali ca şi corelaţia dintre predictor şi performanţele profesionale ale unui eşantion de indivizi. Rezultatul este cunoscut ca şi coeficient de validitate. Un test poate avea mai mulţi coeficienţi de 18
  19. 19. validitate, în funcţie de numărul de dimensiuni profesionale (calitatea muncii, disciplina, categoria profesională etc.) care corelează cu el. Guion (1976) distinge două tipuri de validităţi: validităţi în raport cu criteriul (concurentă şi predictivă) prin care se stabileşte relaţia dintre scorurile la test şi cele de la criteriu (profesionale, şcolare etc.) şi validităţi descriptive (de conţinut şi conceptuală) care evaluează sensul intrinsec al scorurilor la test. Validitate de aspect sau de faţadă Acest tip de validitate nu este de fapt o măsură reală a validităţii, în sens tehnic (în Standardele APA nici nu o include printre celelalte tipuri de validitate). Se referă la aprecierea pe care o fac cei care constituie obiectul testării cu o anumită probă legat de adecvarea acesteia categoriei respective de subiecţi. Un inginer căruia într-un test de vocabular i se includ cuvinte ca “facsimil”, “unicorn”, ”sinapsă ” etc., poate judeca testul respectiv ca nepotrivit profesiei sale. Testul, spunem, în acest caz, nu are validitate de aspect. Validitatea de aspect este importantă pentru că asigură o atitudine pozitivă atât faţă de test cât şi faţă de examenul psihologic. Ea este legată mai mult de motivaţia celui testat decât de aptitudinea măsurată, şi astfel este inclusă ca parte componentă în performanţa generală la examenul psihologic. La estimarea validităţii de aspect contează în primul rând aprecierile subiecţilor şi în al doilea rând experţii participanţi la construcţia testului. Validitatea de aspect nu face apel la metode psihometrice/ statistice de calcul, ea se bazează pe impresii şi opinii. Pentru psihologii antrenaţi în activităţi cu caracter aplicativ, construcţia de teste şi validarea lor, reprezintă acţiuni de mare importanţă. În acest domeniu experienţa acumulată este mare, deşi încă nu s-a spus ultimul cuvânt. Validitatea în raport cu criteriul: proiectarea concurentă Obiectul major al utilizării testelor în industrie este predicţia succesului/ insuccesului într-o anumită profesie. Un test are o valoare predictivă dacă el este capabil să anticipeze realizarea unei performanţe sau însuşirea unor deprinderi de către o persoană sau un lot de persoane. Mai precis, întrebările pe care trebuie să le pună orice psiholog sunt dacă testul măsoară ceea ce pretinde că măsoară şi cât de precis face el acest lucru. Predicţia este condiţionată de validitatea testului, mai precis de paralelismul între rezultatele la test şi cele obţinute în munca profesională. Acest paralelism este estimat cu ajutorul coeficientului de corelaţie. Obiectivitatea testului este deci direct proporţională cu semnificaţia coeficientului de corelaţie dintre test şi criteriul practic. Un test căruia nu-i cunoaştem validitatea constituie o simplă ipoteză. Pentru determinarea validităţii sunt necesare două categorii de date: rezultatele la test şi rezultatele profesionale. (Rezultatele efective în profesiune le numim criteriu). Validitatea concurentă presupune că noi testăm cu un test persoanele care se află pe un post de muncă şi în paralel cu aceasta solicităm şi datele legate de performanţa lor profesională. Cele două seturi de date sunt supuse calculului de corelaţie pentru a vedea dacă între ele există sau nu o relaţie semnificativă, adică dacă testul are sau nu o valoare predictivă. Metoda are avantajul că utilizează subiecţi existenţi pe post, deci uşor de grupat şi examinat; dezavantajul rezidă în valoarea predictivă a coeficientului de validitate obţinut. De exemplu, o corelaţie mare între un test de mecanică şi performanţele profesionale nu ne spune nimic legat de faptul dacă aceasta exprimă o aptitudine sau cunoştinţe cu care cel testat a venit să se angajeze sau este rezultatul unei achiziţii la locul de muncă pe care îl 19
  20. 20. deţine. Un alt dezavantaj este şi faptul că persoanele pe care le avem la dispoziţie reprezintă numai o parte din eşantion, al celor care au rezistat în timp la cerinţele postului, nu şi cei care ar fi fost incompetenţi în postul în cauză. Este vorba deci de un lot selecţionat. Validitatea în raport cu criteriul: proiectarea predictivă Validitatea predictivă este caracterizată prin aceea că între administrarea testului şi obţinerea informaţiilor criteriu se lasă un anumit interval de timp. Astfel, un test de aptitudini mecanice administrat la angajare, este corelat cu performanţele profesionale recoltate după un an; un coeficient de validitate semnificativ va fi astfel un indicator al capacităţii predictive a testului experimentat. De menţionat că în acest caz testul nu este utilizat ca instrument de selecţie decât după ce şi-a dovedit utilitatea (după ce a fost validat). Obişnuit, coeficienţii de validitate, în acest caz, sunt mai realişti, mai apropiaţi de realitate. Coeficientul de validitate v R este coeficientul de validitate; ridicat la pătrat indică varianţia scorurilor la test explicată de test v De exemplu: dacă r este .80, atunci coeficientul de validitate la pătrat va fii .64 ceea ce înseamnă că 64% din varianţă poate fi explicată de test Se apreciază că un test are validitate de criteriu bună atunci când coeficientul de validitate este mare. Valoarea coeficientului de validitate evidenţiază gradul în care randamentul la test corelează cu rezultatele la criteriu. v Valoarea coeficientului este influenţată de o serie de factori având în vedere că, de regulă, mai ales când apelăm la modalitatea predictivă, există o durată de timp între cele două serii de măsurători. În orice caz, două aspecte sunt implicate: 1. natura şi specificul grupului (vârstă, sex, pregătire profesională) 2. caracter omogen sau eterogen al eşantionului (val. coeficientului de corelaţie e mai mare) v Majoritatea consideră că valoarea corelaţiei trebuie să fie suficient de mare pentru a fi semnificativă la un prag de 0.01 - 0.05 v În experienţa obţinută, valoarea coeficientului de validitate predictivă al unui test este cuprinsă între 0 şi 0.60, în majoritatea cazurilor fiind situată în partea inferioară a intervalului (Guilford, 1965) Validitatea de conţinut Acest tip de validitate se referă la eşantionul de itemi din care este alcă tuit testul (şi eşantionul de comportament evidenţiat de aceşti itemi), dacă reprezintă într-adevăr domeniul (atributul sau însuşirea de personalitate) din care a fost eşantionat. De exemplu, dacă cineva doreşte să selecţioneze dintr-un grup de candidaţi pentru postul de dactilografă, pe câţiva dintre ei, în bateria de teste va include şi unul de dactilografiere. Acest test va fi bine reprezentat de itemi specifici activităţii respective (aptitudinea de dactilografiere). Validitatea de conţinut este determinată de cât de bine materialul testului încorporează un eşantion de itemi conectaţi cu profesia în care este utilizat. Aceasta înseamnă că validitatea de conţinut implică şi o acţiune de apreciere calitativă. Anastasi (1976) subliniază că în analiza validităţii de conţinut a unui test, un prim pas este definirea şi descrierea domeniului de conţinut al acestuia (un test care va măsura memoria de scurta durată, va 20
  21. 21. face apel la acest proces psihic; itemii unui test care va estima capacitatea de analiză şi sinteză a unui poliţist, va avea în vedere secvenţe din activitatea acestora şi axate pe problemele care implică analiza şi sinteza). Următorul demers în studiul validităţii de conţinut, presupune analiza de itemi ai testului. Se elimină itemii care nu se referă la comportamentele cuprinse în domeniul de conţinut la care se referă testul. În practica psihologică prezentă se obişnuieşte ca proiectarea unor strategii de selecţie să includă şi construirea unor teste cu un conţinut adecvat. Pentru aceasta, ponderea analizei muncii este crescută, în construirea itemilor de test fiind implicate câteva grupuri de experţi care sunt practicanţi ai domeniului respectiv (Landy, 1985). Validitatea de construct Validitatea de construct a unui test de inteligenţă este în esenţă un răspuns la întrebarea: “Acest grupaj de operaţii (testul) măsoară în realitate acel ceva (construit ipotetic sau abstract) pe care noi îl etichetăm ca inteligenţă?“. De fapt, aceasta este cea mai teoretică definiţie a validităţii întrucât se referă la abstracţiile care definesc structuri, funcţii sau însuşiri psihologice şi nu la predicţia unor criterii externe. O informaţie despre validitatea de construct ne poate fi oferită şi de la corelaţia unui test nou construit cu altul consacrat, despre care ştim că măsoară o anumită calitate. Validitatea de construct este denumită şi validitate ipotetico-deductivă. Ea este strâns legată de ilustrarea unor comportamente observabile mijlocit sau nemijlocit (comportamentul inteligent al managerului, creativitatea sculptorului, ingeniozitatea pompierului etc.). Adesea întâlnită şi sub denumirea de “validitate conceptuală”, validitatea de construct presupune o descriere cât mai adecvată a constructorului în termeni comportamentali concreţi – explicarea constructorului (Murphy & Davidshofer, 1991). Ea presupune parcurgerea a trei paşi: 1. Se identifică setul de comportamente care au legătură cu constructul măsurat de test. 2. Se identifică constructele, pentru fiecare decizându-se dacă are sau nu vreo legătură cu constructul măsurat de test. 3. Se face o listă de comportamente prin care se manifestă constructele respective. În final, un test pentru a fi valid trebuie să fie fidel. În practică, pentru a valida teoretic un test, se folosesc diferite tehnici şi criterii care ne ajută să identificăm constructul măsurat de test. Criterii/proceduri folosite pentru validare: 1. Vârsta/dezvoltarea în timp a subiectului. De exemplu, testele de inteligenţă pleacă de la ideea implicită că inteligenţa copiilor evoluează în timp, cel puţin până la maturitate, deci orice test de inteligenţă trebuie să arate o creştere a performanţei copiilor pe măsură ce avansează în vârstă. Dacă un test nu relevă o asemenea evoluţie pe vârste, înseamnă că el nu măsoară inteligenţa. Acest criteriu al vârstei nu este valabil şi pentru testele (în special de personalitate) care măsoară trăsături relativ stabile de la o vârstă la alta (temperamentul, agresivitatea, dominanţa etc). De asemenea, acest criteriu al vârstei este necesar dar nu suficient pentru a valida teoretic un test. Odată cu vârsta copiii cresc şi în înălţime şi în greutate. În fine, acest criteriu al vârstei nu este universal pentru toate culturile şi societăţile, nici măcar pentru testele de inteligenţă. În societăţile moderne oamenii investesc în instruirea copiilor, în special în abilităţile matematice, pe când într-o societate de tip 21
  22. 22. tradiţional (mediu rural)/primitiv bu există o astfel de cultură numerică – aceşti copii nu vor avea o inteligenţă matematică semnificativ mai mare decât copii mai mici. 2. Corelaţia cu alte teste – este folosită uneori ca dovadă că testul măsoară/atinge aproximativ acelaşi domeniu de comportament ca un alt test mai vechi, dar corelaţia dintre cele două teste nu trebuie să fie prea mare, ci doar moderată pentru că altfel noul test nu-şi are sensul dacă nu ar avea alte avantaje. Exemplu: în general, depresivii prezintă şi un anumit grad de anxietate, dar corelaţia dintre un test de depresie şi unul de anxietate trebuie să fie moderată (nu foarte mare pentru că astfel noul test va măsura de fapt depresia). 3. Analiza factorială – ea ne arată ce factori şi în ce măsură participă ei la rezolvarea unui test, deci în scorul subiectului. Analiza factorială s-a dezvoltat ca o metodă de a descoperi nişte factori psihologici complecşi, analizând corelaţiile reciproce dintre mai multe teste. De exemplu: aplicăm unor subiecţi 20 de teste dintre care: teste de identificare a antonimelor, teste de vocabular şi teste de completare de fraze (cuvântul care completează logic o frază) După ce subiecţii rezolvă testele, observăm că cele trei teste menţionate corelează foarte mult între ele şi foarte puţin cu celelalte – deci, între cele trei teste există o legătură, un factor, un construct teoretic care le uneşte, pe care îl putem denumi capacitatea de înţelegere a limbajului sau inteligenţa verbală – factor major pe care-l putem folosi în viitor pentru a descrie într-un mod mai simplu şi mai concis subiecţii. După ce am identificat un factor, îl putem folosi pentru a putea vedea cât de mult contribuie el la rezolvarea unui test. Această “contribuţie” a factorului în performanţa la test se cheamă validitatea factorială a acelui test vis-à-vis de factorul respectiv. 4. Consistenţa internă – este o metodă de asigurare a validităţii de construct. Se referă la omogenitatea unui test, adică la tendinţa itemilor de a corela între ei sau cu scorul total al subiecţilor. Această metodă se aplică astfel: se aplică noul test pe un lot de subiecţi, apoi se selectează dintre ei două grupuri extreme în funcţie de scop, adică grupul bun şi grupul slab, apoi se analizează fiecare item al testului şi se elimină sau se revizuiesc itemii care nu corelează în aceeaşi direcţie cu performanţa celor două grupuri. 5. Validarea convregentă şi discriminativă – această metodă pleacă de la ideea că un test are o bună validitate de construct nu numai dacă el corelează mult cu ceea ce ar trebui să coreleze, ci şi dacă nu corelează cu anumite variabile cu care chiar nu trebuie să coreleze. Primul aspect se cheamă validitatea convergentă a unui test, al doilea se cheamă validitatea discriminativă a unui test. Mai concret, un test de abilităţi numerice, de exemplu, are o bună validitate convergentă dacă el corelează mult cu notele la matematică şi are o bună validitate discriminativă dacă el nu corelează semnificativ cu un test de vocabular, să spunem. Validitatea discriminativă se calculează în special pentru testele de personalitate. Exemplu: în od normal un test de anxietate n-ar trebui să coreleze mult cu inteligenţa (nu există nici o legătură între ele) bsau între agresivitate şi inteligenţă. 22
  23. 23. 6. Metoda experimentală – uneori, pentru a valida un test care pretinde că măsoară o anumită variabilă, putem provoca experimental acea variabilă utilizând un anumit design sau model experimental. Consideraţii scurte vis-à-vis de problema validităţii în general: 1. Cât de mare trebuie să fie coeficientul de validitate al unui test? Să fie semnificativ satistic la pragurile acceptate statistic (0,01 – 0,05 – p). De multe ori, dacă vrem să prezicem performanţa unui anumit subiect într-un domeniu, coeficientul de validitate a testului exprimă prin aşa numita eroare standard a estimării (SEE) – ea ne arată care este marja de eroare în predicţia noastră pe baza testului: SEE = SD y × 1 − rxy 2 Sdy = abaterea standard a scorurilor la test rxy = coeficientul de validitate predictivă Dacă un test este incapabil să prezică ceva (performanţa viitoare), rxy ar trebui să fie 0, atunci SEE=SDy. Practic, decât să aplici testul ca să faci o predicţie despre subiect, mai bine ghiceşti. SEE ne arată de fapt cu cât cresc şansele noastre să prezicem corect evoluţia subiectului în baza scorului la test, faţă de simplul “ghicit”. 2. Prin câte metode trebuie validat un test? Depinde de natura testului şi de scopul lui. (până acum am discutat despre 12 metode – vezi validitatea de criteriu, validitatea de construct) De exemplu: v dacă avem un test de cunoştinţe este suficient să folosim validitatea de conţinut; v dacă avem un test de aptitudini şi vrem să prezicem evoluţia subiectului trebuie să foloseşti metoda validării predictive; v dacă vrem să evaluăm starea actuală a subiectului pe o anumită trăsătură, foloseşti proceduri de validare concurentă (corelezi performanţa la test imediat cu un criteriu disponibil imediat). 3. Când este nevoie să revalidăm un test? Ori de câte ori acelui test i se aduce o modificare (în natura itemilor ori în instructaj, ori în alte caracteristici) şi, de asemenea, atunci când îl traduci dintr-o altă limbă şi atunci când vrei să-l aplici pe o populaţie diferită de cea pe care a fost validat testul trebuie revalidat. Majoritatea testelor serioase, când fac diferite validări, tind să replice demersurile de validare pe diferite loturi de subiecţi, repetă acest proces de mai multe ori ca să se asigure că acei coeficienţi rămân apropiaţi de la o testare la alta. Tema 5. ELABORAREA ŞI CONSTRUIREA TESTELOR Etape ale construcţiei testului 1. Conceptualizare 2. Construcţia 3. Experimentarea 4. Analiza de item 23
  24. 24. 5. Revizia testului Pe scurt, prima etapă a proiectării testului debutează cu definirea conceptului care se doreşte a fi măsurat (conceptualizarea testului) Urmează apoi procesul de cupegere şi sau construire a itemilor care intră (potenţial) în structura de conţinut al testului şi despre care se crede că ar defini cel mai bine conceptul studiat (construirea testului). După construirea bazei de itemi se structurează o primă formă ipotetică a testului care va fi administrată unui lot de subiecţi (studiu pilot). Datelor rezultate în urma studiului pilot vor fi analizate realizîndu-se un studiu preliminar de analiză a fiecărui item şi unul global. Procedura statistică utilizată este cunoscută sub denumirea de "analiză de itemi”, ea furnizându-ne informaţii asupra calităţii itemilor testului. În urma acestui demers, unii itemi vor fi revizuiţi, alţii respinşi şi alţii menţinuţi în test/chestionar. Desigur, procesul de analiză de itemi poate include la fel de bine şi studiul consistenţei interne a probei, validitatea şi capacitatea lor discriminativă, nivelul de dificultate al itemilor etc. Pe baza analizei de itemi testul va fi restructurat şi administrat unui lot reprezentativ de subiecţi. Procedura de revizuire va fi repetată periodic din diferite raţiuni legate mai mult de perimarea în timp a versiunii iniţiale a probei. 1. Obiectivul testului: ce va măsura? 2. La ce nevoi reale răspunde testul: ce avantaje se obţin din utilizarea lui? 3. Populaţia ţintă a testului: pentru cine este construit? 4. Conţinutul testului: ce anume aspect psihologic va acoperi testul? 5. Stilul de administrare: cum va fi aministrat? 6. Fomatul itemilor: alegere forţată? alegere multiplă? 7. Construirea unor forme alternative: sunt necesare astfel de forme alternative? 8. Cerinţe de formare: ce tip de profesionişti pot lucra cu testul? Scalarea v Scalarea semnifică procesul de atribuire de numere în măsurare v Thurstone a fost primul care a subliniat problema; scalele ar trebui dezvoltate în funcţie de performanţa la test a mai multor subiecţi ; scalarea permite să afirmi că o persoană prezintă în mai mare sau mai mică măsură caracteristica măsurată. v Scale sumative: când scorurile la itemi sunt totalizate (de ex, un chestionar compus pe baza scalelor Likert) v Scale comparative: subiectul trebuie să aleagă unul sa altul dintre răspunsuri, deit comparaţie pe perechi v Scale categoriale: plasarea itemilor în diferite categrii care sunt ulterior scorate diferit v Scale Guttman: itemii sunt rangaţi secvenţial de la o slabă, la o puternică exprimare a atitudinii sau trăsăturii respective. Scrierea itemilor Format dihotomic: pentru fiecare item se oferă 2 răspunsuri posibile (de ex., Adevărat vs. Fals) Format politomic: mai mult decât o singură alegere pentru fiecare item, punctajul find desemnat numai pentru un anume răspuns Ceilalţi itemi sunt “distractori” (de ex., în alegerile multiple) 24
  25. 25. Testul pilot este dat spre rezolvare unui număr mic de subiecţi cu scopul de a determina: populaţia corectă, numărul itemilor, calitatea itemilor. Analiza itemilor se realizează în două modalităţi: 1. Gradul de dificultate: la fiecare dintre itemi se calculează proporţia de subiecţi care au reuşit 2. Discrimnarea itemilor: măsoară modul cum corelează itemii individuali cu întregul test, în cadrul unei populaţii definite Analiza gradului de dificultate şi a capacităţii de discriminare a itemului Analiza de itemi are ca obiectiv de bază descifrarea mecanismelor cognitive aplicate de subiecţi pentru formularea răspunsurilor la itemi şi verificarea calităţilor itemilor ca instrumente de măsură sau de predicţie. Pe baza analizei de itemi se obţin informaţiile care permit selectarea itemilor care intră în componenţa testului. Itemii pot fi analizaţi dintr-o dublă perspectivă – cantitativă şi calitativă. Analiza cantitativă se referă la proprietăţile statistice ale itemilor şi este focalizată în principal pe clarificarea problemelor privind dificultatea şi capacitatea de discriminare a itemilor. Analiza calitativă se referă în principal la aspecte de conţinut şi de formă incluzând problema evaluării eficienţei procedurilor de redactare şi a validării de conţinut. Analiza itemilor poate fi rezumată prin următorul algoritm: 1. calculul indicelui de dificultate pentru toţi itemi şi eliminarea celor care sunt rezolvaţi de toţi subiecţii şi celor nerezolvaţi de nici un subiect; 2. depistarea cauzelor pentru care unii indici de dificultate sunt foarte mari sau foarte mici şi eliminarea itemilor cu greşeli; 3. în situaţia itemilor cu răspunsuri la alegere, se analizează răspunsurile incorecte şi se elimină aceia în care unele răspunsuri greşite au fost alese de foarte mulţi sau foarte puţini subiecţi; 4. aplicarea uneia dintre procedurile analizei de itemi în funcţie de condiţiile pe care trebuie să le îndeplinească testul ce se construieşte, respectiv: 5. dacă testul trebuie să discrimineze între două grupe contrastante, respectiv să permită scoruri care diferă mult de la o grupă la opusul ei, se va calcula pentru fiecare item indicele de discriminare, eliminându-se itemii necorespunzători 6. dacă testul trebuie să se comporte într-o manieră prestabilită faţă de un anume criteriu, se vor elimina itemii necorespunzători; 7. se vor elimina itemii cu indicele de dificultate necorespunzător scopului pe care urmează să-l îndeplinească testul. În principiu se vor elimina cei foarte uşori şi foarte dificili. Dacă cerinţa este ca testul să identifice pe cei care prezintă nivele foarte scăzute şi foarte ridicate pentru o anume trăsătură sau facultate, se vor reţine doar aceste tipuri de itemi; 8. se va calcula coeficientul de corelaţie între scorurile testului şi scorurile itemului şi se vor elimina itemii care prezintă corelaţii nesemnificative sau negative. În continuarea construirii testului pe baza itemilor astfel selectaţi se procedează la studierea caracteristicilor psihometrice (fidelitate, validitate, dificultate, putere de discriminare), aspectele legate de lungimea testului, tipuri de itemi din care este compus, 25
  26. 26. timpul de rezolvare a testului (inclusiv variante privind standardizarea timpului), costurile administrării testului. Dificultatea itemului e definită în funcţie de procentul de persoane care răspunde corect la el. În procesul de construire a unui test, motivul principal al analizei dificultăţii este de a alege itemi care au un procent de dificultate adecvat, în aşa fel încât testul să nu constituie nici o dificultate de netrecut pentru majoritatea subiecţilor, nici să nu fie rezolvabil de marea lor majoritate. a. Pentru diferite loturi de subiecţi, cu caracteristici diferite privind de exemplu vârsta, nivelul de pregătire academică, tipul de pregătire, mediul de provenienţă etc., aceeaşi itemi pot conduce la diferite procente sau ponderi de subiecţi care răspund corect. b. Majoritatea testelor sunt construite cu itemi având grade de dificultate diferite astfel se pune problema asigurării unui nivel de dificultate optim şi a posibilităţii de a compensa inter-itemi gradul de dificultate. c. Nivelul de dificultate recomandabil este .50 (50% reuşită). Cu cât un item se apropie de 0% sau de 100% , cu atât este ineficient în diferenţierea subiecţilor. Itemul trebuie să fie capabil să diferenţieze între toţi cei care îl reuşesc şi cei care nu îl reuşesc pentru a avea valoare de informaţie diferenţială. De exemplu, pentru gradul de dificultate de 0.5 (50%): Să presupunem că din 100 de persoane, 50 reuşesc şi 50 nu reuşesc să rezolve itemul. Deci itemul ne va da posibilitatea să diferenţiem între fiecare dintre cei care l-au reuşit şi fiecare dintre cei care au eşuat. Deci avem astfel 50 x 50 = 2.500 perechi de comparaţie, sau biţi de informaţie diferenţială. Un item reuşit de .70 (70%) va favoriza 70 x 30 = 2.100 biţi informaţionali. Unul reuşit de .9 (90%) furnizează deci 90 x 10 = 900, iar cel reuşit de 100%, 100 x 0 = 0. Acelaşi lucru este valabil şi pentru itemi mai dificili, pe care îi reuşesc sub 50% dintre subiecţi. Itemii din cadrul unui test tind să intercoreleze. Cu cât este mai omogen testul, cu atât gradul de intercorelare este mai mare. În situaţia extremă în care toţi itemii ar fi perfect intercorelaţi şi toţi ar avea gradul de dificultate .50, aceleaşi 50 de persoane din 100 vor rezolva fiecare dintre itemi. Deci jumătate dintre subiecţi vor avea scoruri perfecte, iar cealaltă jumătate, vor avea un rezultat nul. Deci, datorită intercorelării dintre itemii testului cel mai bine este să fie selectaţi itemi cu nivele de dificultate diferite a căror medie a dificultăţii să fie .50. Cu cât e mai mare nivelul de intercorelare dintre itemi, cu atât mai largă trebuie să fie gama de grade de dificultate a itemilor selectaţi. În cazul scalelor de interval, procentul de persoane care reuşeşte un item exprimă dificultatea itemilor la nivelul scalei ordinale., ceea ce înseamnă că indică corect rangul şi dificultatea relativă a itemilor. De exemplu, dacă avem 3 itemi care sunt rezolvaţi respectiv de 30%, 20% şi 10% dintre subiecţii lotului, putem conchide că primul item este cel mai uşor, iar itemul al treilea cel mai dificil, gradul de dificultate crescând de la primul la al treilea. Dar, pentru diferenţe de procentaje egale, nu putem aprecia dacă există şi diferenţe egale în gradul de dificultate între cei trei itemi. Acest lucru ar fi posibil doar în cazul unei distribuţii rectangulare, unde cazurile ar fi uniform distribuite pe tot şirul. Scorurile de tip percentil nu reprezintă unităţi egale, ele diferă în mărime de la centru la extremele distribuţiei. 26
  27. 27. Analiza capacităţii de discriminare a itemilor Discriminarea itemilor se referă la gradul în care un item diferenţiază corect între subiecţi în ceea ce priveşte comportamentul destinat să-l măsoare. În literatura de specialitate apar peste 50 de indicatori de discriminare care pot fi utilizaţi în construirea diferitelor tipuri de teste, indicatori care, de regulă oferă rezultate relativ asemănătoare. O metodă utilă pentru grupe în general mici cuprinde următoarea procedură. Sunt pretestaţi subiecţii unui lot restrâns (ex. 60 de persoane). În funcţie de rezultate, subiecţii sunt grupaţi în trei clase. 20 cu scorurile cele mai înalte (clasa de sus, “U” de la upper), 20 cu scorurile cele mai scăzute (clasa de jos, “L”, de la lower), şi 20 cu scoruri intermediare (clasa medie, “M”, de la middle). Pe cele 3 clase se vor verifica itemii testului astfel: Item U M L Dificultatea Discriminarea U+M+L U-L 1 15 9 7 31 8 2 20 20 16 56* 4 3 19 18 9 46 10 4 10 11 16 37 -6* 5 11 13 11 35 0* 6 16 14 9 39 7 7 5 0 0 5* 5 Etc…… v Dificultatea itemului reprezintă suma de reuşite la cele trei clase de subiecţi iar discriminarea este dată de diferenţa dintre grupele extreme. v În aceste condiţii putem vedea că există 4 itemi care prezintă probleme (*) fie din perspectiva dificultăţii, itemii 2 şi 7, fie a discriminării, itemii 4 şi 5. Dacă itemul 2 are o dificultate prea mică, 7 este prea dificil, deci trebuiesc excluşi. Itemii 4 şi 5 au dificultate fie negativă, fie nulă, deci vor fi excluşi. De regulă, în situaţia claselor de subiecţi care au aceeaşi dimensiune, itemii cu valoare de discriminare scăzută sunt cei de la 3 puncte în jos. Indexul de discriminare Când exprimăm în procente numărul de subiecţi care reuşesc la itemii cuprinşi într- un nou test, o diferenţă de 2% reprezintă indexul de discriminare, indiferent de dimensiunea grupelor. Acest index de discriminare este denumit "Upper-lower discrimination", prescurtat ca “U-L”, “ULI”, sau “ULD” sau pur si simplu “D”. De exemplu, calcului D pornind de la datele anterioare se prezintă astfel: Item Procentaj de reuşită Index de discriminare Clasa “U” Clasa “L” (diferenţa) 1 75 35 40 2 100 80 20 3 95 45 50 4 50 80 -30 5 55 55 0 6 80 45 35 7 25 0 25 etc. 1. D poate avea o valoare cuprinsă între +100 şi –100. 27
  28. 28. 2. Dacă toţi subiecţii clasei “U” reuşesc la item şi nici unul dintre subiecţii clasei “L” nu reuşeşte, D = 100. 3. Dacă nici un subiect din “U” nu reuşeşte şi toţi cei din “L” reuşesc, avem valoarea lui D = 0. Relaţia dificultate / discriminare Dacă fie 100% - fie 0% din lot reuşesc la un item, nu apare nici o diferenţă între clasele de subiecţi, deci “D” este 0. Dacă 50% reuşesc un item, este posibil ca toţi cei din clasa “U” să-l treacă, şi nimeni din clasa “l”, iar “D” va fi 100 – 0 = 100. Dacă 70% reuşesc, maximul valorii pe care o poate lua “D” va fi 60 pentru că “U” 50/50= 100% şi “L” 20/50 = 40%. “D” va fi 100 – 40 = 60. Pentru majoritatea scopurilor de testare, sunt preferabili itemii cu dificultatea 50%. Indicii de discriminare care favorizează acest nivel de dificultate vor fi adecvaţi pentru selecţie. Relaţia dintre valoarea maximă a lui “D” şi dificultatea itemilor: Procentul de reuşită la item Valoarea maximă a lui D 100 0 90 20 70 60 50 100 30 60 10 20 0 0 Teoria răspunsului la item T.R.I. Teoria răspunsului la item a fost denumită şi teoria trăsăturii latente şi teoria curbei caracteristice (TCC). Aspectul fundamental al acestei abordări este faptul că performanţa la item este legată de cantitatea estimată de “trăsătură latentă” a celui care răspunde, reprezentată prin T (theta). Denumirea de trăsătură latentă se referă la un construct statistic (ceea ce nu implică automat că ar exista o entitate psihologică sau fiziologică corespunzătoare, cu o existenţă independentă). De exemplu, în testele cognitive, trăsătura latentă este reprezentată de obicei de abilitatea măsurată de test iar scorul total la test este considerat adesea ca reprezentând o estimare iniţială a acestei abilităţi. v Scopul teoriei răspunsului la item este de a elabora metode de estimare a valorii variabilei latente la subiecţii testaţi şi metode de estimare a caracteristicilor itemilor testului, pe baza răspunsurilor date de subiecţi la itemi. T.R.I. are la bază următoarele trei postulate: 1. comportamentul unui subiect la un item al unui test poate fi prezisă cu ajutorul unui set de factori, denumiţi trăsături latente (orice construct inobservabil, presupus continuu, despre care o teorie psihologică afirmă că deosebeşte personale între ele poate fi privit ca factor, iar fiecărui factor i se asociază o variabilă cu valori numerice între – infinit şi + infinit, denumită variabilă latentă); 2. putem afirma existenţa unui factor doar după ce se observă că răspunsurile la itemii prin care se doreşte măsurarea constructului, covariază; 28
  29. 29. 3. relaţia dintre performanţa la item a subiecţilor şi fiecare dintre trăsăturile care au legătură cu performanţa poate fi descrisă prin câte o funcţie crescătoare denumită funcţie caracteristică a itemului sau curbă caracteristică a itemului. Funcţia indică cum depinde probabilitatea de a răspunde corect la item de nivelul trăsăturii. O trăsătură nu poate fi nici observată, nici măsurată direct. Evaluarea ei cantitativă este indirectă, prin intermediul unor variabile observabile (de ex., răspunsul la itemi unui test) despre care se presupune că reprezintă adecvat variabila latentă. Revizia testului implică inter-validarea, respectiv: administrarea testului unui alt grup de subiecţi pentru a vedea dacă rezultatele sunt similare cu grupul iniţial Validarea testului reluată după un anume interval de timp, aprox. 10 ani, timp în care se presupune că s-a schi,bat ceva din modul cum funcţionează trăsătura respectivă în populaţia generală. Prezentarea unui test cuprinde: titlul / denumirea, populaţia ţintă, dreptul de copiere, autorul, editura, existenţa sau nu a unui manual al testului; de asemenea, sunt prezente toate datele tehnici privind experimentarea (analize de item, fidelităţi, procesul de validare şi tipuri de validări de criteriu, etaloane pe diferite populaţii etc.) Tema 6. ETALONAREA ŞI REETALONAREA TESTULUI Etalonarea testelor – ea reprezintă ultima fază în construcţia unui test şi contribuie cel mai mult la standardizarea acestuia. Este un proces care duce la alcătuirea unor norme/etaloane prin care putem interpreta ulterior scorul subiectului în funcţie de ceilalţi subiecţi din etalon. Deci, etalonul este un reper care ne arată unde se plasează performanţele unui individ în raport cu ceilalţi. De exemplu, poate obţine un scor sub medie, peste medie sau mediu. De asemenea, etalonul unui test ne ajută să comparăm între ele rezultatele aceluiaşi subiect la teste diferite. În manualul testului, etalonul trebuie descris în detaliu în ceea ce priveşte: a) populaţia pentru care este valabil b) cum s-a format eşantionul de subiecţi pe care s-a etalonat testul c) câte persoane conţine eşantionul de etalonare d) caracteristicile eşantionului după anumite criterii: sex, rasă, vârstă, localizare geografică sau nivel de instruire e) cât de reprezentativ este eşantionul pentru populaţia ţintă f) data testării eşantionului Procesul de etalonare are următoarele faze: 1. Se defineşte populaţia ţintă căreia îi este destinat testul. De exemplu: toate persoanele între 14 şi 18 ani din Bucureşti; sau întreaga populaţie adultă a României; sau populaţia de electricieni din România etc. 2. Din această populaţie se alege un eşantion pe care se va aplica testul în vederea etalonării. Eşantionul trebuie să fie reprezentativ pentru a reprezenta acea populaţie, adică să reflecte cât mai bine populaţia ţintă după anumite criterii relevante, cum ar fi: 29

×