Proiect spss

14,007 views
13,510 views

Published on

using spss for data analysis

0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
14,007
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
381
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Proiect spss

  1. 1. IAŞI- 2012-
  2. 2. CUPRINSCUPRINS............................................................................................................................2CAPITOLUL I.....................................................................................................................3Introducere...........................................................................................................................3 1.1.Definirea problemei...................................................................................................3 1.2.Obiectivul proiectului................................................................................................3 CAPITOLUL II.....................................................................4Construirea bazei de date.....................................................................................................4 2.1.Alegerea variabilelor analizate..................................................................................4 2.2.Definirea variabilelor şi introducerea datelor în SPSS...............................4 ...................................................................................................................5CAPITOLUL III .................................................................................................................6Verificarea bazei de date.....................................................................................................6 3.1.Depistarea outlierilor.................................................................................................6 3.2.Verificarea normalităţii distribuţiilor.........................................................................9CAPITOLUL IV................................................................................................................12Analiza statistică univariată a datelor................................................................................12 4.1. Descrierea statistică a variabilelor nominale..........................................................12 4.2 Descrierea statistică a variabilelor numerice...........................................................16CAPITOLUL V.................................................................................................................20Analiza statistică bivariată a datelor..................................................................................20 5.1 Analiza statistică a gradului de asociere între două variabile..................................20 5.2 Analiza de regresie şi corelaţie................................................................................22CAPITOLUL VI................................................................................................................26Estimarea şi testarea statistică...........................................................................................266.1 Estimarea parametrilor prin interval de încredere......................................................26 6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii...............26 6.2 Testarea statistică.....................................................................................................32 6.2.1 Testarea unei medii şi a unei proporţii..............................................................32 6.2.2 Testarea diferenţei dintre două medii şi două proporţii.....37CONCLUZII......................................................................................................................40BIBLIOGRAFIE................................................................................................................41 2
  3. 3. CAPITOLUL I Introducere 1.1.Definirea problemei Piata firmelor listate pe Bursa de Valori Bucuresti, este una in continua miscare,deoarece mereu se listeaza noi firme,aducand cu ele posibilitati noi de investitii , iar celeexistente isi modifica valoarea catodata si de cateva ori intr-o zi. Aceasta dinamica nuimpiedica insa tot mai multi investitori sa caute sa dea lovitura si tot mai multe firme sase expuna in incercarea de atragere de capital. Un segment mai restrans il reprezinta firmele din judetul Iasi ce sunt listate pebursa, acestea snt relativ putine dar au o dinamica variata, in functie de vechimea pebursa si de evolutia lor in segmentele lor de piata. 1.2.Obiectivul proiectului O cere ridicata de jeansi se inregistreaza in randul tinerilor mai ales a studentilorsi asta deoarece ei sunt cei care poarta cel mai adesea acest produs.Exista si tineri care sunt reprezentanti a unor firme mentionate printre care KENVELO,LEVIS, MOTOR, D&G, ce se gasesc in compexul de magazine Mall sau in oricarecentru de oras din tara de la noi sau din afara pentru ca sunt firme cunoscute si acceptatein general de tinerii ce vor sa fie in rand cu moda si care vor lucruri de calitate. In cadrul acestui proiect se va incerca analiza modului in care diversi factori(variabile) influenteaza cererea de jeansi. Ca urmare a privatizarilor companiilor de stat, ca masura de atragere de capitalsau doar ca atragere de publicitate, din ce in ce mai multe firme se listeaza pe bursa, fieca este vorba de companii cu o putere financiara mare ce sunt listate pe lista BVB sau decompaniile mici si mijlocii listate pe lista RASDAQ. In cadrul acestui proiect se va incerca analiza evolutiilor cat si a firmelor dinjudetul Iasi ce sunt listate pe bursa. 3
  4. 4. CAPITOLUL II Construirea bazei de date 2.1.Alegerea variabilelor analizate Pentru a putea analiza problema considerata s-au prelevat datele overite de site-ulwww.bvb.ro pentru unu esantion de 32 de firme listate, sortate dupa judetul unde isidesfasoara activitatea, selectat fiind judetul Iasi. Datele ce au fost prelevate se refera ladenumire, oras, domeniu de activitate (cod CAEN), ultimul pret la care s-a incheiatultima sedinta de tranzactionare, sectiunea de bursa unde este listata, starea tranzactiilor. Variabilele ce vor constitui baza de date din SPSS vor fi: Simbol, Denumire,Sectiunebursa, Categorie, CAENCAENRev.2,Oras,u_pret,site şi stare_T. Acestea vorconstitui baza de date FirmeIasi.sav. 2.2.Definirea variabilelor şi introducerea datelor în SPSS Atributele acestor variabile sunt definite în fereastra Data Editor – FoaiaVariableView:Figura 2.1 Fereastra Data Editor – Foaia Variable View pentru baza de date:FirmeIasi.sav. 4
  5. 5. Astfel baza de date ce va fii analizata este urmatoarea: Figura 2.2 Fereastra Data Editor – Foaia Data View pentru baza 5
  6. 6. CAPITOLUL III Verificarea bazei de date 3.1.Depistarea outlierilor Outlierile reprezintă valorile aberante înregistrate la nivelul unui eşantion şi se potdepista pe baza graficelor care verifică normalitatea distribuţiilor variabilelor. Pentru această analiză se vor analiza ca variabile numerice ultimul preţtranzactionat şi variatia pe care firma a inregistrat-o in ultima sedinta de tranzactionare,iar ca variabile nominale sectiunea de bursa unde este listata şi starea de tranzactionare. Outlierile se pot depista în cazul variabilelor numerice, iar valorile acestora se vordepista urmând demersul Analyze – Descriptive Statistics – Explore, outlierile fiinddepistate implicit. Figura 3.1. Selectarea opţiunii Analyze – Descriptive Statistics - Explore 6
  7. 7. Pentru variabila”u_pret” :Figura 3.2 Diagrama Boxplot pentru variabila „u_pret” 7
  8. 8. Interpretare: Aşa cum se observă, există valori ce ies din tipar, lucru acceptabil pepiata de actiuni. Aceste valori reprezinta o valoare foarte mare a pretului unei actiuni. Pentru variabila „Var”: În cazul acestei variabile în fereastra Explore se înlocuieşte în Dependent Listvariabila „u_pret” cu variabila „Var” şi se obţine următorul rezultat: Figura 3.3 Diagrama Boxplot pentru variabila „Var” 8
  9. 9. Interpretare: De asemenea, se poate observa că şi în cazul variabilei „Var” existăoutlieri, aratand astfel ca fluctuatiile pot avea valori foarte mari. 3.2.Verificarea normalităţii distribuţiilor Pentru a verifica normalitatea distribuţiilor variabilelor „u_pret” şi „Var” sefolosesc procedeele grafice Q-Q Plot, P-P Plot, Boxplot, histograma, testul Kolmogorov-Smirnov-Lilliefors. Pentru a putea depista şi outlierile se va folosi procedeul Q-Q Plot. Q-Q Plotcompară valorile ordonate ale variabilei observate cu valorile quantilice ale distribuţieieteoretice specificate (în acest caz distribuţia normală). Dacă distribuţia variabilei testateeste normală, atunci punctele Q-Q conturează o linie care se suprapune cu dreapta carereprezintă distribuţia teoretică, adică trece prin origine şi are panta egală cu 1. Pentru acesta se va urmări demersul: Analyze–Descriptive Statistics – Q-Q Plotsla Variables se introduce variabila de analizat, iar la Test Distribution se alege Normal.Pentru cele două variabile numerice rezultatele sunt următoarele: Figura 3.4 Selectarea opţiunii Descriptive Statistics – Q-Q Plots 9
  10. 10. Figura 3.5 Selectarea variabilelor de analizat pentru „u_pret” Figura 3.6 Q-Q Plot pentru variabila „u_pret” 10
  11. 11. Interpretare: Se observă că punctele sunt deviate de la linia dreaptă, ceea ceindică o distribuţie anormală, acest fapt se datoreaza atat diferentelor dintre BVB siRASDQ cat si faptului ca multe firme nu au mai avut activitate pe bursa. Pentru „Var”: Figura 3.7 Q-Q Plot pentru variabila „Var” Interpretare: Se observă că punctele desi sunt deviate de la linia dreaptă,deviatiaeste mai mica decta in cazul ultimului pret ceea ce indică o distribuţie ce se apropie maimult de o distribuţie normală. 11
  12. 12. CAPITOLUL IV Analiza statistică univariată a datelor 4.1. Descrierea statistică a variabilelor nominale Cele două variabile nominale ce vor fi analizate sunt sectiunea de bursa in careeste listata firma şi orasul de provenienta.Pentru a descrie aceste variabile se vor urmapaşii: meniul Analyze – Descriptive Statistics – Frequencies – Statistics (unde la CentralTendency se bifează Mode) şi Charts (unde la Chart Type se bifează Pie sau Bar, iar laChart Value Frequencies sau Percentages). Astfel, se obţin următoarele rezultate: 12
  13. 13. 13
  14. 14. Figura 4.1 Selectarea variabilelor şi a indicatorilorPentru variabila „Sectiune” se obţin rezultatele: Tabelul 4.1 Sectiune bursa 14
  15. 15. Figura 4.2 Diagrama Pie pentru variabila „Sectiune bursa”Interpretare: Se observă şi din tabel şi din grafic că proporţie firmelor listate la RASDAQdin eşantion este de 87.5%, iar cea a firmelor listate la BVB este de 12,5% Pentru variabila „Oras”: 15
  16. 16. Figura 4.3 Diagrama Pie pentru variabila „Oras” Interpretare: Se observă atât din tabel cât şi din grafic proporţiile oraselor dincare provin firmele lista sunt: CIORTESTi(3.1%), CIUREA(3.1%), IASI(75%),PASCANI(12.5%), TARGU FRUMOS(6.3%). 4.2 Descrierea statistică a variabilelor numerice În cazul variabilelor numerice se foloseşte acelaşi demers ca în cazul variabilelornominale, cu diferenţa că se bifează toţi indicatorii din Statistics, iar la Charts se bifeazăHistograms. Astfel, se obtin următoarele rezultate: 16
  17. 17. Figura 4.4 Prezentarea demersului 17
  18. 18. Figura 4.5 Histograma pentru variabila „u_pret” 18
  19. 19. Pentru variabila „Var”: Figura 4.6 Histograma pentru variabila „Var” Interpretare: Pentru ambele variabile se citesc în tabel principalii indicatori:media, mediana, varianţa, modul, valorile minime şi valorile maxime. 19
  20. 20. CAPITOLUL V Analiza statistică bivariată a datelor 5.1 Analiza statistică a gradului de asociere între două variabile Gradul de asociere se poate studia pentru variabilele nominale, în acest caz stareafirmei şi orasul unde isi desfasoara activitatea. Gradul de asociere presupune obţinereatabelului de asociere, în care sunt prezentate relaţiile dintre variabilele categoriale. Înfiecare celulă a tabelului este prezentată frecvenţa parţială, adică efectivul care poartăsimultan o valoare a fiecărei variabile. Obţinerea acestui tabel presupune următoruldemers: Analyze – Descriptive Statistics – Crosstabs. 20
  21. 21. Figura 5.1 Prezentarea demersului 21
  22. 22. Gradul de asociere se poate testa folosind testul Chi – Square, care se bifează înCrosstabs: Statistics. Se obţine rezultatul: Interpretare: În eşantionul analizat majoritatea firmelor ce sunt incatranzactionabile sunt din Iasi (17) apoi urmeaza Pascani si Targu Frumos,in celelalteorase nu sunt firme tranzactionabile. 5.2 Analiza de regresie şi corelaţie Analiza de corelaţie presupune măsurarea gradului de intensitate a legăturii dintrevariabilele numerice, precum şi testarea semnificaţiei legăturii. Acest lucru se realizeazăurmând paşii: Analyze – Correlate – Bivariate. În cazul celor două variabile numericestudiate (preţul şi numărul de jeansi cumpărati) se obţine următorul output: 22
  23. 23. Figura 5.2 Prezentarea demersului: 23
  24. 24. Tabelul 5.3 Correlations Interpretare: Se observă că s-a obţinut un coeficient de corelaţie Pearson egal cu0.012, ceea ce înseamnă că între cele două variabile nu există o corelaţie directa, valoareacoeficientului ne fiind apropiata de unu. Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testuluit. Valoarea Sig. corespunzătoare, egală cu 0.952, evidenţiază că s-a obţinut un coeficientde corelaţie semnificativ la un prag de 0.952, adică sunt şanse mai mari de 90% (α = 0.9)de a nu gresi in a afirma ca intre cele doua variabile nu exista o corelatie semnificativa. Analiza de regresie presupune aproximarea modelului de regresie, estimarea şitestarea parametrilor modelului de regresie. Între cele două variabile numerice se poatestabili o legătură liniară dată prin ecuaţia de regresie liniară simplă, care are forma: Yi = α + Βxi + εiîn care:Y – variabila dependentă (ultimul pret)X – variabila independentă (variatia)ε – variabila aleatorie eroare sau reziduu Aproximarea modelului de regresie se realizează din meniul Reggresion apoiselectand optiunea potrivita, pentru a testa valorile gasite mai sus am ales Curveestimation ,deoarece nu exista o corelatie intre cele doua valori grficul va arata in felulurmator: 24
  25. 25. Figura 5.3 Prezentarea demersuluiSe optine outputul: Figura 5.4 Regresia între „Var” şi „Ultimul pret” 25
  26. 26. CAPITOLUL VI Estimarea şi testarea statistică Estimarea este procedeul prin care se generalizează rezultatele observate pe uneşantion, la nivelul populaţiei din care este extras, adică se află valoarea unui parametrual unei populaţii pe baza datelor înregistrate la nivelul unui eşantion extras din aceasta. Estimarea poate fi punctuală sau prin interval de încredere. În acest caz se vaestima prin interval de încredere. 6.1 Estimarea parametrilor prin interval de încredere . Acest lucru presupune aflarea limitelor de încredere ale unui interval careacoperă valoarea adevărată a unui parametru al populaţiei (media sau proporţia în acestcaz). Calculul intervalului de încredere pentru o medie sau pentru o proporţie presupuneparcurgerea următorilor paşi:  Calculul valorii tipice de sondaj (media sau proporţia);  Determinarea variabilităţii estimatorului considerat;  Alegerea intervalului de încredere (95% şi 99%);  Calculul limitelor intervalului de încredere. 6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Zcorespunzător, eroarea standard a mediei, limita inferioară şi limita superioară aintervalului de încredere. Pentru baza de date FirmeIasi.sav se va calcula media variatieişi intervalul de încredere corespunzător. Pentru aceasta se parcurge demersul: meniul 26
  27. 27. Analyze – Descriptives Statistics – Explore. Se stabileşte nivelul de încredere de 95%, şiapoi de 99%. Figura 6.1 Prezentarea demersului Se obţin rezultatele: - nivelul de încredere: 95% 27
  28. 28. Tabelul 6.1 Case Processing SummaryInterpretare: Se poate spune cu o încredere de 95% că variatia a fost cuprinsa intre-19.509 si 9.013.- nivelul de încredere: 99% 28
  29. 29. Tabelul 6.3 Case Processing Summary Tabelul 6.4 Descriptives Interpretare: Se poate spune cu o încredere de 95% că variatia a fost cuprinsaintre -24.550 si 14.05. Cazul proporţiei. SPSS nu calculează direct intervalul de încredere pentru o proporţie. Estimareaintervalului de încredere presupune efectuarea mai multor operaţii, şi anume:  calculul estimaţiei proporţiei, prin demersul Analyze – Descriptive Statistics – Frequencies. După selectarea variabilei se bifează Display frequency tables;  se află valoarea variabilei Z pentru intervalul de încredere considerat. Pentru un nivel de încredere de 95%, Z = 1.96; pentru un nivel de încredere de 99%, Z = 2.55; 29
  30. 30.  se calculează eroarea standard Sp = s/n, unde s= f(1 – f) este abaterea standard, iar n este volumul eşantionului;  se calculează limitele intervalului folosind formula f ± 1.96Sp, respectiv f ± 2.55Sp.Urmând aceşti paşi se va estima proporţia firmelor ce inca tranzactioneaza. 30
  31. 31. Figura 6.2 Prezentarea demersuluiFrequencies Figura 6.3 Tabelele 6.5 Statistics şi 6.6 stare_t 31
  32. 32. Interpretare: Se observă că proporţia firmelor care inca tranzactioneaza este de68,8%. Calculul erorii Sp: pentru f = 68,8%, înlocuind în formula prezentată mai sus seobţine valoarea 0.006708. Calculul limitelor intervalului de încredere:  pentru z = 1.96, se obţine: Li = f – 1.96*SP = 0.688 – 1.96*0. 006708= 0.674 Ls = f + 1.96*Sp = 0. 688 + 1.96*0. 006708= 0.701 Interpretare: Ne putem aştepta, cu o încredere de 95%, ca procentul firmelor ceinca tranzactineaza să fie cuprins între 67.4% şi 70.1%.  Pentru z = 2.55, se obţine: Li = f – 2.55*0. 006708= 0.688 – 2.55*0. 006708= 0.670 Ls = f + 2.55*0. 006708= 0. 688 + 2.55*0. 006708= 0.70.5 Interpretare: Ne putem aştepta, cu o încredere de 95%, ca procentul firmelor ceinca tranzactineaza să fie cuprins între 67% şi 70.5%. 6.2 Testarea statistică Testele asupra mediilor, respectiv a proporţiilor, sunt folosite pentru a verificadacă o medie sau o proporţie diferă semnificativ de o valoare specificată (ipotetică) saupentru a compara două sau mai multe medii sau proporţii între ele pentru a testa dacăexistă diferenţe semnificative între ele. 6.2.1 Testarea unei medii şi a unei proporţii Testarea mediei. Testarea mediei cu o valoare specificată se realizează utilizând procedeul One-Sample T Test. Acest lucru presupune parcurgerea demersului: Analyze – Compare 32
  33. 33. Means – One-Sample T Test. Se va analiza dacă valoarea medie avariatiei diferă sau nude 0. 33
  34. 34. Figura 6.4 Prezentarea demersuluiSe obţine outputul: Figura 6.5 Tabelele 6.7 One-Sample Statistics şi 6.8 One-Sample Test Interpretare: Valoarea medie observată este -5.24808; valoarea specificată este 0;diferenţa dintre valoarea medie observată şi valoarea ipotetică este -5.24808. Intrevaloarea medie observată şi valoarea ipotetică există diferenţe semnificative. 34
  35. 35. Testarea proporţiei. Pentru realizarea acestui lucru se foloseşte Binomial Test. Acesta este un procedeuprin carese testează ipoteze cu privire la o variabilă cu distribuţie binomială, variabilăcare poate lua doar două valori, cum ar fi starea.Binomial Test este folosit pentru acompara o proporţie cu o valoare specificată şi presupune parcurgerea demersului:Analyze – Nonparametric Tests – Binomial. Se va verifica dacă proporţia uneia din celedouă grupe de firme definite prin variabila „stare”, tran şi susp diferă semnificativ de0.50. În Test Variable List se introduce variabila „stare”. 35
  36. 36. Figura 6.6 Prezentarea demersului Se obţine outputul: Interpretare: Proporţia observată în eşantion pentru grupa 1 (susp) este de 31%,proporţia specificată este 50%. Valoarea Sig. asociată testului este egala cu 0.05; astfelse poate concluziona cu o încredere de 95% că proporţia firmelor în eşantion diferăsemnificativ de proporţia specificată de 50%. 36
  37. 37. 6.2.2 Testarea diferenţei dintre două medii şi două proporţii Testarea diferenţei dintre două medii. Acest lucru est echivalent cu a testa egalitatea mediilor a două eşantionaeindependente. Testarea se realizează cu ajutorul testului Independent-Samples T Test.Demersul este: Analyze – Compare Means – Independent-Samples T Test. Se va testadacă var este aceeaşi pe cele două categorii de firme: susp şi tran. 37
  38. 38. Figura 6.7 Prezentarea demersuluiSe obţine outputul: 38
  39. 39. Figura 6.8 Tabelele 6.10 Group Statistics şi 6.11 Independent Samples Test Interpretare: Întrucât nivelul de semnificaţie observat pentru acest test este maimare decât pragul α = 0.05 (0.415), se folosesc varianţe reunite . În acest caz testul t esteegal cu 1.542 cu o probabilitate Sig. de 0.154 >0.05, ceea ce arată că variatii pentru celedouă grupe (10.75 pentru susp şi -9.05 pentru tran) diferă semnificativ. 39
  40. 40. CONCLUZII În urma realizării analizei firmelor din judetul Iasi listate pe bursa se poateconcluziona ca variatia preturilor actiunilor nu depinde de pretul efectiv al actiunilor. Deasemenea se observa ca multe din firmele prezente pe bura nu mai sunt active iar cele maimulte firme ce inca au actiuni tranzactionabile sunt din Iasi. 40
  41. 41. BIBLIOGRAFIE Jaba, Elisabeta, Statistica, ediţia a III-a, Editura Economică, Bucureşti, 2002; Jaba, Elisabeta; Grama, Ana, Analiza statistică cu SPSS sub Windows, Editura Polirom, 2004 41

×