Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Dades smoke
1. DADES SMOKE
Treball de mètodes
quantitatius per la
2. TEMA PLANTEJAT
Trobem unes dades sobre els fumadors d’Estats Units,
en els quals apareix:
-Anys d’escolarització
-Preu del cigarret per estat
-Tabac ros o negre
-Edad
-Ingressos
-Cigarrets per dia
3. TEMA PLANTEJAT
Volem estudiar aquest tema ja que creiem que ens podem
emportar alguna sorpresa amb les dades que hem trobat en
la pagina web:
http://www.econ.upf.edu/~raya/basedatosJose.htm
Volem fer un anàlisi de regresió en les hipòtesi que ara
mostrarem. Per contrastar-les utilitzarem el programa mini
tab.
Estem parlant de 5 dades quantitatives (anys
d’escolarització,preu del cigarret per estat, edad, ingressos,
cigarrets per dia) i 2 qualitatives (tabac ros o negre, mesures
antitabac)
4. ALTRES DADES
ALTRE INFORMACIÓ IMPORTANT
Descripció de les dades:
Quantitatives
Preu de
Anys diferents Edad Ingresso Cirgarets
descolar estats, per pack en s per fumats per
ització en centims anys any dia
Tabac ros o Lleis anti-tabac en
Qualitatives negre: 1 si és els restaurants: 1
ros si n’hi ha
5. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures
antitabac.
6. HIPÒTESI
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys
d'escolarització)
7. RESOLUCIO D'HIPOTESI 1
Prova T
Ho= Es fumen igual de ros que negre
H1= Es fuma més ros
R/ Rebutjem Ho ja que 0,054 és més gran que 0,05 per tan amb un
95% de confiança podem afirmar que es fuma més tabac ros amb un
IC (-0,016; 1,803).
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és més elevat en el ros però no en tots els casos. ( no
podem assegurar la nostre hipòtesi en tots els casos)
8. RESOLUCIO D'HIPOTESI 1
Anova o Chi^2
Ho= Tenen dependència
H1= Tenen independència
R/ Rebutjem Ho ja que 0,08 és més gran que 0,05 per tan
amb un 95% de confiança podem afirmar que
aquestes 2 variables no tenen dependència.
9. RESOLUCIO D'HIPOTESI 1
Anàlisi de Regresió
Valor P= ,200
R/ Rebutjem Ho ja que 0,2 és més gran que 0,05 per tan
amb un 95% de confiança podem afirmar que si és ros
o negre no és determinant per determinar el preu.
10. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures antitabac.
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys d'escolarització)
11. RESOLUCIO D'HIPOTESI 2
Prova T
R/ No rebutjem Ho ja que 0,00 és més petit que 0,05 per tan amb un
95% de confiança podem dir que la diferència entre les mitjanes
poblacionals de preu del cigarret i de les restriccions per fumar es
situa entre (50,611; 52,617).
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és més elevat en persones que fumen més.
12. RESOLUCIO D'HIPOTESI 2
Anova o Chi^2
Valor P= 0,747
Ho= Tenen dependència
H1= Tenen independència
R/ Rho ja que 0,747 és més gran que 0,05. Per tan amb un 95% de
confiança podem afirmar que el preu i la quantitat no estàn
relacionats i són independents. Per tan la gent no fumarà més
per si és més barat o més car.
13. RESOLUCIO D'HIPOTESI 2
Anàlisi de Regresió
Veient l'anàlisi de regresió:
- 0,0006 cigs smoked per day
Valor P= 0,963
R/ Vol dir que el preu és inversament proporcional a la quantitat
de cigarrets fumats al dia. Per tan direm que teniem raó. Malgrat
això el preu no té a veure directament a la quantitat de cigarrets
per dia és totalment independent a aquesta variable ja que 0,963
> 0,05.
14. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures antitabac.
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys d'escolarització)
15. RESOLUCIO D'HIPOTESI 3
Prova T
Ho= tant si hi ha restriccions o no el preu augmentarà
H1= Si hi ha restriccions el preu augmentarà
R/ No rebutjem Ho ja que 0,00 és més petit que 0,05 per tan amb un
95% de confiança podem dir que la diferència entre les mitjanes
poblacionals de preu del cigarret i de les restriccions per fumar es
situa entre (-2,060; -0,997).
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és menys elevat en els estats que tenen restriccions
per fumar.
Per tan podem dir que no teniem raó en la nostre hipòtesi.
16. RESOLUCIO D'HIPOTESI 3
Anova o Chi^2
Ho= Tenen dependència
H1= Tenen independència
R/ No Rho ja que 0,00 és més petit que 0,05. Per tan amb un 95% de
confiança podem afirmar que hi ha una relació de dependència
entre el preu i les mesures antitabac.
17. RESOLUCIO D'HIPOTESI 3
Anàlisi de Regresió
Valor P= 0,00
R/ Hi ha relació de dependència per tan si hi ha restricions per
fumar determinarà el preu.
18. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures antitabac.
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys d'escolarització)
19. RESOLUCIO D'HIPOTESI 4
Prova T
R/ No rebutjem Ho ja que 0,00 és més petit que 0,05 per tan amb un
95% de confiança podem dir que la diferència entre les mitjanes
poblacionals de preu del cigarret i dels ingresos anuals es situa entre
(,282; 50,944).
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és més elevat en ingressos alts.
Per tan podem dir momentàniament que teniem raó en la nostre
hipòtesi.
20. RESOLUCIO D'HIPOTESI 4
Anova o Chi^2
Ho= Tenen dependència
H1= Tenen independència
Valor p= 0,033
R/ No Rho ja que 0,03 és més petit que 0,05. Per tan amb un 95% de
confiança podem afirmar que hi ha una relació de dependència
entre ingresos i el preu del cigarret.
21. RESOLUCIO D'HIPOTESI 4
Anàlisi de Regresió
Valor P=0,103
R/ Rebutjem hipòtesi 0 ja que 0,103 és més gran que 0,05, per tan
amb un 95% de confiança podem dir que els ingressos no tene
relació directa amb l'augment de preu.
Podem veure aquí que malgrat tot no teniem raó en la nostre
hipòtesi.
22. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures antitabac.
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys d'escolarització)
23. RESOLUCIO D'HIPOTESI 5
Prova T
R/ No rebutjem Ho ja que 0,00 és més petit que 0,05 per tan amb un
95% de confiança podem dir que la diferència entre les mitjanes
poblacionals de preu del cigarret i dels ingresos anuals es situa entre
(17,841; 20,284)
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és més elevat en més edad.
Per tan podem dir momentàniament que teniem raó en la nostre
hipòtesi.
24. RESOLUCIO D'HIPOTESI 5
Anova o Chi^2
Ho= Tenen dependència
H1= Tenen independència
Valor P= 0,407
R/ Rho ja que 0,407 és més gran que 0,05. Per tan amb un 95% de
confiança podem afirmar que l'edad de la persona no influeix en
la variable preu i per tan són independents.
25. RESOLUCIO D'HIPOTESI 5
Anàlisi de Regresió
Valor P=0,103
R/ Rebutjem hipòtesi 0 ja que 0,293 és més gran que 0,05, per tan
amb un 95% de confiança podem dir que els ingressos no tene
relació directa amb l'augment de l'edad.
Podem veure aquí que malgrat tot no teniem raó en la nostre
hipòtesi.
26. HIPÒTESI
1)RESPECTE EL PREU DEL CIGARRET I SI ÉS NEGRE
Creiem que el tabac més car és el negre.
2)RESPECTE EL PREU DEL CIGARRET I CIGARRETS FUMATS
Creiem que quan més tabac fumat més barat és el cigarret.
3)RESPECTE EL PREU PER ESTAT I MESURES ANTITABAC
Creiem que hi ha una relació entre més preu i més mesures antitabac.
4)RESPECTE EL QUE COBREN I PREU DEL CIGARRET
Creiem que quan més cobren, més car el cigarret serà.
5)RESPECTE L’EDAD I PREU DEL CIGARRET
Creiem que quan més gran és la gent més car compren.
6) Dada presumptament no relacionada amb el preu (Anys d'escolarització)
27. RESOLUCIO D'HIPOTESI 6
Prova T
R/ No rebutjem Ho ja que 0,00 és més petit que 0,05 per tan amb un
95% de confiança podem dir que la diferència entre les mitjanes
poblacionals de preu del cigarret i dels anys d'escolarització es situa
entre (47,440; 48,219)
Per tant amb una confiança del 95% podem afirmar que el nivell
mitjà del preu és més elevat en més anys d'escolarització.
Per tan podem dir momentàniament que no teniem raó en la nostre
hipòtesi.
28. RESOLUCIO D'HIPOTESI 6
Anova o Chi^2
Ho= Tenen dependència
H1= Tenen independència
Valor p= 0,379
R/ Rho ja que 0,379 és més gran que 0,05. Per tan amb un 95% de
confiança podem afirmar que l'edad d'escolarització de la
persona no influeix en la variable preu i per tan són
independents.
29. RESOLUCIO D'HIPOTESI 6
Anàlisi de Regresió
Valor P=0,775
R/ Rebutjem hipòtesi 0 ja que 0,775 és més gran que 0,05, per tan
amb un 95% de confiança podem dir que els ingressos no tene
relació directa amb l'augment dels anys d'escolarització.
Podem veure aquí que hem acertat.
30. ANÀLISI DE REGRESIÓ
1)
La ecuación de regresión es
state cigarette price, cents pe = 56,0 + 0,0166 years of schooling
- 0,653 white=1 if white + 0,0104 age in years
+ 0,402 log income
- 0,0006 cigs smoked per day
+ 1,43 restaurn =1 if state restaurant
31. ANÀLISI DE REGRESIÓ
Predictor Coef Coef. de EE T P
Constante 55,996 2,368 23,65 0,000
years of schooling 0,01658 0,05805 0,29 0,775
white=1 if white -0,6530 0,5089 -1,28 0,200
age in years 0,010411 0,009894 1,05 0,293
log income 0,4021 0,2461 1,63 0,103
cigs smoked per day -0,00057 0,01217 -0,05 0,963
restaurn =1 if state restaurant 1,4266 0,3888 3,67 0,000
S = 4,69198 R-cuad. = 2,7% R-cuad.(ajustado) = 2,0%
32. ANÀLISI DE REGRESIÓ
R/ Podem veure que aquesta anàlisi encara que el valor P de la equació és
0,001 < 0,05 per tan podem dir que l'anàlisi és fiable, el podem millorar
treient aquelles variables que no són determinants en el preu.
Veiem que totes les variables menys la variable restaurants no tenen a vere
amb el preu i que per tan s'haurien de treure de l'estudi.
Mirant les gràfiques veiem que els valors tenen bastant error i veiem que
els valors s'acosten poc a la recta ja que r^2(ajustada) és molt petita,
només d'un 2% i tenim una S bastamt alta de quasi 5.
No valoraré els canvis que experimentaria el preu segons els canvis de les
variables ja que no és un model bò, només argumentar que al tenir les
dades de ingresos en logaritmes hariem de parlar en % d'augments de
ingrés respecte al preu resultant.
33. ANÀLISI DE REGRESIÓ
2)
La ecuación de regresión es
state cigarette price, cents pe = 59,9 + 1,53 restaurn =1 if state restaurant
Coef.
Predictor Coef de EE T P
Constante 59,9234 0,1904 314,69 0,000
restaurn =1 if state restaurant 1,5289 0,3835 3,99 0,000
S = 4,69528 R-cuad. = 1,9% R-cuad.(ajustado) = 1,8%
34. ANÀLISI DE REGRESIÓ
R/ Encara ara en el model no tenim variables que no aportavan informació, ara ens
trobem un estudi en el qual determinem el preu seons si hi ha restriccions o no, i
en el cas de no tenir restriccions el preu seria de 59,9 centims i amb restriccions
1,53 centims més. Estem veient llavors que no podem determinar un bon model
primerament per manca de variables i a sobre també per manca de % en r^2, ja
que és molt baix i els valors no s'ajusten als esperats.
En conclusió hauriem de buscar noves variables que ens hagin passat per alt com les
marques de tabac o si compra en estanc o no o si simplement fuma de liar o no.
A sobre de tot això l'estudi s'ha elaborat de forma que la majoria d'equestats no fuma
ni un cigarret per dia.
Podriem elaborar altres possibilitas de regresió malgrat això podem considerar l'altre
anàlisi com a correcte en forma que encar que totes les variables no influeixen, el
valor P de la equació no supera el 0,05 i llavors la podem considerar acceptable.