Chi Cuadrado
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
No Downloads

Views

Total Views
216,059
On Slideshare
214,778
From Embeds
1,281
Number of Embeds
8

Actions

Shares
Downloads
2,014
Comments
13
Likes
14

Embeds 1,281

http://www.slideshare.net 1,231
http://saulefrainuncp.blogspot.com 36
http://webcache.googleusercontent.com 6
http://saulefrainuncp.blogspot.in 3
http://www.saulefrainuncp.blogspot.com 2
http://www.facebook.com 1
http://estadistica-ingenieria-unach-2013.blogspot.com 1
http://saulefrainuncp.blogspot.com.ar 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. CHI CUADRADO DE PEARSON Prueba de bondad de ajuste Ho: La muestra se ajusta a una distribución teorica (esperado o modelo) H1: Ho: La muestra no se ajusta a una distribución teorica (esperado o modelo) Analizar/estadisticos descriptivos/tablas de contingencia En estadisticos elegir chi cuadrado
  • 2. CHI CUADRADO DE PEARSON F C (Oij − Eij ) 2 χ 2 ( F −1)( C −1) = ∑∑ i =1 j =1 Eij Criterio de homogeneidad Ho= Las poblaciones son homogeneas Ho= Las poblaciones no son homogeneas Analizar/estadisticos descriptivos/tablas de contingencia En estadisticos elegir chi cuadrado
  • 3. CHI CUADRADO DE PEARSON F C (Oij − Eij ) 2 χ 2 ( F −1)( C −1) = ∑∑ i =1 j =1 Eij Criterio de independencia Ho: Las variable son independientes H1: Las variable estan relacionadas Analizar/estadisticos descriptivos/tablas de contingencia En estadisticos elegir chi cuadrado
  • 4. Chi cuadrado: homogeneidad de poblaciones Un estudio sobre caries dental en niños de seis ciudades con diferentes cantidades de fluor en el suministro de agua, ha proporcionado los resultados siguientes: Comunidad Nº niños sin caries Nº niños con caries A 38 87 B 8 117 C 30 95 D 44 81 E 64 61 F 32 93 H0: Las incidencia de caries es igual en las seis ciudades (las poblaciones son homogeneas) H1: Las incidencia de caries no es igual en las seis ciudades (las poblaciones no son homogeneas)
  • 5. Data weight cases Cargar de esta manera los resultados, al hacer weight cases se esta consiguiendo que la tabla se despliegue como una base de datos completa a partir del cual se han resumido los datos en la tabla
  • 6. Analyze descriptive statistics crosstabs
  • 7. Chi cuadrado (homogeneidad) Case Processing Summary Cases Valid Missing Total N Percent N Percent N Percent grupo * caries 750 100,0% 0 ,0% 750 100,0% grupo * caries Crosstabulation Count Chi-Square Tests caries sin caries con caries Total Asymp. Sig. grupo A 38 87 125 Value df (2-sided) Pearson Chi-Square 65,855a 5 ,000 B 8 117 125 Likelihood Ratio 72,153 5 ,000 C 30 95 125 Linear-by-Linear D 44 81 125 12,860 1 ,000 Association E 64 61 125 N of Valid Cases 750 F 32 93 125 a. 0 cells (,0%) have expected count less than 5. The Total 216 534 750 minimum expected count is 36,00. H0: Las incidencia de caries es igual en las seis ciudades H1: Las incidencia de caries no es igual en las seis ciudadesCon p<0.05 se rechaza H0 Con p>0.05 no se rechaza H0 Conclusiòn: La incidencia de caries no es igual en las 6 ciudades
  • 8. CHI CUADRADO (CRITERIO DE INDEPENDENCIA) Una muestra aleatoria de 200 adultos se clasifican de acuerdo al sexo y al número de horas que miran televisión durante la semana las frecuencias se dan en la siguiente tabla: Nº de horas que miran TV Menos de 15 horas Al menos 15 horas Hombre 55 45 Mujer 40 60 Con esta información, ¿se puede concluir que el tiempo utilizado para ver tv es independiente del sexo? use α= 0.05 Ho : El sexo es independiente de las horas de ver televisión H1 : El sexo y las horas de ver televisión estan relacionadas
  • 9. Data weight cases
  • 10. Analyze descriptive statistics crosstabs
  • 11. Chi cuadrado (independencia) sexo * tv Crosstabulation Case Processing Summary Count Cases tv Valid Missing Total Menos de Al menos N Percent N Percent N Percent 15 horas 15 horas Total sexo * tv 200 100,0% 0 ,0% 200 100,0% sexo Femenino 40 60 100 Masculino 55 45 100 Total 95 105 200 Chi-Square Tests Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) Pearson Chi-Square 4,511b 1 ,034 Continuity Correctiona 3,930 1 ,047 Likelihood Ratio 4,529 1 ,033 Fisher's Exact Test ,047 ,024 Con p<0.05 se rechaza H0 Linear-by-Linear 4,489 1 ,034 Association Con p>0.05 no se rechaza H0 N of Valid Cases 200 a. Computed only for a 2x2 table b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 47,50. H0: El sexo es independiente de las horas de mirar TV H1: El sexo esta asociado a las horas de mirar TV Conclusiòn: El sexo de la persona esta asociado al tiempo que mira TV, las mujeres permanecen màs tiempo mirando TV
  • 12. ¿Como se calcula el chi cuadrado? Trabaja en base a valores observados valores esperados El valor esperado para cada celda de la tabla de contingencia se obtiene multiplicando el total marginal de columna por el total marginal de la fila divido por el total Luego se calcula un valor chi para cada celda el cual se obtiene restando el valor observado menos el valor esperado , esta diferencia se eleva al cuadrado y se divide por el valor esperado. Finalmente se suman todos los valores chi de todas las celdas y se obtiene el chi cuadrado Se buscara en la tabla de chi el area que le corresponde según los grados de libertad Los grados de libertad se obtiene de multiplicar numero de filas menos 1 por numero de columnas menos 1
  • 13. Grado de instrucción total Primaria Secundaria Superior o13 o11 o12 Si e13 e11 e12 Control pre natal o13 o21 o22 No e13 e12 e14 total Criterio de independencia Ho: El control prenatal de las gestantes es independiente del su grado de instrucción H1: El control prenatal de las gestantes esta asociado a su grado de instrucción
  • 14. Grado de instrucción total Primaria Secundaria Superior Si 240 120 68 52 Control pre natal No 460 300 142 18 total 420 210 70 700 420 x 240 210 x 240 70 x 240 Valores esperados e11 = = 144 e12 = = 72 e13 = = 24 700 700 700 (120 − 144) 2 ( 68 − 72) 2 χ 2 13 = ( 52 − 24) 2 = 32.67 Chi cuadrado parcial χ 2 11 = =4 χ 2 12 = = 0.22 144 72 24
  • 15. Grado de instrucción total Primaria Secundaria Superior Si 240 120 68 52 Control pre natal No 460 300 142 18 total 420 210 70 700 420 x 460 210 x 460 70 x 460 Valores esperados e 21 = = 276 e22 = = 138 e23 = = 46 700 700 700 ( 300 − 276) 2 (142 − 138) 2 χ 2 13 = (18 − 46) 2 = 17.04 Chi cuadrado parcial χ 2 21 = χ = 2.09 2 22 = = 0.12 276 138 46
  • 16. Grado de instrucción total Primaria Secundaria Superior Si 4 0.22 32.67 Control pre natal No 2.09 0.12 17.04 total Sumando los chi parciales se obtiene el chi cuadrado con 2 grados de libertad (Filas-1) (Columnas-1) χ 2 ( F −1)( C −1) = χ 2 2 = 4 + 0.22 + 32.67 + 2.09 + 0.12 + 17.04 = 56.14
  • 17. Buscamos en la tabla y el valor de x2 esta a la derecha de 5.09915 que es el valor critico que corresponde a α=0.05, por tanto rechazaremos Ho
  • 18. Conclusion: En este estudio se encuentra que el control prenatal esta asociado al grado de instrucción de la gestante
  • 19. 100% 90% 80% Control prenatal 70% 60% 50% 40% 30% 20% 10% 0% Primaria Secundaria Superior Grado de instrucción Si No Graficamente se muestra que la proporcion de gestantes que tienen contro prenatal esta en las gestantes con instrucción superior y es menor en las que tienen solo instrucción primaria
  • 20. El ultimo ejemplo en SPSS se obtendrá de la siguiente manera
  • 21. Valores control: Si 1 No 2 Instrucción: Primaria 1, Secundaria 2 Superior 3 Datos/ponderar
  • 22. Tabla de contingencia control * instruccion Recuento instruccion Primaria Secundaria Superior Total control Si 120 68 52 240 No 300 142 18 460 Total 420 210 70 700 Pruebas de chi-cuadrado Sig. asintótica Valor gl (bilateral) Chi-cuadrado de Pearson 56.135a 2 .000 Razón de verosimilitudes 53.247 2 .000 Asociación lineal por 38.045 1 .000 lineal N de casos válidos 700 a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 24.00. Siempre debe verse este valor, si el 25% o mas de celdas tiene valor esperado menor que 5, no debe sacarse conclusiones, pues hay mucha posibilidad que la conclusión sea errónea, en este caso solo se presenta la tabla pero no se concluye En ocasiones es necesario agrupar categorías para evitar este problema y es conveniente que no haya muchas categorías
  • 23. Se espera sus comentarios Visite nuestro blog http://www.hnsebgastro.blogspot.com/