Your SlideShare is downloading. ×
Chi Cuadrado
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Chi Cuadrado

103,713
views

Published on


6 Comments
26 Likes
Statistics
Notes
No Downloads
Views
Total Views
103,713
On Slideshare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
1,623
Comments
6
Likes
26
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Prueba Cuadrado [email_address]
  • 2. Están relacionados los hábitos de lectura con el sexo del lector? ¿Están relacionadas las calificaciones obtenidas con el número de faltas? ¿Es independiente la opinión sobre la política exterior de la política partidista? ¿Es independiente el sexo de una persona de su preferencia en colores? ¿Está relacionado el sexo con tener una educación universitaria?
  • 3. ¿Son independientes el tamaño de una familia y el nivel de educación de los padres? ¿Está relacionado el desempleo con el incremento de la criminalidad? ¿El precio está asociado con la calidad de un producto electrodoméstico? ¿El estado nutricional esta asociado con el desempeño académico? ¿Están relacionadas las enfermedades del corazón con el tabaquismo?
  • 4. Objetivo El objetivo general de este tópico es que se comprenda las dos técnicas estadísticas empleadas para analizar datos categóricos, con lo cual podrá:
    • Analizar datos usando la prueba de Ji cuadrado de independencia
    • Comprender la prueba ji cuadrado de bondad de ajuste y cómo usarla
    • Usar la prueba Ji cuadrado para homogeneidad
  • 5.  
  • 6. Prueba de Independencia, Se usa para analizar la frecuencia de dos variables con categorías múltiples para determinar si las dos variables son independientes o no. Por ejemplo: ¿El tipo de refresco preferido por un consumidor es independiente de su grupo etáreo? ¿El estado nutricional esta asociado con el desempeño académico?
  • 7. ¿determinar si la región geográfica es independiente del tipo de inversión financiera? La prueba Chi cuadrado de independencia es particularmente útil para analizar datos de variables cualitativas nominales.
  • 8. Los datos de variables cualitativa o categóricas representan atributos o categorías y se organizan en tablas llamadas tablas de contingencia o tablas de clasificación cruzada. Tabla de contingencia Una Tabla de contingencia con r filas y c columnas tiene la siguiente forma:
  • 9. Donde: O i j : es el número de sujetos que tienen las características A i y B j a la vez. R i : (i = 1,…,r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos que poseen la característica A i . C j :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos que poseen la característica B j . n : representa el total de observaciones tomadas.
  • 10. Formulación de hipótesis: Hipótesis nula (H 0 ) : Las variables X e Y son independientes, ( X e Y no están relacionadas) Hipótesis alternativa (H 1 ) : Las variables X e Y no son independientes, (X e Y están relacionadas) La pregunta es: ¿Existirá o no relación entre las variables A y B?, es decir, si A y B son o no independientes.
  • 11. Pruebas de Independencia La estadistica Ji-Cuadrado esta dado por: donde Oij : es la frecuencia observada de la celda que está en la fila i, columna j, es la frecuencia esperada de la celda (i, j).
  • 12. La frecuencia esperada es aquella que debe ocurrir para que la hipótesis nula sea aceptada. La prueba estadística se distribuye como una Ji-Cuadrado con ( r-1)*(c-1) grados de libertad. La hipótesis Nula se rechaza si , o equivalentemente si el “p-value” es menor que (prefijado)
  • 13. Ejemplo: Se toma una muestra aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según su nivel de ingresos (alto, medio o bajo) y el tipo de colegio a la que envían sus hijos. La siguiente tabla muestra los resultados obtenidos: ¿A un nivel de significancia del 1% hay razón para creer que el ingreso y el tipo de colegio no son variables independientes?
  • 14. Primero: ingresar los datos: ya tabulados de la siguiente manera
  • 15. Segundo: ponderar las frecuencias, de la siguiente forma:
  • 16. Tercero: realizar el proceso de pedido de la prueba Chi cuadrado
  • 17.  
  • 18. Solución: Las hipótesis a plantearse son las siguientes: Ho: No hay relación entre el ingreso y el tipo de colegio H1: Si hay relación entre el ingreso y el tipo de colegio. Interpretación: Como el “P-value” es menor que 0.01 se puede concluir que hay relación entre el nivel de ingreso y el tipo de colegio.
  • 19. El uso de bebida ordenado con alimentos en un restaurante ¿es independiente de la edad del consumidor? Se toma una muestra aleatoria de 309 clientes del restaurante de donde resulta el siguiente cuadro de valores observados. Utilice alfa = 0.01 para determinar si las dos variedades son independientes.º Ejemplo
  • 20. Solución 1.- Planteamiento de hipótesis Ho : El tipo de bebida preferida es independiente de la edad H1 : El tipo de bebida preferida esta relacionada con la edad 2.- Estadístico de Prueba 3.- Nivel de significación: = 0.01
  • 21.  
  • 22.  
  • 23. Decisión Las dos variables, bebida preferida y edad, no son independientes. El tipo de bebida que un cliente ordena con alimentos está relacionada con la edad y depende de está.
  • 24.
    • HOMOGENEIDAD
      • Se extraen Muestras Independientes de varias poblaciones y se prueban para ver si son homogéneas con respecto a algún criterio de clasificación.
      • Un conjunto de Totales Marginales Son Fijos mientras que los otros marginales son Aleatorios.
  • 25. Ejemplo Con el fin de probar la efectividad de una vacuna contra cierta enfermedad, se realizo un experimento observando a 200 personas, 110 de ellas vacunadas y las otras 90 sin vacunar. Presentan los datos evidencia suficiente como para indicar que la proporción de personas vacunadas que contrajeron la enfermedad no es la misma que la proporción de personas que no se vacunaron y que contrajeron la enfermedad Los resultados obtenidos se muestran en el siguiente cuadro. Datos
  • 26. Resultados: 1.- Planteamiento de hipótesis Ho: P 1 = P 2 H1 : P 1 diferente de P 2 donde: P1 = Proporción de vacunados que contraen la enfermedad P2 = Proporción de no vacunados que contraen la enfermedad
  • 27. Resultados
  • 28. Decisión Como p-valor =0.286 es mayor que 0.05 (alfa) podemos indicar que no existe suficiente evidencia para aceptar que hay diferencias entre las proporciones P 1 y P 2
  • 29. Prueba de Bondad de Ajuste Los procedimientos de prueba de hipótesis que se han presentado en capítulos anteriores están diseñados para problemas en los que se conoce la población o o distribución de probabilidad, y la hipótesis involucra los parámetros de la distribución. A menudo se encuentra otra clase de hipótesis: no se sabe cuál es la distribución de la población, y se desea probar la hipótesis de que una distribución en particular será un modelo satisfactorio de la población. Por ejemplo: Probar la hipótesis de que la población tiene comportamiento normal, Poisson,.exponencial etc.
  • 30. El procedimiento general para realizar la prueba es: 1.- Formulación de la hipótesis Ho: Los datos de la muestra se ajustan a la distribución teórica escogida H1: Los datos de la muestra no se ajustan a la distribución teórica escogida 2.- Fijar el nivel de significación 3.- La estadística de prueba donde: Ei = npi Oi = observado p = número de parámetros estimados a partir de la muestra K = número de categorías o clases pi = probabilidad 4.- Determinar la región crítica: rechazar Ho si: caso contrario no se rechaza 5.- Decisión y conclusión Nota: si alguna frecuencia esperada es menor que 5, se debe eliminar esa clase, Y sumar la frecuencia observada a una clase contigua.
  • 31.
    • BONDAD DE AJUSTE
      • Se utiliza para la comparación de la distribución de una muestra con alguna distribución teórica que se supone describe a la población de la cual se extrajo.
      • H o : La variable tiene comportamiento normal
      • H 1 : La variable no tiene comportamiento normal
  • 32. Ejemplo: Los siguientes porcentajes provienen de una encuesta nacional sobre las edades de compradores de música pregrabada. Una encuesta local produjo los valores y la evidencia de los datos observados, ¿indica que debemos rechazar la distribución de la encuesta nacional para compradores locales de música pregrabada? Utilice alfa=0.01
  • 33.  
  • 34.  
  • 35. Solución: Ho : La variable edad tiene comportamiento normal H1 : La variable edad no tiene comportamiento normal Resultados Como p-valor es 0.025 es menor que 0.05, rechazamos la hipótesis nula. Es decir, la variable edad no tiene comportamiento normal.

×