SesióN 16

1,711 views
1,636 views

Published on

Published in: Travel, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,711
On SlideShare
0
From Embeds
0
Number of Embeds
41
Actions
Shares
0
Downloads
36
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

SesióN 16

  1. 1. Estadística (Psicología) Sesión N°16 (07/08/2008) Prof. Ricardo Escalante
  2. 2. Agenda BPMM30 2 3 4 5 Distribucíones muestrales Población de la H 0 Prueba z Distribución muestral 1 6 Región crítica Proceso de muestreo
  3. 3. Distribuciones muestrales <ul><li>La distribución muestral de un estadístico proporciona: </li></ul><ul><ul><li>Una lista de todos los valores que dicho estadístico puede asumir </li></ul></ul><ul><ul><li>La probabilidad de obtener cada valor suponiendo que éste sea producido únicamente por el azar. </li></ul></ul><ul><li>Dados los ejercicios vistos en la sesión pasada, podemos generalizar que el análisis de datos implica los siguientes pasos </li></ul><ul><ul><li>El cálculo del estadístico apropiado, por ejemplo, el número de signos positivos y negativos para la prueba del signo </li></ul></ul><ul><ul><li>La evaluación del estadístico con base en su distribución muestral. </li></ul></ul>
  4. 4. Generación de distribuciones muestrales <ul><li>Hemos definido una distribución muestral como una distribución de probabilidad de todos los valores posibles que puede asumir un estadístico suponiendo que sólo influye el azar. </li></ul><ul><li>Una forma de obtener las distribuciones muestrales consiste en utilizar las consideraciones básicas de la probabilidad </li></ul><ul><li>También podemos deducir las distribuciones muestrales partiendo desde un punto de vista de un muestreo empírico. </li></ul><ul><li>En este caso tenemos un conjunto de datos poblacionales, real o teórico, que existe si la variable independiente no produce efecto alguno. </li></ul>
  5. 5. Generación de distribuciones muestrales <ul><li>La deducción de la distribución muestral del estadístico se hace de la siguiente manera: </li></ul><ul><ul><li>Determinamos todas las muestras posibles de tamaño N que pueden formarse a partir de la población de datos </li></ul></ul><ul><ul><li>Calculamos el estadístico para cada una de las pruebas </li></ul></ul><ul><ul><li>Calculamos la probabilidad de obtener cada uno de los valores del estadístico si sólo influye el azar. </li></ul></ul><ul><li>Para ver el enfoque del muestreo, suponga que realizamos un experimento con un tamaño de muestra N=2, y aplicamos la prueba de los signos para el análisis. Podemos imaginar un conjunto teórico de datos resultantes si el experimento se realiza sobre toda la población y la variable independiente no produce efecto alguno </li></ul><ul><li>Este conjunto de datos es la población de la hipótesis nula </li></ul>
  6. 6. Población de la hipótesis nula <ul><li>La Población de la hipótesis nula: es el conjunto real o teórico de datos provenientes de una población que resultaría si el experimento se aplicara sobre toda la población y la variable independiente no tuviese efecto alguno. </li></ul><ul><li>Recibe este nombre porque se utiliza para verificar la validez de H 0 </li></ul><ul><li>En el caso de la prueba del signo, si la IV no hubiera producido efecto alguno, entonces la hipótesis nula tendría el mismo número de signos positivos y de signos negativos. (P = Q = 0,50) </li></ul>
  7. 7. Proceso de muestreo <ul><li>Para facilitar los cálculos necesarios para generar la distribución muestral, supongamos que hay solamente 6 datos en la población, tres signos positivos y tres signos negativos. </li></ul><ul><li>Para deducir una distribución muestral del “número de signos positivos” con N=2 debemos determinar todas las distintas muestras de tamaño 2 que es posible formar con esta población. </li></ul><ul><li>El muestreo es de un elemento a la vez, con reemplazo. </li></ul>+ - + + - - 1 2 3 4 5 6 + - 3 4 + 1 + 1 + 1 + 2 + 1 + 3 + 1 - 4 + 1 + 1 - 5 - 6 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 3 + 3 - 4 - 4 - 4 - 4 - 4 + 1 + 2 + 3 - 4 - 5 - 6 + 1 + 2 + 3 - 4 - 5 - 6 + 1 + 2 + 3 - 4 - 5 - 6 … ..
  8. 8. Distribución muestral <ul><li>Resultan 36 muestras diferentes de tamaño 2. </li></ul><ul><li>9 muestras tienen 2 signos positivos </li></ul><ul><li>18 muestras tienen 1 signo positivo </li></ul><ul><li>9 muestras tienen 0 signos positivos </li></ul>N° Muestra N° elementos Datos reales N° de positivos en el estadístico N° Muestra N° elementos Datos reales N° de positivos en el estadístico 1 1.1 + + 2 + 19 4.1 - + 1 + 2 1.2 + + 2 + 20 4.2 - + 1 + 3 1.3 + + 2 + 21 4.3 - + 1 + 4 1.4 + - 1 + 22 4.4 - - 0 + 5 1.5 + - 1 + 23 4.5 - - 0 + 6 1.6 + - 1 + 24 4.6 - - 0 + 7 2.1 + + 2 + 25 5.1 - + 1 + 8 2.2 + + 2 + 26 5.2 - + 1 + 9 2.3 + + 2 + 27 5.3 - + 1 + 10 2.4 + - 1 + 28 5.4 - - 0 + 11 2.5 + - 1 + 29 5.5 - - 0 + 12 2.6 + - 1 + 30 5.6 - - 0 + 13 3.1 + + 2 + 31 6.1 - + 1 + 14 3.2 + + 2 + 32 6.2 - + 1 + 15 3.4 + + 2 + 33 6.3 - + 1 + 16 3.4 + - 1 + 34 6.4 - - 0 + 17 3.5 + - 1 + 35 6.5 - - 0 + 18 3.6 + - 1 + 36 6.6 - - 0 +
  9. 9. Distribución muestral <ul><li>Si solo interviene el azar </li></ul><ul><li>Cada muestra es igualmente probable </li></ul><ul><li>Hemos obtenido la distribución muestral para N=2 del estadístico “número de signos positivos” </li></ul>p (2 signos positivos) 9/36 0.2500 p(1 signo positivo) 18/36 0.5000 p(0 signos positivos) 9/36 0.2500
  10. 10. Distribución muestral <ul><li>En el ejemplo anterior utilizamos una población de sólo 6 datos. </li></ul><ul><li>Habríamos obtenido la misma distribución muestral, aunque hubiese muchas más muestras diferentes si se hubiera empleado una población mayor, siempre que el número de signos positivos fuera igual que el de signos negativos y el tamaño de la muestra fuese N=2 </li></ul><ul><li>Basta con observar la distribución del caso de las 2 monedas y contrastarlo con el cuadro </li></ul>Renglón N° Moneda 1 Moneda 2 N° de resultados 1 Cara Cara 1 2 Cara Sello 1 2 3 Sello Cara 1 4 Sello Sello 1 Total de resultados 4 p (2 signos positivos) 9/36 0.2500 p(1 signo positivo) 18/36 0.5000 p(0 signos positivos) 9/36 0.2500
  11. 11. Distribución muestral <ul><li>Una distribución muestral proporciona todos los valores que puede asumir un estadístico junto con la probabilidad de obtener cada valor si el muestreo es aleatorio a partir de la población de hipótesis nula </li></ul><ul><li>Aparentemente hasta ahora estamos en un plano abstracto y poco práctico. Es necesario entonces ver una aplicación concreta. </li></ul><ul><li>La prueba z de la desviación normalizada se utiliza cuando conocemos los parámetros de la población de la hipótesis nula </li></ul><ul><li>En la prueba z la media muestral se utiliza como estadístico básico. </li></ul>
  12. 12. Prueba z de la desviación normalizada <ul><li>Utilizaremos el ejemplo que R. Pagano nos propone: </li></ul><ul><ul><li>Supongamos que usted es un inspector de escuelas públicas de la ciudad donde vive. Recientemente, los ciudadanos han estado preocupados pues creen que el programa de lectura impartido en las escuelas públicas es de mala calidad. Como este asunto es grave, usted decide realizar un experimento para investigar. Establece un  =0,05 1 cola para tomar su decisión. Para empezar compara el nivel de lectura de los estudiantes del último año del bachillerato con las normas establecidas. Estas normas están basadas en la calificación de un examen que mide la habilidad de lectura y que fue aplicado a nivel nacional a un gran número de alumnos de este sector. Las calificaciones de esta población presentan una distribución normal con  =75 y  =16. Para su experimento Ud. aplica el examen de lectura a 100 estudiantes elegidos al azar de su ciudad. La media muestral obtenida es de 72 pts. ¿cuál es su conclusión? </li></ul></ul><ul><li>Aunque la media muestral es menor que la media a nivel nacional ¿es significativa la diferencia? </li></ul><ul><li>Si solamente interviene el azar entonces podemos considerar a los 100 datos muestrales como una muestra aleatoria de una población con  =75 </li></ul>
  13. 13. Prueba z de la desviación normalizada <ul><li>La hipótesis nula para este experimento establece ¿cuál es la probabilidad de obtener una media tan baja o más baja que 72, si los 100 datos provienen de una muestra aleatoria de una población con distribución normal con  =75 y  =16? </li></ul><ul><li>Si la probabilidad resulta igual o menor que  entonces rechazamos H 0 y aceptamos H 1. en caso contrario conservamos H 0 </li></ul><ul><li>Es evidente que el estadístico que estamos utilizando es la media de la muestra. Para determinar la probabilidad adecuada, debemos conocer la distribución muestral de la media. </li></ul><ul><li>Al aplicar la definición de la distribución muestral de un estadístico a la media aritmética se obtiene: </li></ul>
  14. 14. Distribución muestral de la media <ul><li>La distribución muestral de la media proporciona todos los valores que puede asumir la media, junto con la probabilidad de obtener cada valor si se hace un muestreo aleatorio a partir de la población de la hipótesis nula. </li></ul><ul><li>Tomando una población específica de datos en bruto que tiene una media  y una desviación estándar  </li></ul><ul><ul><li>Se extraen todas las distintas muestras posibles de un tamaño fijo N </li></ul></ul><ul><ul><li>Se calcula la media aritmética de cada muestra </li></ul></ul><ul><ul><li>Se calcula la probabilidad de obtener cada valor de la media si solo interviene el azar. </li></ul></ul>
  15. 15. Distribución muestral de la media <ul><li>Esta distribución de la media nos proporcionará todos los valores que puede asumir la media para muestras de tamaño N, junto con la probabilidad de obtener cada valor si se realiza un muestreo aleatorio a partir de la población especificada. </li></ul><ul><li>Al repetir este procedimiento variando de manera sistemática N, se puede establecer que la distribución muestral de la media tiene las siguientes características generales. </li></ul>Muestra 1 de tamaño N Muestra 2 de tamaño N Muestra 3 de tamaño N Última muestra de tamaño N
  16. 16. Distribución muestral de la media <ul><li>Características para muestras de un tamaño arbitrario N: </li></ul><ul><li>Cada dato es una media muestral de N datos. Es un conjunto de datos poblacionales, aunque los datos se basen en muestras, porque la distribución contiene a un conjunto completo de medias muestrales. </li></ul><ul><li>También se conoce como error estándar de la media debido a que cada media muestral se puede considerar una estimación de la media poblacional de los datos en bruto. La variabilidad en las medias muestrales se debe a los errores de estimación. </li></ul><ul><li>Tiene una media igual a la media poblacional de los datos en bruto </li></ul><ul><li>Tiene una desviación estándar igual a: </li></ul><ul><li>Tiene la forma normal y depende de la forma de la población de datos en bruto y del tamaño de la muestra. </li></ul>
  17. 17. Ejemplo <ul><li>Para este ejemplo supondremos que los datos en bruto de la población son: 2, 3, 4, 5 y 6. La media  =4,00 y la desviación estándar  =1,41. </li></ul><ul><li>El propósito del experimento es deducir la distribución muestral de la media para muestras de tamaño N=2 extraídas de esta población. </li></ul><ul><li>Supondremos que el muestreo se realiza tomando un dato a la vez y con reemplazo. </li></ul>N° Muestra Datos muestrales Media N° Muestra Datos muestrales Media 1 2.2 2,0 14 4.5 4,5 2 2.3 2,5 15 4.6 5,0 3 2.4 3,0 16 5.2 3,5 4 2.5 3,5 17 5.3 4,0 5 2.6 4,0 18 5.4 4,5 6 3.2 2,5 19 5.5 5,0 7 3.3 3,0 20 5.6 5,5 8 3.4 3,5 21 6.2 4,0 9 3.5 4,0 22 6.3 4,5 10 3.6 4,5 23 6.4 5,0 11 4.2 3,0 24 6.5 5,5 12 4.3 3,5 25 6.6 6,0 13 4.4 4,0
  18. 18. Ejemplo <ul><li>Suponga ahora que por alguna razón queremos determinar la probabilidad de obtener una media aritmética  5,5 como resultado de un muestreo aleatorio de dos datos. Considerando uno a la vez, con reemplazo, tomados a partir de la población de datos en bruto. </li></ul>Media aritmética Probabilidad 2,0 0,04 2,5 0,08 3,0 0,12 3,5 0,16 4,0 0,20 4,5 0,16 5,0 0,12 5,5 0,08 6,0 0,04
  19. 19. Prueba z de la desviación normalizada <ul><li>Regresamos al ejemplo: </li></ul><ul><ul><li>Supongamos que usted es un inspector de escuelas públicas de la ciudad donde vive. Recientemente, los ciudadanos han estado preocupados pues creen que el programa de lectura impartido en las escuelas públicas es de mala calidad. Como este asunto es grave, usted decide realizar un experimento para investigar. Establece un  =0,05 1 cola para tomar su decisión. Para empezar compara el nivel de lectura de los estudiantes del último año del bachillerato con las normas establecidas. Estas normas están basadas en la calificación de un examen que mide la habilidad de lectura y que fue aplicado a nivel nacional a un gran número de alumnos de este sector. Las calificaciones de esta población presentan una distribución normal con  =75 y  =16. ¿Es razonable considerar a los 100 datos como una muestra aleatoria de una población normal de calificaciones de lectura con  =75 y  =16? </li></ul></ul><ul><li>Esta distribución: </li></ul><ul><li>Tiene forma normal </li></ul><ul><li>Posee </li></ul><ul><li>Tiene una desviación estándar de </li></ul>
  20. 20. Prueba z de la desviación normalizada <ul><li>Hasta ahora conocemos la ecuación de puntajes z para datos en bruto </li></ul><ul><li>Para el caso que nos ocupa el puntaje z queda determinado por la fórmula </li></ul><ul><li>Si utilizamos esta fórmula para calcular z en este experimento </li></ul><ul><li>Utilizando la tabla de puntajes z </li></ul><ul><li>Dado que 0,0301 < 0,05 rechazamos H 0 concluyendo que NO es razonable suponer que los 100 datos sean una muestra aleatoria de una población con  =75. </li></ul><ul><li>0,0301 </li></ul>
  21. 21. Región crítica <ul><li>La región crítica para el rechazo de la hipótesis nula es el área debajo de la curva que contiene a todos los valores del estadístico que permiten el rechazo de la hipótesis nula </li></ul><ul><li>El valor crítico de un estadístico es aquél valor que delimita la región crítica </li></ul><ul><li>En el caso que nos ocupa buscaremos el puntaje z que corresponde a  =0,05 1 cola negativo </li></ul><ul><li>0,5000 – 0,0500 = 0,4500 </li></ul><ul><li>Dado que está en el centro de los puntajes z 1,64 y 1,65 corresponde -1,645 como puntaje z crítico </li></ul><ul><li>El valor crítico está dado por la fórmula: </li></ul><ul><li>Sustituyendo: </li></ul>
  22. 22. Región crítica <ul><li>Queda establecido el valor crítico 72,368 como el límite de la media muestral del experimento en cuestión para rechazar la hipótesis nula. </li></ul><ul><li>Cualquier media muestral por encima de este valor nos permite conservar la H 0 </li></ul><ul><li>Repetiremos el experimento para  =0,05 1 cola positivo </li></ul><ul><li>Y para  =0,05 2 colas que se maneja mediante  =0,025 1 cola negativo y  =0,025 1 cola positivo </li></ul><ul><li>Problemas de práctica págs. 280ss </li></ul>

×