Estadistica inferencial

2,375 views

Published on

Conceptos relacionados con la Estadística inferencial.estimación de la media,estimación de la proporción y contrastes de hipótesis

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,375
On SlideShare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
147
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Estadistica inferencial

  1. 1. ESTADÍSTICA INFERENCIAL: 1)ESTIMACIÓN DE LA MEDIA. 2)ESTIMACIÓN DE LA PROPORCIÓN. 3)CONTRASTES DE HIPÓTESIS.© Inmaculada Leiva Tapia IES Alborán
  2. 2. DISTRIBUCIÓN NORMAL:LA CAMPANA DE GAUSS 2
  3. 3. Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de 1,2,3 y 4 dados son,respectivamente: 0,18 0,18 0,16 0,16 0,14 0,14 0,12 0,12 0,1 0,1 0,08 0,08 0,06 0,06 0,04 0,04 0,02 0,02 0 0 1 2 3 4 5 6 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 0,1400 0,0500 0,0450 0,1200 0,0400 0,1000 0,0350 0,0300 0,0800 0,0250 0,0600 0,0200 0,0400 0,0150 0,0100 0,0200 0,0050 0,0000 0,0000 1,33 2 2,67 3,33 4 4,67 5,33 6 1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25 5,75 1 1,67 2,33 3 3,67 4,33 5 5,67 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6Se observa que,cuantos más dados intervienen,más se parece la distribución de lospromedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5). 3Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n) ?
  4. 4. DISTRIBUCIÓN NORMAL: LA CAMPANA DE GAUSSEl calificativo de “normal” para esta distribución se debe a la enorme frecuencia con queaparece en las situaciones más variadas.Entre las muchas variables que se distribuyen normalmente podemos citar: Caracteres morfológicos: tallas,pesos,... Caracteres fisiológicos:efectos de una misma dosis de un fármaco,niveles de glucemia,de colesterol,... Caracteres sociológicos: consumo de ciertos productos por individuos de un mismo grupo Caracteres físicos: resistencia a la rotura de piezas aparentemente idénticas,errores al medir reiteradamente una magnitud,.... Y,en general, cualquier característica que se obtenga como suma de muchos factores.Por su forma acampanada,se denomina campana de Gauss (ya que fue descrita por elmatemático alemán Carl Friedrich Gauss), curva de Gauss o curva normal. 4
  5. 5. Para cada valor de µ (media) y cada valor de σ (desviación típica) hay una curva normalque se representa por N(µ,σ).La campana de Gauss o curva normal, es una función de probabilidad continua,simétricacuyo máximo coincide con la media µ Características de la N(µ,σ): N(µ,σ) Su media,mediana y moda coinciden en µ Gráfica simétrica respecto de la recta vertical x=µ Valor máximo en la media x=µ Tiene al eje OX como asíntota horizontal Tiene inflexiones en los puntos de abscisas µ-σ y µ+σ . El área bajo la curva vale 1. Para la función de distribución (acumulativa) de una variable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la normal y el eje OX, desde -∞ hasta k : Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k. 5
  6. 6. COMPARANDO DISTRIBUCIONES NORMALES Mayor desviación típica σ (mayor dispersión) → curva más aplanada. Menor desviación típica σ (menor dispersión) → curva más alargada. Sin embargo, el reparto de probabilidades en las curvas normales es idéntico, 6 y sólo depende de los parámetros µ y σ.
  7. 7. Tienen especial interés los siguientes intervalos:El 68 % de los valores de la población El 96 % de los valores de la poblaciónse desvían de la media en menos de se desvían de la media en menos de1 vez la desviación típica σ. 2 veces la desviación típica σ.El 99,8 % de los valores de la población El 99,99 % de los valores de la poblaciónse desvían de la media en menos de se desvían de la media en menos de 73 veces la desviación típica σ. 4 veces la desviación típica σ.
  8. 8. PROBABILIDADES EN DISTRIBUCIONES NORMALESVeamos el reparto de probabilidades en las curvas normales,yalgunos intervalos más usuales . Practica 8
  9. 9. En conclusión todas las distribuciones normales son similares,y por ello se puede utilizar una de ellas como modelo.Esta será la distribución normal estándar N(0,1), es decir,aquellaque tiene media 0 y desviación típica 1.Las probabilidades asociadas a la normal estándar,están tabuladaspara valores positivos y menores de 4. 9
  10. 10. PROBABILIDADES EN LANORMAL ESTÁNDAR N(0,1) 10
  11. 11. TABLA DE LA NORMAL ESTÁNDAR z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57530,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 Φ(k)=0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,98172,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,98572,22,3 0,9861 0,9893 0,9864 0,9896 0,9868 0,9898 0,9871 0,9901 0,9875 0,9904 0,9878 0,9906 0,9881 0,9909 0,9884 0,9911 0,9887 0,9913 0,9890 0,9916 Para la función de distribución (acumulativa) de una2,42,5 0,9918 0,9938 0,9920 0,9940 0,9922 0,9941 0,9925 0,9943 0,9927 0,9945 0,9929 0,9946 0,9931 0,9948 0,9932 0,9949 0,9934 0,9951 0,9936 0,9952 variable aleatoria que sigue una N(0,1),se tiene que Φ(k) es el área encerrada por la gráfica de la2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,99642,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,99742,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,99812,93,0 0,9981 0,9987 0,9982 0,9987 0,9982 0,9987 0,9983 0,9988 0,9984 0,9988 0,9984 0,9989 0,9985 0,9989 0,9985 0,9989 0,9986 0,9990 0,9986 0,9990 normal y el eje OX, desde -∞ hasta k :3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,99933,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,99953,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,99973,43,5 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9997 0,9998 0,9998 0,9998 Φ(k) = P(z ≤ k) = área bajo la curva normal,a la izquierda de k.3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,99993,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 En la tabla sólo aparecen las probabilidades P(z ≤ k) para valores de k entre 0 y 4, pudiendo variar k de centésima en centésima,y aproximando dichas probabilidades hasta las diezmilésimas. La tabla tiene un doble uso: directo( dado k, hallar la probabilidad P) e inverso (dada la 11 probabilidad P, hallar k)
  12. 12. z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852k = 0.26 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 Φ(0.26) = P(zP(z < 0.26) 0.6026 Φ(0.26) = < 0.26 ) = = ? 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 12 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
  13. 13. z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852k = 2.24 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 Φ(2.24) = P(z < k ) = 0.9875 Φ(k) = P(z < 2.24) = 0.9875 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 13 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
  14. 14. 1) Área total bajo la curva Por ser una función de probabilidad,el área total bajo la curva es 1. P(-∞ < z <+∞) = 1 Un valor cualquiera z está en el intervalo ( -∞,+∞) en el 100% de los casos. Pero en la normal no será necesario recurrir a valores tan alejados de la media. ɸ(3) = P(z < 3) = 0,9987 Observa en la tabla: ɸ(3,5) = P(z < 3,5) = 0,9998 ɸ(3,9) = P(z < 3,9) = 1,0000 14
  15. 15. 2) Áreas a izquierda y derecha del origen Por ser simétrica la curva respecto del eje OY, el área a la izquierda de 0 y el área a la derecha de 0, tienen el mismo valor, que será la mitad del área total 1. 15
  16. 16. 3) Área a la izquierda de abscisas positivas Si k es positivo , P(z < k) representa el área que queda a la izquierda de k, comprendida entre la curva normal estándar y el eje de abscisas. ɸ(k) = P(z < k) = [ área bajo la curva normal,a la izquierda de k ] Se busca directamente en la tabla: ɸ(0,92) = P(z < 0,92) = 0,8212 Practica 16
  17. 17. 4) Área a la derecha de abscisas positivas Si k es positivo, P(z > k) representa el área que queda a la derecha de k, comprendida entre la curva normal estándar y el eje de abscisas. P(z > k) = 1 - P(z < k) = 1 - ɸ(k) = [ área bajo la curva normal,a la derecha de k ] P(z > 0,69) = 1 – P(z < 0,69) = 1 – ɸ(0,69) = 1 – 0,7549 = 0,2451 Practica 17
  18. 18. 5) Área a la izquierda de abscisas negativas Si k es positivo,el área a la izquierda de la abscisa negativa P(z < -k) es, por simetría,igual que el área a la derecha de la abscisa opuesta positiva P(z > k) Pero el área a la derecha es P(z > k) = 1 – ɸ(k) P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372 18
  19. 19. 5) Área a la izquierda de abscisas negativas Paso 1Lo repetimos de nuevo,paso a paso: Si k es positivo, el área a la izquierda P(z < -k) es por simetría igual que el área a la derecha P(z > k) P(z < -0,42) = P(z > 0,42) 19
  20. 20. 5) Área a la izquierda de abscisas negativas Paso 2 Pero el área a la derecha es P(z > k) = 1 – ɸ(k) P(z > 0,42) = 1 – P(z < 0,42) 20
  21. 21. 5) Área a la izquierda de abscisas negativas Paso 3 Buscamos en la tabla P(z < 0,42) = 0,66276 21
  22. 22. 5) Área a la izquierda de abscisas negativas Paso 4 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372 22
  23. 23. 5) Área a la izquierda de abscisas negativas Paso 5 Si k es positivo, el área a la izquierda P(z < -k) es,por simetría, igual que el área a la derecha P(z > k).Por tanto, P(z < -k) = P(z > k) = 1 – ɸ(k)P(z < -0,42) = P(z > 0,42) = 1 – P(z < 0,42) = 1 – ɸ(0,42) = 1 – 0,6628 = 0,3372 23
  24. 24. 6) Área a la derecha de abscisas negativas Si k es positivo, el área a la derecha P(z > -k) es,por simetría,igual al área a la izquierda de k. Por tanto, P(z > -k) = P(z < k) = ɸ(k) P(z > -0.42) = P(z < 0,42) = ɸ(0,42) = 0,6628 24
  25. 25. 7) Área en un intervalo El área comprendida en un intervalo [a,b],se calcula como diferencia entre el área a la izquierda de b (extremo superior) y el área a la izquierda de a (extremo inferior): P(a < z < b) = P(z < b) – P(z < a) P(0,25 < z < 1,61) = P(1,61) - P(0,25) = 0,9463 – 0,5987 = 0,3476 Practica 25
  26. 26. PROBABILIDADES EN UNANORMAL GENERALIZADA N(µ,σ) 26
  27. 27. Tipificación de la variableMedimos en cuántas desviaciones típicas se separaun valor x de la variable normal,de su media: Practica 27
  28. 28. Intervalos característicos asociados a una probabilidad en N(0,1) 28
  29. 29. Intervalos característicos asociados a una probabilidad en N(μ,σ) El área dentro del intervalo es p = 1 - α. El área fuera del intervalo,corresponde a dos colas simétricas;el valor de cada una es α/2. 29
  30. 30. Intervalos característicos asociados a una probabilidad Paso 1 30
  31. 31. Intervalos característicos asociados a una probabilidad Paso 2 31
  32. 32. Intervalos característicos asociados a una probabilidad Paso 3 32
  33. 33. Intervalos característicos asociados a una probabilidad Paso 4 33 Practica
  34. 34. Intervalos característicos asociados a una probabilidad Paso 5 34 Practica
  35. 35. DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES.TEOREMA CENTRAL DEL LÍMITE.APLICACIONES. 35
  36. 36. 36Practica
  37. 37. Las distribuciones de probabilidad correspondientes al promedio en el lanzamiento de1,2,3 y 4 dados son,respectivamente: 0,18 0,18 0,16 0,16 0,14 0,14 0,12 0,12 0,1 0,1 0,08 0,08 0,06 0,06 0,04 0,04 0,02 0,02 0 0 1 2 3 4 5 6 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 0,1400 0,0500 0,0450 0,1200 0,0400 0,1000 0,0350 0,0300 0,0800 0,0250 0,0600 0,0200 0,0400 0,0150 0,0100 0,0200 0,0050 0,0000 0,0000 1,33 2 2,67 3,33 4 4,67 5,33 6 1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25 5,75 1 1,67 2,33 3 3,67 4,33 5 5,67 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6Se observa que,cuantos más dados intervienen,más se parece la distribución de lospromedios a la curva normal.Todas las distribuciones tienen la misma media (µ = 3,5). 37Cuantos más dados intervienen,menor desviación típica tiene la distribución (σ = 1,71/√n) ?
  38. 38. Teorema central del límite 38 Practica
  39. 39. Observaciones sobre el TCLEl teorema es válido cualquiera que sea la distribución de partida,tanto si es discretacomo si es continua.Si la población de partida es normal,entonces también lo será la distribución de lasmedias muestrales,independientemente del tamaño n de la muestra.Aunque la población de partida no sea normal,la distribución de medias muestralespuede ser a veces muy similar a la normal,incluso para valores pequeños de n(por ejemplo,al promediar el resultado obtenido al lanzar varios dados).Para n ≥30 (“muestras grandes”) es seguro que se consigue una gran aproximacióna la normal,cualquiera que sea la distribución de partida. 39
  40. 40. Consecuencias del TCL 40
  41. 41. Control de las medias muestrales 41
  42. 42. Control de la suma de todos los individuos de la muestra Practica 42
  43. 43. ESTADÍSTICA INFERENCIAL:1)ESTIMACIÓN DE LA MEDIA.2)ESTIMACIÓN DE LA PROPORCIÓN.3)CONTRASTES DE HIPÓTESIS. 43
  44. 44. Estadística inferencial La Estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos para deducir propiedades de una población estadística, a partir del conocimiento de una pequeña parte de la misma (muestra). Los resultados así obtenidos siempre tienen cierto grado de incertidumbre, que se mide en términos de probabilidad (y, a veces, de porcentaje). La Estadística inferencial tiene dos grandes ramas: La Estadística inductiva: su objeto es la estimación de parámetros de la población,conociendo el valor del correspondiente parámetro en una muestra. La Estadística hipotético-deductiva: su objeto es el contraste de hipótesis que consiste en decidir si aceptar o rechazar hipótesis realizadas sobre parámetros de una población,contrastándolas con el valor obtenido de dicho parámetro en una muestra concreta,extraída aleatoriamente de la población (y que se obtiene después de realizado el test de hipótesis). A esta rama de la Estadística se le llama también teoría de la decisión. 44
  45. 45. ESTIMACIÓN POR INTERVALOS 45
  46. 46. Estimación mediante intervalos A partir de una muestra aleatoria de tamaño n, podemos estimar el valor de un parámetro de la población del siguiente modo: Dando un intervalo dentro del cual confiamos que esté el parámetro: intervalo de confianza. Hallando la probabilidad de que tal cosa ocurra: nivel de confianza.La eficacia de una estimación se mide de dos formas:Con el tamaño del intervalo de confianza ( intervalo más pequeño → mayor precisión)Con el nivel de confianza ( mayor nivel de confianza → más seguridad )Las tres variables que intervienen en los problemas de estimación son: n = tamaño de la muestra E = error máximo admisible (siempre se fijan dos de ellas y se halla la tercera) (1 – α) = nivel de confianzaHaremos estimaciones de la media y de la proporción de una población. 46
  47. 47. ESTIMACIÓN DE LA MEDIA 47
  48. 48. Intervalo de confianza para estimación de la media Se desea estimar la media μ de una población x con desviación típica σ conocida. Se toma una muestra aleatoria de tamaño n, de la que se obtiene la media muestral x . Si la población x es N(μ σ), o bien si n ≥ 30, el intervalo de confianza para la estimación de μ,con un nivel de confianza de (1 – α) ·100% es el intervalo simétrico centrado en x ( x – E, x + E) = ( x - zα/2 ·σ/√n , x + zα/2 ·σ/√n ) en el que P( x – E < μ < x + E ) = 1 – α. E = zα/2 ·σ/√n se llama error máximo admisible ( semiamplitud o radio del intervalo de confianza). Depende de (1 – α) y de n del siguiente modo: cuanto mayor es n (aumenta tamaño de la muestra), menor es E (intervalo más pequeño) → estimación más precisa cuanto mayor sea (1 – α), (aumenta la seguridad), mayor es E (intervalo más grande) → estimación menos precisa 48
  49. 49. Relación entre nivel de confianza,error y tamaño de la muestra La fórmula E = zα/2 ·σ/√n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera; por ello hay tres tipos de ejercicios: Conocidos (1 – α) , n ==> E ? Conocidos (1 – α) , E ==> n ? Conocidos E,n ==> (1 – α) ? 49
  50. 50. Intervalo de confianza para estimación de la media:1) Hallar el error máximo admisible E 50
  51. 51. Intervalo de confianza para estimación de la media:2) Hallar el tamaño n de la muestra 51
  52. 52. Intervalo de confianza para estimación de la media:3) Hallar el nivel de confianza (1 - α) 52 Practica
  53. 53. DISTRIBUCIÓN BINOMIAL 53
  54. 54. Distribución binomial Si en una experiencia aleatoria,nos interesa únicamente un suceso A,y aceptamos como únicos resultados que ocurra A o que no ocurra A(con lo cual ocurre su contrario A), diremos que la experiencia es dicotómica. Al suceso A se le llama éxito y a su probabilidad P(A) = p Para el suceso contrario A,su probabilidad es P(A) = q = 1 – p Se repite n veces una experiencia dicotómica. Sea x el número de éxitos (nº veces que ocurre A).Entonces x es una variable discreta que toma los valores 1,2,3,.....,n. La distribución de probabilidad de x se llama distribución binomial B(n,p). La probabilidad de que x tome el valor k viene dada por k P  x=k  = n p · q k n−k Los parámetros de esta distribución son: media μ = np ; desviación típica σ = √npq 54
  55. 55. Aproximación de la binomial a la normalSi np ≥ 5 y nq ≥ 5, entonces la binomial se aproxima de forma casi perfecta a una curvanormal con la misma media y desviación típica que la binomial de partida: np ≥ 5 y nq ≥ 5 ==> B(n,p) ≈ N(np ,√npq) 55
  56. 56. DISTRIBUCIÓN DE LASPROPORCIONES MUESTRALES 56
  57. 57. Distribución de las proporciones muestrales Sea una población donde p es la proporción de individuos que posee una determinada característica C.Tomamos muestras del mismo tamaño n.En cada una de esas muestras habrá una proporción pr de individuos con C.¿Cómo se distribuye la variable pr? PROPOSICIÓN: si np ≥ 5 y nq ≥ 5, entonces la proporción pr de individuos con la característica C en las muestras de tamaño n,es una variable estadística que sigue una distribución normal de media p y de desviación típica √pq/n: np ≥ 5 y nq ≥ 5 ==> pr es N(p ,√pq/n ) Demostración: Si x = nº individuos en cada muestra de tamaño n con la característica C, x es B(n,p). Si además np ≥ 5 y nq ≥ 5,entonces: x es B(n,p) ≈ N(np ,√npq). Si pr = proporción de individuos de la muestra con la característica C,entonces pr = x/n y,por tanto,la distribución de pr es como la de x,pero con los parámetros media y desv. típica divididos por n: pr es N(np/n ,√npq/n) = N(p ,√pq/n) 57
  58. 58. Control de las proporciones muestrales 58
  59. 59. ESTIMACIÓN DE LA PROPORCIÓN 59
  60. 60. Intervalo de confianza para estimación de la proporción Se desea estimar la proporción p de individuos de una población con una característica C. Se toma una muestra aleatoria de tamaño n,y se obtiene en ella la proporción muestral pr. Si n·p ≥ 5 y n·q ≥ 5,y además la muestra es grande (n ≥ 30), entonces el intervalo de confianza para la estimación de la proporción p en la población,con un nivel de confianza de (1 – α) ·100% , es el intervalo simétrico centrado en pr: ( pr – E, pr + E) = ( pr - zα/2 ·√pr·(1-pr)/n , pr + zα/2 ·√pr·(1-pr)/n ) en el que se cumple que P( pr – E < p < pr + E ) = 1 – α. La fórmula E = zα/2 ·√pr·(1-pr)/n relaciona las tres variables. Siempre se fijan dos de ellas,y se calcula la tercera;por ello hay tres tipos de ejercicios: Conocidos (1 – α) , n ==> E ? Conocidos (1 – α) , E ==> n ? Conocidos E,n ==> (1 – α) ? 60
  61. 61. Intervalo de confianza para estimación de la proporción:1) Hallar el error máximo admisible E 61
  62. 62. Intervalo de confianza para estimación de la proporción:2) Hallar el tamaño n de la muestra 62
  63. 63. Intervalo de confianza para estimación de la proporción:3) Hallar el nivel de confianza (1 - α) 63 Practica
  64. 64. CONTRASTES DE HIPÓTESIS 64
  65. 65. Pasos para efectuar un contraste de hipótesis: Enunciación: de las hipótesis nula H0 y alternativa H1. Deducción de conclusiones: suponiendo cierta la hipótesis nula H0 , el parámetro muestral (media x o proporción pr ,de las muestras),se distribuye mediante una normal con parámetros conocidos. Entonces,se elige un nivel de significación α y se construye la zona de aceptación,que es el intervalo (o semirrecta) fuera del cual sólo se encuentran el α·100% de los casos “raros” de la población. Verificación: se extrae ahora una muestra de tamaño n, y en ella se calcula el parámetro muestral. Decisión: si el valor del parámetro muestral obtenido cae dentro de la zona de aceptación, se acepta la hipótesis nula con un nivel de significación α. En caso contrario,se rechaza la hipótesis nula y se acepta la alternativa. Hay dos tipos de contrastes: bilateral y unilateral. 65
  66. 66. Contrastes de hipótesis para la media (bilateral) 66
  67. 67. Contrastes de hipótesis para la media (unilateral,a la izquierda) 67
  68. 68. Contrastes de hipótesis para la media (unilateral,a la derecha) 68
  69. 69. Contrastes de hipótesis para la proporción (bilateral) 69
  70. 70. Contrastes de hipótesis para la proporción(unilateral,a la izquierda) 70
  71. 71. Contrastes de hipótesis para la proporción(unilateral,a la derecha) 71
  72. 72. FIN© Inmaculada Leiva Tapia IES Alborán 72

×