MÉTODOS ESTATÍSTICOS
    E NUMÉRICOS

          UNIDADE 10

 ESTIMACIÓN DE PARÁMETROS


                     ÍNDICE
   IES Isidro Parga Pondal. Departamento de matemáticas
CONTIDOS

Tipos de estimación.
Estimación puntual.
Características dos estimadores puntuais.
Estimadores puntuais: media mostral e proporción mostral.
Intervalo de confianza.
Intervalo de confianza para a media dunha poboación normal da que
  se coñece a varianza.
Intervalo de confianza para a media dunha poboación normal da que
  non se coñece a varianza.
Intervalo de confianza para a proporción.
Intervalo de confianza para a diferenza de medias.
Intervalo de confianza para a varianza dunha poboación normal.
Erro máximo admisible.
Tamaño da mostra para a estimación da media e da proporción.



              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

Observa estes tres problemas, correspondentes a situacións
parecidas pero moi distintas:

 Problema 1:                                               X

 A media de idade das alumnas e alumnos que se presentan á selectividade
é de 18.1 anos; e unha desviación típica de 0.5 anos. Eliximos ao azar unha
mostra de 80 alumnos/as, cal é a probabilidade de que a media de idade da
mostra estea entre 17.9 e 18.3?
 Sabemos:                                                Queremos saber:
 A media μ da poboación, que é 18.1                      A media X dunha mostra.
                                                         p(17.9< X <18.3)?


  Coñecemos a poboación e pretendemos deducir o comportamento das
mostras. Isto viuse no tema anterior baseándonos no teorema central do
límite.

                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

 Problema 2:
 A idade media dunha mostra de 80 alumnos/as que se presentan a
selectividade é de 18.1 anos. Cal é a probabilidade de que a media de todos
os alumnos que se presentan á selectividade estea entre 17.9 e 18.3 anos?



Sabemos:                                               Queremos saber:
A media X dunha mostra:
        X                         X   =18.1            A media μ da poboación.
                                                      p(17.9<μ<18.3)?


 Coñecemos unha mostra, e pretendemos deducir aspectos da poboación.
Pretendemos inferir ou estimar o valor da media poboacional a partir do
valor da media mostral. Este é o tema da presente unidade.



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

 Problema 3:
 Está admitido como certo que a idade media dos alumnos/as que se
presentan á selectividade é de 18.1. Para comprobalo tomouse unha mostra
de 80 alumnos/as que se presentan á selectividade e calculouse a súa
media, obtendo 18.3. É razoable admitir como válida a hipótese inicial de
que μ=18.1?

Sabemos:                                               Queremos saber:
A media dunha mostra: X =18.3                          É admisible a afirmación de que a
                                                      media da poboación é μ=18.1?


 Temos unha afirmación ou hipótese, pero sen garantías de certeza. Para
contrastalo, tomamos unha mostra, e a partir do resultado desta, decidimos
se a hipótese é ou non é admisible.
 Este problema corresponde á chamada teoría da decisión ou contraste
de hipótese que veremos na seguinte unidade
                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

Nota :
Ao traballar con mostras, hai que diferenciar
entre:
Os parámetros observados na mostra,
chamados parámetros estatísticos ou
simplemente estatísticos.
Os parámetros reais correspondentes á
poboación, chamados parámetros poboacionais
ou simplemente parámetros.


              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Introdución

  Estimación de Parámetros
                                                                                                                       Parámetros:
  Parámetros poboacionais e Estatísticos Mostrais
                                                                                        H to r m d laP b c n
                                                                                         is g a a e   o la io
                                                                                                                        Media (µ )
                                                                             10
                                                                              6

                                                                             10
                                                                              4
                                                                                                                       Varianza(σ 2)
                                                                             10
                                                                              2


        Datos


                                                                 re u n ia
                                                                             10
                                                                              0
                                                                                                                       Desv. Est. (σ )




                                                                F cec
                                                                             80


(Poboación de Interese)                                                      6

                                                                             4
                                                                              0

                                                                              0                                             Etc.
                                                                             20

                                                                              0
                                                                              -4          -2         0
                                                                                                   C ss
                                                                                                    la e
                                                                                                           2    4
                                                                                                                      Inferencias
                                                                              Histograma de la Muestra

      Mostraxe                                             16                                                         Estatísticos:
                                                           14

                                                           12                                                       Termo medio( X )
                                              Frecuencia




                                                           10


         Mostras
                                                           8                                                    Varianza mostral(S2)
                                                           6

                                                           4
                                                                                                                Desv. Est. mostral(S)
                                                           2

                                                           0
                                                           -4                      -2        0
                                                                                          Clases
                                                                                                      2    4              Etc.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
1. Tipos de estimación


                           Puntual:
                           Trátase de estimar un parámetro da poboación a
                          partir dun estatístico obtido dunha mostra dela,
                          dando un único valor como aproximación do
                          parámetro poboacional.


 Tipos de                  Por intervalos de confianza:
estimación:                A partir dunha mostra aleatoria de tamaño n
                          podemos estimar o valor dun parámetro da
                          poboación dando un intervalo dentro do cal
                          confiamos que estea o parámetro, intervalo de
                          confianza, e calculando a probabilidade de que tal
                          cousa ocorra; a dita probabilidade chamámoslle
                          nivel de confianza.

              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

Estimación puntual:

 Ao estimar un parámetro poboacional por estimación puntual
 poden considerarse, en principio, varios estatísticos.

 Exemplo:
 Para estimar a media poboacional μ podemos utilizar a media
 mostral x, pero tamén outros estatísticos, como mediana, moda...

 Debemos, polo tanto, facer un estudo para saber que estatístico
 proporciona unha estimación máis fiable do parámetro
 poboacional.


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

 Para controlar a fiabilidade da estimación proporcionada por un
 estatístico, definimos o concepto de estimador:

 Chamamos estimador S dun parámetro poboacional λ a unha
 variable aleatoria que a cada unha das mostras dun certo tamaño n
 da poboación asócialle o valor dun estatístico dado con valores
 aproximados ao parámetro poboacional λ que desexamos estimar.




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual


Exemplo:
 Nun edificio viven 6 nenos de idades:

Nenos     Celia            Raquel              María               Alex                Marta                Xoán

Idades    5                7                   8                   6                   1                    8




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

 Podemos polo tanto coñecer a idade media da poboación de nenos
 do edificio que sería:

              μ =(5+7+8+6+1+8)/6=5.83

 Pero un veciño do edificio non coñece as idades de todos os nenos
 así que decide estimar cal é a idade media dos nenos do edificio
 preguntándolle a idade a tres dos nenos e calculando a media de
 idade de dita mostra.

 O parámetro media poboacional intenta estimarse mediante un
 estatístico dunha mostra de tres elementos que é a media
 mostral.

 Pero, o valor obtido deste xeito, realmente se aproxima á media
 poboacional?

               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

       Para controlar a fiabilidade da estimación, recorremos ao estudo do seguinte
       estimador:
       Experimento aleatorio = obtención dunha mostra de tamaño 3.
       Definimos unha variable aleatoria que a cada mostra de tres nenos asígnalle a idade
       media da mostra.
       X =idade media mostral dunha mostra de tamaño 3
Mos      Celia    Celia    Celia    Celia    Celia   Celia   Celia   Celia  Celia  Celia
tras    Raquel e Raquel e Raquel e Raquel e María e María e María e Alex e Alex e Marta e
        María    Alex     Marta Xoán        Alex    Marta Xoán      Marta Xoán    Xoán

 x       6.67      6        4.33         6.67          6.33         4.33          7            4.33          6.33    4.67


Mos Raquel Raquel Raquel Raquel Raquel Raquel María María María Alex
tras María e María e María e Alex e Alex e Marta e Alex e Alex e Marta e Marta e
     Alex    Marta   Xoán    Marta Xoán    Xoán    Marta Xoán Xoán Xoán

 x       7       5.33      7.67          4.67           7             5.33          5            7.33         5.67   5

                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
2. Estimación puntual

                                                    xi                       p( X =xi)
                                                    4.33                     3/20
 Trátase dunha variable                             4.67                     2/20
aleatoria discreta coa                              5                        2/20
seguinte función masa de                            5.33                     2/20
probabilidade                                       5.67                     1/20
                                                    6                        1/20
                                                    6.33                     2/20
                                                    6.67                     2/20
                                                    7                        3/20
                                                    7.33                     1/20



            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Nun estimador considéranse desexables as seguintes
 características:

•     Ausencia de nesgo
•     Eficiencia
•     Consistencia

 para considerar fiable a estimación correspondente.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Ausencia de nesgo
 Observa as seguintes figuras onde se representa o valor real do parámetro
 poboacional a estimar λ e os valores que toman certos estimadores                                           f(x)=8



 correspondentes a certos tamaños de mostra e a certos estatísticos que
                                                                                                             f(x)=4
                                                                                                             f(x)=0
                                                                                                             Serie 1


 poderiamos empregar.
                                                                                                             Serie 2




                                                   λ




                                                   λ




                                                   λ
                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 No primeiro caso os valores do estimador están arredor de λ mentres no
 segundo caso a maior parte son maiores λ e no terceiro son
 maioritariamente menores ca λ.

 A nós interésanos que os valores do estimador se repartan ao redor de λ,
 coma no primeiro caso. Isto dáse cando a súa esperanza está próxima ao
 valor de λ e cando isto sucede dise que o estimador é non esguellado.

Dise que un estimador S dun parámetro λ é non esguellado se a
súa esperanza μS coincide con λ.

Se μS< λ , dise que ten nesgo negativo (caso 3)

Se μS> λ , dise que ten nesgo positivo (caso 2)




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Exemplo:
  Lembrades o exemplo de estimador que puxemos ?
 Fixádevos no valor da idade media da poboación de
nenos do edificio e nos valores que toma o estimador X                                                                  f(x)=0
                                                                                                                        Serie 1




que son as idades medias das mostras de tres
                                                                                                                        Serie 2




elementos que podemos tomar nesta poboación.
 Pensades que é ou non esguellado?


    4.2   4.4   4.6   4.8      5    5.2   5.4   5.6   5.8    6    6.2   6.4   6.6   6.8    7    7.2   7.4   7.6   7.8
                                                        λ




                            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Se no noso exemplo calculamos a esperanza do
 estimador X obtemos:


   μX = ∑ xi ⋅ pi =
         i

             3           2      2           2           1       1
   = 4.33 ⋅    + 4.67 ⋅    +5⋅    + 5.33 ⋅    + 5.67 ⋅    + 6⋅    +
            20          20     20          20          20      20
             2           2      3           1           1
   + 6.33 ⋅    + 6.67 ⋅    +7⋅    + 7.33 ⋅    + 7.67 ⋅    =
            20          20     20          20          20
   = 5.83 = idade media dos nenos do edificio



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Eficiencia dun estimador
Pero observa agora os valores que toman estes dous estimadores                                          f(x)=8


non esguellados do mesmo parámetro poboacional λ.                                                       f(x)=4
                                                                                                        Serie 1




Cal cres ti que deberiamos empregar se queremos un resultado
                                                                                                        Serie 2




fiable?.

                                                 λ




                                                 λ


              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

 Loxicamente nos quedariamos co segundo, pois os
 valores que toma o estatístico están máis concentrados
 arredor de λ.

 Isto ocorre cando a desviación típica do estimador é
 menor; e dise que dito estimador é máis eficiente.


 De entre dous estimadores, dicimos que é
 máis eficiente o que ten menor varianza ou
 desviación típica.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Exemplo:
Os 4 fillos dunha familia estudan 1,2,3,4 horas diarias
respectivamente. Se desexásemos estimar o nº medio de horas de
estudo diario dos nenos desta familia mediante unha mostra de
tamaño 3, que estimador dos dous seguintes é máis eficiente?

X =media mostral dunha mostra de tamaño3
Me=mediana dunha mostra de tamaño 3.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

As posibles mostra de tamaño 3
daríannos os seguintes resultados:

Calculemos as esperanzas destas                              Mostras                      x                 Me
variables aleatorias (estimadores)
para ver se teñen ou non nesgo
                                                             (1,2,3)                  2                     2
  μX = (2 + 2.33 + 2.67 + 3)/4 = 2.5
  μMe = (2 + 2 + 3 + 3)/4 = 2.5                              (1,2,4)                  2.33                  2
O nº medio de horas de estudo da
poboación formada polos 4 nenos                              (1,3,4)                  2.67                  3
era:
     μ = (1 + 2 + 3 + 4)/4 = 2.5                             (2,3,4)                  3                     3
Como μ = μX = μMe
 ambos estimadores son non
esguellados.


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Cal é máis eficiente?

 Pois aquel que teña menor varianza.
 Ao calculalas podemos ver que a media mostral ten unha
varianza máis baixa polo que é un estimador máis
eficiente que a mediana.

                                1          1          1      1
  σ X = ∑ xi ⋅ pi − x = 22 ⋅
    2        2
                                  + 2.332 ⋅ + 2.67 2 ⋅ + 32 ⋅ − 2.52 = 0.13
         i                      4          4          4      4
      2      1      1
  σ Me = 22 ⋅ + 32 ⋅ − 2.52 = 0.25
             2      2



                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais

Consistencia dun estimador
 Intuitivamente canto maior é a mostra elixida, máis
 próxima debería estar a estimación realizada dun
 parámetro ao valor real do parámetro.


 Dicimos que un estimador é consistente se a
 probabilidade de que estean moi próximos a
 estimación e o parámetro poboacional
 aumenta e tende a 1 ao incrementarse o
 tamaño da mostra.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
3. Características dos estimadores puntuais


Conclusión:
Un estimador é bo se é non esguellado, o
máis eficiente posible e consistente.




           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral
 A elección do estimador máis axeitado en cada caso excede o nivel deste
 curso.

 Abondará con saber:
•A media poboacional μ aproxímase pola media mostral x A mediana
                                                        .
 tamén é un estimador non esguellado para a media poboacional pero menos
 eficiente que a media mostral.
•A varianza poboacional σ2 aproxímase pola cuasivarianza mostral ŝ2 que
 se define como:
                                 ˆ2 = n ⋅ s2
                                 s
                                     n −1
 Parece que o estimador máis adecuado debería ser a varianza mostral,
 pero pode demostrarse que non é así.
•A proporción poboacional aproxímase por a proporción mostral.
•A diferenza de medias de dúas poboaciones μ1-μ2 aproxímase pola
 diferenza de medias mostráis x1 − x 2


                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

 Exemplo 1:
 Das 25 aulas dun centro educativo escolléronse 5 ao
chou, e contouse o número de alumnos da clase,
obténdose os seguintes resultados: 33, 27, 19, 34, 30.
Estima o número total de alumnos do centro.




             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

Solución:
Estimaríamos o nº medio de alumnos por aula no
centro escolar calculando o nº medio de
alumnos nas 5 aulas que se tomaron como
mostra.
Como a media mostral da (33+27+19+34+30)/5=
28,6 consideramos que o nº medio de alumnos
por aula no centro escolar é 28.6 e, polo tanto,
estimariamos que o número total de alumnos no
centro escolar é de 25·28,6=715 alumnos


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral




Exemplo 2:
Entre os estudantes dunha cidade escolléronse
150 ao azar e preguntóuselles se estaban de
acordo co actual sistema de acceso á
universidade. 40 responderon que si. Estímese
a proporción de alumnos de dita cidade que
están de acordo co sistema de acceso á
universidade.
           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
4. Estimadores puntuais: media mostral e
proporción mostral

Solución:
A proporción mostral é un bo estimador da
proporción poboacional, así que calculamos a
proporción de alumnos da mostra que
responderon afirmativamente e considerámola
como proporción poboacional.

 40 de 150 é un 26,67%
 Estimamos que un 26,67% da poboación está de
 acordo co sistema de acceso á universidade.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

A estimación puntual serve de pouco mentres
descoñezamos cal é o grao de aproximación entre o
estatístico mostral e o parámetro poboacional.
A estimación puntual non nos indica o erro cometido
en dita estimación.
O razoable na práctica é incluír, xunto á estimación
puntual do parámetro, un certo intervalo numérico
que mida a marxe de erro que, de acordo coas
observacións mostrais, poda ter dita estimación.
A idea de intervalo de confianza é propór un rango de
valores entre os que posiblemente se encontre o
verdadeiro valor do parámetro.


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Por este motivo recórrese á estimación                                                  por
 intervalos.

 A partir dunha mostra de tamaño n podemos estimar o
 valor dun parámetro da poboación do seguinte modo:

  Dando un intervalo dentro do cal confiamos que estea
 o parámetro, chamado intervalo de confianza.

•Calculando a probabilidade de que tal cousa ocorra. A
 dita probabilidade chámaselle nivel de confianza que se
 nomea como p=1-α sendo α o nivel de significación.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Supoñamos que para estimar unha media poboacional μ
 tomamos unha mostra de tamaño n e a partir dela
 construímos un intervalo de confianza ao 90% para μ. É
 dicir, o nivel de confianza é 0,9 e o nivel de
 significación 0,1.

No intervalo calculado pode ou non estar realmente μ.

Nin sequera podemos dicir que μ está no intervalo
calculado cunha probabilidade do 90%.

Só podemos falar de que o intervalo contén a μ cunha
confianza do 90%. Que significa entón nivel de
confianza do 90%?

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Se construímos moitos intervalos de confianza para μ cun nivel de confianza do
 90%

                                  μ




 O 90% de ditos intervalos de confianza conterán a media poboacional.




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza




Nota:
 Como polo xeral só vamos a dispór dunha
 mostra, temos que contar (por exemplo cun
 90% de confianza) que a mostra que temos
 pertence ao grupo das mostras boas (as que nos
 dan unha estimación do intervalo que contén o
 verdadeiro valor do parámetro).


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Para o cálculo de intervalos de confianza é importante
 coñecer que é un intervalo característico e como
 calculalo

Intervalos característicos :
 Se unha variable aleatoria X ten unha distribución de
 esperanza ou media μ, chámase intervalo característico
 correspondente a unha probabilidade p a un intervalo
 centrado na media (μ-k, μ+k) tal que a probabilidade de
 que X pertenza a dito intervalo é p

                  p(μ-k < X < μ+k)=p


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

Intervalos característicos en distribucións N(0,1)
Exemplo:
  Calcula o intervalo característico dunha variable
aleatoria Z que segue unha distribución normal N(0,1)
correspondente á probabilidade p=0.9.

 Trátase de atopar un intervalo centrado na media μ=0 e
 polo tanto da forma (-k, k) que conteña unha
 probabilidade de 0.9.

 Fóra do intervalo haberá unha probabilidade de
 1-p=1-0.9=0.1. Como o intervalo é simétrico , a área ou
 probabilidade de cada “cola” é de 0.1/2=0.05

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza.
                                                                                                         y                                                                          f(x)=(1/sqr(2*pi))*e^-(x^2/2)
                                                                                                0.034
                                                                                                                                                                                    Relleno 2
                                                                                                                                                                                    Relleno 3
                                                                                                0.032                                                                               Relleno 4
                                                                                                                                                                                    x(t)=-1.65 , y(t)=t
                                                                                                                                                                                    x(t)=1.65 , y(t)=t
                                                                                                 0.03


                                                                                                0.028


                                                                                                0.026              N(0,1)
                                                                                                0.024


                                                                                                0.022


                                                                                                 0.02


                                                                                                0.018


                                                                                                0.016


                                                                                                0.014


                                                                                                0.012


                                                                                                 0.01


                                                                                                0.008
                                                                                                                     p(-k<z<k)=p=1-α=0,9

                                                                                                0.006


                                                                                                0.004

                                                                                                                                                               p(z>k)=(1-p)/2=α/2=0.05
         p(z<-k)=(1-p)/2=α/2=0.05                                                               0.002

                                                                                                                                                                                                               x
 -2.8   -2.6   -2.4   -2.2   -2   -1.8    -1.6   -1.4   -1.2   -1   -0.8   -0.6   -0.4   -0.2                0.2     0.4    0.6   0.8   1   1.2   1.4   1.6   1.8   2   2.2   2.4          2.6           2.8
                                         -k                                                     -0.002                                                    k
                                                                                                -0.004
                                                                                                                                   p(z≤k)=p+(1-p)/2=1-α+α/2=0.95

                                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

      Vemos , entón, que
p(Z≤k)=0.95

      E recorremos á
táboa da distribución
N(0,1) para atopar o valor
de k correspondente á
probabilidade 0.95

 K é un valor entre 1.64 e
1.65; polo que tomamos o
punto medio 1.645
             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 O intervalo característico para unha variable aleatoria
 Z que segue unha distribución normal N(0,1)
 correspondente a unha probabilidade p= 0.9 sería:

                           (-1.645, 1.645)

 Diremos que k=1.645 é o valor crítico correspondente a
 p=0.9.
 Habitualmente desígnase a probabilidade p mediante 1-
 α. O valor crítico correspondente denomínase zα/2
 téndose as desigualdades:

      p(Z> zα/2 )=α/2                                     p(-zα/2 <Z< zα/2 )=1-α

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

Intervalos característicos en distribucións N(μ,σ)
Sexa X unha variable aleatoria que segue unha
distribución N(μ,σ).
Desexamos encontrar un intervalo centrado na media μ,
(μ-k, μ+k) tal que p(μ-k<X<μ+k)=p=1-α. É dicir, un
intervalo no que estea o (1-α).100% dos individuos da
poboación.

 Se X é N(μ,σ) entón Z=(X-μ)/σ é N(0,1).
 Calculariamos o intervalo característico para Z
 correspondente a p=1-α que sería (-zα/2 , zα/2 ) .
 Polo tanto:
       p(-zα/2 <Z< zα/2 )=p (-zα/2 < (X-μ)/σ < zα/2 )=p=1-α

              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

 Multiplicando toda a desigualdade pola desviación típica σ e
 sumando a toda a desigualdade a esperanza ou media μ temos:
       p(μ- zα/2 ·σ < X < μ+ zα/2 ·σ )=p=1-α

 O intervalo característico será :
                (μ- zα/2 ·σ , μ+ zα/2 ·σ )
 Exemplo:
 Calcula o intervalo característico para unha distribución N(3,2)
 correspondente a unha probabilidade p=1-α=0.9.

 Calculariamos o valor crítico para a N(0,1) correspondente a unha
 probabilidade 0.9 . zα/2 =1.645
 O intervalo característico sería (3-1.645·2, 3+1.645·2) =
(-0.29 , 6.29)


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

O método pivotal para o cálculo de intervalos de confianza
Fixado un nivel de confianza p=1-α (0 < p < 1), o procedemento xeral
para a construción dun intervalo de confianza ao nivel
p=1-α para un parámetro de interese λ desenvólvese de acordo co
seguinte mecanismo:

1 Elección do estatístico pivotal:
 Elíxese un estatístico que dependa só do parámetro que se desexa
 estimar e cuxa distribución sexa coñecida T.

2 Formulación do enunciado probabilístico:
 Preséntase un enunciado probabilístico tendo en conta a distribución
 de probabilidade do estatístico elixido na etapa anterior e o valor
 p=1-α fixado como nivel de confianza, é dicir, determínanse
 constantes a e b tales que:
               P (a < T < b) = p=1-α
 ou dito doutro xeito, calcúlase un intervalo característico de T para
 unha probabilidade p.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
5. Intervalo de confianza

3 Transformación do enunciado probabilístico:

 Se é posible despexar da expresión anterior, transfórmase o
 enunciado probabilístico noutros equivalentes, mediante
 operacións aritméticas, ata chegar a unha expresión na que o
 parámetro de interese figure só no centro da desigualdade.
 Dependendo das operacións aritméticas a realizar podemos obter:

              P (T-1(a)< λ < T-1(b))= p=1-α
              P (T-1(b)< λ < T-1(a))= p=1-α


 Calculando o valor do estimador T nun caso concreto e sustituíndo
 este dato no intervalo probabilístico construído anteriormente
 obtense o intervalo de confianza para λ con un nivel de confianza
 p=1-α.


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Método pivotal aplicado ao cálculo dun
 intervalo de confianza para a media dunha
 poboación normal con varianza coñecida

Caso xeral.
X variable aleatoria que segue unha N(μ,σ),
μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño
n, n≥30 e calculamos a media mostral
Como calcular un intervalo de confianza para
μ ó p·100%= (1-α)·100%?
          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
1 Elección do estatístico pivotal :
Sabemos polo teorema central do límite que X = media mostral dunha
                                              σ 
mostra de tamaño n segue unha distribución N μ,      se a poboación
                                                 n
partida X é normal ou se o tamaño das mostras é n ≥ 30 .
2 Formulació n do enunciado probabilístico :
Intentemos calcular un intervalo característico nesta distribución con probabilidade
p = 1 - α.
p(c1 < X < c2 ) = p = 1 − α
Tipificamos para pasar a unha normalN(0, 1).
                      
  c1 − μ X − μ c2 − μ 
p       <     <        = p =1−α
  σ       σ     σ     
      n     n      n
Calculamos o intervalo característico da normal N(0,1) para unha probabilidade p = 1 - α.
Para isto calculamos o valor crítico zα para esta probabilidade p = 1 - α.
                                                 2


                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
    Temos entón
    c1 − μ              c2 − μ
           = −zα e             = zα
     σ          2        σ          2
        n                   n
                σ                     σ
    c1 = −zα ⋅     + μ e c2 = zα ⋅       +μ
            2    n                2    n
    e polo tanto

     (           )
    p c1 < X < c2 = p = 1 − α ⇒
                                
                              p − zα ⋅
                                        σ
                                         n
                                           + μ < X < zα ⋅
                                                          σ
                                                           n
                                                                
                                                             + μ = p = 1 − α
                                    2                 2        
    3 Transform ación do enunciado probabilístico :
    E facendo as seguintes operacións na desigualdade : restar μ, restar X
    e multiplicar por − 1 , chegamos a :
               σ                 σ 
    p X − zα ⋅    < μ < X + zα ⋅    = p =1−α
            2   n             2   n
    Substituímos X polo valor concreto obtido da mostra e temos que
    o intervalo de confianza ao p ⋅ 100% = ( 1 - α ) ⋅ 100% para μ será :
              σ             σ 
     x − zα ⋅    , x + zα ⋅   
           2   n         2   n

                     IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Conclusión:
Deséxase estimar a media, μ, dunha poboación con
desviación típica, σ, coñecida.
Para isto recórrese a unha mostra de tamaño n na que
se obtén unha media mostral, x.
 Se a poboación de partida é normal ou se o tamaño da
 mostra é n≥30, entón o intervalo de confianza de μ cun
 nivel de confianza de p·100%= (1-α)·100% é:
                        σ             σ 
               x − zα ⋅    , x + zα ⋅   
                     2   n         2   n
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α
             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Vexamos o feito nun exemplo concreto:
 Os estudantes de bacharelato de Galicia dormen un
 número de horas diarias que se distribúe segundo unha
 lei normal de media μ descoñecida e de desviación
 típica 3. A partir dunha mostra de tamaño 30 obtívose
 unha media mostral igual a 7 horas.

 Obtén un intervalo de confianza ao 90% para a media
 de horas de sono, μ.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Partimos da seguinte situación:
 Poboación: Alumnos de bacharelato de Galicia.
 Variable aleatoria:
 X=nº de horas diarias de sono dun alumno de bacharelato de
 Galicia, que segue unha distribución normal de media μ
 descoñecida e desviación típica 3; N(μ,3).

 Desexamos estimar a media poboacional μ para o que tomamos
 unha mostra de tamaño 30 e calculamos o estatístico media
 mostral, que sabemos é un estimador non esguellado da media
 poboacional, obtendo x =7.

 Pero non desexamos facer unha estimación puntual senón dar un
 intervalo de confianza ao 90% para a media poboacional μ.




              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Empregaremos o método pivotal

Polo Teorema Central do Límite:
 Como X segue unha distribución normal N(μ,3), a
 variable aleatoria X que a cada unha desas mostras asígnalle a súa
 media mostral
               mi-------› xi
 segue unha distribución normal de media μ e desviación típica
 3/√30=0,55. N(μ,0´55).

 Primeiro trataremos de atopar un intervalo carácterístico (c1,c2)
 desta distribución normal N(μ,0,55) tal que
                       p(c1< X<c2)=0.9.




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Para poder atopar dito intervalo temos que tipificar
 para poder traballar ca N(0,1) que é a única tabulada.
 Se X segue unha distribución N(μ,0.55), a variable
 aleatoria Z=(X-μ)/0.55 segue unha distribución N(0,1):




              c1 − μ X − μ c2 − μ 
            p                     
              0.55 < 0.55 < 0.55  = 0.9
                                  




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
                                                                                                         y                                                                       f(x)=(1/sqr(2*pi))*e^-(x^2/2)



 Lembremos como se calcula un intervalo característico da N(0,1)
                                                                                                0.034
                                                                                                                                                                                 Relleno 2
                                                                                                                                                                                 Relleno 3
                                                                                                0.032                                                                            Relleno 4



para unha probabilidade p=1-α=0.9.
                                                                                                                                                                                 x(t)=-1.65 , y(t)=t
                                                                                                                                                                                 x(t)=1.65 , y(t)=t
                                                                                                 0.03



 Trátase de atopar un intervalo de forma (-k,k) tal que p(-k<z<k)=p=                            0.028


                                        N(0,1)
 =1-α=0.9
                                                                                                0.026


                                                                                                0.024


                                                                                                0.022


                                                                                                 0.02


                                                                                                0.018


                                                                                                0.016


                                                                                                0.014


                                                                                                0.012


                                                                                                 0.01


                                                                                                0.008
                                                                                                                   p(-k<z<k)=p=1-α=0,9

                                                                                                0.006


                                                                                                0.004

                                                                                                                                                            p(z>k)=(1-p)/2=α/2=0.05
         p(z<-k)=(1-p)/2=α/2=0.05                                                               0.002

                                                                                                                                                                                                            x
 -2.8   -2.6   -2.4   -2.2   -2   -1.8    -1.6   -1.4   -1.2   -1   -0.8   -0.6   -0.4   -0.2                0.2   0.4   0.6   0.8   1   1.2   1.4   1.6   1.8   2   2.2   2.4          2.6           2.8
                                         -k                                                     -0.002                                                 k
                                                                                                -0.004
                                                                                                                                p(z≤k)=p+(1-p)/2=1-α+α/2=0.95
                                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

 Empregamos as táboas da N(0,1) para
calcular o valor de k tamén nomeado
como zα/2 tal que p(Z≤k)=p(Z< zα/2 )=0.95.

 Atopamos que é un valor intermedio
entre 1.64 e 1.65 polo que tomamos
1.645.

 K= zα/2=1.645 chámase valor crítico
correspondente á probabilidade p=1-
α=0.9.


 Polo tanto o intervalo característico
sería :
                    (-1.645,1.645)




                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Volvendo ao problema orixinal
  c1 − μ X − μ c2 − μ 
p                     
  0.55 < 0.55 < 0.55  = 0.9
                      
c1 − μ
       = −1.645 c1 = −1.645 ⋅ 0.55 + μ
0.55
c2 − μ
       = 1.645 c2 = 1.645 ⋅ 0.55 + μ
0.55
E como :

p(c1 < X < c2 ) = 0.9
p(μ − 1.645 ⋅ 0.55 < X < μ + 1.645 ⋅ 0.55) = 0.9
pero a min "interésame un intervalo para estimar μ".
Como o consigo?
                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

  Restando μ á desigualdade :
  p(-1.645 ⋅ 0.55 < X - μ < 1.645 ⋅ 0.55) = 0.9
  Restando X á desigualdade :
  p(-1.645 ⋅ 0.55 - X < -μ < 1.645 ⋅ 0.55 - X) = 0.9
  Multiplicando a desigualdade por - 1 :
  p(1.645 ⋅ 0.55 + X > μ > −1.645 ⋅ 0.55 + X) = 0.9
  p(X - 1.645 ⋅ 0.55 < μ < X + 1.645 ⋅ 0.55) = 0.9
  Como temos unha mostra cun resultado da media mostral x = 7 substituímos
  obtendo :
  p(7 - 1.645 ⋅ 0.55 < μ < 7 + 1.645 ⋅ 0.55) = 0.9
  p(6.09525 < μ < 7.90475) = 0.9
  Poderiamos concluír que : O nº medio de horas de sono dos estudantes
   de bacharelato de Galicia está no intervalo
  (6.09525, 7.90475) cun nivel de confianza do 90%.


                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Outra maneira de enfocalo:
X variable aleatoria que segue unha N(μ,σ), μ descoñecida.
Para estimar μ tomamos unha mostra de tamaño n, n≥30 e
calculamos a media mostral
Como calcular un intervalo de confianza para μ ao p·100%=
(1-α)·100%?.
       Pensemos en x como unha estimación puntual de μ.
       Entón X segue unha distribución normal N(x, σ      )
                                                        n
       Calculamos , entón, un intervalo característico para esta distribución
       correspondente a unha probabilidade p = 1 − α.
       Dito intervalo sería :
                      σ             σ 
             x − zα ⋅    , x + zα ⋅   
                   2   n         2   n
       Dito intervalo considérase o intervalo de confianza para μ ó p ⋅ 100% =
       = (1 − α) ⋅ 100%.

                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

Exemplo 2:
Co fin de investigar o cociente de intelixencia medio
dunha poboación estudiantil , pasouse unha proba a 200
estudantes. A media mostral foi de 64 puntos. Por
outra banda, sábese por estudos anteriores que o
cociente intelectual na poboación distribúese
normalmente cunha desviación típica poboacional de 9.3
puntos.
Acha un intervalo de confianza para
a media poboacional do cociente de
intelixencia ao nivel de confianza
do 92%.

            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza

SOLUCIÓN
X = cociente intelectual dun estudante
segue unha distribución normal N( μ,9.3)
Tomamos x como estimación puntual de μ
X segue unha distribución N(64, 9.3)
E como consecuencia
X = media dunha mostra de tamaño 200
                               9.3
segue unha distribución N(64,       ) = N(64, 0.66)
                               200
Calculemos un intervalo característico para esta distribución con
probabilidade 0.92
p(c1 < X < c2 ) = 0.92

                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
 poboación normal da que se coñece a varianza
Tipificamos
  c − 64 X − 64 c2 − 64 
p 1                     
  0.66 < 0.66 < 0.66  = 0.92
                        
E traballamo s cunha N(0,1)
Buscamos o valor crítico zα para p = 1 − α = 0.92
                               2

Se dentro do intervalo característico
hai unha probabilidade 0.92, fóra hai
α = 0.08, e, en cada " cola" 0.04; polo tanto :
p(Z ≤ zα ) = 0.96
        2

Buscamos na táboa obtendo zα = 1.75
                                    2

Polo tanto :
c1 − 64             c − 64
        = −1.75 e 2        = 1.75
 0.66                0.66
c1 = 64 − 1.75 ⋅ 0.66 = 62.8
c2 = 64 + 1.75 ⋅ 0.66 = 65.2
O intervalo de confianza buscado é ( 62.8, 65.2)

                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
 Tamén o podes resolver simplemente empregando a fórmula, unha
 vez sabes de onde se obtén.

 Exemplo 3:
 Un nadador obtén os seguintes tempos, en minutos, en 10 probas
 cronometradas polo seu adestrador:
41.48   42.34   41.95      41.86         41.60         42.04         41.81         42.18         41.72      42.26

 Obter un intervalo de confianza para a marca media desta proba
 cun 95% de confianza, supoñendo que se coñece por outras probas
 que ditas marcas deste nadador seguen unha
 distribución normal con desviación típica de
 0.3 minutos.




                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
Solución:
Neste caso pídese un intervalo de confianza para a marca media
desta proba para dito nadador (μ) sabendo que as súas marcas
seguen unha normal con desviación típica σ=0.3 minutos.
A mostra coa que contamos é de tamaño n=10.
O intervalo de confianza será:

                            σ             σ 
                   x − zα ⋅    , x + zα ⋅   
                         2   n         2   n

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade p=1-α=0.95




               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza
 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95

 Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.

Polo tanto p(Z≤ zα/2)=0.975

E zα/2=1.96




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
 poboación normal da que se coñece a varianza

Calculamos x
     41.48 + 42.34 + 41.95 + 41.86 + 41.60 + 42.04 + 41.81 + 42.18 + 41.72 + 42.26
x=                                                                                 =
                                          10
  419.24
=          = 41.924
     10
e o intervalo de confianza ao 95% quedaría :
          σ              σ 
 x − zα ⋅    , x + zα ⋅    =
       2   n         2    n
                  0.3                    0.3 
 41.924 − 1.96 ⋅       , 41.924 + 1.96 ⋅     =
                    10                    10 
= ( 41.738, 42.11)




                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
6. Intervalo de confianza para a media dunha
poboación normal da que se coñece a varianza



 Na seguinte páxina de internet tes unha
 aplicación onde se calculan este tipo de
 intervalos de confianza.
  http://www.catedu.es/
 matematicas_blecua/bacmat
 /temario/bac2/mas2_estima1.htm


          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Intervalo de confianza para a media dunha
 poboación normal da que “non” se coñece a varianza.

Hai que ter en conta:
Na maioría das ocasións nas que se realiza unha
investigación estatística a varianza poboacional σ é un
parámetro tan descoñecido como a media poboacional µ

A cuasivarianza mostral   2     n        ∑ i     i                                   (x − x )       2
                                                                                                          ⋅f
                           s =       ⋅ s2 = i
é un bo estimador de σ2 .       n −1          n −1
Estimaremos a desviación típica poboacional mediante
ŝ=√ŝ2.


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza




Distinguiremos dous casos:
Se a mostra é pequena n < 30
Se a mostra é grande n ≥ 30




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Se a mostra é pequena n < 30:

 Empregando o método do pivote

 1 Elección do estatístico pivotal:

 Fariamos unha estimación puntual da varianza poboacional mediante a
 cuasivarianza mostral.
 Pero a distribución correspondente a X non é unha N(μ,ŝ/√n) polo que ao
 tipificala non obtemos unha N(0,1).

 Gosset estudou esta variable aleatoria como estimador para calcular
 intervalos de confianza para a media poboacional µ dunha poboación
 normal con σ2 descoñecida :
                                                      X −μ
                                            tn −1   =
                                                      sˆ
                                                         n
 E segue unha distribución chamada t de student con n-1 graos de
 liberdade.
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 A distribución t de Student
con n-1 graos de liberdade ten
unha función de densidade
cunha forma “parecida” a unha
N(0,1) sendo centrada no 0 e
tendo simetría par.
 Esta distribución está
tabulada.
 Calcular un intervalo
característico desta
distribución faise de xeito
similar a como se fai na N(0,1).




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


 2 Formulación do enunciado probabilístico:
 Calculariamos o intervalo característico dunha t de student con
 n-1 graos de liberdade correspondente a unha probabilidade p=1-
 α. Buscariamos na táboa o valor c tal que:
                          1−p       α
     p( tn −1 < c ) = p +     =1−α+
                           2        2
     Temos un intervalo característico ( −c, c) da t de student
     con n - 1 graos de liberdade que cumpre :
                                             
                                     X −μ    
    p( − c < tn −1   < c ) = p − c <      < c = p = 1 − α
                                     sˆ      
                                        n    

                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


3 Transformación do enunciado probabilístico:

  Facendo operacións na desigualdade
  (multiplicar por s , restar X, multiplicar por − 1)
                   ˆ
                     n

  p X − c ⋅ s
   
             ˆ   < μ < X + c⋅ s  = p = 1− α
                              ˆ
                                 
              n                n
  O intervalo de confianza para μ ao p ⋅ 100% = ( 1 − α ) ⋅ 100% será :
          ˆ ,X + c⋅ s 
   X − c⋅ s
                     ˆ 
            n         n


               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Se a mostra é grande n ≥ 30
 Entón a t de student con n-1 graos de liberdade, tn-1 ,
 aseméllase cada vez máis a unha N(0,1) . Polo que se
 traballa directamente coa N(0,1) para obter o intervalo
 característico con probabilidade p=1-α.
 A partir de aquí o problema resólvese igual chegando ao
 intervalo:

                         s
                          ˆ             s 
                                        ˆ
                x − zα ⋅
                            , x + zα ⋅   
                      2   n         2   n
                                          


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
Conclusión:
 Deséxase estimar a media, μ, dunha poboación normal con desviación
 típica, σ, descoñecida.
 Para isto recórrese a unha mostra de tamaño n na que se obtén unha
 media mostral, x.
 Primeiro estímase puntualmente a desviación típica empregando ŝ=√ŝ2
 sendo ŝ2 a cuasivarianza mostral.

• Se o tamaño da mostra é n<30, entón o intervalo de confianza de μ cun
 nivel de confianza de p·100%= (1-α)·100% é:

                                   s
                                    ˆ          s 
                                               ˆ
                            x − c⋅
                                      ,x + c⋅   
                                    n          n
                                                 

 sendo c o valor crítico nunha t de student con n-1 graos de liberdade
 correspondente a unha probabilidade p=1-α


                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


Se o tamaño da mostra é n≥30, entón o intervalo de
confianza de μ cun nivel de confianza de p·100% =
(1-α)·100% é:
                     s
                      ˆ            s 
                                   ˆ
            x − zα ⋅
                       , x + zα ⋅   
                  2  n         2  n

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Exemplo1:
Nunha multinacional de servicios modifícase a
aplicación informática de xestión. Os tempos (en horas)
que tardaron 15 traballadores elixidos ao azar en
adaptarse ao novo sistema foron os seguintes:
3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5,
2.9, 4.7
Determina un intervalo de confianza ao 95% para o
tempo medio de adaptación de todos os empregados da
empresa.



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Solución:
Neste caso pídese un intervalo de confianza para o
tempo medio de adaptación de todos os empregados(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=15<30; polo
tanto, o intervalo de confianza será:

             s
              ˆ         s  
                        ˆ             s
                                      ˆ          s 
                                                 ˆ
      x − c⋅
               ,x + c⋅    = x − c⋅
                                       ,x + c⋅    
             n         n           15         15 
                                                    


 sendo c o valor crítico para unha distribución t de
 student con n-1=14 graos de liberdade correspondente
 a unha probabilidade p=1-α=0.95
              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza
                                                                      xi                      (xi − x)2
Calculamos x :                                                        3.3                   0.2209
    3.3 + 2.9 + ... + 4.7                                             2.9                   0.7569
x=                        =                                           4.3                   0.2809
            15                                                        2.6                   1.3689
  56.6                                                                3.2                   0.3249
=       = 3.77 horas                                                  4.1                   0.1089
   15                                                                 4.9                   1.2769
Calculamos s :
             ˆ                                                        2.8                   0.9409
                                                                      5.5                   2.9929
                ∑ (x − x )
                                  2
                                      ⋅f                              5.3                   2.3409
       n                i               i
                                                                      3.6                   0.0289
s2 =
ˆ         ⋅ s2 = i                                                    3                     0.5929
     n −1          n −1
                                                                      3.5                   0.0729
ˆ 12.9295 = 0.92
s2 =                                                                  2.9                   0.7569
         14                                                           4.7                   0.8649
                                                                                            12.9295
s = 0.92 = 0.96 horas
ˆ

                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Calculamos c, o valor crítico
para unha distribución t de
student con n-1=14 graos de
liberdade correspondente a
unha probabilidade p=1-α = 0.95

 Buscamos os graos de liberdade
en vertical (14) e a
probabilidade p en horizontal
0.95.

C=1.761



               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

O intervalo de confianza será:
           sˆ         s  
                        ˆ               s
                                        ˆ           s 
                                                     ˆ
   x − c⋅
              ,x + c⋅     = x − c⋅
                                         ,x + c⋅     =
            n          n             15          15 
                                                       
                     0.96                   0.96 
   =  3.77 − 1.761 ⋅       , 3.77 + 1.761 ⋅       =
                       15                     15 
   = ( 3.33, 4.21)


O tempo medio de adaptación
está entre 3.33 horas e 4.21 horas
cun nivel de confianza dun 95%
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Exemplo 2:
Para analizar o peso duns botes de conserva,
tómase unha mostra de tamaño 32. Os pesos en
quilogramos obtidos son:
   0.97   0.99        1.01           0.98            0.99           1.00            0.98              0.98
   1.00   1.02        0.97           0.97            0.99           0.99            0.99              0.96
   0.98   1.00        0.99           1.01            1.00           1.00            0.98              0.99
   0.99   0.98        0.97           0.97            1.01           0.96            1.03              0.92


 Calcula o intervalo de confianza ao 95% para o
 peso medio dos botes.
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza


Solución:
Neste caso pídese un intervalo de confianza para o
peso medio en quilogramos duns botes de conserva(μ)
sendo a desviación típica σ descoñecida, que
estimaremos puntualmente por ŝ.
A mostra coa que contamos é de tamaño n=32>30; polo
tanto, o intervalo de confianza será:
                           s
                            ˆ             s 
                                          ˆ
                  x − zα ⋅
                              , x + zα ⋅   
                        2   n         2  n
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α=0.95

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

Calculamos x :                               xi            fi       xi ·fi          (xi − x)2              (xi − x)2 ·f i
     ∑x ⋅f
         i   i
                   31.57                     0.92          1        0.92             0.004489                   0.004489
x=   i
                 =       =                   0.96          2        1.92             0.000729                   0.001458
      N             32
= 0.987 Kg                                   0.97          5        4.85             0.000289                   0.001445
Calculamos s :
           ˆ                                 0.98          6        5.88             0.000049                   0.000294

                   ∑ (x − x)
                                 2           0.99          8        7.92             0.000009                   0.000072
                                     ⋅f
       n           i                   i
                                             1             5        5                0.000169                   0.000845
s =
ˆ2
          ⋅s = i
            2

     n −1          n −1                      1.01          3        3.03             0.000529                   0.001587
     0.013128
s2 =
ˆ              = 0.00042                     1.02          1        1.02             0.001089                   0.001089
         31
                                             1.03          1        1.03             0.001849                   0.001849
s = 0.00042 = 0.206 Kg
ˆ
                                                           32       31.57                                       0.013128


                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.95

 Fóra do intervalo
característico queda α=0.05 e
en cada cola α/2=0.025.

Polo tanto p(Z≤ zα/2)=0.975

E zα/2=1.96



                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
7. Intervalo de confianza para a media dunha
poboación normal da que non se coñece a varianza

O intervalo de confianza será:
                s
                 ˆ             s 
                                ˆ
       x − zα ⋅
                   , x + zα ⋅    =
             2   n         2   n
                       0.206                  0.206 
       0.987 − 1.96 ⋅         ,0.987 + 1.96 ⋅       =
                          32                    32 
      ( 0.916,1.058)
O peso medio dos botes
de conserva está entre
0.916 Kg e 1.058 Kg cun
nivel de confianza do 95%

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción




 Intervalo de confianza para a
 proporción.
 Desexamos atopar un intervalo de confianza
 cun nivel de confianza do p’·100%=(1-α)·100%
 para a proporción p poboacional de certa
 característica C.



           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

 O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a unha mostra de tamaño n, na que se obtén
 unha proporción mostral pr.
 Se x é o número de éxitos nas n probas, entón o estimador é:
                       Pr=X/n
 X=nº de éxitos, en principio, corresponde a unha distribución
 binomial B(n,p)
 p=probabilidade de éxito , μ=np e σ=√npq.

 Pero se np>5 e nq>5 dita binomial aproxímase por unha normal
 N(np,√npq) .

 E neste caso Pr=x/n segue unha distribución normal
 N(np/n, √npq/n)=N(p,√(pq/n))=N(p,√(p(1-p)/n)
               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

2 Formulación do enunciado probabilístico:
 Trataremos de atopar un intervalo característico do estimador que conteña unha
 probabilidade p’=1-α e p(c1<Pr<c2)=p’=1-α, Tipificamos a normal, para traballar cunha
 N(0,1)                              
                                                     
            c −p       Pr − p      c −p
         p 1        <           < 2                   = p'= 1 − α
           p(1 - p)   p(1 - p )   p( 1 - p )         
                                                     
              n          n            n              
         Buscamos na táboa da N(0,1) o valor crítico para p'= 1 − α
                                  α
         p(Z ≤ zα/2 ) = 1 − α +
                                  2
         Entón :
           c1 − p                      c2 − p
                       = −zα/2 e                   = zα/2
           p(1 - p )                   p( 1 - p)
              n                            n
                           p(1 - p )                         p(1 - p )
         c1 = p − zα/2 ⋅               e c2 = p + zα/2 ⋅
                              n                                 n
         Polo tanto :
                                         p(1 - p )                   p(1 - p )     
         p(c1 < Pr < c2 ) = p p − zα/2 ⋅
                                                   < Pr < p + zα/2 ⋅                = p'= 1 − α
                                                                                    
                                            n                           n          
                         IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

3 Transformación do enunciado probabilístico:
Facendo as operacións seguintes na desigualdade conseguimos que p quede no
 medio:
         Restar p :
                    p(1 - p)                   p( 1 - p)   
         p − zα/2 ⋅
                             < Pr - p < zα/2 ⋅              = p'= 1 − α
                                                            
                       n                           n       
         Restar Pr :
                    p(1 - p)                    p(1 - p)      
         p − zα/2 ⋅
                             − Pr < -p < zα/2 ⋅          − Pr  = p'= 1 − α
                                                               
                       n                           n          
         Multiplicar por − 1 :
                  p( 1 - p)                    p( 1 - p)      
         p zα/2 ⋅
                            + Pr > p > −zα/2 ⋅           + Pr  = p'= 1 − α
                                                               
                      n                            n          
                       p(1 - p)                   p( 1 - p) 
         p Pr - zα/2 ⋅
                                < p < Pr + zα/2 ⋅            = p'= 1 − α
                          n                           n    
         Sustituindo Pr polo valor concreto obtido da mostra, o mesmo que p, que non é coñecido
         obtemos como intervalo de confianza ao nivel de confianza dun p'⋅100% = ( 1 − α ) ⋅ 100% :
                      pr(1 - pr)               pr( 1 - pr )   
          pr - zα/2 ⋅            , pr + zα/2 ⋅                
                          n                         n         
                                                              
                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

Conclusión:
 Deséxase estimar a proporción p , de individuos cunha
 certa característica que hai nunha poboación. Para iso
 recórrese a unha mostra de tamaño n, na que se obtén
 unha proporción mostral pr.
 O intervalo de confianza de p cun nivel de confianza
 p’·100%=(1-α)·100% é:

                           pr( 1 - pr )               pr(1 - pr ) 
               pr - zα/2 ⋅              , pr + zα/2 ⋅             
                                n                         n       
                                                                  


 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p’=1-α

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

Exemplo:

 Para estudar a proporción
de estudantes que
practicaban football,
tómase unha mostra de
tamaño 300. O resultado
obtido é que o practican
210. Calcula o intervalo de
confianza para a
proporción p cun nivel de
confianza do 98%.


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción


 Queremos estimar a proporción de estudantes que practican
 football, polo que tomamos unha mostra de tamaño n=300,
 obtendo unha proporción mostral pr=210/300=0.7 (70%).
 Sabemos que o intervalo de confianza para unha proporción p cun
 nivel de confianza do 98% é:
                        pr( 1 - pr )               pr( 1 - pr )            
            pr - zα/2 ⋅              , pr + zα/2 ⋅                         
                             n                          n                  
                                                                           
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade 0.98




                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción

 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p’=1-α = 0.98

 Fóra do intervalo
característico queda α=0.02 e
en cada cola α/2=0.01

Polo tanto p(Z≤ zα/2)=0.99

 zα/2 está entre 2.32 e 2.33,
tomaremos 2.325



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
8. Intervalo de confianza para a proporción



          O intervalo de confianza
  para a proporción de estudantes
  que xogan ao fútbol cun nivel de
  confianza dun 98% será:
               pr( 1 - pr)                  pr(1 - pr ) 
   pr - zα/2 ⋅             , pr + zα/2 ⋅                =
                    n                           n       
                                                        
                     0.7 ⋅ ( 1 − 0.7 )                     0.7 ⋅ ( 1 − 0.7 )   
   0.7 − 2.325 ⋅                       , 0.7 + 2.325 ⋅                         =
                          300                                  300             
                                                                               
  ( 0.64, 0.76)


         O intervalo está entre
  un 64% e un 76%


                               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

Intervalo de confianza para a diferenza de medias.
 Desexamos atopar un intervalo de confianza cun nivel de confianza do
 p·100% = (1-α)·100% para a diferenza de medias
 μ1-μ2 de dúas poboacións sendo as desviacións típicas de ditas poboacións
 coñecidas σ1 e σ2.

O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a dúas mostras de tamaños n1 e n2, nas que se
                                   x
 obteñen dúas medias mostrais x1 e 2 .Empregaremos como
 estimador :
                                            X1 − X2
 A distribución desta variable viuse que correspondía a unha normal
    N(μ1-μ2, √(σ12/ n1 + σ22/ n2 )) se as poboacións iniciais eran
 normais ou se o tamaño das mostras é maior de 30
                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
2 Formulación do enunciado probabilístico:
 Trataremos de atopar un intervalo característico do estimador que conteña unha
 probabilidade p=1-α
           (                      )
          p c1 < X1 − X2 < c2 = p = 1 − α
          Tipificamos para traballar coa N(0,1)
                                                                       
                                                                       
            c1 − ( μ1 − μ2 ) (X1 − X2 ) − ( μ1 − μ2 ) c2 − ( μ1 − μ2 ) 
          p                 <                        <                  = p'= 1 − α
            σ1 + σ 2                σ12 σ2               σ12 σ2 
                  2      2                    2                    2

            n                           +                     +
                 1     n2           n1 n2                n1 n2        
                                                                                                                 α
          Buscamos na táboa da N(0,1) o valor crítico para p = 1 − α; p(Z ≤ zα/2 ) = 1 − α +
                                                                                                                 2
          Entón :
          c1 − ( μ1 − μ2 )               c2 − ( μ1 − μ2 )
                             = −zα/2 e                      = zα/2
               σ
               2
                   σ  2
                                            σ12 σ2
                                                 2
               1
                 +    2
                                               +
               n1 n2                        n1 n2
                                      σ12 σ2
                                           2
                                                                              σ12 σ2
                                                                                   2
          c1 = ( μ1 − μ2 ) − zα/2 ⋅      +      e c2 = ( μ1 − μ2 ) + zα/2 ⋅      +
                                      n1 n2                                   n1 n2
          Polo tanto :
                                                         σ2 σ2                                  σ2 σ2 
          p(c1 < X1 − X2 < c2 ) = p ( μ1 − μ2 ) − zα/2 ⋅ 1 + 2 < X1 − X2 < ( μ1 − μ2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α
                                                         n1 n2                                  n1 n2 
                                                                                                      
                              IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
3 Transformación do enunciado probabilístico
     Facendo operacións na desigualdade conseguimos que μ1 − μ2quede no medio
     Restar μ1 − μ2 :
                σ2 σ2                                    σ2 σ2 
     p − zα/2 ⋅ 1 + 2 < (X1 − X2 ) − (μ1 − μ2 ) < zα/2 ⋅ 1 + 2  = p = 1 − α
                n1 n2                                    n1 n2 
                                                               
     Restar X1 − X2 :
                                                                     
       − z ⋅ σ1 + σ2 − (X − X ) < −(μ − μ ) < z ⋅ σ1 + σ2 − (X − X )  = p = 1 − α
                2    2                               2   2
     p
       α/2 n1 n2          1  2       1   2     α/2
                                                    n1 n2
                                                               1   2
                                                                      
                                                                     
     Multiplicar por − 1 :
              σ2 σ2                                     σ2 σ2             
     p zα/2 ⋅ 1 + 2 + (X1 − X2 ) > (μ1 − μ2 > −zα/2 ⋅ 1 + 2 + (X1 − X2 )  = p = 1 − α
              n1 n2                                     n1 n2             
                                                                          
                           σ2 σ2                                 σ2 σ2 
     p (X1 − X2 ) − zα/2 ⋅ 1 + 2 < μ1 − μ2 < (X1 − X2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α
                           n1 n2                                 n1 n2 
                                                                       
     Substituíndo X1 − X2 polo valor concreto obtido da mostra,
     obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
                                                         2 
      ( x − x ) − z ⋅ σ1 + σ 2 , ( x − x ) + z ⋅ σ 1 + σ 2 
                         2    2                     2

      1 2          α/2
                        n1 n2
                                     1   2     α/2
                                                   n1 n2 
                                                           
                        IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
Conclusión:
 Deséxase estimar a diferenza de medias μ1-μ2 de dúas poboacións con desviacións
 típicas, σ1 e σ2, , coñecidas .
 Para isto recórrese a dúas mostras de tamaños n1 e n2 nas que se obteñen dúas
 medias mostrais.

 Entón, o intervalo de confianza de μ1-μ2 cun nivel de confianza de p·100%= (1-
 α)·100% é:
                              σ12 σ2
                                    2
                                                          σ12 σ2 
                                                               2
              (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   
              1     2     α/2
                               n1 n2                      n1 n2 
                                                                

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α



 Se as desviacións típicas, σ1 e σ2, , non fosen coñecidas, pero o tamaño das dúas
 mostras fose maior de 30 tomariamos no lugar das varianzas poboacionais, as
 cuasivarianzas mostrais, ŝ1 e ŝ2 .


                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

Exemplo:
O tempo en minutos que tardan en reparar certo tipo
de avaría nun taller A segue unha distribución normal
con desviación típica de 25 minutos; mentres nun taller
B a desviación típica é de 30 minutos. Nunha mostra de
10 reparacións dese tipo de avaría no taller A o tempo
medio foi de 80 minutos, mentres que nunha mostra de
15 reparacións en B a media foi de 75 minutos.

 Calcula o intervalo de confianza para a diferenza de
 tempos medios, cun nivel de significación α do 1%.



             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias
Solución:
Neste caso pídese un intervalo de confianza para a diferenza de
tempos medios de reparación dun tipo de avaría entre dous
talleres A e B (μ1-μ2 ) sabendo que o tempo de reparación deste
tipo de avaría segue nos dous talleres unha distribución normal
con desviacións típicas σ1=25 minutos e σ2=30 minutos
respectivamente.
As mostra coas que contamos son de tamaños n1=10 e n2=15;
obténdose nelas tempos medios mostrais de 80 minutos e 75
minutos respectivamente.
Polo tanto, o intervalo de confianza será:
                         σ12 σ2
                               2
                                                     σ12 σ2 
                                                          2
         (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   
           1   2     α/2
                          n1 n2                      n1 n2 
                                                           
 sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha
 probabilidade p=1-α=1-0.1=0.99

               IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza
de medias
 Calculamos zα/2 , o valor crítico
para unha distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.99

 Fóra do intervalo
característico queda α=0.01 e en
cada cola α/2=0.005

Polo tanto p(Z≤ zα/2)=0.995

 zα/2 está entre 2.57 e 2.58,
tomaremos 2.575



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
9. Intervalo de confianza para a diferenza de
medias

O intervalo de confianza para a diferenza de medias quedaría :
                 σ12 σ2
                       2
                                             σ12 σ2 
                                                  2
 (x − x ) − z ⋅     + , (x1 − x2 ) + zα/2 ⋅    +   =
   1   2     α/2
                  n1 n2                      n1 n2 
                                                   
                     252 302                       252 302 
 (80 − 75) − 2.575 ⋅    +    , (80 − 75) + 2.575 ⋅    +    =
                     10   15                       10   15 
                                                           
( − 23.5, 33.5)




                IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

 Intervalo de confianza para a varianza dunha distribución
 normal .
 Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100%=(1-
 α)·100% para a varianza σ2 dunha poboación normal.

O método pivotal
 1 Elección do estatístico pivotal:

 Para iso recórrese a unha mostra de tamaño n, na que se obtén a
 cuasivarianza mostral ŝ .
 Empregaremos como estimador
                                            ˆ
                                    n − 1 ⋅ S2     (           )
                                                           σ2
 Polo Teorema de Fisher sabemos que dita variable aleatoria segue unha
 distribución chi-cadrado con n-1 graos de liberdade
 No seguinte enlace podes observar a forma que ten a función de
 densidade de dita distribución.


                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

2 Formulación do enunciado probabilístico:
Trataremos de atopar un intervalo do estimador que
conteña unha probabilidade p=1-α e que deixe a cada
lado (dúas colas) unha probabilidade (1-p)/2=α/2
   
  p c1 <
          (n − 1) ⋅ S2 < c  = p = 1 - α
                    ˆ
                           
             σ2
                          2
                          
  Buscamos na táboa da chi - cadrado con n - 1 graos de liberdade os valores
  c e c que deixan á súa esquerda probabilidades
   1 2
      1−p α        1−p      α
   de    =    e p+      =1−
       2   2        2       2
  respectivamente.




                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

3 Transformación do enunciado probabilístico
 Facendo as operacións seguintes na desigualdade conseguimos que σ2 quede no
 medio:

      c1 < ( n − 1) ⋅ S < c2  = p = 1 - α
                      ˆ2     
    p
                σ2           
                             
                             c1      ˆ
                                     S2      c 
    Dividir por n - 1 : p         < 2 < 2  = p =1−α
                             n -1 σ        n -1 
                                                
                ˆ          c1       1       c2      
    Dividir por S2 :p             < 2<
                      (n - 1) ⋅ S2 σ
                                                      = p =1−α
                                 ˆ                ˆ2 
                                        (n - 1) ⋅ S 
                     
    Ao inverter as fraccións as desigualdades dan a volta :
                 ˆ
      (n - 1) ⋅ S2                ˆ
                         (n - 1) ⋅ S2                             ˆ
                                                        (n - 1) ⋅ S2                ˆ
                                                                           (n - 1) ⋅ S2 
    p              >σ >
                       2               = p =1−α ;    p              <σ <
                                                                        2                = p =1−α
           c1                c2                            c2                c1      
                                                                                     
                      ˆ
    Substituíndo S2 polo valor concreto obtido da mostra,
    obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :
                ˆ            ˆ
     (n - 1) ⋅ S2 (n - 1) ⋅ S2 
                 ,             
          c2           c1      
                               

                          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

Conclusión:
 Deséxase estimar a varianza σ2 dunha poboación normal.
 Para isto recórrese a unha mostra de tamaño n na que se obtén a
 cuasivarianza mostral ŝ2.

 Entón, o intervalo de confianza de σ2 cun nivel de confianza de p·100%=
 (1-α)·100% é:
                                      ˆ            ˆ
                           (n - 1) ⋅ S2 (n - 1) ⋅ S2 
                                       ,             
                                c2           c1      
                                                     
 sendo c1 e c2 os valores que deixan á esquerda probabilidades
  1−p α         1−p          α
     = e p+         = 1 − α + respectivamente nunha distribución chi-
   2   2        2              2
 cadrado con n-1 graos de liberdade.



                 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza


Exemplo:
 Un fabricante de baterías de coche asegura
 que duran catro anos cunha desviación típica de
 1 ano. Tense unha mostra de cinco baterías que
 duraron 3, 5, 5.8, 6.4, e 8 anos
 respectivamente. Determínese un intervalo de
 confianza ao 99% para a varianza poboacional
 σ2 e indíquese se é valida a afirmación do
 fabricante.


           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

Solución:
 A variable “duración dunha batería de coche de dita marca” segue unha distribución
 normal N(4,1) segundo o fabricante.
 Tomamos unha mostra de 5 baterías obtendo unha media mostral e unha
 cuasivarianza mostral de
         ∑x ⋅fi   i
                          3 + 5 + 5.8 + 6.4 + 8 28.2
    x=    i
                      =                        =     = 5.64 anos
              N                     5            5

               n
                              (
                          ∑ xi − x ⋅ fi  )   2


    s2 =
    ˆ              ⋅ s2 = i
            n −1                n −1

    s =
    ˆ 2     ( 3 - 5.64 ) 2 + ( 5 − 5.64 ) 2 + ( 5.8 − 5.64 ) 2 + ( 6.4 − 5.64 ) 2 + ( 8 − 5.64 ) 2 =
                                                       4

    =
        ( − 2.64 ) 2 + ( − 0.64 ) 2 + 0.162 + 0.762 + 2.362 = 13.552 = 3.39
                                     4                                   4
    s = 3.39 = 1.84 anos
    ˆ
                      IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

 O intervalo de confianza para a varianza poboacional a
 un nivel do 99% (p=1-α=0.99) sería:

                                   ˆ            ˆ
                        (n - 1) ⋅ S2 (n - 1) ⋅ S2 
                                    ,             
                             c2           c1      
                                                  


 Sendo c1 e c2 dous valores que para unha distribución
 chi-cadrada con n-1 =4 graos de liberdade deixan á súa
 esquerda unha probabilidade de 0.005 e 0.995
 respectivamente.


            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza

 Calculamos na táboa da chi-
cadrada de Pearson ditos
valores.

Obtendo c1=0.207 e c2=14.9
 O intervalo de confianza para a
varianza poboacional ao 99%
obtido sería:
                ˆ            ˆ
     (n - 1) ⋅ S2 (n - 1) ⋅ S2 
                  ,            =
          c2           c1      
                               
     4 ⋅ 3.39 4 ⋅ 3.39 
                ,          =
     14.9         0.207 
    ( 0.91, 65.5)

                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
10. Intervalo de confianza para a varianza


 Polo tanto, o intervalo de confianza para a desviación
 típica poboacional obteríase calculando as raíces
 cadradas dos extremos deste; obtendo que a
 desviación típica da duración das baterías estaría entre
 0.95 e 8.09 anos cun nivel de confianza do 99%:

                    (0.95, 8.09)
 Tendo en conta que 1 está no intervalo, a afirmación de
 que a desviación típica da duración das baterias é 1 ano
 pode darse por válida.


             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
Caso                        estimador          Distribución na mostraxe                     Intervalo de confianza

 Intervalo de                                   N(μ,σ/√n)
confianza para a
media μ dunha
poboación normal con                                                                                σ             σ 
                         X                                                                 x − zα ⋅    , x + zα ⋅   
varianza σ2 coñecida                                                                             2   n         2   n
 Intervalo de                                  Si n<30
confianza                                      t de student con n-1 graos                           sˆ          s 
                                                                                                                 ˆ
                                                                                           x − c ⋅− μ , x + c ⋅
                                                                                                 X                
 para a media dunha                 X −μ      de liberdade                                tn −1 =
                                                                                                 sˆ n           n
                         tn −1 =                                                                       n
 poboación normal da                sˆ          Si n≥30
 que “non” se coñece a                 n        Se aproxima a unha N(0,1)                           s
                                                                                                     ˆ             s 
                                                                                                                   ˆ
                                                                                           x − zα ⋅
                                                                                                       , x + zα ⋅   
varianza.
                                                                                                 2   n         2   n
                                                                                                                     
                         X
 Intervalo de                Pr=X/n             N(p,√(p(1-p)/n))
confianza para a                                                                                          pr(1 - pr)               pr(1 - pr) 
                                                                                           pr - z                    , pr + z                 
proporción                                                                                
                                                                                                 α/2
                                                                                                      ⋅
                                                                                                               n              α/2
                                                                                                                                  ⋅
                                                                                                                                        n      
                                                                                                                                               
                                                                                                                                                


 Intervalo de                                   N(μ1-μ2, √(σ12/ n1 + σ22/ n2 ))                                                                2 
                                                                                           (x1 − x2 ) − z ⋅ σ1 + σ 2 , (x1 − x2 ) + z ⋅ σ1 + σ 2 
                                                                                                               2    2                      2


confianza para a                                                                                                                         n1 n2 
                                                                                                          α/2                         α/2
                                                                                                             n1 n2                               
diferenza de medias       X1 − X2

                                                                                           (n -1) ⋅S2 (n -1) ⋅ S2 
                                                                                                   ˆ           ˆ 
 Intervalo de                                  Chi-cuadrada con n-1 graos                             ,
                             (n − 1) ⋅ S2
                                                                                               c          c       
confianza para a                       ˆ      de liberdade                                
                                                                                                2          1      
                                                                                                                   
varianza                         σ2

                         IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
11. Erro máximo admisible

Erro máximo admisible:
 O erro máximo admisible nunha estimación,
 empregando un intervalo de confianza con un
 nivel de confianza p=1-α, é o radio de dito
 intervalo de confianza.
 O erro depende do tamaño da mostra n e do
 nivel de confianza p=1-α.
•Canto maior é a mostra, menor é o erro
 cometido.
•Canto maior é o nivel de confianza, maior é zα/2
 ou similar e, polo tanto, tamén o erro.

           IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
11. Erro máximo admisible

 Caso                                                   Erro máximo admisible
 Intervalo de confianza para a media μ
                                                                               σ
 dunha poboación normal con varianza σ2
                                                                          zα ⋅
                                                                                n
 coñecida
                                                                            2

 Intervalo de confianza                                 Si n<30
                                                                                  s
                                                                                  ˆ
 para a media dunha                                                            c⋅
                                                                                  n
 poboación normal da                                    Si n≥30                  s
                                                                                 ˆ
 que “non” se coñece a varianza.                                            zα ⋅
                                                                              2   n
 Intervalo de confianza para a proporción                                       pr(1 - pr )
                                                                      zα/2 ⋅
                                                                                    n
 Intervalo de confianza para a diferenza                                     σ12 σ2
                                                                                  2
 de medias                                                            zα/2 ⋅    +
                                                                             n1 n2
                  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

Tamaño da mostra :

 Nalgúns casos, podemos fixar o erro máximo
 admisible e o nivel de confianza p=1-α para o noso
 intervalo de confianza, e calcular a partir deles o
 tamaño mínimo de mostra que necesitamos para que se
 cumpran ditas condicións despexando n na fórmula do
 erro máximo admisible.




            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

Caso                             Erro máximo                                 Tamaño da mostra
                                 admisible


Intervalo de confianza para
a media μ dunha poboación                                                                                                 2
normal con varianza σ2                       σ                                         zα ⋅ σ             zα ⋅ σ 
                                    E = zα ⋅
coñecida
                                          2   n                                 n=         2
                                                                                                    ⇒n =  2 
                                                                                           E              E 
                                                                                                                 

Intervalo de confianza para                                                                          pr ⋅ (1 − pr )
a proporción                                                                      n = zα ⋅                            ⇒
                                             pr(1 - pr )                                       2     E
                                  E = zα/2 ⋅                                          zα ⋅ pr ⋅ (1 − pr )
                                                                                       2
                                                 n
                                                                               n=         2
                                                                                                   E2
                     IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

 Exemplo 1:
    Tomouse unha mostra aleatoria de 100 individuos
    aos que se lles preguntou pola cantidade de cartos
    que tiñan na súa carteira, obténdose unha media
    mostral de 110€. Sábese que a desviación típica da
    poboación é de 20 €.
 a) Obtén o intervalo de confianza ao 90 % para a
    cantidade media de cartos que leva na carteira a
    poboación.
 b) Cal é o erro máximo cometido na estimación
    anterior?
 c) Se desexamos que o erro cometido, co mesmo nivel
    de confianza, sexa a décima parte do erro calculado
    no apartado anterior, cal debe de ser o tamaño da
    mostra?.
            IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

Solución apartado a):
Neste caso pídese un intervalo de confianza para a
cantidade media de cartos que leva na carteira un
individuo dunha poboación (μ) sabendo que dita
cantidade ten unha desviación típica σ=20€.
A mostra coa que contamos é de tamaño n=100.
O intervalo de confianza será:

                          σ             σ 
                 x − zα ⋅    , x + zα ⋅   
                       2   n         2   n

 sendo zα/2 o valor crítico nunha N(0,1) correspondente a
 unha probabilidade p=1-α=0.9

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción
 Calculamos zα/2 , o valor
crítico para unha
distribución N(0,1)
correspondente a unha
probabilidade p=1-α = 0.9

 Fóra do intervalo
característico queda α=0.1
e en cada cola α/2=0.05.

Polo tanto, p(Z≤ zα/2)=0.95

      E zα/2=1.645

             IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción
  Como x = 110€
  o intervalo de confianza ao 90% quedaría :
             σ             σ                   20                  20 
   x − zα ⋅     , x + zα ⋅    =  110 − 1.645 ⋅     , 110 + 1.645 ⋅     =
         2    n         2   n                  100                 100 
  = ( 110 - 3.29, 110 + 3.29) = ( 106.71,113.29 )
  Solución ao apartado 2)
          σ
  E = zα ⋅   = 3.29
       2   n
  Solución ao apartado 3)
                                                          3.29
  Desexamos que o erro máximo sexa de                          = 0.329
                                                           10
              2
      zα ⋅ σ   1.645 ⋅ 20 2
  n= 2  =                    = 10000
      E   0.329          
             
  A mostra debe ser como mínimo de 10000 persoas.

                   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

Exemplo 2:
Deséxase facer unha enquisa nos fogares da
Galicia interior co fin de determinar o consumo
de sal iodado nunha campaña para a
erradicación do bocio. Existe o convencemento,
baseado nos resultados de certas
investigacións de mercado, de que a porcentaxe
de fogares que consomen tal tipo de sal non
chega ao 30%. Cun nivel de confianza do 99% e
un erro na estimación de 0.05, cal debe ser o
tamaño da mostra?

          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción




          IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
12. Tamaño da mostra para a estimación da
media e da proporción

Solución :
O tamaño mínimo da mostra para un erro máximo de 0.05, e un nivel
de confianza do 99% , tendo en conta a estimación previa do 30%
para a proporción da poboación que consome sal iodado é :
   zα ⋅ pr ⋅ (1 − pr )
    2
                   2.582 ⋅ 0.3 ⋅ ( 1 − 0.3)
n= 2             =                          = 559.1376
        E 2
                          0.05   2


sendo zα o valor crítico correspondente a p = 1 − α = 0.99
          2



Polo tanto, teriamos que tomar unha mostra de polo menos 560 fogares.




                    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.

10.estimacióndeparámetros

  • 1.
    MÉTODOS ESTATÍSTICOS E NUMÉRICOS UNIDADE 10 ESTIMACIÓN DE PARÁMETROS ÍNDICE IES Isidro Parga Pondal. Departamento de matemáticas
  • 2.
    CONTIDOS Tipos de estimación. Estimaciónpuntual. Características dos estimadores puntuais. Estimadores puntuais: media mostral e proporción mostral. Intervalo de confianza. Intervalo de confianza para a media dunha poboación normal da que se coñece a varianza. Intervalo de confianza para a media dunha poboación normal da que non se coñece a varianza. Intervalo de confianza para a proporción. Intervalo de confianza para a diferenza de medias. Intervalo de confianza para a varianza dunha poboación normal. Erro máximo admisible. Tamaño da mostra para a estimación da media e da proporción. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 3.
    Introdución Observa estes tresproblemas, correspondentes a situacións parecidas pero moi distintas: Problema 1: X A media de idade das alumnas e alumnos que se presentan á selectividade é de 18.1 anos; e unha desviación típica de 0.5 anos. Eliximos ao azar unha mostra de 80 alumnos/as, cal é a probabilidade de que a media de idade da mostra estea entre 17.9 e 18.3? Sabemos: Queremos saber: A media μ da poboación, que é 18.1 A media X dunha mostra. p(17.9< X <18.3)? Coñecemos a poboación e pretendemos deducir o comportamento das mostras. Isto viuse no tema anterior baseándonos no teorema central do límite. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 4.
    Introdución Problema 2: A idade media dunha mostra de 80 alumnos/as que se presentan a selectividade é de 18.1 anos. Cal é a probabilidade de que a media de todos os alumnos que se presentan á selectividade estea entre 17.9 e 18.3 anos? Sabemos: Queremos saber: A media X dunha mostra: X X =18.1 A media μ da poboación. p(17.9<μ<18.3)? Coñecemos unha mostra, e pretendemos deducir aspectos da poboación. Pretendemos inferir ou estimar o valor da media poboacional a partir do valor da media mostral. Este é o tema da presente unidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 5.
    Introdución Problema 3: Está admitido como certo que a idade media dos alumnos/as que se presentan á selectividade é de 18.1. Para comprobalo tomouse unha mostra de 80 alumnos/as que se presentan á selectividade e calculouse a súa media, obtendo 18.3. É razoable admitir como válida a hipótese inicial de que μ=18.1? Sabemos: Queremos saber: A media dunha mostra: X =18.3 É admisible a afirmación de que a media da poboación é μ=18.1? Temos unha afirmación ou hipótese, pero sen garantías de certeza. Para contrastalo, tomamos unha mostra, e a partir do resultado desta, decidimos se a hipótese é ou non é admisible. Este problema corresponde á chamada teoría da decisión ou contraste de hipótese que veremos na seguinte unidade IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 6.
    Introdución Nota : Ao traballarcon mostras, hai que diferenciar entre: Os parámetros observados na mostra, chamados parámetros estatísticos ou simplemente estatísticos. Os parámetros reais correspondentes á poboación, chamados parámetros poboacionais ou simplemente parámetros. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 7.
    Introdución Estimaciónde Parámetros Parámetros: Parámetros poboacionais e Estatísticos Mostrais H to r m d laP b c n is g a a e o la io Media (µ ) 10 6 10 4 Varianza(σ 2) 10 2 Datos re u n ia 10 0 Desv. Est. (σ ) F cec 80 (Poboación de Interese) 6 4 0 0 Etc. 20 0 -4 -2 0 C ss la e 2 4 Inferencias Histograma de la Muestra Mostraxe 16 Estatísticos: 14 12 Termo medio( X ) Frecuencia 10 Mostras 8 Varianza mostral(S2) 6 4 Desv. Est. mostral(S) 2 0 -4 -2 0 Clases 2 4 Etc. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 8.
    1. Tipos deestimación Puntual: Trátase de estimar un parámetro da poboación a partir dun estatístico obtido dunha mostra dela, dando un único valor como aproximación do parámetro poboacional. Tipos de Por intervalos de confianza: estimación: A partir dunha mostra aleatoria de tamaño n podemos estimar o valor dun parámetro da poboación dando un intervalo dentro do cal confiamos que estea o parámetro, intervalo de confianza, e calculando a probabilidade de que tal cousa ocorra; a dita probabilidade chamámoslle nivel de confianza. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 9.
    2. Estimación puntual Estimaciónpuntual: Ao estimar un parámetro poboacional por estimación puntual poden considerarse, en principio, varios estatísticos. Exemplo: Para estimar a media poboacional μ podemos utilizar a media mostral x, pero tamén outros estatísticos, como mediana, moda... Debemos, polo tanto, facer un estudo para saber que estatístico proporciona unha estimación máis fiable do parámetro poboacional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 10.
    2. Estimación puntual Para controlar a fiabilidade da estimación proporcionada por un estatístico, definimos o concepto de estimador: Chamamos estimador S dun parámetro poboacional λ a unha variable aleatoria que a cada unha das mostras dun certo tamaño n da poboación asócialle o valor dun estatístico dado con valores aproximados ao parámetro poboacional λ que desexamos estimar. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 11.
    2. Estimación puntual Exemplo: Nun edificio viven 6 nenos de idades: Nenos Celia Raquel María Alex Marta Xoán Idades 5 7 8 6 1 8 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 12.
    2. Estimación puntual Podemos polo tanto coñecer a idade media da poboación de nenos do edificio que sería: μ =(5+7+8+6+1+8)/6=5.83 Pero un veciño do edificio non coñece as idades de todos os nenos así que decide estimar cal é a idade media dos nenos do edificio preguntándolle a idade a tres dos nenos e calculando a media de idade de dita mostra. O parámetro media poboacional intenta estimarse mediante un estatístico dunha mostra de tres elementos que é a media mostral. Pero, o valor obtido deste xeito, realmente se aproxima á media poboacional? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 13.
    2. Estimación puntual Para controlar a fiabilidade da estimación, recorremos ao estudo do seguinte estimador: Experimento aleatorio = obtención dunha mostra de tamaño 3. Definimos unha variable aleatoria que a cada mostra de tres nenos asígnalle a idade media da mostra. X =idade media mostral dunha mostra de tamaño 3 Mos Celia Celia Celia Celia Celia Celia Celia Celia Celia Celia tras Raquel e Raquel e Raquel e Raquel e María e María e María e Alex e Alex e Marta e María Alex Marta Xoán Alex Marta Xoán Marta Xoán Xoán x 6.67 6 4.33 6.67 6.33 4.33 7 4.33 6.33 4.67 Mos Raquel Raquel Raquel Raquel Raquel Raquel María María María Alex tras María e María e María e Alex e Alex e Marta e Alex e Alex e Marta e Marta e Alex Marta Xoán Marta Xoán Xoán Marta Xoán Xoán Xoán x 7 5.33 7.67 4.67 7 5.33 5 7.33 5.67 5 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 14.
    2. Estimación puntual xi p( X =xi) 4.33 3/20 Trátase dunha variable 4.67 2/20 aleatoria discreta coa 5 2/20 seguinte función masa de 5.33 2/20 probabilidade 5.67 1/20 6 1/20 6.33 2/20 6.67 2/20 7 3/20 7.33 1/20 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 15.
    3. Características dosestimadores puntuais Nun estimador considéranse desexables as seguintes características: • Ausencia de nesgo • Eficiencia • Consistencia para considerar fiable a estimación correspondente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 16.
    3. Características dosestimadores puntuais Ausencia de nesgo Observa as seguintes figuras onde se representa o valor real do parámetro poboacional a estimar λ e os valores que toman certos estimadores f(x)=8 correspondentes a certos tamaños de mostra e a certos estatísticos que f(x)=4 f(x)=0 Serie 1 poderiamos empregar. Serie 2 λ λ λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 17.
    3. Características dosestimadores puntuais No primeiro caso os valores do estimador están arredor de λ mentres no segundo caso a maior parte son maiores λ e no terceiro son maioritariamente menores ca λ. A nós interésanos que os valores do estimador se repartan ao redor de λ, coma no primeiro caso. Isto dáse cando a súa esperanza está próxima ao valor de λ e cando isto sucede dise que o estimador é non esguellado. Dise que un estimador S dun parámetro λ é non esguellado se a súa esperanza μS coincide con λ. Se μS< λ , dise que ten nesgo negativo (caso 3) Se μS> λ , dise que ten nesgo positivo (caso 2) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 18.
    3. Características dosestimadores puntuais Exemplo: Lembrades o exemplo de estimador que puxemos ? Fixádevos no valor da idade media da poboación de nenos do edificio e nos valores que toma o estimador X f(x)=0 Serie 1 que son as idades medias das mostras de tres Serie 2 elementos que podemos tomar nesta poboación. Pensades que é ou non esguellado? 4.2 4.4 4.6 4.8 5 5.2 5.4 5.6 5.8 6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 7.8 λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 19.
    3. Características dosestimadores puntuais Se no noso exemplo calculamos a esperanza do estimador X obtemos: μX = ∑ xi ⋅ pi = i 3 2 2 2 1 1 = 4.33 ⋅ + 4.67 ⋅ +5⋅ + 5.33 ⋅ + 5.67 ⋅ + 6⋅ + 20 20 20 20 20 20 2 2 3 1 1 + 6.33 ⋅ + 6.67 ⋅ +7⋅ + 7.33 ⋅ + 7.67 ⋅ = 20 20 20 20 20 = 5.83 = idade media dos nenos do edificio IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 20.
    3. Características dosestimadores puntuais Eficiencia dun estimador Pero observa agora os valores que toman estes dous estimadores f(x)=8 non esguellados do mesmo parámetro poboacional λ. f(x)=4 Serie 1 Cal cres ti que deberiamos empregar se queremos un resultado Serie 2 fiable?. λ λ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 21.
    3. Características dosestimadores puntuais Loxicamente nos quedariamos co segundo, pois os valores que toma o estatístico están máis concentrados arredor de λ. Isto ocorre cando a desviación típica do estimador é menor; e dise que dito estimador é máis eficiente. De entre dous estimadores, dicimos que é máis eficiente o que ten menor varianza ou desviación típica. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 22.
    3. Características dosestimadores puntuais Exemplo: Os 4 fillos dunha familia estudan 1,2,3,4 horas diarias respectivamente. Se desexásemos estimar o nº medio de horas de estudo diario dos nenos desta familia mediante unha mostra de tamaño 3, que estimador dos dous seguintes é máis eficiente? X =media mostral dunha mostra de tamaño3 Me=mediana dunha mostra de tamaño 3. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 23.
    3. Características dosestimadores puntuais As posibles mostra de tamaño 3 daríannos os seguintes resultados: Calculemos as esperanzas destas Mostras x Me variables aleatorias (estimadores) para ver se teñen ou non nesgo (1,2,3) 2 2 μX = (2 + 2.33 + 2.67 + 3)/4 = 2.5 μMe = (2 + 2 + 3 + 3)/4 = 2.5 (1,2,4) 2.33 2 O nº medio de horas de estudo da poboación formada polos 4 nenos (1,3,4) 2.67 3 era: μ = (1 + 2 + 3 + 4)/4 = 2.5 (2,3,4) 3 3 Como μ = μX = μMe ambos estimadores son non esguellados. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 24.
    3. Características dosestimadores puntuais Cal é máis eficiente? Pois aquel que teña menor varianza. Ao calculalas podemos ver que a media mostral ten unha varianza máis baixa polo que é un estimador máis eficiente que a mediana. 1 1 1 1 σ X = ∑ xi ⋅ pi − x = 22 ⋅ 2 2 + 2.332 ⋅ + 2.67 2 ⋅ + 32 ⋅ − 2.52 = 0.13 i 4 4 4 4 2 1 1 σ Me = 22 ⋅ + 32 ⋅ − 2.52 = 0.25 2 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 25.
    3. Características dosestimadores puntuais Consistencia dun estimador Intuitivamente canto maior é a mostra elixida, máis próxima debería estar a estimación realizada dun parámetro ao valor real do parámetro. Dicimos que un estimador é consistente se a probabilidade de que estean moi próximos a estimación e o parámetro poboacional aumenta e tende a 1 ao incrementarse o tamaño da mostra. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 26.
    3. Características dosestimadores puntuais Conclusión: Un estimador é bo se é non esguellado, o máis eficiente posible e consistente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 27.
    4. Estimadores puntuais:media mostral e proporción mostral A elección do estimador máis axeitado en cada caso excede o nivel deste curso. Abondará con saber: •A media poboacional μ aproxímase pola media mostral x A mediana . tamén é un estimador non esguellado para a media poboacional pero menos eficiente que a media mostral. •A varianza poboacional σ2 aproxímase pola cuasivarianza mostral ŝ2 que se define como: ˆ2 = n ⋅ s2 s n −1 Parece que o estimador máis adecuado debería ser a varianza mostral, pero pode demostrarse que non é así. •A proporción poboacional aproxímase por a proporción mostral. •A diferenza de medias de dúas poboaciones μ1-μ2 aproxímase pola diferenza de medias mostráis x1 − x 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 28.
    4. Estimadores puntuais:media mostral e proporción mostral Exemplo 1: Das 25 aulas dun centro educativo escolléronse 5 ao chou, e contouse o número de alumnos da clase, obténdose os seguintes resultados: 33, 27, 19, 34, 30. Estima o número total de alumnos do centro. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 29.
    4. Estimadores puntuais:media mostral e proporción mostral Solución: Estimaríamos o nº medio de alumnos por aula no centro escolar calculando o nº medio de alumnos nas 5 aulas que se tomaron como mostra. Como a media mostral da (33+27+19+34+30)/5= 28,6 consideramos que o nº medio de alumnos por aula no centro escolar é 28.6 e, polo tanto, estimariamos que o número total de alumnos no centro escolar é de 25·28,6=715 alumnos IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 30.
    4. Estimadores puntuais:media mostral e proporción mostral Exemplo 2: Entre os estudantes dunha cidade escolléronse 150 ao azar e preguntóuselles se estaban de acordo co actual sistema de acceso á universidade. 40 responderon que si. Estímese a proporción de alumnos de dita cidade que están de acordo co sistema de acceso á universidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 31.
    4. Estimadores puntuais:media mostral e proporción mostral Solución: A proporción mostral é un bo estimador da proporción poboacional, así que calculamos a proporción de alumnos da mostra que responderon afirmativamente e considerámola como proporción poboacional. 40 de 150 é un 26,67% Estimamos que un 26,67% da poboación está de acordo co sistema de acceso á universidade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 32.
    5. Intervalo deconfianza A estimación puntual serve de pouco mentres descoñezamos cal é o grao de aproximación entre o estatístico mostral e o parámetro poboacional. A estimación puntual non nos indica o erro cometido en dita estimación. O razoable na práctica é incluír, xunto á estimación puntual do parámetro, un certo intervalo numérico que mida a marxe de erro que, de acordo coas observacións mostrais, poda ter dita estimación. A idea de intervalo de confianza é propór un rango de valores entre os que posiblemente se encontre o verdadeiro valor do parámetro. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 33.
    5. Intervalo deconfianza Por este motivo recórrese á estimación por intervalos. A partir dunha mostra de tamaño n podemos estimar o valor dun parámetro da poboación do seguinte modo: Dando un intervalo dentro do cal confiamos que estea o parámetro, chamado intervalo de confianza. •Calculando a probabilidade de que tal cousa ocorra. A dita probabilidade chámaselle nivel de confianza que se nomea como p=1-α sendo α o nivel de significación. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 34.
    5. Intervalo deconfianza Supoñamos que para estimar unha media poboacional μ tomamos unha mostra de tamaño n e a partir dela construímos un intervalo de confianza ao 90% para μ. É dicir, o nivel de confianza é 0,9 e o nivel de significación 0,1. No intervalo calculado pode ou non estar realmente μ. Nin sequera podemos dicir que μ está no intervalo calculado cunha probabilidade do 90%. Só podemos falar de que o intervalo contén a μ cunha confianza do 90%. Que significa entón nivel de confianza do 90%? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 35.
    5. Intervalo deconfianza Se construímos moitos intervalos de confianza para μ cun nivel de confianza do 90% μ O 90% de ditos intervalos de confianza conterán a media poboacional. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 36.
    5. Intervalo deconfianza Nota: Como polo xeral só vamos a dispór dunha mostra, temos que contar (por exemplo cun 90% de confianza) que a mostra que temos pertence ao grupo das mostras boas (as que nos dan unha estimación do intervalo que contén o verdadeiro valor do parámetro). IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 37.
    5. Intervalo deconfianza Para o cálculo de intervalos de confianza é importante coñecer que é un intervalo característico e como calculalo Intervalos característicos : Se unha variable aleatoria X ten unha distribución de esperanza ou media μ, chámase intervalo característico correspondente a unha probabilidade p a un intervalo centrado na media (μ-k, μ+k) tal que a probabilidade de que X pertenza a dito intervalo é p p(μ-k < X < μ+k)=p IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 38.
    5. Intervalo deconfianza Intervalos característicos en distribucións N(0,1) Exemplo: Calcula o intervalo característico dunha variable aleatoria Z que segue unha distribución normal N(0,1) correspondente á probabilidade p=0.9. Trátase de atopar un intervalo centrado na media μ=0 e polo tanto da forma (-k, k) que conteña unha probabilidade de 0.9. Fóra do intervalo haberá unha probabilidade de 1-p=1-0.9=0.1. Como o intervalo é simétrico , a área ou probabilidade de cada “cola” é de 0.1/2=0.05 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 39.
    5. Intervalo deconfianza. y f(x)=(1/sqr(2*pi))*e^-(x^2/2) 0.034 Relleno 2 Relleno 3 0.032 Relleno 4 x(t)=-1.65 , y(t)=t x(t)=1.65 , y(t)=t 0.03 0.028 0.026 N(0,1) 0.024 0.022 0.02 0.018 0.016 0.014 0.012 0.01 0.008 p(-k<z<k)=p=1-α=0,9 0.006 0.004 p(z>k)=(1-p)/2=α/2=0.05 p(z<-k)=(1-p)/2=α/2=0.05 0.002 x -2.8 -2.6 -2.4 -2.2 -2 -1.8 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 -k -0.002 k -0.004 p(z≤k)=p+(1-p)/2=1-α+α/2=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 40.
    5. Intervalo deconfianza Vemos , entón, que p(Z≤k)=0.95 E recorremos á táboa da distribución N(0,1) para atopar o valor de k correspondente á probabilidade 0.95 K é un valor entre 1.64 e 1.65; polo que tomamos o punto medio 1.645 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 41.
    5. Intervalo deconfianza O intervalo característico para unha variable aleatoria Z que segue unha distribución normal N(0,1) correspondente a unha probabilidade p= 0.9 sería: (-1.645, 1.645) Diremos que k=1.645 é o valor crítico correspondente a p=0.9. Habitualmente desígnase a probabilidade p mediante 1- α. O valor crítico correspondente denomínase zα/2 téndose as desigualdades: p(Z> zα/2 )=α/2 p(-zα/2 <Z< zα/2 )=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 42.
    5. Intervalo deconfianza Intervalos característicos en distribucións N(μ,σ) Sexa X unha variable aleatoria que segue unha distribución N(μ,σ). Desexamos encontrar un intervalo centrado na media μ, (μ-k, μ+k) tal que p(μ-k<X<μ+k)=p=1-α. É dicir, un intervalo no que estea o (1-α).100% dos individuos da poboación. Se X é N(μ,σ) entón Z=(X-μ)/σ é N(0,1). Calculariamos o intervalo característico para Z correspondente a p=1-α que sería (-zα/2 , zα/2 ) . Polo tanto: p(-zα/2 <Z< zα/2 )=p (-zα/2 < (X-μ)/σ < zα/2 )=p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 43.
    5. Intervalo deconfianza Multiplicando toda a desigualdade pola desviación típica σ e sumando a toda a desigualdade a esperanza ou media μ temos: p(μ- zα/2 ·σ < X < μ+ zα/2 ·σ )=p=1-α O intervalo característico será : (μ- zα/2 ·σ , μ+ zα/2 ·σ ) Exemplo: Calcula o intervalo característico para unha distribución N(3,2) correspondente a unha probabilidade p=1-α=0.9. Calculariamos o valor crítico para a N(0,1) correspondente a unha probabilidade 0.9 . zα/2 =1.645 O intervalo característico sería (3-1.645·2, 3+1.645·2) = (-0.29 , 6.29) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 44.
    5. Intervalo deconfianza O método pivotal para o cálculo de intervalos de confianza Fixado un nivel de confianza p=1-α (0 < p < 1), o procedemento xeral para a construción dun intervalo de confianza ao nivel p=1-α para un parámetro de interese λ desenvólvese de acordo co seguinte mecanismo: 1 Elección do estatístico pivotal: Elíxese un estatístico que dependa só do parámetro que se desexa estimar e cuxa distribución sexa coñecida T. 2 Formulación do enunciado probabilístico: Preséntase un enunciado probabilístico tendo en conta a distribución de probabilidade do estatístico elixido na etapa anterior e o valor p=1-α fixado como nivel de confianza, é dicir, determínanse constantes a e b tales que: P (a < T < b) = p=1-α ou dito doutro xeito, calcúlase un intervalo característico de T para unha probabilidade p. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 45.
    5. Intervalo deconfianza 3 Transformación do enunciado probabilístico: Se é posible despexar da expresión anterior, transfórmase o enunciado probabilístico noutros equivalentes, mediante operacións aritméticas, ata chegar a unha expresión na que o parámetro de interese figure só no centro da desigualdade. Dependendo das operacións aritméticas a realizar podemos obter: P (T-1(a)< λ < T-1(b))= p=1-α P (T-1(b)< λ < T-1(a))= p=1-α Calculando o valor do estimador T nun caso concreto e sustituíndo este dato no intervalo probabilístico construído anteriormente obtense o intervalo de confianza para λ con un nivel de confianza p=1-α. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 46.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Método pivotal aplicado ao cálculo dun intervalo de confianza para a media dunha poboación normal con varianza coñecida Caso xeral. X variable aleatoria que segue unha N(μ,σ), μ descoñecida. Para estimar μ tomamos unha mostra de tamaño n, n≥30 e calculamos a media mostral Como calcular un intervalo de confianza para μ ó p·100%= (1-α)·100%? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 47.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza 1 Elección do estatístico pivotal : Sabemos polo teorema central do límite que X = media mostral dunha  σ  mostra de tamaño n segue unha distribución N μ,  se a poboación  n partida X é normal ou se o tamaño das mostras é n ≥ 30 . 2 Formulació n do enunciado probabilístico : Intentemos calcular un intervalo característico nesta distribución con probabilidade p = 1 - α. p(c1 < X < c2 ) = p = 1 − α Tipificamos para pasar a unha normalN(0, 1).    c1 − μ X − μ c2 − μ  p < <  = p =1−α  σ σ σ   n n n Calculamos o intervalo característico da normal N(0,1) para unha probabilidade p = 1 - α. Para isto calculamos o valor crítico zα para esta probabilidade p = 1 - α. 2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 48.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Temos entón c1 − μ c2 − μ = −zα e = zα σ 2 σ 2 n n σ σ c1 = −zα ⋅ + μ e c2 = zα ⋅ +μ 2 n 2 n e polo tanto ( ) p c1 < X < c2 = p = 1 − α ⇒  p − zα ⋅ σ n + μ < X < zα ⋅ σ n  + μ = p = 1 − α  2 2  3 Transform ación do enunciado probabilístico : E facendo as seguintes operacións na desigualdade : restar μ, restar X e multiplicar por − 1 , chegamos a :  σ σ  p X − zα ⋅ < μ < X + zα ⋅  = p =1−α  2 n 2 n Substituímos X polo valor concreto obtido da mostra e temos que o intervalo de confianza ao p ⋅ 100% = ( 1 - α ) ⋅ 100% para μ será :  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 49.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Conclusión: Deséxase estimar a media, μ, dunha poboación con desviación típica, σ, coñecida. Para isto recórrese a unha mostra de tamaño n na que se obtén unha media mostral, x. Se a poboación de partida é normal ou se o tamaño da mostra é n≥30, entón o intervalo de confianza de μ cun nivel de confianza de p·100%= (1-α)·100% é:  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 50.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Vexamos o feito nun exemplo concreto: Os estudantes de bacharelato de Galicia dormen un número de horas diarias que se distribúe segundo unha lei normal de media μ descoñecida e de desviación típica 3. A partir dunha mostra de tamaño 30 obtívose unha media mostral igual a 7 horas. Obtén un intervalo de confianza ao 90% para a media de horas de sono, μ. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 51.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Partimos da seguinte situación: Poboación: Alumnos de bacharelato de Galicia. Variable aleatoria: X=nº de horas diarias de sono dun alumno de bacharelato de Galicia, que segue unha distribución normal de media μ descoñecida e desviación típica 3; N(μ,3). Desexamos estimar a media poboacional μ para o que tomamos unha mostra de tamaño 30 e calculamos o estatístico media mostral, que sabemos é un estimador non esguellado da media poboacional, obtendo x =7. Pero non desexamos facer unha estimación puntual senón dar un intervalo de confianza ao 90% para a media poboacional μ. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 52.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Empregaremos o método pivotal Polo Teorema Central do Límite: Como X segue unha distribución normal N(μ,3), a variable aleatoria X que a cada unha desas mostras asígnalle a súa media mostral mi-------› xi segue unha distribución normal de media μ e desviación típica 3/√30=0,55. N(μ,0´55). Primeiro trataremos de atopar un intervalo carácterístico (c1,c2) desta distribución normal N(μ,0,55) tal que p(c1< X<c2)=0.9. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 53.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Para poder atopar dito intervalo temos que tipificar para poder traballar ca N(0,1) que é a única tabulada. Se X segue unha distribución N(μ,0.55), a variable aleatoria Z=(X-μ)/0.55 segue unha distribución N(0,1):  c1 − μ X − μ c2 − μ  p   0.55 < 0.55 < 0.55  = 0.9   IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 54.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza y f(x)=(1/sqr(2*pi))*e^-(x^2/2) Lembremos como se calcula un intervalo característico da N(0,1) 0.034 Relleno 2 Relleno 3 0.032 Relleno 4 para unha probabilidade p=1-α=0.9. x(t)=-1.65 , y(t)=t x(t)=1.65 , y(t)=t 0.03 Trátase de atopar un intervalo de forma (-k,k) tal que p(-k<z<k)=p= 0.028 N(0,1) =1-α=0.9 0.026 0.024 0.022 0.02 0.018 0.016 0.014 0.012 0.01 0.008 p(-k<z<k)=p=1-α=0,9 0.006 0.004 p(z>k)=(1-p)/2=α/2=0.05 p(z<-k)=(1-p)/2=α/2=0.05 0.002 x -2.8 -2.6 -2.4 -2.2 -2 -1.8 -1.6 -1.4 -1.2 -1 -0.8 -0.6 -0.4 -0.2 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 2.2 2.4 2.6 2.8 -k -0.002 k -0.004 p(z≤k)=p+(1-p)/2=1-α+α/2=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 55.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Empregamos as táboas da N(0,1) para calcular o valor de k tamén nomeado como zα/2 tal que p(Z≤k)=p(Z< zα/2 )=0.95. Atopamos que é un valor intermedio entre 1.64 e 1.65 polo que tomamos 1.645. K= zα/2=1.645 chámase valor crítico correspondente á probabilidade p=1- α=0.9. Polo tanto o intervalo característico sería : (-1.645,1.645) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 56.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Volvendo ao problema orixinal  c1 − μ X − μ c2 − μ  p   0.55 < 0.55 < 0.55  = 0.9   c1 − μ = −1.645 c1 = −1.645 ⋅ 0.55 + μ 0.55 c2 − μ = 1.645 c2 = 1.645 ⋅ 0.55 + μ 0.55 E como : p(c1 < X < c2 ) = 0.9 p(μ − 1.645 ⋅ 0.55 < X < μ + 1.645 ⋅ 0.55) = 0.9 pero a min "interésame un intervalo para estimar μ". Como o consigo? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 57.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Restando μ á desigualdade : p(-1.645 ⋅ 0.55 < X - μ < 1.645 ⋅ 0.55) = 0.9 Restando X á desigualdade : p(-1.645 ⋅ 0.55 - X < -μ < 1.645 ⋅ 0.55 - X) = 0.9 Multiplicando a desigualdade por - 1 : p(1.645 ⋅ 0.55 + X > μ > −1.645 ⋅ 0.55 + X) = 0.9 p(X - 1.645 ⋅ 0.55 < μ < X + 1.645 ⋅ 0.55) = 0.9 Como temos unha mostra cun resultado da media mostral x = 7 substituímos obtendo : p(7 - 1.645 ⋅ 0.55 < μ < 7 + 1.645 ⋅ 0.55) = 0.9 p(6.09525 < μ < 7.90475) = 0.9 Poderiamos concluír que : O nº medio de horas de sono dos estudantes de bacharelato de Galicia está no intervalo (6.09525, 7.90475) cun nivel de confianza do 90%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 58.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Outra maneira de enfocalo: X variable aleatoria que segue unha N(μ,σ), μ descoñecida. Para estimar μ tomamos unha mostra de tamaño n, n≥30 e calculamos a media mostral Como calcular un intervalo de confianza para μ ao p·100%= (1-α)·100%?. Pensemos en x como unha estimación puntual de μ. Entón X segue unha distribución normal N(x, σ ) n Calculamos , entón, un intervalo característico para esta distribución correspondente a unha probabilidade p = 1 − α. Dito intervalo sería :  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n Dito intervalo considérase o intervalo de confianza para μ ó p ⋅ 100% = = (1 − α) ⋅ 100%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 59.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Exemplo 2: Co fin de investigar o cociente de intelixencia medio dunha poboación estudiantil , pasouse unha proba a 200 estudantes. A media mostral foi de 64 puntos. Por outra banda, sábese por estudos anteriores que o cociente intelectual na poboación distribúese normalmente cunha desviación típica poboacional de 9.3 puntos. Acha un intervalo de confianza para a media poboacional do cociente de intelixencia ao nivel de confianza do 92%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 60.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza SOLUCIÓN X = cociente intelectual dun estudante segue unha distribución normal N( μ,9.3) Tomamos x como estimación puntual de μ X segue unha distribución N(64, 9.3) E como consecuencia X = media dunha mostra de tamaño 200 9.3 segue unha distribución N(64, ) = N(64, 0.66) 200 Calculemos un intervalo característico para esta distribución con probabilidade 0.92 p(c1 < X < c2 ) = 0.92 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 61.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Tipificamos  c − 64 X − 64 c2 − 64  p 1   0.66 < 0.66 < 0.66  = 0.92   E traballamo s cunha N(0,1) Buscamos o valor crítico zα para p = 1 − α = 0.92 2 Se dentro do intervalo característico hai unha probabilidade 0.92, fóra hai α = 0.08, e, en cada " cola" 0.04; polo tanto : p(Z ≤ zα ) = 0.96 2 Buscamos na táboa obtendo zα = 1.75 2 Polo tanto : c1 − 64 c − 64 = −1.75 e 2 = 1.75 0.66 0.66 c1 = 64 − 1.75 ⋅ 0.66 = 62.8 c2 = 64 + 1.75 ⋅ 0.66 = 65.2 O intervalo de confianza buscado é ( 62.8, 65.2) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 62.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Tamén o podes resolver simplemente empregando a fórmula, unha vez sabes de onde se obtén. Exemplo 3: Un nadador obtén os seguintes tempos, en minutos, en 10 probas cronometradas polo seu adestrador: 41.48 42.34 41.95 41.86 41.60 42.04 41.81 42.18 41.72 42.26 Obter un intervalo de confianza para a marca media desta proba cun 95% de confianza, supoñendo que se coñece por outras probas que ditas marcas deste nadador seguen unha distribución normal con desviación típica de 0.3 minutos. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 63.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para a marca media desta proba para dito nadador (μ) sabendo que as súas marcas seguen unha normal con desviación típica σ=0.3 minutos. A mostra coa que contamos é de tamaño n=10. O intervalo de confianza será:  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 64.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.95 Fóra do intervalo característico queda α=0.05 e en cada cola α/2=0.025. Polo tanto p(Z≤ zα/2)=0.975 E zα/2=1.96 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 65.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Calculamos x 41.48 + 42.34 + 41.95 + 41.86 + 41.60 + 42.04 + 41.81 + 42.18 + 41.72 + 42.26 x= = 10 419.24 = = 41.924 10 e o intervalo de confianza ao 95% quedaría :  σ σ   x − zα ⋅ , x + zα ⋅ =  2 n 2 n  0.3 0.3   41.924 − 1.96 ⋅ , 41.924 + 1.96 ⋅ =  10 10  = ( 41.738, 42.11) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 66.
    6. Intervalo deconfianza para a media dunha poboación normal da que se coñece a varianza Na seguinte páxina de internet tes unha aplicación onde se calculan este tipo de intervalos de confianza. http://www.catedu.es/ matematicas_blecua/bacmat /temario/bac2/mas2_estima1.htm IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 67.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Intervalo de confianza para a media dunha poboación normal da que “non” se coñece a varianza. Hai que ter en conta: Na maioría das ocasións nas que se realiza unha investigación estatística a varianza poboacional σ é un parámetro tan descoñecido como a media poboacional µ A cuasivarianza mostral 2 n ∑ i i (x − x ) 2 ⋅f s = ⋅ s2 = i é un bo estimador de σ2 . n −1 n −1 Estimaremos a desviación típica poboacional mediante ŝ=√ŝ2. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 68.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Distinguiremos dous casos: Se a mostra é pequena n < 30 Se a mostra é grande n ≥ 30 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 69.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Se a mostra é pequena n < 30: Empregando o método do pivote 1 Elección do estatístico pivotal: Fariamos unha estimación puntual da varianza poboacional mediante a cuasivarianza mostral. Pero a distribución correspondente a X non é unha N(μ,ŝ/√n) polo que ao tipificala non obtemos unha N(0,1). Gosset estudou esta variable aleatoria como estimador para calcular intervalos de confianza para a media poboacional µ dunha poboación normal con σ2 descoñecida : X −μ tn −1 = sˆ n E segue unha distribución chamada t de student con n-1 graos de liberdade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 70.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza A distribución t de Student con n-1 graos de liberdade ten unha función de densidade cunha forma “parecida” a unha N(0,1) sendo centrada no 0 e tendo simetría par. Esta distribución está tabulada. Calcular un intervalo característico desta distribución faise de xeito similar a como se fai na N(0,1). IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 71.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza 2 Formulación do enunciado probabilístico: Calculariamos o intervalo característico dunha t de student con n-1 graos de liberdade correspondente a unha probabilidade p=1- α. Buscariamos na táboa o valor c tal que: 1−p α p( tn −1 < c ) = p + =1−α+ 2 2 Temos un intervalo característico ( −c, c) da t de student con n - 1 graos de liberdade que cumpre :    X −μ  p( − c < tn −1 < c ) = p − c < < c = p = 1 − α  sˆ   n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 72.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza 3 Transformación do enunciado probabilístico: Facendo operacións na desigualdade (multiplicar por s , restar X, multiplicar por − 1) ˆ n p X − c ⋅ s  ˆ < μ < X + c⋅ s  = p = 1− α ˆ   n n O intervalo de confianza para μ ao p ⋅ 100% = ( 1 − α ) ⋅ 100% será :  ˆ ,X + c⋅ s  X − c⋅ s ˆ   n n IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 73.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza  Se a mostra é grande n ≥ 30 Entón a t de student con n-1 graos de liberdade, tn-1 , aseméllase cada vez máis a unha N(0,1) . Polo que se traballa directamente coa N(0,1) para obter o intervalo característico con probabilidade p=1-α. A partir de aquí o problema resólvese igual chegando ao intervalo:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 74.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Conclusión: Deséxase estimar a media, μ, dunha poboación normal con desviación típica, σ, descoñecida. Para isto recórrese a unha mostra de tamaño n na que se obtén unha media mostral, x. Primeiro estímase puntualmente a desviación típica empregando ŝ=√ŝ2 sendo ŝ2 a cuasivarianza mostral. • Se o tamaño da mostra é n<30, entón o intervalo de confianza de μ cun nivel de confianza de p·100%= (1-α)·100% é:  s ˆ s  ˆ x − c⋅  ,x + c⋅   n n  sendo c o valor crítico nunha t de student con n-1 graos de liberdade correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 75.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Se o tamaño da mostra é n≥30, entón o intervalo de confianza de μ cun nivel de confianza de p·100% = (1-α)·100% é:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 76.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Exemplo1: Nunha multinacional de servicios modifícase a aplicación informática de xestión. Os tempos (en horas) que tardaron 15 traballadores elixidos ao azar en adaptarse ao novo sistema foron os seguintes: 3.3, 2.9, 4.3, 2.6, 3.2, 4.1, 4.9, 2.8, 5.5, 5.3, 3.6, 3, 3.5, 2.9, 4.7 Determina un intervalo de confianza ao 95% para o tempo medio de adaptación de todos os empregados da empresa. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 77.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para o tempo medio de adaptación de todos os empregados(μ) sendo a desviación típica σ descoñecida, que estimaremos puntualmente por ŝ. A mostra coa que contamos é de tamaño n=15<30; polo tanto, o intervalo de confianza será:  s ˆ s   ˆ s ˆ s  ˆ x − c⋅  ,x + c⋅  = x − c⋅   ,x + c⋅   n n  15 15   sendo c o valor crítico para unha distribución t de student con n-1=14 graos de liberdade correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 78.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza xi (xi − x)2 Calculamos x : 3.3 0.2209 3.3 + 2.9 + ... + 4.7 2.9 0.7569 x= = 4.3 0.2809 15 2.6 1.3689 56.6 3.2 0.3249 = = 3.77 horas 4.1 0.1089 15 4.9 1.2769 Calculamos s : ˆ 2.8 0.9409 5.5 2.9929 ∑ (x − x ) 2 ⋅f 5.3 2.3409 n i i 3.6 0.0289 s2 = ˆ ⋅ s2 = i 3 0.5929 n −1 n −1 3.5 0.0729 ˆ 12.9295 = 0.92 s2 = 2.9 0.7569 14 4.7 0.8649 12.9295 s = 0.92 = 0.96 horas ˆ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 79.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Calculamos c, o valor crítico para unha distribución t de student con n-1=14 graos de liberdade correspondente a unha probabilidade p=1-α = 0.95 Buscamos os graos de liberdade en vertical (14) e a probabilidade p en horizontal 0.95. C=1.761 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 80.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza O intervalo de confianza será:  sˆ s   ˆ s ˆ s  ˆ x − c⋅  ,x + c⋅  = x − c⋅   ,x + c⋅ =  n n  15 15    0.96 0.96  =  3.77 − 1.761 ⋅ , 3.77 + 1.761 ⋅ =  15 15  = ( 3.33, 4.21) O tempo medio de adaptación está entre 3.33 horas e 4.21 horas cun nivel de confianza dun 95% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 81.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Exemplo 2: Para analizar o peso duns botes de conserva, tómase unha mostra de tamaño 32. Os pesos en quilogramos obtidos son: 0.97 0.99 1.01 0.98 0.99 1.00 0.98 0.98 1.00 1.02 0.97 0.97 0.99 0.99 0.99 0.96 0.98 1.00 0.99 1.01 1.00 1.00 0.98 0.99 0.99 0.98 0.97 0.97 1.01 0.96 1.03 0.92 Calcula o intervalo de confianza ao 95% para o peso medio dos botes. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 82.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 83.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Solución: Neste caso pídese un intervalo de confianza para o peso medio en quilogramos duns botes de conserva(μ) sendo a desviación típica σ descoñecida, que estimaremos puntualmente por ŝ. A mostra coa que contamos é de tamaño n=32>30; polo tanto, o intervalo de confianza será:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=0.95 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 84.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Calculamos x : xi fi xi ·fi (xi − x)2 (xi − x)2 ·f i ∑x ⋅f i i 31.57 0.92 1 0.92 0.004489 0.004489 x= i = = 0.96 2 1.92 0.000729 0.001458 N 32 = 0.987 Kg 0.97 5 4.85 0.000289 0.001445 Calculamos s : ˆ 0.98 6 5.88 0.000049 0.000294 ∑ (x − x) 2 0.99 8 7.92 0.000009 0.000072 ⋅f n i i 1 5 5 0.000169 0.000845 s = ˆ2 ⋅s = i 2 n −1 n −1 1.01 3 3.03 0.000529 0.001587 0.013128 s2 = ˆ = 0.00042 1.02 1 1.02 0.001089 0.001089 31 1.03 1 1.03 0.001849 0.001849 s = 0.00042 = 0.206 Kg ˆ 32 31.57 0.013128 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 85.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.95 Fóra do intervalo característico queda α=0.05 e en cada cola α/2=0.025. Polo tanto p(Z≤ zα/2)=0.975 E zα/2=1.96 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 86.
    7. Intervalo deconfianza para a media dunha poboación normal da que non se coñece a varianza O intervalo de confianza será:  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅ =  2 n 2 n  0.206 0.206   0.987 − 1.96 ⋅ ,0.987 + 1.96 ⋅ =  32 32  ( 0.916,1.058) O peso medio dos botes de conserva está entre 0.916 Kg e 1.058 Kg cun nivel de confianza do 95% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 87.
    8. Intervalo deconfianza para a proporción Intervalo de confianza para a proporción. Desexamos atopar un intervalo de confianza cun nivel de confianza do p’·100%=(1-α)·100% para a proporción p poboacional de certa característica C. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 88.
    8. Intervalo deconfianza para a proporción O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a unha mostra de tamaño n, na que se obtén unha proporción mostral pr. Se x é o número de éxitos nas n probas, entón o estimador é: Pr=X/n X=nº de éxitos, en principio, corresponde a unha distribución binomial B(n,p) p=probabilidade de éxito , μ=np e σ=√npq. Pero se np>5 e nq>5 dita binomial aproxímase por unha normal N(np,√npq) . E neste caso Pr=x/n segue unha distribución normal N(np/n, √npq/n)=N(p,√(pq/n))=N(p,√(p(1-p)/n) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 89.
    8. Intervalo deconfianza para a proporción 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo característico do estimador que conteña unha probabilidade p’=1-α e p(c1<Pr<c2)=p’=1-α, Tipificamos a normal, para traballar cunha N(0,1)     c −p Pr − p c −p p 1 < < 2  = p'= 1 − α  p(1 - p) p(1 - p ) p( 1 - p )     n n n  Buscamos na táboa da N(0,1) o valor crítico para p'= 1 − α α p(Z ≤ zα/2 ) = 1 − α + 2 Entón : c1 − p c2 − p = −zα/2 e = zα/2 p(1 - p ) p( 1 - p) n n p(1 - p ) p(1 - p ) c1 = p − zα/2 ⋅ e c2 = p + zα/2 ⋅ n n Polo tanto :  p(1 - p ) p(1 - p )  p(c1 < Pr < c2 ) = p p − zα/2 ⋅  < Pr < p + zα/2 ⋅  = p'= 1 − α   n n  IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 90.
    8. Intervalo deconfianza para a proporción 3 Transformación do enunciado probabilístico: Facendo as operacións seguintes na desigualdade conseguimos que p quede no medio: Restar p :  p(1 - p) p( 1 - p)  p − zα/2 ⋅  < Pr - p < zα/2 ⋅  = p'= 1 − α   n n  Restar Pr :  p(1 - p) p(1 - p)  p − zα/2 ⋅  − Pr < -p < zα/2 ⋅ − Pr  = p'= 1 − α   n n  Multiplicar por − 1 :  p( 1 - p) p( 1 - p)  p zα/2 ⋅  + Pr > p > −zα/2 ⋅ + Pr  = p'= 1 − α   n n   p(1 - p) p( 1 - p)  p Pr - zα/2 ⋅  < p < Pr + zα/2 ⋅  = p'= 1 − α  n n   Sustituindo Pr polo valor concreto obtido da mostra, o mesmo que p, que non é coñecido obtemos como intervalo de confianza ao nivel de confianza dun p'⋅100% = ( 1 − α ) ⋅ 100% :  pr(1 - pr) pr( 1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 91.
    8. Intervalo deconfianza para a proporción Conclusión: Deséxase estimar a proporción p , de individuos cunha certa característica que hai nunha poboación. Para iso recórrese a unha mostra de tamaño n, na que se obtén unha proporción mostral pr. O intervalo de confianza de p cun nivel de confianza p’·100%=(1-α)·100% é:  pr( 1 - pr ) pr(1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p’=1-α IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 92.
    8. Intervalo deconfianza para a proporción Exemplo: Para estudar a proporción de estudantes que practicaban football, tómase unha mostra de tamaño 300. O resultado obtido é que o practican 210. Calcula o intervalo de confianza para a proporción p cun nivel de confianza do 98%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 93.
    8. Intervalo deconfianza para a proporción Queremos estimar a proporción de estudantes que practican football, polo que tomamos unha mostra de tamaño n=300, obtendo unha proporción mostral pr=210/300=0.7 (70%). Sabemos que o intervalo de confianza para unha proporción p cun nivel de confianza do 98% é:  pr( 1 - pr ) pr( 1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅   n n    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade 0.98 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 94.
    8. Intervalo deconfianza para a proporción Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p’=1-α = 0.98 Fóra do intervalo característico queda α=0.02 e en cada cola α/2=0.01 Polo tanto p(Z≤ zα/2)=0.99 zα/2 está entre 2.32 e 2.33, tomaremos 2.325 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 95.
    8. Intervalo deconfianza para a proporción O intervalo de confianza para a proporción de estudantes que xogan ao fútbol cun nivel de confianza dun 98% será:  pr( 1 - pr) pr(1 - pr )   pr - zα/2 ⋅ , pr + zα/2 ⋅ =  n n     0.7 ⋅ ( 1 − 0.7 ) 0.7 ⋅ ( 1 − 0.7 )   0.7 − 2.325 ⋅ , 0.7 + 2.325 ⋅ =  300 300    ( 0.64, 0.76) O intervalo está entre un 64% e un 76% IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 96.
    9. Intervalo deconfianza para a diferenza de medias Intervalo de confianza para a diferenza de medias. Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100% = (1-α)·100% para a diferenza de medias μ1-μ2 de dúas poboacións sendo as desviacións típicas de ditas poboacións coñecidas σ1 e σ2. O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a dúas mostras de tamaños n1 e n2, nas que se x obteñen dúas medias mostrais x1 e 2 .Empregaremos como estimador : X1 − X2 A distribución desta variable viuse que correspondía a unha normal N(μ1-μ2, √(σ12/ n1 + σ22/ n2 )) se as poboacións iniciais eran normais ou se o tamaño das mostras é maior de 30 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 97.
    9. Intervalo deconfianza para a diferenza de medias 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo característico do estimador que conteña unha probabilidade p=1-α ( ) p c1 < X1 − X2 < c2 = p = 1 − α Tipificamos para traballar coa N(0,1)      c1 − ( μ1 − μ2 ) (X1 − X2 ) − ( μ1 − μ2 ) c2 − ( μ1 − μ2 )  p < <  = p'= 1 − α  σ1 + σ 2 σ12 σ2 σ12 σ2  2 2 2 2  n + +  1 n2 n1 n2 n1 n2   α Buscamos na táboa da N(0,1) o valor crítico para p = 1 − α; p(Z ≤ zα/2 ) = 1 − α + 2 Entón : c1 − ( μ1 − μ2 ) c2 − ( μ1 − μ2 ) = −zα/2 e = zα/2 σ 2 σ 2 σ12 σ2 2 1 + 2 + n1 n2 n1 n2 σ12 σ2 2 σ12 σ2 2 c1 = ( μ1 − μ2 ) − zα/2 ⋅ + e c2 = ( μ1 − μ2 ) + zα/2 ⋅ + n1 n2 n1 n2 Polo tanto :  σ2 σ2 σ2 σ2  p(c1 < X1 − X2 < c2 ) = p ( μ1 − μ2 ) − zα/2 ⋅ 1 + 2 < X1 − X2 < ( μ1 − μ2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 98.
    9. Intervalo deconfianza para a diferenza de medias 3 Transformación do enunciado probabilístico Facendo operacións na desigualdade conseguimos que μ1 − μ2quede no medio Restar μ1 − μ2 :  σ2 σ2 σ2 σ2  p − zα/2 ⋅ 1 + 2 < (X1 − X2 ) − (μ1 − μ2 ) < zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    Restar X1 − X2 :    − z ⋅ σ1 + σ2 − (X − X ) < −(μ − μ ) < z ⋅ σ1 + σ2 − (X − X )  = p = 1 − α 2 2 2 2 p  α/2 n1 n2 1 2 1 2 α/2 n1 n2 1 2    Multiplicar por − 1 :  σ2 σ2 σ2 σ2  p zα/2 ⋅ 1 + 2 + (X1 − X2 ) > (μ1 − μ2 > −zα/2 ⋅ 1 + 2 + (X1 − X2 )  = p = 1 − α  n1 n2 n1 n2     σ2 σ2 σ2 σ2  p (X1 − X2 ) − zα/2 ⋅ 1 + 2 < μ1 − μ2 < (X1 − X2 ) + zα/2 ⋅ 1 + 2  = p = 1 − α  n1 n2 n1 n2    Substituíndo X1 − X2 polo valor concreto obtido da mostra, obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% :  2   ( x − x ) − z ⋅ σ1 + σ 2 , ( x − x ) + z ⋅ σ 1 + σ 2  2 2 2  1 2 α/2 n1 n2 1 2 α/2 n1 n2    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 99.
    9. Intervalo deconfianza para a diferenza de medias Conclusión: Deséxase estimar a diferenza de medias μ1-μ2 de dúas poboacións con desviacións típicas, σ1 e σ2, , coñecidas . Para isto recórrese a dúas mostras de tamaños n1 e n2 nas que se obteñen dúas medias mostrais. Entón, o intervalo de confianza de μ1-μ2 cun nivel de confianza de p·100%= (1- α)·100% é:  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +   1 2 α/2 n1 n2 n1 n2    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α Se as desviacións típicas, σ1 e σ2, , non fosen coñecidas, pero o tamaño das dúas mostras fose maior de 30 tomariamos no lugar das varianzas poboacionais, as cuasivarianzas mostrais, ŝ1 e ŝ2 . IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 100.
    9. Intervalo deconfianza para a diferenza de medias Exemplo: O tempo en minutos que tardan en reparar certo tipo de avaría nun taller A segue unha distribución normal con desviación típica de 25 minutos; mentres nun taller B a desviación típica é de 30 minutos. Nunha mostra de 10 reparacións dese tipo de avaría no taller A o tempo medio foi de 80 minutos, mentres que nunha mostra de 15 reparacións en B a media foi de 75 minutos. Calcula o intervalo de confianza para a diferenza de tempos medios, cun nivel de significación α do 1%. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 101.
    9. Intervalo deconfianza para a diferenza de medias Solución: Neste caso pídese un intervalo de confianza para a diferenza de tempos medios de reparación dun tipo de avaría entre dous talleres A e B (μ1-μ2 ) sabendo que o tempo de reparación deste tipo de avaría segue nos dous talleres unha distribución normal con desviacións típicas σ1=25 minutos e σ2=30 minutos respectivamente. As mostra coas que contamos son de tamaños n1=10 e n2=15; obténdose nelas tempos medios mostrais de 80 minutos e 75 minutos respectivamente. Polo tanto, o intervalo de confianza será:  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ +   1 2 α/2 n1 n2 n1 n2    sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=1-0.1=0.99 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 102.
    9. Intervalo deconfianza para a diferenza de medias Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.99 Fóra do intervalo característico queda α=0.01 e en cada cola α/2=0.005 Polo tanto p(Z≤ zα/2)=0.995 zα/2 está entre 2.57 e 2.58, tomaremos 2.575 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 103.
    9. Intervalo deconfianza para a diferenza de medias O intervalo de confianza para a diferenza de medias quedaría :  σ12 σ2 2 σ12 σ2  2  (x − x ) − z ⋅ + , (x1 − x2 ) + zα/2 ⋅ + =  1 2 α/2 n1 n2 n1 n2     252 302 252 302   (80 − 75) − 2.575 ⋅ + , (80 − 75) + 2.575 ⋅ + =  10 15 10 15    ( − 23.5, 33.5) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 104.
    10. Intervalo deconfianza para a varianza Intervalo de confianza para a varianza dunha distribución normal . Desexamos atopar un intervalo de confianza cun nivel de confianza do p·100%=(1- α)·100% para a varianza σ2 dunha poboación normal. O método pivotal 1 Elección do estatístico pivotal: Para iso recórrese a unha mostra de tamaño n, na que se obtén a cuasivarianza mostral ŝ . Empregaremos como estimador ˆ n − 1 ⋅ S2 ( ) σ2 Polo Teorema de Fisher sabemos que dita variable aleatoria segue unha distribución chi-cadrado con n-1 graos de liberdade No seguinte enlace podes observar a forma que ten a función de densidade de dita distribución. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 105.
    10. Intervalo deconfianza para a varianza 2 Formulación do enunciado probabilístico: Trataremos de atopar un intervalo do estimador que conteña unha probabilidade p=1-α e que deixe a cada lado (dúas colas) unha probabilidade (1-p)/2=α/2  p c1 < (n − 1) ⋅ S2 < c  = p = 1 - α ˆ   σ2 2   Buscamos na táboa da chi - cadrado con n - 1 graos de liberdade os valores c e c que deixan á súa esquerda probabilidades 1 2 1−p α 1−p α de = e p+ =1− 2 2 2 2 respectivamente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 106.
    10. Intervalo deconfianza para a varianza 3 Transformación do enunciado probabilístico Facendo as operacións seguintes na desigualdade conseguimos que σ2 quede no medio:  c1 < ( n − 1) ⋅ S < c2  = p = 1 - α  ˆ2  p  σ2     c1 ˆ S2 c  Dividir por n - 1 : p  < 2 < 2  = p =1−α  n -1 σ n -1    ˆ  c1 1 c2  Dividir por S2 :p < 2<  (n - 1) ⋅ S2 σ  = p =1−α ˆ ˆ2  (n - 1) ⋅ S   Ao inverter as fraccións as desigualdades dan a volta : ˆ  (n - 1) ⋅ S2 ˆ (n - 1) ⋅ S2  ˆ  (n - 1) ⋅ S2 ˆ (n - 1) ⋅ S2  p >σ > 2  = p =1−α ; p <σ < 2  = p =1−α  c1 c2   c2 c1      ˆ Substituíndo S2 polo valor concreto obtido da mostra, obtemos como intervalo de confianza ao nivel de confianza dun p ⋅ 100% = ( 1 − α ) ⋅ 100% : ˆ ˆ  (n - 1) ⋅ S2 (n - 1) ⋅ S2   ,   c2 c1    IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 107.
    10. Intervalo deconfianza para a varianza Conclusión: Deséxase estimar a varianza σ2 dunha poboación normal. Para isto recórrese a unha mostra de tamaño n na que se obtén a cuasivarianza mostral ŝ2. Entón, o intervalo de confianza de σ2 cun nivel de confianza de p·100%= (1-α)·100% é: ˆ ˆ  (n - 1) ⋅ S2 (n - 1) ⋅ S2   ,   c2 c1    sendo c1 e c2 os valores que deixan á esquerda probabilidades 1−p α 1−p α = e p+ = 1 − α + respectivamente nunha distribución chi- 2 2 2 2 cadrado con n-1 graos de liberdade. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 108.
    10. Intervalo deconfianza para a varianza Exemplo: Un fabricante de baterías de coche asegura que duran catro anos cunha desviación típica de 1 ano. Tense unha mostra de cinco baterías que duraron 3, 5, 5.8, 6.4, e 8 anos respectivamente. Determínese un intervalo de confianza ao 99% para a varianza poboacional σ2 e indíquese se é valida a afirmación do fabricante. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 109.
    10. Intervalo deconfianza para a varianza Solución: A variable “duración dunha batería de coche de dita marca” segue unha distribución normal N(4,1) segundo o fabricante. Tomamos unha mostra de 5 baterías obtendo unha media mostral e unha cuasivarianza mostral de ∑x ⋅fi i 3 + 5 + 5.8 + 6.4 + 8 28.2 x= i = = = 5.64 anos N 5 5 n ( ∑ xi − x ⋅ fi ) 2 s2 = ˆ ⋅ s2 = i n −1 n −1 s = ˆ 2 ( 3 - 5.64 ) 2 + ( 5 − 5.64 ) 2 + ( 5.8 − 5.64 ) 2 + ( 6.4 − 5.64 ) 2 + ( 8 − 5.64 ) 2 = 4 = ( − 2.64 ) 2 + ( − 0.64 ) 2 + 0.162 + 0.762 + 2.362 = 13.552 = 3.39 4 4 s = 3.39 = 1.84 anos ˆ IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 110.
    10. Intervalo deconfianza para a varianza O intervalo de confianza para a varianza poboacional a un nivel do 99% (p=1-α=0.99) sería: ˆ ˆ  (n - 1) ⋅ S2 (n - 1) ⋅ S2   ,   c2 c1    Sendo c1 e c2 dous valores que para unha distribución chi-cadrada con n-1 =4 graos de liberdade deixan á súa esquerda unha probabilidade de 0.005 e 0.995 respectivamente. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 111.
    10. Intervalo deconfianza para a varianza Calculamos na táboa da chi- cadrada de Pearson ditos valores. Obtendo c1=0.207 e c2=14.9 O intervalo de confianza para a varianza poboacional ao 99% obtido sería: ˆ ˆ  (n - 1) ⋅ S2 (n - 1) ⋅ S2   , =  c2 c1     4 ⋅ 3.39 4 ⋅ 3.39   , =  14.9 0.207  ( 0.91, 65.5) IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 112.
    10. Intervalo deconfianza para a varianza Polo tanto, o intervalo de confianza para a desviación típica poboacional obteríase calculando as raíces cadradas dos extremos deste; obtendo que a desviación típica da duración das baterías estaría entre 0.95 e 8.09 anos cun nivel de confianza do 99%: (0.95, 8.09) Tendo en conta que 1 está no intervalo, a afirmación de que a desviación típica da duración das baterias é 1 ano pode darse por válida. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 113.
    Caso estimador Distribución na mostraxe Intervalo de confianza Intervalo de N(μ,σ/√n) confianza para a media μ dunha poboación normal con  σ σ  X  x − zα ⋅ , x + zα ⋅  varianza σ2 coñecida  2 n 2 n Intervalo de Si n<30 confianza t de student con n-1 graos  sˆ s  ˆ  x − c ⋅− μ , x + c ⋅  X  para a media dunha X −μ de liberdade tn −1 =  sˆ n n tn −1 = n poboación normal da sˆ Si n≥30 que “non” se coñece a n Se aproxima a unha N(0,1)  s ˆ s  ˆ  x − zα ⋅  , x + zα ⋅  varianza.  2 n 2 n  X Intervalo de Pr=X/n N(p,√(p(1-p)/n)) confianza para a  pr(1 - pr) pr(1 - pr)   pr - z , pr + z  proporción   α/2 ⋅ n α/2 ⋅ n     Intervalo de N(μ1-μ2, √(σ12/ n1 + σ22/ n2 ))  2   (x1 − x2 ) − z ⋅ σ1 + σ 2 , (x1 − x2 ) + z ⋅ σ1 + σ 2  2 2 2 confianza para a  n1 n2  α/2 α/2  n1 n2  diferenza de medias X1 − X2  (n -1) ⋅S2 (n -1) ⋅ S2   ˆ ˆ  Intervalo de Chi-cuadrada con n-1 graos , (n − 1) ⋅ S2  c c  confianza para a ˆ de liberdade   2 1   varianza σ2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 114.
    11. Erro máximoadmisible Erro máximo admisible: O erro máximo admisible nunha estimación, empregando un intervalo de confianza con un nivel de confianza p=1-α, é o radio de dito intervalo de confianza. O erro depende do tamaño da mostra n e do nivel de confianza p=1-α. •Canto maior é a mostra, menor é o erro cometido. •Canto maior é o nivel de confianza, maior é zα/2 ou similar e, polo tanto, tamén o erro. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 115.
    11. Erro máximoadmisible Caso Erro máximo admisible Intervalo de confianza para a media μ σ dunha poboación normal con varianza σ2 zα ⋅ n coñecida 2 Intervalo de confianza Si n<30 s ˆ para a media dunha c⋅ n poboación normal da Si n≥30 s ˆ que “non” se coñece a varianza. zα ⋅ 2 n Intervalo de confianza para a proporción pr(1 - pr ) zα/2 ⋅ n Intervalo de confianza para a diferenza σ12 σ2 2 de medias zα/2 ⋅ + n1 n2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 116.
    12. Tamaño damostra para a estimación da media e da proporción Tamaño da mostra : Nalgúns casos, podemos fixar o erro máximo admisible e o nivel de confianza p=1-α para o noso intervalo de confianza, e calcular a partir deles o tamaño mínimo de mostra que necesitamos para que se cumpran ditas condicións despexando n na fórmula do erro máximo admisible. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 117.
    12. Tamaño damostra para a estimación da media e da proporción Caso Erro máximo Tamaño da mostra admisible Intervalo de confianza para a media μ dunha poboación 2 normal con varianza σ2 σ zα ⋅ σ  zα ⋅ σ  E = zα ⋅ coñecida 2 n n= 2 ⇒n =  2  E  E    Intervalo de confianza para pr ⋅ (1 − pr ) a proporción n = zα ⋅ ⇒ pr(1 - pr ) 2 E E = zα/2 ⋅ zα ⋅ pr ⋅ (1 − pr ) 2 n n= 2 E2 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 118.
    12. Tamaño damostra para a estimación da media e da proporción Exemplo 1: Tomouse unha mostra aleatoria de 100 individuos aos que se lles preguntou pola cantidade de cartos que tiñan na súa carteira, obténdose unha media mostral de 110€. Sábese que a desviación típica da poboación é de 20 €. a) Obtén o intervalo de confianza ao 90 % para a cantidade media de cartos que leva na carteira a poboación. b) Cal é o erro máximo cometido na estimación anterior? c) Se desexamos que o erro cometido, co mesmo nivel de confianza, sexa a décima parte do erro calculado no apartado anterior, cal debe de ser o tamaño da mostra?. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 119.
    12. Tamaño damostra para a estimación da media e da proporción IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 120.
    12. Tamaño damostra para a estimación da media e da proporción Solución apartado a): Neste caso pídese un intervalo de confianza para a cantidade media de cartos que leva na carteira un individuo dunha poboación (μ) sabendo que dita cantidade ten unha desviación típica σ=20€. A mostra coa que contamos é de tamaño n=100. O intervalo de confianza será:  σ σ   x − zα ⋅ , x + zα ⋅   2 n 2 n sendo zα/2 o valor crítico nunha N(0,1) correspondente a unha probabilidade p=1-α=0.9 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 121.
    12. Tamaño damostra para a estimación da media e da proporción Calculamos zα/2 , o valor crítico para unha distribución N(0,1) correspondente a unha probabilidade p=1-α = 0.9 Fóra do intervalo característico queda α=0.1 e en cada cola α/2=0.05. Polo tanto, p(Z≤ zα/2)=0.95 E zα/2=1.645 IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 122.
    12. Tamaño damostra para a estimación da media e da proporción Como x = 110€ o intervalo de confianza ao 90% quedaría :  σ σ   20 20   x − zα ⋅ , x + zα ⋅  =  110 − 1.645 ⋅ , 110 + 1.645 ⋅ =  2 n 2 n  100 100  = ( 110 - 3.29, 110 + 3.29) = ( 106.71,113.29 ) Solución ao apartado 2) σ E = zα ⋅ = 3.29 2 n Solución ao apartado 3) 3.29 Desexamos que o erro máximo sexa de = 0.329 10 2  zα ⋅ σ   1.645 ⋅ 20 2 n= 2  = = 10000  E   0.329     A mostra debe ser como mínimo de 10000 persoas. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 123.
    12. Tamaño damostra para a estimación da media e da proporción Exemplo 2: Deséxase facer unha enquisa nos fogares da Galicia interior co fin de determinar o consumo de sal iodado nunha campaña para a erradicación do bocio. Existe o convencemento, baseado nos resultados de certas investigacións de mercado, de que a porcentaxe de fogares que consomen tal tipo de sal non chega ao 30%. Cun nivel de confianza do 99% e un erro na estimación de 0.05, cal debe ser o tamaño da mostra? IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 124.
    12. Tamaño damostra para a estimación da media e da proporción IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.
  • 125.
    12. Tamaño damostra para a estimación da media e da proporción Solución : O tamaño mínimo da mostra para un erro máximo de 0.05, e un nivel de confianza do 99% , tendo en conta a estimación previa do 30% para a proporción da poboación que consome sal iodado é : zα ⋅ pr ⋅ (1 − pr ) 2 2.582 ⋅ 0.3 ⋅ ( 1 − 0.3) n= 2 = = 559.1376 E 2 0.05 2 sendo zα o valor crítico correspondente a p = 1 − α = 0.99 2 Polo tanto, teriamos que tomar unha mostra de polo menos 560 fogares. IES Isidro Parga Pondal. Departamento de matemáticas: Métodos estatísticos e numéricos.