Distribución NormalEsta distribución es frecuentemente utilizada en las aplicaciones estadísticas.Su propio nombre indica ...
se denomina aleatorio estratificado con asignación proporcional.Las inferencias realizadas mediante muestras seleccionadas...
Error MuestralDe estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medid...
(2,6)                               4                           4–4=0(4,2)                               3                ...
Ejemplo 1.6Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre:μ, l...
La media de la distribución muestral de medias es:d) La desviación estándar de la distribución muestral de medias es:     ...
Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30. La forma de la distribuciónmuestral d...
Upcoming SlideShare
Loading in …5
×

Distribución normal

4,611 views

Published on

Distribución normal

  1. 1. Distribución NormalEsta distribución es frecuentemente utilizada en las aplicaciones estadísticas.Su propio nombre indica su extendida utilización, justificada por las frecuencia o normalidad con la que las ciertosfenómenos tienden a parecerse en su comportamiento a esta distribución.Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana.En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas afenómenos naturales que siguen el modelo de la normal.- Caracteres morfológicos de individuos (personas, animales, plantas,…) de una especie.Por ejemplo: tallas, pesos, envergaduras, diámetros, perímetros,…- Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono.- Caracteres sociológicos, por ejemplo: consciente intelectual, grado de adaptación a un medio.- Errores cometidos al medir ciertas magnitudes.- Valores estadísticos maestrales, por ejemplo: la media.- Otras distribuciones como la binomial o la Poisson son aproximaciones normales.Y en general cualquier característica que se obtenga como suma de mucho factores.1.3. Función De DensidadEmpleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad quecorresponde a tales distribuciones viene dando por la fórmulaPuede tomar cualquier valor (- ∞ ,+ ∞ )Son más probables los valores cercanos a uno central que llamados mediaConforme nos separamos de ese valor µ , la probabilidad va decreciendo de igual forma a derecha e izquierda (essimétrica).Conforme nos separamos de ese valor µ , la probabilidad va decreciendo de forma más o menos rápida dependiendode un parámetro s , que es la desviación típica.MuestreoEn estadística, es el proceso por el cual se seleccionan los individuos que formarán una muestra.Para que se puedan obtener conclusiones fiables para la población a partir de la muestra, es importante tanto sutamaño como el modo en que han sido seleccionados los individuos que la componen.El tamaño de la muestra depende de la precisión que se quiera conseguir en la estimación que se realice a partir deella. Para su determinación se requieren técnicas estadísticas superiores, pero resulta sorprendente cómo, conmuestras notablemente pequeñas, se pueden conseguir resultados suficientemente precisosPara seleccionar los individuos de la muestra es fundamental proceder aleatoriamente, es decir, decidir al azar quéindividuos de entre toda la población forma parte de la muestra.Si se procede como si de un sorteo se tratara, eligiendo directamente de la población sin ningún otro condicionante,el muestreo se llama aleatorio simple o irrestrictamente aleatorio.Cuando la población se puede subdividir en clases (estratos) con características especiales, se puede mostrar de modoque el número de individuos de cada estrato en la muestra mantenga la proporción que existía en la población. Unavez fijado el número que corresponde a cada estrato, los individuos se designan aleatoriamente. Este tipo de muestreo
  2. 2. se denomina aleatorio estratificado con asignación proporcional.Las inferencias realizadas mediante muestras seleccionadas aleatoriamente están sujetas a errores, llamados errores demuestreo, que están controlados. Si la muestra está mal elegida - no es significativa - se producen errores sistemáticosno controlados.Métodos De MuestreoExisten dos métodos de muestreo:El muestreo probabilístico y no probabilísticoMétodos de muestreo probabilísticoLos métodos de muestreo probabilísticas son aquéllos que se basan en el principio de equiprobabilidad. Es decir,aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de unamuestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.Sólo estos métodos de muestreo probabilísticas nos aseguran la representatividad de la muestra extraída y son, portanto, los más recomendables. Dentro de los métodos de muestreo probabilísticas encontramos los siguientes tipos:Muestreo aleatorio simpleEl procedimiento es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún mediomecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadorau ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamosmanejando es muy grande.Muestreo aleatorio sistemáticoEste procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer nnúmeros aleatorios solo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y loselementos que integran la muestras son los que ocupan los lugares i ,i+k, i+2k, i+3k,…,i+(n-1)k, es decir se toman losindividuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n.el número i que empleamos como punto de partida será un número al azar entre 1 y k.El riesgo de este tipo de muestreo está en los casos en que se dan periodicidad constante (k) podemos introducir unahomogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10individuos en los que los 5 primeros son varones y los últimos 5 son mujeres, si empleamos un muestreo aleatoriosistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representaciónde los dos sexos.Muestreo aleatorio estratificado.Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el errormuestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos)que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión,el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarsede que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funcionaindependientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir loselementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiadograndes, pues exige un conocimiento detallado de la población. (tamaño geográfico, sexos, edades…).La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentestipos:Afijación simpleA cada estrato le corresponde igual número de elementos maestrales.Afijación proporcionalLa distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.Muestreo aleatorio por conglomeradosLos métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, esdecir, que las unidades maestrales son los elementos de la población. En el muestreo por conglomerados la unidadmuestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Lasunidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomeradosnaturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de"muestreo por áreas".El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (elnecesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes alos conglomerados elegidos.Para finalizar con esta exposición de los métodos de muestreo probabilístico es necesario comentar que ante locompleja que puede llegar a ser la situación real de muestreo con la que nos enfrentemos es muy común emplear loque se denomina muestreo polietápico. Este tipo de muestreo se caracteriza por operar en sucesivas etapas,empleando en cada una de ellas el método de muestreo probabilístico más adecuado.
  3. 3. Error MuestralDe estimación o estándar. Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de alvariabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara dehasta donde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenidopor medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigación nos indicaráhasta qué medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza quevarían muestra a muestra). Un estadístico será más preciso en cuanto y tanto su error es más pequeño. Podríamosdecir que es la desviación de la distribución muestral de un estadístico y su fiabilidad.Cuando se utilizan valores muestrales, o estadísticos para estimar valores poblacionales, o parámetros, puedenocurrir dos tipos generales de errores: el error muestral y el error no muestral.El error muestral se refiere a la variación natural existente entre muestras tomadas de la misma población.Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran cuidado para asegurar que dosmuestras del mismo tamaño sean representativas de una cierta población, no esperaríamos que las dos sean idénticasen todos sus detalles. El error muestral es un concepto importante que ayudará a entender mejor la naturaleza de laestadística inferencial.Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se denominanerrores no muestrales.El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia sistemáticainherente a un método de muestreo que da estimaciones de un parámetro que son, en promedio, menores (sesgonegativo), o mayores (sesgo positivo) que el parámetro real.El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.La aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el que la selecciónes imparcial o no está sesgada; una muestra elegida con procedimientos aleatorios se llama muestra aleatoria.Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio simple, el muestreoestratificado, el muestreo por conglomerados y el muestreo sistemático.Si una muestra aleatoria se elige de tal forma que todos los elementos de la población tengan la misma probabilidad deser seleccionados, la llamamos muestra aleatoria simple.Error MuestralCualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional μ, entonces lamedia muestral, como medida, conlleva algún error. Por ejemplo, supongamos que se ha obtenido una muestraaleatoria de tamaño 25 de una población con media μ = 15: si la media de la muestra es x =12, entonces a ladiferencia observada x - μ = -3 se le denomina el error muestral. Una media muestral x puede pensarse como lasuma de dos cantidades, la media poblacional μ y el error muestral; si e denota el error muestral, entonces: x = μ+eEjemplo 1.5Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6, para simular una población"grande" de manera que el muestreo pueda realizarse un gran número de veces, supondremos que éste se hace conreemplazo, es decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionanmuestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, portanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posibleseleccionar con reemplazo y también contiene las medias muestrales y los correspondientes errores muestrales. Lamedia poblacional es igual aμ= (2+4+6)/3 = 4. Ver la tabla en la siguiente página.Nótese las interesantes relaciones siguientes contenidas en la tabla:La media de la colección de medias muestrales es 4, la media de la población de la que se extraen las muestras. Si μ xdenota la media de todas las medias muestrales entonces tenemos:μ x = (3+4+3+4+5+5+2+4+6)/9 = 4La suma de los errores muestrales es cero.e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0Muestras ordenadas x Error muestral e = x - μ(2,2) 2 2 – 4 = -2(2,4) 3 3 – 4 = -1
  4. 4. (2,6) 4 4–4=0(4,2) 3 3 – 4 = -1(4,4) 4 4–4=0(4,6) 5 5–4=1(6,2) 4 4–4=0(6,4) 5 5–4=1(6,6) 6 6–4=2En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de todos los errores muestraleses cero.Distribuciones MuestralesLas muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría quedos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o quesean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partirde las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar ladistribución de todos los valores posibles de un estadístico. Tales distribuciones serán muy importantes en el estudiode la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muestrales.Como el análisis de las distribuciones asociadas con los estadísticos muestrales, podremos juzgar la confiabilidad de unestadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido.Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar comouna variable aleatoria con su correspondiente distribución de frecuencias.La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, ladistribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestrasdel mismo tamaño.Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madiamuestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribuciónmuestral de medias, lo que se puede ilustrar en la siguiente figura:Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la desviación estándarde cada una. La colección de todas estas desviaciones estándar muestrales se llama distribución muestral de ladesviación estándar, y lo podemos ver en la siguiente figura:
  5. 5. Ejemplo 1.6Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre:μ, la media poblaciona.σ, la desviación estándar poblacional.μ x, la media de la distribución muestral de medias.σ, la desviación estándar de la distribución muestral de medias.Además, grafique las frecuencias para la población y para la distribución muestral de medias.Solución:a. La media poblacional es:b. La desviación estándar de la población es:c. A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de frecuencias.
  6. 6. La media de la distribución muestral de medias es:d) La desviación estándar de la distribución muestral de medias es: De aquíque podamos deducir que:Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene una media o valor esperado, unavarianza y una desviación estándar, se puede demostrar que la distribución muestral de medias tiene una media igual ala media poblacional. Esto es:Distribuciones muestralesDespués de haber realizado el ejercicio anterior se puede ver que una distribución muestral se genera extrayendotodas las posibles muestras del mismo tamaño de la población y calculándoles a éstas su estadístico.Si la población de la que se extraen las muestras es normal, la distribución muestral de medias será normal sinimportar el tamaño de la muestra.Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la muestra debe ser mayor oigual a 30, para que la distribución muestral tenga una forma acampanada. Mientras mayor sea el tamaño de la muestra,más cerca estará la distribución muestral de ser normal.
  7. 7. Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30. La forma de la distribuciónmuestral de medias sea aproximadamente normal, aún en casos donde la población original es bimodal, es realmentenotable.Distribución de los errores de muestreoe = x −µE(e ) = E( x ) − µ = 0σ 2 (e) = σ 2 ( x ) = σ 2 / nLuego si x∼ N(μ, σ2) e∼ N(o, σ2/n)

×