Estadistica 2

11,916 views

Published on

0 Comments
7 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
11,916
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
192
Comments
0
Likes
7
Embeds 0
No embeds

No notes for slide

Estadistica 2

  1. 1. INSTITUTO TECNOLOGICO DE VERACRUZAlumnos:  Garay Sosa Eduardo.  Barrios Pérez Raymundo.  Bravo Rodríguez Josey Sloan.Materia: Estadística I.Catedrático: Ing. Claudio Yepez Sosa.Semestre: Agosto Diciembre 2011.
  2. 2. ÍndiceTema paginaIntroducción…………………………………………………………...….1Unidad 2 Distribuciones Muéstrales2.1 Introducción…………………………..………………………..…...…22.2 Teorema de combinación lineal de variables aleatorias y teorema del límitecentral……………………………………………………………….…......32.3 Muestreo: Introducción al muestreo y tipos de muestreo…….....…152.4 Teorema del límite central……………………………………….......212.5 Distribución muestral de la media…………………………..….…..232.6 Distribución muestral de la diferencia de medias……………...…242.7 Distribución muestral de la proporción………………...………….272.8 Distribución muestral de la diferencia de proporciones………….292.9 Distribución muestral de la varianza……………………………….312.10 Distribución muestral de la relación de varianzas……………….34Unidad 3 Estimación de parámetros3.1 Introducción……………………………………………………...…..373.2 Características de un buen estimador…………………….…….…373.3 Estimación puntual……………………………………………....….393.3.1 Métodos………………………………………………………...….413.3.1.1 Máxima verosimilitud……………………………………..…….423.3.3.2 Momentos…………………………………………………….…..453.4 Intervalo de confianza para la media………………………..……..463.5 Intervalo de confianza para la diferencia de medias……….……..49Conclusiones……………………………………………………….…….53Bibliografía……………………………………………………….……..54
  3. 3. IntroducciónEl presente trabajo es una investigación donde se expone la importancia delas condiciones bajo las que trabaja cualquier empleado y deberán ser seguras,es decir, no deben suponer una amenaza o una posibilidad significativa desufrir un daño de cierta entidad, que pueda incapacitar aunque sea parcial ytemporalmente, por parte de los trabajadores en relación con el trabajo.Las distribuciones muéstrales: pueden definirse como el estudio dedeterminadas características de una población se efectúa a través de diversasmuestras que pueden extraerse de ella.El muestreo puede hacerse con o sin reposición, y la población de partidapuede ser infinita o finita. Una población finita en la que se efectúa muestreocon reposición puede considerarse infinita teóricamente. También, a efectosprácticos, una población muy grande puede considerarse como infinita. Entodo nuestro estudio vamos a limitarnos a una población de partida infinita o amuestreo con reposición.Estimación de parámetros: Es el procedimiento utilizado paraconocer las características de un parámetro poblacional, apartir del conocimiento de la muestra.Con una muestra aleatoria, de tamaño n, podemos efectuar unaestimación de un valor de un parámetro de la población.En tal sentido el presente trabajo es una investigación se realiza con elobjetivo de examinar un tema o problema de investigación. Sirve parafamiliarizarnos con los conceptos básicos de estadística.
  4. 4. Unidad 2 Distribuciones Muéstrales 2.1 IntroducciónDistribuciones MuéstralesEn estudios pasados de Estadísticas centramos nuestra atención en técnicasque describen los datos, tales como organizar datos en distribuciones defrecuencias y calcular diferentes promedios y medidas de variabilidad.Estábamos concentrados en describir algo que ya ocurrió.También comenzamos a establecer los fundamentos de la estadísticainferencial, con el estudio de los conceptos básicos de la probabilidad, lasdistribuciones de probabilidad discretas y continuas. Distribuciones que sonprincipalmente generadas para evaluar algo que podría ocurrir. Ahora veremosotro tipo de distribución de probabilidad, que se llaman distribucionesmuéstrales.¿Por qué muestrear?Muestrear es una forma de evaluar la calidad de un producto, la opinión de losconsumidores, la eficacia de un medicamento o de un tratamiento. Muestra esuna parte de la población. Población es el total de resultados de unexperimento. Hacer una conclusión sobre el grupo entero (población) basadosen información estadística obtenida de un pequeño grupo (muestra) es haceruna inferencia estadística.A menudo no es factible estudiar la población entera. Algunas de las razonespor lo que es necesario muestrear son:1. La naturaleza destructiva de algunas pruebas2. La imposibilidad física de checar todos los elementos de la población.3. El costo de estudiar a toda la población es muy alto.4. El resultado de la muestra es muy similar al resultado de la población.5. El tiempo para contactar a toda la población es inviable.
  5. 5. Distribución Maestral de las MediasEl ejemplo de los ratings de eficiencia muestra como las medias de muestrasde un tamaño específico varían de muestra a muestra. La media de la primeramuestra fue 101 y la media de la segunda fue 99.5. En una tercera muestraprobablemente resultaría una media diferente. Si organizamos las medias detodas las posibles muestras de tamaño 2 en una distribución de probabilidad,obtendremos la distribución maestral de las medias.Distribución maestral de las medias. Es una distribución de probabilidad detodas las posibles medias muéstrales, de un tamaño de muestra dado,seleccionada de una población.2.2 Teorema de combinación lineal de variablesaleatorias y teorema del límite central.Variable AleatoriaEn el tratamiento que se ha dado, hasta el momento, a los fenómenosaleatorios se ha visto que los eventos elementales no son necesariamentenúmeros. Sin embargo, en muchas situaciones experimentales se requiere queel resultado de la observación realizada sea registrado como un número, pararesponder a preguntas planteadas con respecto al fenómeno de observación.Así tenemos los siguientes ejemplos.Ejemplo: Supongamos ahora que cada una de tres personas a las quedenominaremos A, B, C, tiran una moneda y se ajustan a las siguientes reglas:Si las tres monedas muestran el mismo lado, no se efectúa pago alguno. Entodos los otros casos, la persona con el lado diferente recibe una unidadmonetaria de cada una de las otras personas.Desde el punto de vista A se tendría la correspondenciacss 2 scc 2ccc 0 sss 0ssc -1 csc -1
  6. 6. scs -1 ccs -1Luego A puede considerar una función XA cuyo recorrido sea el punto {-1, 0,2}Como vemos en estos ejemplos, a partir del espacio muestral asociado alfenómeno aleatorio en cuestión, considerado como dominio de una ciertafunción, se ha generado un conjunto cuyos elementos son números. Desde elpunto de vista del modelo, el concepto que responde al requerimientoplanteado, es el de variable aleatoria, cuya definición formal es la siguiente.Definición: Dado un campo de probabilidad oe y una función realvalorada X, cuyo dominio es y su recorrido es un conjunto no vacío denúmeros reales, se dice que X es una variable aleatoria si para cada númeroreal a que se considere, el conjunto de los eventos elementales tales que es un evento, es decir oeSimbólicamente tenemos la función R,Tal que oe para cada número a. (1)Podemos notar que si consideramos oe = PT , entonces la condición (1) nonecesita ser explícitamente comprobada, pues por ser un conjunto deeventos elementales, es decir un subconjunto de , es siempre un evento. Encambio, si el sigma álgebra de eventos no coincide con el conjunto potencialdel espacio muestral, puede ocurrir que la condición (1) no se satisfaga paraalgún valor de a y entonces la función en consideración no sería una variablealeatoria, como ilustraremos a través de los siguientes ejemplos.Ejemplo: En relación con el ejemplo 3.2, consideremos
  7. 7. Oe y el número real a tal que Tenemos entonces oepor lo que podemos afirmar que XA no es una variable aleatoria en el campo oe .Ejemplo: Sea el espacio maestral y sea la función Y tal que Y(a) = O y Y (b) = Y (c) = Y (d) = 1Si consideramos oe = PT entonces para cada número real a ypor ende oe, por que podemos afirmar que Y es una variablealeatoria sobre el campo oe .Si, en cambio consideramos oe1 dado por oe1la situación esdonde se tiene oe1. En este caso, entonces, Y no es una variablealeatoria definida sobre oe1 .A este punto del desarrollo resulta conveniente plantear las siguientesobservaciones.Observaciones:
  8. 8. 1. Desde el punto de vista de la teoría, la terminología de variable aleatoria no parece ser muy adecuada por que se la define como función y se la denomina variable. Sin embargo, se mantiene la denominación debido a que los valores que realmente puede tomar la variable aleatoria dependen del resultado observado, es decir dependen del azar. 2. De acuerdo con lo observado en los ejemplos 3.3 y 3.4, no toda función concebible es una variable aleatoria, pero esta dificultad no se presenta en las aplicaciones donde, como se ha establecido antes, el modelo a considerar tiene como sigma álgebra de eventos, en general, el conjunto potencia del espacio muestral asociado. 3. En algunos casos cada evento elemental es ya una característica numérica, y se tendrá que X es la función identidad pues . 4. En la mayoría de las discusiones no interesa la naturaleza funcional de X, sino sus posibles valores. 5. Por su naturaleza de función, a cada evento elemental W le corresponde un solo valor de X, pero diferentes eventos elementales pueden llevar a un mismo valor de X. 6. El recorrido o campo de variación de X, denotamos por RX se denomina a veces espacio recorrido y, en cierto sentido, puede ser considerado como un espacio muestral, punto de partida para construir un modelo de probabilidad: el modelo asociado a la característica numérica en estudio. Si la variable aleatoria es la función identidad, entonces . 7. Al presentar la definición de la variable aleatoria, se ha hecho uso de la siguiente notaciónen forma similar tenemosnotación que se interpreta diciendo que
  9. 9. sí y sólo siCondiciones para Variable AleatoriaDesde el punto de vista de la teoría, es conveniente disponer de algunascondiciones necesarias y suficientes, para que una función real valorada cuyodominio en un espacio muestral sea una variable aleatoria. Condiciones quepermitirán demostraciones de propiedades de variables aleatorias. Lademostración de la validez de las condiciones que se presentan se apoya, a suvez, en el uso de ciertos lemas referentes a conjuntos de eventos elementalesasociados con valores de funciones con dominio de un espacio muestral, loscuales forman parte de esta sección.Lema: Si X es una función real valorada con dominio entoncespara todo número real a.Teorema: Sea X una función con dominio y con recorrido un conjunto novacío de números reales. Entonces X es una variable aleatoria sí y sólo si oepara todo número real a.Suficiencia: Supongamos, ahora, que oe para todo número real a.Entonces se cumple que oepor propiedad de oe. Y, por el teorema 3.1, X es una variable aleatoria.Teorema: Si X es una función cuyo dominio es y cuyo recorrido es unconjunto no vacío de números reales, entonces X es una variable aleatoria sí ysólo si
  10. 10. oepara todo número real a.Teorema: Una condición necesaria y suficiente para que una función X, cuyodominio es y su recorrido es un conjunto no vacío de números reales, seavariable aleatoria es que oepara todo par de números reales a, b tales que a < b.Combinaciones de Variables AleatoriasPor la naturaleza funcional de las variables aleatorias, se puede realizaroperaciones con ellas, generando nuevas funciones con dominio del espaciomuestral considerando, cuáles se irán definiendo en esta sección a medida quesean introducidas. La principal preocupación es saber si las funcionesresultantes son a su vez variables aleatorias. Como demostraremos, cualquiercombinación lineal de variables aleatorias proporciona una nueva variablealeatoria, y en los teoremas que presentamos, se considerarán otrasoperaciones con variables aleatorias y las condiciones que hay que exigir paraque el resultado también lo sea.Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo deprobabilidad, entonces su suma X + Y es también una variable aleatoria.Teorema: Si X es una variable aleatoria y si K es un número real cualquiera,entonces KX es una variable aleatoria.Teorema: Si X es una variable aleatoria, entonces X2 es variable aleatoria.Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo deprobabilidad, entonces su producto XY es una variable aleatoria.Teorema: Si X Y son variables aleatorias definidas sobre el mismo campo deProbabilidad y si , entonces es variable aleatoria.
  11. 11. Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo deprobabilidad, entonces mín (X, Y) es variable aleatoria.Ejemplo: De una urna que contiene los tres dígitos 1, 2, 3, se extrae al azar undígito, se le repone y se extrae al azar un segundo dígito. Sea X la diferenciadel primer dígito menos el segundo dígito extraídos y sea Y el producto de losmismos. Consideremos las funciones X + Y, XY, mín (X, Y) y , para loscuales deseamos obtener sus recorridos y decidir si son o no variablesaleatorias.Resulta conveniente advertir que si disponemos de los recorridoscorrespondientes a X y Y no podemos operar indiscriminadamente con loselementos de estos conjuntos para obtener el recorrido de, por ejemplo, X + Y,como comprobaremos al efectuar la evaluación correspondiente. Para facilitarla presentación, construyamos la tabla siguiente.De esta tabla tenemos que el recorrido de cada una de las funciones X, Y, X +Y esde donde vemos que por ejemplo no figure en R X+Y la suma de los puntos y , por corresponder a diferentes eventos elementales.
  12. 12. En forma similar tenemos para las funciones restantesPodemos observar que en este caso, es X = mín (X, Y) puesto que a cadaevento elemental w le asignan el mismo número real. Además observamos que no está definida para w1, w5, y w9 por lo que tenemos dom .Teorema del límite centralEl teorema del límite central o teorema central del límite indica que, encondiciones muy generales, si Sn es la suma de n variables aleatoriasindependientes, entonces la función de distribución de Sn «se aproxima bien» auna distribución normal (también llamada distribución gaussiana, curva deGauss o campana de Gauss). Así pues, el teorema asegura que esto ocurrecuando la suma de estas variables aleatorias e independientes es losuficientemente grande.DefiniciónSea la función de densidad de la distribución normal definida comocon una media µ y una varianza σ2. El caso en el que su función de densidades , a la distribución se le conoce como normal estándar.Se define Sn como la suma de n variables aleatorias, independientes,idénticamente distribuidas, y con una media µ y varianza σ2 finitas (σ2≠0):
  13. 13. de manera que, la media de Sn es n·µ y la varianza n·σ2, dado que sonvariables aleatorias independientes. Con tal de hacer más fácil la comprensióndel teorema y su posterior uso, se hace una estandarización de Sn comopara que la media de la nueva variable sea igual a 0 y la desviación estándarsea igual a 1. Así, las variables Zn convergerán en distribución a la distribuciónnormal estándar N (0,1), cuando n tienda a infinito. Como consecuencia, si Φ(z) es la función de distribución de N (0,1), para cada número real z:donde Pr( ) indica probabilidad y lim se refiere a límite matemático.Enunciado formalDe manera formal, normalizada y compacta el enunciado del teorema es:Teorema del límite central: Sea X1, X2, ..., Xn un conjunto de variablesaleatorias, independientes e idénticamente distribuidas con media μ y varianzaσ2 distinta de cero. SeaEntonces .Es muy común encontrarlo con la variable estandarizada Zn en función de lamedia muestral ,puesto que son equivalentes, así como encontrarlo en versiones nonormalizadas como puede ser:
  14. 14. Teorema (del límite central): Sea X1, X2,..., Xn un conjunto de variablesaleatoria, independientes e idénticamente distribuidas de una distribución conmedia μ y varianza σ2≠0. Entonces, si n es suficientemente grande, la variablealeatoriatiene aproximadamente una distribución normal con y .Nota: es importante remarcar que este teorema no dice nada acerca de ladistribución de Xi, excepto la existencia de media y varianza.Ejemplos: La variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Silanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada unaindependiente entre si) se distribuye según una distribución normal.Este teorema se aplica tanto a suma de variables discretas como de variablescontinuas.Los parámetros de la distribución normal son:Media: n * m (media de la variable individual multiplicada por el número devariables independientes)Varianza: n * s2 (varianza de la variable individual multiplicada por elnúmero de variables individuales)Veamos ahora un ejemplo:Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y sisale cruz el valor 0. Cada lanzamiento es una variable independiente que sedistribuye según el modelo de Bernouilli, con media 0,5 y varianza 0,25.Calcular la probabilidad de que en estos 100 lanzamientos salgan más de 60caras.
  15. 15. La variable suma de estas 100 variables independientes se distribuye, portanto, según una distribución normal.Media = 100 * 0,5 = 50Varianza = 100 * 0,25 = 25Para ver la probabilidad de que salgan más de 60 caras calculamos la variablenormal tipificada equivalente:(*) 5 es la raíz cuadrada de 25, o sea la desviación típica de esta distribuciónPor lo tanto:P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228Es decir, la probabilidad de que al tirar 100 veces la moneda salgan más de 60caras es tan sólo del 2,28%.Ejercicio 1.La renta media de los habitantes de un país se distribuye uniformemente entre4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que alseleccionar al azar a 100 personas la suma de sus rentas supere los 725millones ptas.Cada renta personal es una variable independiente que se ditribuye según unafunción uniforme. Por ello, a la suma de las rentas de 100 personas se le puedeaplicar el Teorema Central del Límite.La media y varianza de cada variable individual es: m = (4 + 10) / 2 = 7 s2 = (10 - 4) ^2 / 12 = 3Por tanto, la suma de las 100 variables se distribuye según una normal cuyamedia y varianza son:
  16. 16. Media: n * m = 100 * 7 = 700Varianza: n * s2 = 100 * 3 = 300Para calcular la probabilidad de que la suma de las rentas sea superior a 725millones ptas, comenzamos por calcular el valor equivalente de la variablenormal tipificada:Luego: P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749Es decir, la probabilidad de que la suma de las rentas de 100 personasseleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%2.3 Muestreo: Introducción al muestreo y tipos demuestreo.En estadística se conoce como muestreo a la técnica para la selección de unamuestra a partir de una población.Al elegir una muestra se espera conseguir que sus propiedades seanextrapolables a la población. Este proceso permite ahorrar recursos, y a la vezobtener resultados parecidos a los que se alcanzarían si se realizase un estudiode toda la población.Cabe mencionar que para que el muestreo sea válido y se pueda realizar unestudio adecuado (que consienta no solo hacer estimaciones de la poblaciónsino estimar también los márgenes de error correspondientes a dichasestimaciones), debe cumplir ciertos requisitos. Nunca podremos estarenteramente seguros de que el resultado sea una muestra representativa, perosí podemos actuar de manera que esta condición se alcance con unaprobabilidad alta.En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de lapoblación, se puede extraer dos o más muestras de la misma población. Al
  17. 17. conjunto de muestras que se pueden obtener de la población se denominaespacio muestral. La variable que asocia a cada muestra su probabilidad deextracción, sigue la llamada distribución muestral.Tipos de muestreoExisten dos métodos para seleccionar muestras de poblaciones: el muestreo noaleatorio o de juicio y el muestreo aleatorio (que incorpora el azar comorecurso en el proceso de selección). Cuando este último cumple con lacondición de que todos los elementos de la población tienen algunaoportunidad de ser escogidos en la muestra, si la probabilidad correspondientea cada sujeto de la población es conocida de antemano, recibe el nombre demuestreo probabilístico. Una muestra seleccionada por muestreo de juiciopuede basarse en la experiencia de alguien con la población. Algunas vecesuna muestra de juicio se usa como guía o muestra tentativa para decidir cómotomar una muestra aleatoria más adelante.Muestreo probabilísticoForman parte de este tipo de muestreo todos aquellos métodos para los quepuede calcular la probabilidad de extracción de cualquiera de las muestrasposibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunqueen ocasiones no es posible optar por él. En este caso se habla de muestrasprobabilísticas, pues no es en rigor correcto hablar de muestrasrepresentativas dado que, al no conocer las características de la población, noes posible tener certeza de que tal característica se haya conseguido.Sin reposición de los elementos: Cada elemento extraído se descarta para lasubsiguiente extracción. Por ejemplo, si se extrae una muestra de una"población" de bombillas para estimar la vida media de las bombillas que laintegran, no será posible medir más que una vez la bombilla seleccionada.Con reposición de los elementos: Las observaciones se realizan conreemplazamiento de los individuos, de forma que la población es idéntica entodas las extracciones. En poblaciones muy grandes, la probabilidad de repetiruna extracción es tan pequeña que el muestreo puede considerarse sinreposición aunque, realmente, no lo sea.
  18. 18. Con reposición múltiple: En poblaciones muy grandes, la probabilidad derepetir una extracción es tan pequeña que el muestreo puede considerarse sinreposición. Cada elemento extraído se descarta para la subsiguienteextracción.Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útilla extracción de números aleatorios mediante ordenadores, calculadoras otablas construidas al efecto.Muestreo estratificadoConsiste en la división previa de la población de estudio en grupos o clasesque se suponen homogéneos con respecto a alguna característica de las que sevan a estudiar. A cada uno de estos estratos se le asignaría una cuota quedeterminaría el número de miembros del mismo que compondrán la muestra.Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una delas técnicas de selección más usadas en la práctica.Según la cantidad de elementos de la muestra que se han de elegir de cada unode los estratos, existen dos técnicas de muestreo estratificado:  Asignación proporcional: el tamaño de la muestra dentro de cada estrato es proporcional al tamaño del estrato dentro de la población.  Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población.Por ejemplo, para un estudio de opinión, puede resultar interesante estudiarpor separado las opiniones de hombres y mujeres pues se estima que, dentrode cada uno de estos grupos, puede haber cierta homogeneidad. Así, si lapoblación está compuesta de un 55% de mujeres y un 45% de hombres, setomaría una muestra que contenga también esos mismos porcentajes dehombres y mujeres.Para una descripción general del muestreo estratificado y los métodos deinferencia asociados con este procedimiento, suponemos que la población estádividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,..., Nh talque las unidades en cada estrato sean homogéneas respecto a la característicaen cuestión. La media y la varianza desconocidas para el i-ésimo estrato sondenotadas por mi y si2, respectivamente.
  19. 19. Muestreo sistemáticoSe utiliza cuando el universo o población es de gran tamaño, o ha deextenderse en el tiempo. Primero hay que identificar las unidades yrelacionarlas con el calendario (cuando proceda). Luego hay que calcular unaconstante, que se denomina coeficiente de elevación K= N/n; donde N es eltamaño del universo y n el tamaño de la muestra. Determinar en qué fecha seproducirá la primera extracción, para ello hay que elegir al azar un númeroentre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares.Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.Esto quiere decir que si tenemos un determinado número de personas que es lapoblación (N) y queremos escoger de esa población un número más pequeñoel cual es la muestra (n), dividimos el número de la población por el númerode la muestra que queremos tomar y el resultado de esta operación será elintervalo, entonces escogemos un número al azar desde uno hasta el númerodel intervalo, y a partir de este número escogemos los demás siguiendo elorden.Se divide la población en subconjuntos tomando en cuenta el factor deelevación. Por ejemplo: suponga que en una pequeña ciudad de 8,000habitantes según el censo se va a haber una encuesta y se selecciona unamuestra sistemática de 20 personas entre 1,200 padres de familia para conocerel grado de aceptación de la gestión administrativas de la ciudad por parte delpresidente municipal...(N = 1200 Población n = 20 MuestraFactor de Elevación N/n = 1200/20 = 60N SEDE TRIUNFO) Al azar un número de entre 1 y 60{3+60} n ={3,63,123,183,243,303,363,423,483,543,603,663,723,783,843,903,963,1023,1083,1143.Muestreo por estadios múltiplesEsta técnica es la única opción cuando no se dispone de lista completa de lapoblación de referencia o bien cuando por medio de la técnica de muestreosimple o estratificado se obtiene una muestra con unidades distribuidas de talforma que resultan de difícil acceso. En el muestreo a estadios múltiples sesubdivide la población en varios niveles ordenados que se extraen
  20. 20. sucesivamente por medio de un procedimiento de embudo. El muestreo sedesarrolla en varias fases o extracciones sucesivas para cada nivel.Por ejemplo, si tenemos que construir una muestra de profesores de primariaen un país determinado, éstos pueden subdividirse en unidades primariasrepresentadas por circunscripciones didácticas y unidades secundarias queserían los propios profesores. En primer lugar extraemos una muestra de lasunidades primarias (para lo cual debemos tener la lista completa de estasunidades) y en segundo lugar extraemos aleatoriamente una muestra deunidades secundarias de cada una de las primarias seleccionadas en la primeraextracción.Muestreo por conglomeradosTécnica similar al muestreo por estadios múltiples, se utiliza cuando lapoblación se encuentra dividida, de manera natural, en grupos que se suponeque contienen toda la variabilidad de la población, es decir, la representanfielmente respecto a la característica a elegir, pueden seleccionarse sóloalgunos de estos grupos o conglomerados para la realización del estudio.Dentro de los grupos seleccionados se ubicarán las unidades elementales, porejemplo, las personas a encuestar, y podría aplicársele el instrumento demedición a todas las unidades, es decir, los miembros del grupo, o sólo se lepodría aplicar a algunos de ellos, seleccionados al azar. Este método tiene laventaja de simplificar la recogida de información muestral.Cuando, dentro de cada conglomerado seleccionado, se extraen algunosindividuos para integrar la muestra, el diseño se llama muestreo bietápico.Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. Elprimer método funciona mejor cuanto más homogénea es la poblaciónrespecto del estrato, aunque más diferentes son éstos entre sí. En el segundo,ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad,aunque deben ser muy parecidos entre sí.Homogeneidad de las poblaciones o sus subgruposHomogéneo siginifica, en el contexto de la estratificación, que no hay muchavariabilidad. Los estratos funcionan mejor cuanto más homogéneos son cadauno de ellos respecto a la característica a medir. Por ejemplo, si se estudia laestatura de una población, es bueno distinguir entre los estratos mujeres y
  21. 21. hombres porque se espera que, dentro de ellos, haya menos variabilidad, esdecir, sean menos heterogéneos. Dicho de otro modo, no hay tantasdiferencias entre unas estaturas y otras dentro del estrato que en la poblacióntotal.Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se danlas mismas diferencias dentro del estrato que en toda la población, no hay porqué usar este método de muestreo. En los casos en los que existan grupos quecontengan toda la variabilidad de la población, lo que se construyen sonconglomerados, que ahorran algo del trabajo que supondría analizar toda lapoblación. En resumen, los estratos y los conglomerados funcionan bajoprincipios opuestos: los primeros son mejores cuanto más homogéneo es elgrupo respecto a la característica a estudiar y los conglomerados, sirepresentan fielmente a la población, esto es, contienen toda su viariabilidad, osea, son heterogéneos.Muestreo de juicioAquél para el que no puede calcularse la probabilidad de extracción de unadeterminada muestra. Se busca seleccionar a individuos que se juzga deantemano tienen un conocimiento profundo del tema bajo estudio, por lotanto, se considera que la información aportada por esas personas es vital parala toma de datos.Muestreo por cuotasEs la técnica más difundida sobre todo en estudios de mercado y sondeos deopinión. En primer lugar es necesario dividir la población de referencia envarios estratos definidos por algunas variables de distribución conocida (comoel género o la edad). Posteriormente se calcula el peso proporcional de cadaestrato, es decir, la parte proporcional de población que representan.Finalmente se multiplica cada peso por el tamaño de n de la muestra paradeterminar la cuota precisa en cada estrato. Se diferencia del muestreoestratificado en que una vez determinada la cuota, el investigador es libre deelegir a los sujetos de la muestra dentro de cada estrato.Muestreo de bola de nieveIndicado para estudios de poblaciones clandestinas, minoritarias o muydispersas pero en contacto entre sí. Consiste en identificar sujetos que seincluirán en la muestra a partir de los propios entrevistados. Partiendo de una
  22. 22. pequeña cantidad de individuos que cumplen los requisitos necesarios estossirven como localizadores de otros con características análogas.Muestreo subjetivo por decisión razonadaEn este caso las unidades de la muestra se eligen en función de algunas de suscaracterísticas de manera racional y no casual. Una variante de esta técnica esel muestreo compensado o equilibrado, en el que se seleccionan las unidadesde tal forma que la media de la muestra para determinadas variables seacerque a la media de la población.Véase también  Muestra estadística  Tamaño de la muestra  Error muestralEjemploVamos a hallar el intervalo de probabilidad para el peso medio de una muestrade 100 recién nacidos, con un nivel de confianza de 0,9, sabiendo que =3.100 gramos y =150 gramos.Solución: como se ha dicho anteriormente, tenemos que evaluar la siguienteexpresiónsi consultamos en la tabla de la N (0, 1), comprobaremos que, por lo tanto, el intervalo de probabilidad será el siguiente:Que simplificado, es el intervalo (3.075´325; 3.124´675)
  23. 23. 2.4 Teorema del límite centralEl Teorema del Límite Central o Teorema Central del Límite indica que, bajocondiciones muy generales, la distribución de la suma de variables aleatoriastiende a una distribución gaussiana cuando la cantidad de variables es muygrande.Existen diferentes versiones del teorema, en función de las condicionesutilizadas para asegurar la convergencia. Una de las más simples establece quees suficiente que las variables que se suman sean independientes,idénticamente distribuidas, con valor esperado y varianza finitas.La aproximación entre las dos distribuciones es en general mayor en el centrode las mismas que en sus extremos o colas, motivo por el cual se prefiere elnombre ―Teorema del Límite Central‖ (―central‖ califica al límite, más que alteorema).Esta relación entre la forma de la distribución de la población y la forma de ladistribución de muestreo se denomina teorema del límite central, que es talvez el más importante de toda la inferencia estadística. Nos asegura que ladistribución de muestreo de la media se aproxima a la normal al incrementarseel tamaño de la muestra. Hay situaciones teóricas en las que el teorema dellímite central no se cumple, pero casi nunca se encuentran en la toma dedecisiones práctica. Una muestra no tiene que ser muy grande para que ladistribución de muestreo de la media se acerque a la normal. Los estadísticosutilizan la distribución normal como una aproximación a la distribución demuestreo siempre que el tamaño de la muestra sea al menos de 30, pero ladistribución de muestreo de la media puede ser casi normal con muestrasincluso de la mitad de ese tamaño. La importancia del teorema del límitecentral es que nos permite usar estadísticas de muestra para hacer inferenciascon respecto a los parámetros de población sin saber nada sobre la forma de ladistribución de frecuencias de esa población más que lo que podamos obtenerde la muestra.
  24. 24. EjemploEn una asignatura del colegio la probabilidad de que te saquen a la pizarra encada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura.¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces?Se vuelve a aplicar el Teorema Central del Límite.Salir a la pizarra es una variable independiente que sigue el modelo dedistribución de Bernouilli:"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9La media y la varianza de cada variable independiente es: m = 0,10 s 2 = 0,10 * 0,90 = 0,09Por tanto, la suma de las 100 variables se distribuye según una normal cuyamedia y varianza son:Media: n * m = 100 * 0,10 = 10Varianza: n * s2 = 100 * 0,09 = 9Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamosel valor equivalente de la variable normal tipificada:Luego: P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lolargo del curso es tan sólo del 4,75% (¡¡¡ ánimo!!! no es tan grave)
  25. 25. 2.5 Distribución muestral de la mediaSe encarga de la recolección, clasificación, presentación, organización,análisis e interpretación de un conjunto de fenómenos, (naturales, económicos,políticos o sociales) de manera metódica y numérica, que permitan extraerconclusiones de un hecho, en un momento determinado y así poder tomardecisiones valederas. Estadísticaa) Estadísticab) Físicac) Matemáticasd) Psicologiae) GeografíaEjemploSi la vida media de operación de una pila de linterna es de 24 horas y estádistribuida normalmente con una desviación de 3 horas. ¿Cuál es laprobabilidad de que una muestra aleatoria de 100 pilas tenga una media que sedesvíe por más de 30 minutos del promedio?SOLUCIÓNP(X > 24.5horas) = 4.85%μ = 30 horas de duración_ = 3 horasn = 100 pilasLa probabilidad de que el promedio de la vida útil de las pilas supere las24.5horas es de 4.85%. 2.6 Distribución muestral de la diferencia de mediasSuponga que se tienen dos poblaciones distintas, la primera con media 1 ydesviación estándar 1, y la segunda con media 2 y desviación estándar 2.
  26. 26. Más aún, se elige una muestra aleatoria de tamaño n1 de la primera poblacióny una muestra independiente aleatoria de tamaño n2 de la segunda población;se calcula la media muestral para cada muestra y la diferencia entre dichasmedias. La colección de todas esas diferencias se llama distribuciónmuestral de las diferencias entre medias o la distribución muestral delestadísticoLa distribución es aproximadamente normal para n1 30 y n2 30. Si laspoblaciones son normales, entonces la distribución muestral de medias esnormal sin importar los tamaños de las muestras.En ejercicios anteriores se había demostrado que y que , por loque no es difícil deducir que y que .La fórmula que se utilizará para el cálculo de probabilidad del estadístico dediferencia de medias es:
  27. 27. EjemploEn un estudio para comparar los pesos promedio de niños y niñas de sextogrado en una escuela primaria se usará una muestra aleatoria de 20 niños yotra de 25 niñas. Se sabe que tanto para niños como para niñas los pesossiguen una distribución normal. El promedio de los pesos de todos los niñosde sexto grado de esa escuela es de 100 libras y su desviación estándar es de14.142, mientras que el promedio de los pesos de todas las niñas del sextogrado de esa escuela es de 85 libras y su desviación estándar es de 12.247libras. Si representa el promedio de los pesos de 20 niños y es elpromedio de los pesos de una muestra de 25 niñas, encuentre la probabilidadde que el promedio de los pesos de los 20 niños sea al menos 20 libras másgrande que el de las 25 niñas.Solución:Datos: 1= 100 libras 2 = 85 libras 1= 14.142 libras 2= 12.247 librasn1 = 20 niñosn2 = 25 niñas =?
  28. 28. Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra deniños sea al menos 20 libras más grande que el de la muestra de las niñas es0.1056.2.7 Distribución muestral de la proporciónLa necesidad de encontrar la proporción, porcentaje o porciento de unasituación dada en una población es tarea frecuente en estadística.La distribución muestral de proporciones es el conjunto de todas las muestrasposibles del mismo tamaño extraídas de una población, junto con el conjuntode todas las proporciones muéstrales.EjemploSuponga además que se seleccionan muestras aleatorias de tamaño 2 sinreemplazo. Calcule la antigüedad media para cada muestra, la media de ladistribución muestral y el error estándar, o la desviación estándar de ladistribución muestral.Solución:Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestrasposibles de tamaño 2, con sus respectivas medias muéstrales.
  29. 29. Muestras Antigüedad Media Muestral A,B (6,4) 5 A,C (6,2) 4 B,C (4,2) 3La media poblacional es:La media de la distribución muestral es:La desviación estándar de la población es:El error estándar o la desviación estándar de la distribución muestral es:Si utilizamos la fórmula del error estándar sin el factor de correcióntendríamos que:
  30. 30. Por lo que observamos que este valor no es el verdadero. Agregando el factor decorrección obtendremos el valor correcto: 2.8 Distribución muestral de la diferencia de proporciónesMuchas aplicaciones involucran poblaciones de datos cualitativos que debencompararse utilizando proporciones o porcentajes. A continuación se citanalgunos ejemplos:  Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban inglés?  Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de ese tipo?  Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales.  Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la máquina A a los que genera la máquina B?Cuando el muestreo procede de dos poblaciones binomiales y se trabaja condos proporciones muéstrales, la distribución muestral de diferencia deproporciones es aproximadamente normal para tamaños de muestra grande(n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2 tienen distribucionesmuéstrales aproximadamente normales, así que su diferencia p1-p2 tambiéntiene una distribución muestral aproximadamente normal.
  31. 31. Cuando se estudió a la distribución muestral de proporciones se comprobó que y que , por lo que no es difícil deducir que y que .La fórmula que se utilizará para el calculo de probabilidad del estadístico dediferencia de proporciones es:EjemploLos hombres y mujeres adultos radicados en una ciudad grande del nortedifieren en sus opiniones sobre la promulgación de la pena de muerte parapersonas culpables de asesinato. Se cree que el 12% de los hombres adultosestán a favor de la pena de muerte, mientras que sólo 10% de las mujeresadultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y100 mujeres su opinión sobre la promulgación de la pena de muerte,determine la probabilidad de que el porcentaje de hombres a favor sea almenos 3% mayor que el de las mujeres.Solución:Datos:
  32. 32. PH = 0.12PM = 0.10nH = 100nM = 100p (pH-pM 0.03) = ?Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser unadistribución binomial y se está utilizando la distribución normal.2.9 Distribución muestral de la varianzaLa causa es que el promedio de todas las varianzas de las muestras no coincidecon la varianza de la población s2. Se queda un poco por debajo. En concreto,se verifica que hemos usado el subíndice n para recordar que en la varianza sedivide entre n. Si deseamos que la media de la varianza coincida con lavarianza de la población, tenemos que acudir a la cuasivarianza o varianza
  33. 33. insesgada, que es similar a la varianza, pero dividiendo las sumas decuadrados entre n-1. Su raíz cuadrada es la cuasidesviación típica o desviaciónestándar. Si se usa esta varianza, si coinciden su media y la varianza de lapoblación lo que nos indica que la cuasivarianza es un estimador insesgado, yla varianza lo es sesgado. La suma de cuadrados de la varianza, dividida entrela varianza de la población se distribuye según una chi-cuadrado c2 con n-1grados de libertadLa varianza muestral En muchos casos es importante conocer el valor de lavarianza de la población • Para aplicar el teorema central del lımite • Paraestimar riesgos en inversiones (el riesgo depende de la varianza) • Para estimardesigualdades en ingresos, rentas, etc. Repetimos el estudio que hemosrealizado para la media muestral Partimos de que la varianza muestral es unavariable aleatoria Queremos relacionar sus momentos con los de la poblaciónY si es posible, identificar su distribución Esperanza de la varianza muestralSi ¯x denota la media muestral, se tiene que E" 1 n Xn i=1 (xi − ¯x)2 # = n – 1n_2 El valor esperado de la varianza muestral no es la varianza de la poblaciónDefinamos la varianza muestral como s2 =1 n−1 Xn i=1(xi − ¯x)2 Esperanzade la varianza muestral Con esta definición, tenemos E[s2] = _2 • El valoresperado de s2 coincide con el valor deseado (varianza de la población) • s2 esun estimador insesgado de _2 Distribución de la varianza muestral Nosgustaría tener información adicional sobre la varianza muestral y sudistribución.EjemploAveriguar si la variabilidad de edades en una comunidad local es la misma omayor que la de todo el Estado. La desviación estándar de las edades delEstado, conocida por un estudio reciente es de 12 años. Tomamos una muestraaleatoria de 25 personas de la comunidad y determinamos sus edades. Calcularla varianza de la muestra y usar la ecuación anteriormente explicada paraobtener el estadístico muestral.Las hipótesis nula y alternativas son:  H0 : 2 = 144  H1 : 2 144Se toma la muestra y resulta una desviación estándar muestral de 15
  34. 34. Años. La varianza de la muestra es entonces 225, y el estadístico ji cuadradade la muestra es:(n - 1 ) s2 (25-1)(15)2 2 = --------------- = ------------------- = 37,5 2 122Si la hipótesis nula es cierta, el estadístico muestral de 37,5 se obtiene de ladistribución ji cuadrada teórica, en particular, la distribución con 24 grados delibertad (25 - 1 = 24).Como se puede observar en la ecuación anterior, cuanto más grande es lavarianza muestral respecto a la varianza poblacional hipotética, mas grande esel estadístico que se obtiene. Luego deducimos que de un estadístico muestralgrande llevamos al rechazo de la hipótesis nula, y un estadístico muestralpequeño implicará que no se rechaze. La tabla ji cuadrada se usa paradeterminar si es probable o no que el valor 37,5 haya sido obtenido de ladistribución muestral ji cuadrada hipotética.Supongamos que esta prueba debe llevarse a un nivel de significancia de 0,02.En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra el valorcritico de 40, 27. La regla de decisión es:Si 2 40,27, se rechaza la hipótesis nula de que la varianza de la poblaciónes 144 (Se rechaza H0 si 2 > 40,27 ).Como estadístico de prueba calculado es 37,5, la hipótesis nula no se rechaza(con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se hubieseelegido un alfa de 0,05, el valor crítico de la tabla sería 36,415, y la hipótesisnula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra laimportancia de pensar con cuidado en el riesgo apropiado de un error de tipo Ien una prueba de hipótesis.Se supone que la hipótesis nula es cierta, lo que conduce a la obtención de unestadístico muestral de una distribución ji cuadrada con 2 grados de libertad.
  35. 35. 2.10 Distribución muestral de la relación de varianzasSe definió en la sección de la introducción de las distribuciones muéstrales.Esta sección revisa algunas propiedades importantes de la distribuciónmuestral de la media que se introdujeron en las manifestaciones de estecapítulo. Medio La media de la distribución muestral de la media es la media de la poblaciónde la cual los resultados se tomaron muestras. Por lo tanto, si una poblacióntiene una media, μ, entonces la distribución muestral de la media es μ. El M μsímbolo se utiliza para referirse a la media de la distribución muestral de lamedia. Por lo tanto, la fórmula de la media de la distribución muestral de lamedia puede ser escrito como: μ M = μDiferenciaLa varianza de la distribución muestral de la media se calcula de la siguientemanera: Es decir, la varianza de la distribución muestral de la media es la varianza dela población dividida por N, el tamaño de la muestra (el número de
  36. 36. calificaciones utilizada para calcular una media). Por lo tanto, cuanto mayorsea el tamaño de la muestra, menor será la varianza de la distribución muestralde la media.Esta expresión se puede derivar muy fácilmente de la ley de la suma devarianza . Comencemos por calcular la varianza de la distribución muestralde la suma de tres números en la muestra de una población con varianza σ 2.La varianza de la suma sería σ 2 + σ 2 + σ 2. Para los números de N, lavarianza sería Nσ 2. Puesto que la media es de 1 / N veces la suma, lavarianza de la distribución muestral de la media sería de 1 / N 2 veces lavarianza de la suma, que es igual a σ 2 / N.El error estándar de la media es la desviación estándar de la distribuciónmuestral de la media. Por lo tanto, la raíz cuadrada de la varianza de ladistribución muestral de la media y se puede escribir como:El error estándar está representado por una σ porque es una desviaciónestándar. El subíndice (M) indica que el error estándar en cuestión es el errorestándar de la media.EjemploLos siguientes son los pesos, en decagramos, de 10 paquetes de semillas depasto distribuidas por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8,46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianzade todos los paquetes de semillas de pasto que distribuye esta compañía,suponga una población normal.Solución:Primero se calcula la desviación estándar de la muestra:
  37. 37. al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2=0.286.Para obtener un intervalo de confianza de 95% se elige un = 0.05.Después con el uso de la tabla con 9 grados de libertad se obtienen los valoresde X2.Se puede observar en la gráfica anterior que el valor de X2 corre en formanormal, esto es de izquierda a derecha.Por lo tanto, el intervalo de confianza de 95% para la varianza es:Gráficamente:
  38. 38. Se observa que la varianza corre en sentido contrario, pero esto es sólo en lagráfica. La interpretación quedaría similar a nuestros temas anterioresreferentes a estimación. Con un nivel de confianza del 95% se sabe que lavarianza de la población de los pesos de los paquetes de semillas de pasto estáentre 0.135 y 0.935 decagramos al cuadrado.Unidad 3 Estimación de parámetros3.1 IntroducciónEs el procedimiento utilizado para conocer las característicasde un parámetro poblacional, a partir del conocimiento de lamuestra.Con una muestra aleatoria, de tamaño n, podemos efectuar unaestimación de un valor de un parámetro de la población; perotambién necesitamos precisar un:Intervalo de confianzaSe llama así a un intervalo en el que sabemos que está unparámetro, con un nivel de confianza específico.Nivel de confianzaProbabilidad de que el parámetro a estimar se encuentre en elintervalo de confianza.Error de estimación admisibleQue estará relacionado con el radio del intervalo de confianza.3.2 Características de un buen estimadorConviene que los estadísticos, en su función de estimadores de loscorrespondientes parámetros, reúnan determinados requisitos.Fundamentalmente son:a) CARENCIA DE SESGO.
  39. 39. Un estimador (estadístico) carece de sesgo si el promedio (media) de todos losvalores posibles de todas las muestras posibles de tamaño n de una poblaciónes igual al parámetro, es decir, si la media de la distribución muestral delestadístico considerado es igual al valor del parámetro. Así, la media es unestimador insesgado de μ porque se puede demostrar que la media aritméticade una distribución muestral coincide con el valor del parámetro, algo que nopuede decirse, por ejemplo, o de la varianza o de la mediana de una poblaciónno distribuida normalmente.b) CONSISTENCIA.Un estimador es consistente en la medida en que, al aumentar el tamaño de lamuestra, (n) su valor se acerca cada vez más al parámetro correspondiente o loque es lo mismo, si a medida que aumenta el tamaño de la muestra, lasestimaciones que ésta proporciona son cada vez más próximas al valor delparámetro.Algunos estimadores sesgados son consistentes, acercándose cada vez más susvalores a los de sus respectivos parámetros a medida que el tamaño de lamuestra (n) aumenta, tal es el caso de s o s2 que son estimadores sesgadospero consistentes de la desviación típica (σ) o de la varianza (σ2) de lapoblación.c) EFICIENCIALa 3ª propiedad de los estimadores es su eficiencia, que se refiere a laprecisión que alcanzan los estadísticos en la estimación de los parámetros, esdecir, un estimador será tanto más eficiente cuanto menos varíe de muestra amuestra de una misma población.Como la variabilidad de una distribución muestral viene dada por su errortípico, un buen estimador será aquel que menor error típico alcanza. Así, entrela media y la mediana, la primera es claramente más eficiente. La varianza dela distribución muestral de la mediana es mayor que la de la media, lo quesignifica que la mediana fluctúa más que la media en muestras sucesivas de lamisma población.En general, para escoger un óptimo estimador de un parámetro, debencombinarse los criterios de no tendenciosidad (carencia de sesgo) y deeficiencia. Ante dos estimadores insesgados del mismo parámetro, se preferirá
  40. 40. aquel que tenga mayor eficiencia, es decir, que tenga el mínimo error entérminos de varianza.• Estimadores insesgados: Media, Mediana, Moda, la desviación típica cuandon es tiende a infinito, la cuasivarianza muestral• Estimadores sesgados: la varianza muestral.• Estimadores consistentes: Proporciones, la media, la varianza y desviacióntípica.• Estimadores insesgados y no eficientes: Mediana muestral (estimadorinsesgado de μ]3.3 Estimación puntualPuede decirse que la Estadística es la ciencia que se preocupa de la recogidade datos, su organización y análisis, así como de las predicciones que, a partirde estos datos, pueden hacerse. Los aspectos anteriores hacen que puedahablarse de dos tipos de Estadística: Descriptiva e Inferencial.
  41. 41. La Estadísitica Descriptiva se ocupa de tomar los datos de un conjunto dado,organizarlos en tablas o representaciones gráficas y del cálculo de unosnúmeros que nos informen de manera global del conjunto estudiado.La Estadística Inferencial estudia cómo sacar conclusiones generales paratoda la población a partir del estudio de una muestra.Existen dos formas de hacer Inferencia Estadística:- La estimación de parámetros.- Las pruebas de hipótesis.En la Inferencia Estadística hay varios métodos, pero en cualquier caso esnecesario utilizar una muestra que represente a la población, esto se consiguecon las Técnicas de muestreo.A partir de una muestra nos proponemos dos objetivos:Obtener valores aproximados de parámetros poblacionales: Estimaciónpuntual. La estimación por intervalos de confianza tiene por objeto proporcionar, apartir de la información recogida en la muestra, un intervalo que contenga conalto nivel de confianza (probabilidad), al parámetro objeto de nuestro interés.A partir de dicho intervalo obtendremos una medida del error máximocometido al aproximar puntualmente el parámetro.Esencialmente son tres los parámetros de interés:En el caso de que investiguemos una variable cuantitativa:a) Para la media de la población μ tomaremos como aproximación la mediade la muestra. =
  42. 42. b) Para la varianza de la población σ2 tomaremos la cuasivarianza de lamuestra. = Si el estudio se centra en el estudio de un carácter cualitativo el parámetro deinterés será la proporción de elementos de la población que pertenecen a ciertacategoría C que lo aproximaremos con la correspondiente proporción en lamuestra.EjemploEn la práctica, los intervalos suelen indicarse dando el valor del estimadorpuntual utilizado como centro del intervalo y un valor que debe sumarse yrestarse para obtener el límite superior e inferior; por ejemplo: Equivale a3.3.1 MétodosEn inferencia estadística se llama estimación al conjunto de técnicas quepermiten dar un valor aproximado de un parámetro de una población a partirde los datos proporcionados por una muestra. Por ejemplo, una estimación dela media de una determinada característica de una población de tamaño Npodría ser la media de esa misma característica para una muestra de tamaño n.
  43. 43. La estimación se divide en tres grandes bloques, cada uno de los cuales tienedistintos métodos que se usan en función de las características y propósitos delestudio:  Estimación puntual  Método de los momentos  Método de la máxima verosimilitud  Método de los mínimos cuadrados  Estimación por intervalos  Estimación bayesiana3.3.1.1 Máxima verosimilitudEn estadística, la estimación por máxima verosimilitud (conocida tambiéncomo EMV y, en ocasiones, MLE por sus siglas en inglés) es un métodohabitual para ajustar un modelo y encontrar sus parámetros.FundamentoSupóngase que se tiene una muestra x1, x2, …, xn de n observacionesindependientes extraídas de una función de distribución desconocida confunción de densidad (o función de probabilidad) f0(·). Se sabe, sin embargo,que f0 pertenece a una familia de distribuciones { f(·|θ), θ ∈ Θ }, llamadamodelo paramétrico, de manera que f0 corresponde a θ = θ0, que es elverdadero valor del parámetro. Se desea encontrar el valor (o estimador) queesté lo más próximo posible al verdadero valor θ0.Tanto xi como θ pueden ser vectores.La idea de este método es el de encontrar primero la función de densidadconjunta de todas las observaciones, que bajo condiciones de independencia,esObservando esta función bajo un ángulo ligeramente distinto, se puedesuponer que los valores observados x1, x2, …, xn son fijos mientras que θpuede variar libremente. Esta es la función de verosimilitud:
  44. 44. En la práctica, se suele utilizar el logaritmo de esta función:El método de la máxima verosimilitud estima θ0 buscando el valor de θ quemaximiza . Este es el llamado estimador de máxima verosimilitud(MLE) de θ0:En ocasiones este estimador es una función explícita de los datos observadosx1,…, xn, pero muchas veces hay que recurrir a optimizaciones numéricas.También puede ocurrir que el máximo no sea único o no exista.En la exposición anterior se ha asumido la independencia de lasobservaciones, pero no es un requisito necesario: basta con poder construir lafunción de probabilidad conjunta de los datos para poder aplicar el método.Un contexto en el que esto es habitual es el del análisis de series temporales.Propiedades del estimador de máxima verosimilitudEn muchos casos, el estimador obtenido por máxima verosimilitud posee unconjunto de propiedades asintóticas atractivas:  consistencia,  normalidad asintótica,  eficiencia,  e incluso eficiencia de segundo orden tras corregir el sesgo.Consistencia
  45. 45. Bajo ciertas condiciones bastante habituales,2 el estimador de máximaverosimilitud es consistente: si el número de observaciones n tiende a infinito,el estimador converge en probabilidad a su valor verdadero:Bajo condiciones algo más fuertes,3 la convergencia es casi segura:EjemploSean y dos estimadores del parámetro θ, tales que:····¿Qué estimador es mejor?.Calculamos el sesgo para cada estimador:· Sesgo del Estimador 1: sesgo1 = θ - θ = 0· Sesgo del Estimador 2: sesgo2 = θ - θ/2 = θ/2Podemos observar, que el estimador 1 es insesgado, mientras que el estimador2, es sesgado.Para ver, que estimador es mejor, hallamos el error cuadrático medio de cadaestimador: .
  46. 46. · ECM 1 = 10· ECM 2 = 4 + (θ/2)2Para saber cual estimador es mejor, usamos el cociente del error cuadráticomedio:Sustituyendo valores:Para que el estimador 1 sea mejor que el estimador segundo, se debecorroborar:Despejamos: 40 <. 16 + θ2Por lo tanto, para que el estimador 1 sea más eficiente que el estimador 2, sedebe cumplir: θ2 > 24.1.3.3.2 MomentosSe trata de un método de obtención de estimadores muy intuitivo.Básicamente, consiste en igualar los momentos poblacionales (que seanfunción del o los parámetros a estimar) con los momentos muéstrales ydespejar el parámetro a estimar.Así, por ejemplo, la esperanza de una variable aleatoria se estimaría por la
  47. 47. media muestral; la varianza, por la varianza muestral; etc.La principal ventaja de este método es su simplicidad. Sin embargo, aunquelos estimadores así obtenidos son consistentes, en general, no son centrados nieficientes. Además, en ciertos casos puede proporcionar estimacionesabsurdas, como veremos en el siguiente ejemplo:Supongamos que tenemos una variable con distribución uniforme donde ellímite inferior es cero y el superior es desconocido. Naturalmente, estaremosinteresados en estimar el límite superior (al que llamaremos b) de nuestradistribución uniforme. X sigue una distribución uniforme (a = 0, b =?)Recordemos que la esperanza de una distribución uniforme comprendida entredos valores a y b es el promedio de estos dos valores.Por tanto, para aplicar el método de los momentos para estimar b, igualaremosdicho promedio a la media aritmética:3.4 Intervalo de confianza para la mediaEn estadística, se llama intervalo de confianza a un par de números entre loscuales se estima que estará cierto valor desconocido con una determinadaprobabilidad de acierto. Formalmente, estos números determinan un intervalo,que se calcula a partir de datos de una muestra, y el valor desconocido es unparámetro poblacional. La probabilidad de éxito en la estimación se representacon 1 - α y se denomina nivel de confianza. En estas circunstancias, α es elllamado error aleatorio o nivel de significación, esto es, una medida de lasposibilidades de fallar en la estimación mediante tal intervalo.1El nivel de confianza y la amplitud del intervalo varían conjuntamente, deforma que un intervalo más amplio tendrá más posibilidades de acierto (mayor
  48. 48. nivel de confianza), mientras que para un intervalo más pequeño, que ofreceuna estimación más precisa, aumentan sus posibilidades de error.Para la construcción de un determinado intervalo de confianza es necesarioconocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitualque el parámetro presente una distribución normal. También puedenconstruirse intervalos de confianza con la desigualdad de Chebyshov.En definitiva, un intervalo de confianza al 1 - α por ciento para la estimaciónde un parámetro poblacional θ que sigue una determinada distribución deprobabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α,donde P es la función de distribución de probabilidad de θ.EjemplosDe una población de media μ y desviación típica σ se pueden tomar muestrasde n elementos. Cada una de estas muestras tiene a su vez una media ( ). Sepuede demostrar que la media de todas las medias muéstrales coincide con lamedia poblacional:2Pero además, si el tamaño de las muestras es lo suficientemente grande,ladistribución de medias muéstrales es, prácticamente, una distribución normal(o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: .Esto se representa como sigue: . Si estandarizamos, se sigue que:En una distribución Z ~ N (0, 1) puede calcularse fácilmente un intervalodentro del cual caigan un determinado porcentaje de las observaciones, estoes, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 esel porcentaje deseado (véase el uso de las tablas en una distribución normal).Se desea obtener una expresión tal que
  49. 49. En esta distribución normal de medias se puede calcular el intervalo deconfianza donde se encontrará la media poblacional si sólo se conoce unamedia muestral ( ), con una confianza determinada. Habitualmente semanejan valores de confianza del 95 y del 99 por ciento. A este valor se lellamará 1 − α (debido a que α es el error que se cometerá, un término opuesto).Para ello se necesita calcular el punto Xα / 2 —o, mejor dicho, su versiónestandarizada Zα / 2 o valor crítico— junto con su "opuesto en la distribución"X − α / 2. Estos puntos delimitan la probabilidad para el intervalo, como semuestra en la siguiente imagen:Dicho punto es el número tal que:Y en la versión estandarizada se cumple que:z − α / 2 = − zα / 2Así:Haciendo operaciones es posible despejar μ para obtener el intervalo:
  50. 50. De lo cual se obtendrá el intervalo de confianza:Obsérvese que el intervalo de confianza viene dado por la media muestral± el producto del valor crítico Zα / 2 por el error estándar .Si no se conoce σ y n es grande (habitualmente se toma n ≥ 30):4 , donde s es la desviación típica de una muestra.Aproximaciones para el valor zα / 2 para los niveles de confianza estándar son1,96 para 1 − α = 95% y 2,576 para 1 − α = 99%.5Intervalo de confianza para una proporciónEl intervalo de confianza para estimar una proporción p, conocida unaproporción muestral pn de una muestra de tamaño n, a un nivel de confianzadel (1-α) ·100% es:En la demostración de estas fórmulas están involucrados el Teorema Centraldel Límite y la aproximación de una binomial por una normal. 3.5 Intervalo de confianza para la diferencia de mediasSean X11, X12,… X1n1, una muestra aleatoria de n1 observaciones tomadasde una primera población con valor esperado µ1 y varianza s
  51. 51. 1, y X21, X22,… X2n2 una muestra aleatoria de n2 observaciones tomada dela segunda población con valor esperado µ2 y varianza s2. Si son las medias muéstrales, la estadística es un estimador puntual de µ1 -µ2, y tiene una distribución normal si las dos poblaciones son normales, oaproximadamente normal si cumple con las condiciones del teorema del límitecentral (tamaños de muestras relativamente grandes). Es decir, Por lo tanto,Para calcular el intervalo de confianza para la diferencia de dos medias sedebe saber si las varianzas poblacionales son conocidas o desconocidas, y encaso de que sean desconocidas, se debe probar si son iguales o diferentes.Cada uno de estos tres casos se analizará por separadoVarianzas conocidasSi las varianzas poblacionales son conocidas, los pasos a seguir para encontrarel intervalo de confianza son los siguientes:a) El estadístico usado como estimador puntual de la diferencia de medias µ1 -µ2 será T =, que es un estimador suficiente b) La variable aleatoria asociadacon el estimador será la variable normal estándar dada por:c) Para calcular el intervalo de confianza se debe tener en cuenta la siguienteprobabilidad:Manipulando la expresión anterior en forma similar a como se hizo en loscasos de una sola muestra se llega al siguiente teorema que nos define elintervalo de confianza para la diferencia entre dos medias µ1 - µ2 convarianzas conocidas s1 y s 2.Teorema. Si son las medias de dos muestras aleatorias independientes de tamaño n1 y n2tomadas de poblaciones que tienen varianzas conocidas s1 y s2, respectivamente, entoncesun intervalo de confianza del 100(1-a)% para µ1 - µ2.EjemploConstruya un intervalo de confianza del 94% para la diferencia real entre lasduraciones de dos marcas de bombillos, si una muestra de 40 bombillos
  52. 52. tomada al azar de la primera marca dio una duración media de 418 horas, yuna muestra de 50 bombillos de otra marca dieron una duración media de 402horas. Las desviaciones estándares de las dos poblaciones son 26 horas y 22horas, respectivamente.Solución. Tenemos que:, , s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88. Elintervalo de confianza es, entonces:El hecho de que ambos límites sean positivos, y por lo tanto no contengan elvalor cero indican que ambas marcas no tienen la misma duración media, ysugiere que pueda pensarse que la primera marca de bombillos tenga unaduración media superior a la segunda.Varianzas desconocidas e iguales (= =)Cuando las varianzas son desconocidas, se debe realizar previamente unaprueba estadística para verificar si éstas son iguales o diferentes. Pararealizarlo debemos hacer uso de la distribución F, bien sea mediante el cálculode la probabilidad de que la muestra tomada provenga de dos poblaciones convarianzas iguales, o mediante el uso de un intervalo de confianza para larelación de dos varianzas, según se estudiará más adelante.Si mediante el uso de la distribución F se llega a la conclusión de que lasvarianzas son iguales, el procedimiento a seguir para el cálculo del intervalode confianza para la diferencia de dos medias será el siguiente:a) El estadístico usado como estimador puntual de la diferencia de medias µ1 -µ2 será T =, que es un estimador suficiente.b) La variable aleatoria asociada con el estimador será la variable T definidacomo: donde es un estimador combinado de s, mejor que por separado, yc) Para calcular el intervalo de confianza se debe tener en cuenta la siguienteprobabilidad:De nuevo, manipulando la expresión anterior en forma similar a los casos sellega al siguiente teorema que nos define el intervalo de confianza para ladiferencia entre dos medias µ1 - µ2 con varianzas desconocidas s1 y s 2, peroiguales.
  53. 53. CONCLUSIONESEl análisis de los resultados del presente trabajo conduce a enunciar lassiguientes conclusiones derivadas del proceso de investigación:Que la estadística como ciencia nos ayuda en la recolección, análisis einterpretación de datos, ya sea para ayudar en la toma de decisiones o paraexplicar condiciones regulares o irregulares de algún fenómeno o estudioaplicado, de ocurrencia en forma aleatoria o condicional. Sin embargoestadística es más que eso, en otras palabras es el vehículo que permite llevara cabo el proceso relacionado con la investigación científica.Es transversal a una amplia variedad de disciplinas, desde la física hasta lasciencias sociales, desde las ciencias de la salud hasta el control de calidad. Seusa para la toma de decisiones en áreas de negocios o institucionesgubernamentales.La estadística se divide en dos grandes áreas:  La estadística descriptiva, se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, entre otros.  La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.
  54. 54. Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.Hay también una disciplina llamada estadística matemática, la que se refiere alas bases teóricas de la materia. La palabra «estadísticas» también se refiere alresultado de aplicar un algoritmo estadístico a un conjunto de datos, como enestadísticas económicas, estadísticas criminales, entre otros.Bibliografíahttp://es.wikipedia.org/wiki/Estad%C3%ADsticahttp://www.ucm.es/info/genetica/Estadistica/estadistica_basica.htmhttp://webdelprofesor.ula.ve/arquitectura/jorgem/principal/guias/cap3.pdfhttp://www.monografias.com/trabajos11/tebas/tebas.shtmlhttp://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.htmlhttp://www.uam.es/personal_pdi/psicologia/carmenx/EsquemaTema21b.pdfhttp://www.mitecnologico.com/Main/DistribucionMuestralDeLaVarianzahttp://colposfesz.galeon.com/inferencia/teoria/estima.htmhttp://es.wikipedia.org/wiki/M%C3%A1xima_verosimilitudhttp://es.wikipedia.org/wiki/Intervalo_de_confianzahttp://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0C8m1t16.htm

×