Your SlideShare is downloading. ×
7. metodologia y estadistica aplicada a la educacion
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

7. metodologia y estadistica aplicada a la educacion

3,251
views

Published on


0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
3,251
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
128
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  LGE ESPACIO CURRICULARMETODOLOGÍA Y ESTADÍSTICA APLICADA A LA EDUCACIÓN Autores:  Dra. Marta Graciela del Valle Pece  Mg. Ing. Margarita Juárez de Galíndez  Mg. Lic. María Mercedes Simonetti 1 
  • 2. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE PROGRAMA DE ESPACIO CURRICULARUNIDAD I: EstadísticaConcepto. Etapas en el trabajo estadístico. Estadística Descriptiva eInferencial. Variable: concepto. Clasificación de variables. Seriessimples. Agrupamiento de datos en series de frecuencias. Frecuenciasabsolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,frecuencias relativas acumuladas y porcentajes acumulados. Tasas deuso común: de escolarización, de analfabetismo, de desgranamiento, deretención.UNIDAD II: Presentación de dat os est adísticos.Partes funcionales y construcción de tablas estadísticas. Elementosestructurales de las tablas. Tablas simples, cruzadas. Análisis de tablasestadísticas. Técnicas de representaciones gráficas. Reglas deconstrucción. Gráficos según los distintos tipos de variables.UNIDAD III: Medidas de resumen.Medidas de tendencia central. Media aritmética, mediana y moda.Comparación de media, mediana y moda. Distribuciones simétricas yasimétricas. Medidas de dispersión. Rango, variancia y desviaciónestándar y desviación mediana. Coeficiente de variación. Medidas delocalización. Percentiles y rango percentil. Aplicaciones.UNIDAD IV: Nociones element ales de probabilidad. Inferenciaestadística.Experimentos aleatorios: conceptos básicos. Probabilidad clásica,frecuencial y axiomática. Teorema de la suma y del producto deprobabilidades.Tabla de contingencia. Cálculo de probabilidades.Distribución de probabilidades de variables aleatorias discretas:Uniforme y Binomial.Cálculo de probabilidad en variables aleatorias continuas: distribuciónnormal y distribución normal estándar.Población. Definición de muestra aleatoria. Diseños de muestreo.Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos.Muestreo por conglomerados. Concepto.Estimación puntual y por Intervalos de confianza para muestrasgrandes en el Muestreo al Azar Simple. 2 
  • 3. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DADES I  y I I INTRODUCCIÓN La palabra Estadística proviene del latín status (estado).Precisamente la primera aplicación de la estadística consistió en larecopilación de datos y la construcción de gráficos para describir el estadode un país. Con el correr del tiempo esta herramienta fue evolucionandohasta que en la actualidad podríamos decir que no hay aspectos de la vidacotidiana donde no se aplique la Estadística. Hogares, gobiernos ynegocios se apoyan en datos estadísticos para dirigir sus acciones. El objetivo que se persigue con este módulo es proporcionar aldocente herramientas y técnicas para obtener datos, procesarlos paraobtener información que sirva para la interpretación correcta defenómenos que se producen en su ámbito de trabajo. ESTADÍSTICA. CONCEPTOS. La Estadíst ica es una colección de métodos para planearexperimentos, obtener datos, y después organizar, resumir, presentar,analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004). Otra definición considera a la Estadística como una disciplinaperteneciente a la Matemática Aplicada que se dedica al estudiocuantitativo de fenómenos colectivos. Proporciona los métodos para:· La recolección de datos· Su ordenamiento, resumen y presentación,· Su análisis e interpretación y· Posterior enunciado de conclusiones. Los cuatro pasos que se han enumerado constituyen las etapas deltrabajo estadístico. La primera etapa tiene como objetivo recolectar datos proveniente demedición, conteo u observación efectuado sobre el material objeto deestudio en base a un plan formulado según los principios del diseñoexperimental y las técnicas de muestreo. 3 
  • 4. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La segunda etapa consiste en ordenar los datos en tablas estadísticas,presentarlos mediante gráficos y diagramas y resumirlos a través delcálculo de promedios, porcentajes e índices. En la tercera etapa se analizan los resultados obtenidos en la etapaanterior, y comienzan a distinguirse las características del fenómeno, loque permite utilizar diferentes métodos para analizarlos e interpretarlos. En la última etapa se debe concluir acerca del estudio realizado. Si las conclusiones, se refieren exclusivamente a los datos de los quese dispone (una parte de la población que se desea estudiar), se dice quela Esta dísti ca es Descriptiva . Si por el contrario, las conclusiones van más allá de los datos que sedispone y se refieren a un conjunto mayor (población), del cual seextrajeron, se dice que la Esta dí stica es Inf erencial ; las conclusionesvan de lo particular (muestra) a lo general (la población).Esta se basa en elestudio de la teoría de probabilidades que nos permite medir el error denuestras afirmaciones. Las est adísticas (en plural) se obtienen como resultado del trabajoestadístico y están constituidas por porcentajes, promedios, tablas,gráficos y otros elementos que describen un fenómeno y ayudan a sucomprensión (Ej.: estadísticas demográficas, estadísticas del fútbol,estadísticas de accidentes de tránsito, estadísticas universitarias, etc.). Es necesario definir algunos conceptos importantes: por ejemplo Población. Se define población como el conjunto de individuos u objetos que comparten una característica común, en la que el investigador está interesado. Muestra. Es un subconjunto de la población. Debe ser representativa, es decir se deben mantener las mismas características de la población en estudio. Una población puede ser finita o infinita. Población finita Una población finita es aquella que puede ser físicamente listada Población infinita. Una población es infinita, cuando en la práctica no puede ser físicamente listada 4 
  • 5. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o. Una población puede ser definida como los alumnos de la escuela San Francisco. Los alumnos pueden ser listados e individualizados a través de los registros áulicos. Es un ejemplo de pobl a ción f inita . Personas portadoras de SIDA en Santiago del Estero, constituyen un ejemplo de pobl a ción i nfinita . Unidad de observación: es aquélla sobre la cual se efectúan las mediciones u observaciones. La unidad de observación puede ser una persona, una familia, una planta, una parcela, etc. Dat o: es el valor que se obtiene de la medición, observación o conteo efectuada en la unidad de observación o unidad de muestreo. Por ejemplo si el objetivo de una investigación es el rendimiento de los alumnos, la unidad de observación es el alumno. El número de materias rendidas contadas en un alumno es el dato. El conjunto de datos obtenidos de cada unidad de observación constituirá la base para el análisis estadístico del rendimiento de los alumnos de la escuela San Francisco.Va ri a bles. Concepto y ti pos. Variable. Una variable es cualquier característica que varía de una unidad de muestreo a otra en la población o en la muestra Ejempl o 1: Supóngase que interesa conocer la salud de los alumnos,entonces la variable a observa r en cada alumno será el esta do de sa l ud,el que podrá asumir dos valores: sano o enfermo. Ejempl o 2: Si interesa saber el número de herma nos que poseeca da a lumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,ny se deberá contar cuantos hermanos posee cada alumno. 5 
  • 6. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada poralumnos, se debe medir la variable altura la que, expresada en metrospodrá tener valores mayores a 1 metro. En los tres ejemplos anteriores, el nombre de la variable y la formade obtener sus valores está resaltado en negrita. En el primer ejemplo, losvalores que puede asumir la variable son calidades, por lo que se dice quela variable es cualitat iva. Las calidades o categorías pueden ser naturalescomo al definir la variable sexo, o arbitrarias como la clasificación dealturas en bajas, medianas y altas. Por el contrario, en los otros dos ejemplos los valores que asumenlas variables pueden expresarse mediante números, por lo que las dosúltimas variables son cuant it ativas. En el caso de número de hermanos,la variable toma sólo determinados valores en el intervalo que va de cero an por lo que se la denomina variable cuantitat iva discreta odiscontinua; cuando la variable toma los infinitos valores dentro delintervalo se dice que la variable es cuantitat iv a continua Otra forma de clasificación de las variables es mediante el empleo decuatro niveles de medición: nominal, ordinal, de intervalo y de razón.Cuando se manejan datos reales el nivel de medición es importante ya queorienta sobre el procedimiento estadístico a utilizar. Un nivel de medición es nominal cuando los valores de variablesson nombres, etiquetas o categorías y no se puede establecer un ordenentre ellos.Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de unalumno. Aunque las ciudades pueden ser ordenadas según su tamaño,densidad poblacional, grado de contaminación del aire, etc., en general, lavariable “lugar de nacimiento” no tiene un orden establecido Con estos datos no es posible realizar cálculos. A veces se asignannúmeros a las diferentes categorías; a la variable salud que posee dosvalores sano y enfermo, podemos codificarlas numéricamente de lasiguiente manera 1= sano, 2= enfermo pero esto no es nada más que unacodificación y tales números no tienen significado computacional. Un nivel de medición es ordinal cuando se puede establecer unorden entre las categorías de la variable. Ejemplo: máximo nivel deinstrucción alcanzado por los padres de los alumnos: analfabeto, primario,secundario, terciario, universitario. 6 
  • 7. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Lo único que podemos decir es que el nivel de instrucciónsecundario es mayor que el primario y que el universitario es mayor que elprimario, secundario o terciario, pero no podemos decir cuanto mayor esuna categoría de la variable respecto a la otra. Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5. Si bien se podría hacer la diferencia entre 2­1=1 y 4­3=1, esteresultado 1 no significa que entre el primario y el analfabeto hay la mismacantidad de conocimiento que entre el universitario y el nivel terciario. Otro niv el de medición es el de int erv alo. En este nivel ladiferencia entre dos valores de datos tiene un significado. En este nivel nohay un cero natural, donde nada de la cantidad esté presente. El valor delcero es convencionalEjempl o: La variable Temperatura está medida en escala de intervalo. Untermómetro por ejemplo, mide la temperatura en grados que son del mismotamaño en cualquier punto de la escala. Aquí no existe un punto de partidanatural, el valor 0° es arbitrario y no representa la ausencia total de calor.La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Sepueden realizar operaciones de suma y resta pero no cociente entre valores. Por último el nivel de medición de razón o cociente aunque separece al nivel de medición de intervalo tiene un punto de partida o ceroinherente (donde cero indica que nada de la cantidad está presente). Paralos valores en este nivel tanto las diferencias como los cocientes tienensignificado. En este nivel se pueden realizar todas las operaciones.Ejemplo: Los precios de los libros de texto (0$ representa ningún costo yun precio de $60 es dos veces más costoso que uno de $30). 7 
  • 8. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Datos Variable  Variable  Categórica o  numérica o  cualitativa  cuantitativa  Escala  Escala  Escala de  Escala de  nominal  ordinal  intervalo  razón  minal Seri es de datos. Series si mples El conjunto de valores de una variable constituye una serie de datos.Se presentan a continuación series de datos referidas a los tres ejemplosque se dieron para ilustrar tipos de variables: Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Cursode EGB1 de la escuela San Francisco y se anota su estado de salud(S=Sano, E=Enfermo). Generalmente las variables se designan con las últimas letras delabecedario en mayúscula por ej. X y los valores que toma la variable con xminúscula; incluso se coloca x i donde el subíndice i indica el número deindividuo observado; de éste modo las 30 observaciones son:x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,S, S, S, S.El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.Ejempl o 2: Un maestro de la Escuela San Martín interroga a sus 30alumnos de primer grado de EGB1 sobre el número de hermanos queposeen.Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.  8 
  • 9. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .;x30 =0. Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de SecciónMaternal de la Escuela San Francisco la que expresada en cm es lasiguiente:xi(cm):70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,74. Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .; x25 =74. Los datos en brut o, t al cual fueron obt enidos, sin agruparconst it uyen una serie simple.Tablas y gráficosOrga ni za ci ón de datos ca tegóricos o cua litativos. Cuando la masa de datos obtenidos es muy grande y éstos estándesordenados, no dan información alguna; conviene por lo tantoordenarlos y tabularlos, haciendo uso de tablas estadísticas, que debenconfeccionarse de tal modo que los datos resulten fáciles de ser leídos einterpretados. Con los datos del ejemplo 1 se puede construir una tabla defrecuencias.Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa, es una tabla que asocia cada categoría de la variable con el número de veces que se repite la categoría.Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, segúnestado de salud. Año 2004. i Categorías:xi Frecuencias: fi (Estado de salud) (nº de alumnos) 1 Sano 24 2 Enfermo 6 Total 30 Fuente: Datos ficticios 9 
  • 10. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEFrecuencia absoluta: Es el nº de veces que se repite cada categoría de la variable. Se la simboliza con fi.La suma de las frecuencias absolutas, es igual al nº total de observaciones, 2  å  f i en éste caso 30 ( = 1 =30). Nótese que “ i “ ahora se refiere a las i categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6. La tabla de frecuencias, es la más sencilla de las tablas y es unatabla de simple entrada pues los individuos se clasifican según una únicavariable, estado de salud en el ejemplo. Los datos organizados en tabla de simple entrada para variablecualit ativa, pueden presentarse mediante gráficos, que tiene la finalidadde que la información entre por los ojos. El gráfico que puede usarse enéste caso es el gráfico de barras.Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,según estado de salud. Año 2004.  30  25  Nº de alumnos  20  15  10  5  0  Sanos  Enfermos  Estado de salud  Fuente: Datos ficticios. Para su construcción se utiliza el sistema de coordenadasortogonales. Sobre el eje horizontal se colocan las distintas categorías de lavariable en estudio (estado de salud) y sobre el eje vertical con una escalaadecuada, se representan las frecuencias. Se dibujan barras de ancho 1 0 
  • 11. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEconstante, una para cada valor de la variable, con una altura querepresenta el valor de la frecuencia que corresponde a cada categoría. Esconveniente que la separación entre las barras sea menor que el ancho delas mismas. El ancho de las barras debe elegirse teniendo en cuenta el espaciodisponible, el número de categorías de la variable a representar y la alturaque les corresponde, con el objeto de obtener un gráfico proporcionado.Las barras pueden dibujarse en sentido vertical u horizontal.Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,según estado de salud. Año 2004 Estado de salud  Enfermos  Sanos  0  5  10  15  20  25  30  Nº de alumnos Fuente: Datos ficticios En algunos trabajos es necesario calcular frecuencias relativas.Frecuencia relativa de una categoría es la proporción de veces que ocurre dicha categoría.Se obtiene dividiendo la frecuencia absoluta de cada categoría entre lasuma de las frecuencias de todas las categorías. La suma en éste caso esf1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo å quese denomina sumatoria, así  i  = 2  å  i  = 1 fi  = f  1  + f  2  = 24  + 6  = 30  1 1 
  • 12. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEa la frecuencia relativa de la clase i­ésima se la simboliza con fri y se lacalcula de la siguiente manera:  f i  fr  = i  å f i La suma de las frecuencias relativas es siempre igual a 1. n  å fri   = 1  i  =1 Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes.En éste ejemplo sería:Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, segúnestado de salud. Año 2004. i xi fi f ri Porcentajes: (Estado de salud) % 1 Sano 24 24/30=0,80 80 2 Enfermo 6 6/30=0,20 20 Total 30 1.00 100 Fuente: Datos ficticios Se pueden representar los datos de la tabla 2 mediante un gráfico debarras, sólo que en el eje vertical van los porcentajes.Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,según estado de salud. Año 2004. % 100  80  60  40  20  0  sanos  enfermos  Estado de salud  Fuente: Datos ficticios  1 2 
  • 13. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro gráfico adecuado para representar series de frecuencias devariable cualitativa es el gráfico de sectores circulares, llamado gráficode tortas o pie charts .Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, segúnsexo. Año 2004 Sexo fi f ri 360ºxf ri (nº de alumnos) Varones 15 0,38 137º Mujeres 25 0,62 223º Total 40 1,00 360º Fuente: Datos ficticiosSe elige un radio por ej 3cm (el valor del radio se elige según el espacio quese disponga para el gráfico) y se grafica un círculo. La superficie de dichocírculo representa el total de alumnos (40), en consecuencia, lecorresponde un ángulo de 360°. Se puede discriminar mediante sectorescirculares la porción que corresponde a las mujeres y a los varones. Losgrados correspondientes a los sectores se obtienen multiplicando lafrecuencia relativa por 360º.Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,según sexo. Año 2004 Varones  Mujeres 38%  62%  Fuente: Datos ficticios  1 3 
  • 14. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEVa ri a bles cua ntitativa s.Ejemplo: Nº de hermanos que tienen los alumnos de primer grado deEGB1 de la escuela San MartínXi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0 Para el caso de v ariables cuantitat ivas discretas, la tabla defrecuencias se construye de la siguiente manera: se ubica el valor mayor yel menor valor de la variable (en el ejemplo 2 del n° de hermanos poralumno, el menor valor es cero y el valor mayor 6), se colocan todos losvalores correspondientes en la primera columna de la tabla, y luego secuentan las veces que se presentan dichos valores. La tabla resultante es:Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martínsegún Nº de hermanos Xi fi Fi fr % 0 5 5 0,17 17 1 5 10 0,17 17 2 6 16 0,20 20 3 3 19 0,10 10 4 4 23 0,13 13 5 3 26 0,10 10 6 4 30 0,13 13 Total 30 1,0 100 Fuente: Datos ficticios La diferencia que existe entre cada clase es constante e igual a 1. Además de las frecuencias relativas (cuyo cálculo se explicó enpárrafos anteriores) aquí se puede calcular también las frecuenciasacumuladas Fi. La frecuencia acumulada de una clase se obtienesumándole a la frecuencia de la clase, la frecuencia de las clasesanteriores. F (0)=5 F (1)=5+5=10 F (2)=5+5+6=16 = Fi (1)+6 La tabla de frecuencias para variables cuantitativas discretas serepresenta mediante un gráfico de bastones. En la abscisa se colocan losvalores de la variable y se levanta para cada uno de ellos una línea dealtura igual a su frecuencia. 1 4 
  • 15. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 4. Alumnos de primer grado de EGB1 de la escuela SanMartín según Nº de hermanos  6  5  4  frecuencia  3  2  1  0  0  1  2  3  4  5  6  Número de hermanos  Fuente: Datos ficticiosInt erpretación:El número 6 en la columna de fi significa que 6 alumnos tienen 2hermanosEl número 19 en la columna Fi significa que 19 alumnos tienen 3hermanos o menosEl número 20 en la columna de porcentajes significa que el 20% de losalumnos tienen 2 hermanos Para el caso de variables cuantit ativas continuas como los datosdel ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de laEscuela San Francisco) que fueron obtenidos por medición, se recomiendaconstruir intervalos de clase, cuya amplitud depende de la cantidad deintervalos que se deseen construir y la cantidad de datos que posee la seriesimple. Es recomendable que los intervalos de clases sean iguales, es decirque la amplitud de los mismos (a) sea constante. La técnica a emplear parael agrupamiento de una serie simple de variable cuantitativa continua essencilla. 1 5 
  • 16. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSExi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,78, 95, 99, 97, 84, 86, 78, 741. ­Se ubica el valor mayor que toma la variable (99 cm) y el valor menor(70 cm).2. ­ Se obtiene la diferencia, la que se denomina Rango o amplitud devariación y se designa con la letra R.  R = x  - x  = 99 - 70 = 29  max min 3.– El número de intervalos aproximado se puede calcular con la siguientefórmula:  log(n + 1)  n   de intervalos = ° log(2) dónde n: n° de valores de la serie o tamaño de la muestra log: logaritmo decimal  log(  + 1  25  )  n °de int erv  = .  = 4 7004 » 5 int ervalos  .  log(  )  2 Cuando en la variable que se estudia existen intervalos predeterminados,el número de clases o intervalos dependerá de la amplitud que se usahabitualmente.4. ­ El rango se divide entre el nº de clases o intervalos de clases, 5 paraéste ejemplo, (se recomienda que el número de intervalos no sea menorque 5, ni mayor de 15, pues en el primer casos se reduce demasiado lainformación y en el segundo no se cumple con el objetivo delagrupamiento) obteniéndose una idea aproximada de la longitud oamplitud del intervalo de clase.  Rango  29  a =  = = 5 8 @ 6  .  n º de int ervalos  5  Éste valor de amplitud es orientativo, por lo que se decide tomar unaamplitud de intervalo 5 cm para facilitar el agrupamiento.5.­ Se delimitan las clases buscando preferentemente valores enteros parasus límites. Se debe elegir el límite inferior del 1er intervalo de tal maneraque contenga al menor valor de la serie (70 cm). La elección recae en el 70.El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud. 1 6 
  • 17. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSELi del 1er intervalo = 70Ls del 1er intervalo = Li + a= 70 + 5 = 75 El límite inferior del 2do intervalo debe coincidir con el límite superiordel primer intervalo.Li del 2do intervalo = 75Ls del 2do intervalo Li + a= 75+ 5 = 80 El límite inferior del 3er intervalo debe coincidir con el límitesuperior del 2do intervalo, y así sucesivamente, hasta que el límite superiordel último intervalo, contenga el valor observado más alto de la variable.6.­ Una vez formadas las clases se procede al conteo, que consiste endeterminar el nº de observaciones (frecuencias) de cada clase. Una manerasencilla de hacerlo es leyendo la serie simple y ubicando mediante marcascada valor de la variable en su clase correspondiente. De ésta maneracuando se termine de pasar lista a la serie simple, el agrupamiento hasido efectuado.Tabla 6. Alumnos de Sección maternal de la escuela San Francisco segúnsu altura. Intervalo de clase xi fi fri (altura en cm) (marca de clase) 70 a 75 72.5 4 0.16 75 a 80 77.5 5 0.20 80 a 85 82.5 4 0.16 85 a 90 87.5 5 0.20 90 a 95 92.5 1 0.04 95 a 100 97.5 6 0.24 Total 25 1.00 Fuente: Datos ficticios Un problema que se puede presentar es el siguiente: si un valor de lavariable coincide con uno de los límites del intervalo, por ejemplo la altura95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase?La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si seelige un criterio se lo debe respetar hasta el final del agrupamiento. Enéste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera,cuando aparezca por ejemplo un valor 85, debe ser anotado comoperteneciente al intervalo en el que el nº 85 se encuentra como límiteinferior. El intervalo de clase es cerrado en el límite inferior y abierto en elsuperior. Esto se indica de la siguiente forma [75 80  los valores del ;  ) intervalo van desde 75 a 79,9999. 1 7 
  • 18. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE7.­ Se agrega una tercera columna, titulada “marca de clase” o “puntomedio de clase” que se designa con xi que contiene los valorescorrespondientes a los puntos medios de cada uno de los intervalos y secalcula así:  Li  + Ls  1  1  70 + 75  x1 =    = = 72 5  ,  2  2  Li  + Ls 2  75 + 80  x 2 =  2  = = 77 5  ,  2  2  También se puede calcular de la siguiente manera  x 2 =  x  + a  = 72 5 + 5 = 77 5  1  ,  ,  Al efectuar el agrupamiento, se pierde detalle de la información yaque, por ejemplo, de los valores que resultaron ubicados en la primeraclase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en casode ser necesario asignar un valor a cada uno de ellos, como es en elcálculo de la media aritmética a partir de la tabla de frecuencias, se optapor pensar que todos tienen igual valor, que es el correspondiente al puntomedio de clase. Un gráfico adecuado para representar una serie de frecuencias devariable cuantitativa continua es el hist ograma (gráfico nº 5). Suconstrucción es fácil. Se utiliza el sistema de coordenadas cartesianasortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias(fi) y en el de las abscisas (horizontal), la variable según la cual se efectuóla clasificación (altura). Consiste en rectángulos adyacentes (uno por cadaclase) con bases materializadas por la amplitud de clases (5 cm). La alturaestá dada por la frecuencia correspondiente a la clase. Cuando las clasesson iguales, el área del histograma es proporcional a la frecuencia total. 1 8 
  • 19. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEGráfico 5.Alumnos de Sección maternal de la escuela San Francisco segúnsu altura 7  6  5  4  Nº alum. 3  2  1  0  70  75  80  85  90  95  100  Altura (cm)  Fuente: Datos ficticios Otro gráfico adecuado para representar la serie de frecuencias devariable cuantitativa continua es el polígono de frecuencias (gráfico 6).Se emplea para su realización el sistema de coordenadas cartesianasortogonales. Se coloca la variable clasificadora en el eje horizontal y lasfrecuencias en el vertical. La construcción es sencilla, se marcan tantos puntos como pares devalores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En latabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego seunen los puntos mediante trazos rectos. Algunos autores, en su afán demantener la proporcionalidad entre la superficie y la frecuencia aconsejancerrar el polígono de frecuencias uniendo el primer punto con la marca declase inmediata anterior y el último punto con la inmediata superior; enéstos dos casos la unión de los puntos se realiza con trazos cortados. La principal ventaja de los polígonos de frecuencias consiste en queellos permiten dibujar en el mismo sistema de eje dos o más polígonoscorrespondientes a series diferentes que tengan similar posición sobre eleje de las x, así se puede compararlos, lo cual resulta engorroso efectuarcon los histogramas a causa de la superposición de las superficies de losrectángulos.  1 9 
  • 20. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco segúnsu altura 7  6  Nº de alum nos  5  4  3  2  1  0  65  70  75  80  85  90  95  100  105  Altura(cm)  Fuente: Datos ficticios Como cada miembro de una población presenta diversascaracterísticas, se puede necesitar clasificarlos de acuerdo a dos de ellas.Cuando el número de individuos medidos es pequeño, se enumeran todoslos pares de observaciones, si alguno de ellos aparece dos veces, se lorepite y la presentación suele hacerse de modo que una de las dosvariables esté ordenada.Tabla 9. Alumnos de una escuela según su peso y altura. Peso 39 40 41 42 43 43 44 45 50 52 (kg)Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49 Fuente: Datos ficticios Para representar estos datos que corresponden a dos variablescuantitativas continuas se utilizan los g ráf icos de dispersión o scatterplot , que se construye de la siguiente manera: se coloca una de lasvariables en las abscisas o eje horizontal, por ejemplo la altura y la otravariable, el peso, en el eje vertical, con sus escalas correspondientes, luegose marcan tantos puntos como pares de valores (xi, yi) se tengan. 2 0 
  • 21. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Gráfico 7. Alumnos de una escuela según su peso y altura 1,55  1,5  1,45  Al tura (m)  1,4  1,35  1,3  1,25  35  40  45  50  55  Peso (kg)  Fuente: Datos ficticios Éste gráfico sirve para mostrar la relación entre las dos variables yse usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Siesto no ocurre puede utilizarse el gráfico lineal, que se construye de igualmanera que el anterior, con la única diferencia que se unen los puntos.Éste gráfico, se suele emplear, especialmente, en los casos donde lavariable que se representa en el eje horizontal es el tiempo. De éste modose puede ver la evolución de la otra variable en el período considerado.Pueden representar simultáneamente en el mismo gráfico dos o másvariables, como se observará al representar gráficamente los datos de latabla Nº 10Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A deEGB1 de la Escuela San Martín según sexo Meses N° de inasist. Mujeres Varones Marzo 3 4 Abril 5 7 Mayo 2 4 Junio 6 5 Julio 8 8 Agosto 4 5 Sept. 3 4 Octubre 4 3 Noviem. 5 2 Diciem. 1 6 Fuente: Datos ficticios 2 1 
  • 22. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A deEGB1 de la Escuela San Martín según sexo 9  Mujeres  8  Varones  7  Nº de inas is tenc ias  6  5  4  3  2  1  0  M  A  M  J  J  A  S  O  N  D  Meses  Fuente: Datos ficticios Cuando los pares de valores son muy numerosos, las tablas sepresentan según lo muestra la tabla 11; en éste caso se dice que las tablasson de doble entrada pues son dos las variables de clasificación.Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia. Ocupación Barrios Total de la Madre A B C A. de casa 400 500 200 1100 Profesional 200 200 50 450 Empleada 300 400 100 800 Total 900 1100 350 2350 Fuente: Datos ficticios En este ejemplo cada alumno se caracteriza según la variableOcupación de la madre (variable cualitativa nominal) y Barrio deresidencia (variable cualitativa nominal). 2 2 
  • 23. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Los valores que se encuentran en la celda son frecuencias, es decirrepresentan la cantidad de alumnos que comparten las dos características.Las partes de una tabla son:La ma triz , formada por la primera fila, lleva los encabezamientos de lascolumnas y / o la primera columna que titula a las filas.El cuerpo constituido por celdas. La información proporcionada por los valores de las celdas se completacon la suministrada por los encabezamientos de las filas y columnas; enlas celdas se encuentra la frecuencia, es decir la cantidad de elementos oindividuos que poseen las dos características. Por ejemplo el 100 de la última celda significa que en esa escuela hay100 alumnos que viven en el Barrio C y cuyas madres son empleadas. El gráfico que se utiliza para representar éste tipo de tablas es el gráf ico de barra s compuesta s (gráfico 9) y el gráfi co de barra s a grupa da s (gráfico 10).Gráfi co de barra s compuesta s La construcción del gráfico de barras compuestas es sencilla. Secomienza dibujando las barras como si fueran simples es decir con lasalturas correspondientes a los totales y luego se yuxtaponen los valoresparciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procedede la siguiente manera: se marca una barra de altura 900, en ella se indicala subdivisión que corresponde a alumnos cuyas madres son amas de casacon el valor 400; para marcar el nº de alumnos que es 200, se marca400+200=600 en el eje vertical lo que queda corresponde nº de alumnoscuyas madres son empleadas. De igual manera se procede con los barriosB y C. 2 3 
  • 24. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEGráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia  1200  Empleada  Profesional  1000  Nº de alumnos  A. de casa  800  600  400  200  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos ficticiosGráfi co de barra s a grupa da s Sirven para representar fenómenos similares a los que originanbarras compuestas. La diferencia con éstas estriba en que, para cada valorde la variable independiente “x” en éste ejemplo lugar de residencia, sedibujan grupo de barras . El número de barras en cada grupo es el delnúmero de categorías de la segunda variable, en este ejemplo ocupación delas madres.Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia  600  A. de casa  Prof esional  500  Empleada  Nº de alumnos  400  300  200  100  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos fict ic ios 2 4 
  • 25. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro tipo de gráficos son los gráficos de figuras o pictogramas. Sonlos más indicados para publicaciones de divulgación popular , por su fácil einmediata interpretación. Consisten en dibujos esquemáticos yrelacionados con el fenómeno a representar. Cada figura es equivalente auna cantidad determinada, preferentemente entera, de unidades de lavariable dependiente y el número de unidades no su tamaño, esproporcional a la magnitud a representar. Cart ogramas: Se emplean cuando es importante señalar ladistribución geográfica de un determinado acontecimiento, razón por lacual se construyen sobre planos o mapas. Cart ogramas de señalización (Gráfico 11): Sirven para indicar ladistribución de una variable cualitativa sobre una base geográfica.Mediante figuras, colores o diferentes rayados se señala que hay enlugares determinados. Gráfico 11. Qué es lo que caracteriza a cada provincia argentina. Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005.ISBN Nº987­9101­26­X 2 5 
  • 26. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE En este mapa, se observa lo que caracteriza a cada provinciaargentina. Por ejemplo en Santiago del Estero las aguas termales; en LaPampa la producción de trigo, etc... Cart ogramas de densidad: además de indicar que hay y dónde, deellos se puede obtener la información de cuánto hay. Mediante diferenterayado o colores y también utilizando barras sobre la base geográfica, sepuede expresar la cuantía del fenómeno como así también su ubicación.Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera delos descriptos, sobre el mapa o plano. Resumiendo: los datos se ordenan, clasifican y presentan en formasde tablas. Las tablas pueden de ser de simple entrada(cuando losindividuos se clasifican según una variable), de doble entrada(cuando losindividuos se clasifican según dos características) y de triple o másentradas (cuando se clasifican los datos según tres o más variables).Lastablas se complican a medida que se agregan más variables, por lo tantoes preferible varias tablas sencillas a una complicada. Toda tabla debe llevar título, el cuál debe responder a las preguntas¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?. No se debe olvidar la fuente de datos que indica de donde proviene lainformación. Se debe incluir los totales. En caso de expresar los datos en porcentajes, deben indicarse lostotales de los cuales provienen. Con respecto a los gráficos, éstos constituyen una de las formas másútiles de presentación de datos estadísticos. Su importancia reside en lasmúltiples formas que pueden adoptar, lo que permite su aplicación a unaamplia gama de finalidades: didácticas, de investigación, etc. Sirven paramostrar la relación entre una o más variables. La variedad de tipo derepresentaciones gráficas exige una cautelosa elección de acuerdo a sufinalidad. La selección de la presentación gráfica debe, por lo tanto tenerlos siguientes aspectos: Tipo de análisis estadístico, características y número de losfenómenos o variables a representar y público al que va dirigido. 2 6 
  • 27. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Recomendaciones para la construcción correcta de un gráfico. Una vez elegido el tipo de gráfico adecuado, es conveniente nodescuidar las siguientes consideraciones: · Decidir cuál de las variables es la independiente “x” y cuál la dependiente “y”. · La representación gráfica debe ser sencilla, simple y explicarse por sí misma. · Título se coloca encabezando el gráfico y debe responder a las preguntas; qué, según, cuándo, dónde?. · Fuente de datos. Se coloca al pie del gráfico. · Escalas se elige de tal modo que no alteren la objetividad de la representación, hecho éste muy utilizado para fines publicitarios donde es común ver escalas construidas con el propósito de alterar el fenómeno exagerando ventajas y enmascarando la realidad, o lo que es peor aún eliminando la graduación de los ejes, evitando de ésta forma todo patrón de comparación. Las escalas deben construirse buscando obtener como resultado un dibujo armónico y proporcionado. · Debe nominarse los ejes de modo tal que no quede duda alguna acerca de las variables que en ellos se representan. · No olvidar el corte de ejes en caso de ser necesario. Éste debe efectuarse entre el 0 y el valor mínimo a representar. · Aclaración de las unidades de representación. · Las referencias serán colocadas al pie o al costado del gráfico. · En caso de usarse abreviaturas, éstas serán aclaradas con la debida extensión, en el renglón siguiente al correspondiente a las fuentes. · En lo posible acompañar los gráficos con las tablas estadísticas que lo originen. · Si el tra ba jo lo requiere y es necesario expresar al gunos va l ores en %, deben consignarse la s cifra s de la s cual es provienen éstos porcenta jes. 2 7 
  • 28. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEÍNDICES El Índice es un indicador útil tanto para fijar situaciones como parahacer un diagnóstico. Cuando interesa comparar los valores de unacaracterística de la educación (matrícula, asistencia de alumnos, númerode profesores, etc...) en el tiempo o en el espacio, ya sea comparando dosvalores entre sí o todos con uno de ellos se puede realizar un cociente cuyoresultado se denomina Índice simple.Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos yla de 1994 es de 2000, el Indice será: 4000 I2004/1994= = 2  2000  Lo que indica que la matrícula en el año 2004 es el doble que lamatrícula de 10 años atrás, en esa escuela. El valor que va en el denominador se llama ba se . El Indice del año base es 1: 2000 I1994/1994= 2000  = 1  Con frecuencia se multiplica por 100 los índices con lo que entonceslos índices son los porcentajes correspondientes siendo 100 el porcentajedel índice base.Los Índices más comunes utiliz ados en educación son:· Razón de alumnos mat riculados en las escuelas con respecto a la población en edad escolar. N °alumnos  matriculad os  I=  Población en edad  escolar  2 8 
  • 29. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEEjemplo: En el año 2001, en la localidad de La Banda según el INDEC, lapoblación en edad escolar fue de 88735 y los alumnos matriculados fue de32613. La razón de alumnos matriculados es entonces en ese año de: 32613 I= = 0 37  .  88735 Es decir que solo el 37% del total de la población en edad escolar asiste ala escuela.· Alumnos por maestro en las escuelas primarias. N °  alumnos  I= N °maestros Ejemplo: Si el total de alumnos de una escuela es de 1000 y el planteldocente informa que hay 40 maestros( Datos ficticios), la razón alumnospor maestro es: 1000 I= = 25  40  Es decir que en esa escuela hay 25 alumnos por cada maestro.· Porcentaje de población analfabeta de 15 años y más. N °  analfabeto  .de 15  s   años  y  más  I= *  100  Población de 15  años  y  más Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año2001 el total de población de 15 años y más fue de 571546 personas. Deellas, 31625 no tenían ninguna instrucción. El Porcentaje de población analfabeta para la provincia es entonces, 31625 I=  *  100 = 5 53  .  %  571546  2 9 
  • 30. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE · Tasa de ausentismo de docent esEs el porcentaje de ausentismo de docentes en un período de tiempodeterminado. N º de días de ausencia de todos  los docentes  un período  en  Ta= * 100  N º de días de clase de todos los docentes en ese período Ejemplo: Si en una escuela hay una planta docente de 115 personas y eltotal de inasistencias de los docentes(por diversas causas) en el año es de3101días, la Tasa de ausentismo se calcula como sigue(considere que losdías de clase en el año son 180): 3101 Ta= * 100 = 14 98  .  %  115 * 180 · Tasa de desgranamientoEs la proporción de alumnos ingresados al primer grado (o curso) que nolograron culminar todos los grados (o cursos) correspondientes al nivel, enel período establecido.  N º de alumnos que no cul  aron sus estudios en el  período establecid  min  o  Td = * 100  N º de alumnos matriculad  al inicio del  período  os Ejemplo: Si en el estudio de la cohorte 1974­1980 el número de alumnosmatriculados en la Argentina en la escuela primaria al inicio del período esde 729048 y los que no culminaron sus estudios es de 337292 (Fuente:Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.Año 1999)la Tasa de desgranamiento es: 337292 Td= 729048  = 0 46  . Es decir que en ese período hay un desgranamiento del 46%.El 46% de los alumnos matriculados al inicio del período no culminaronsus estudios al final del mismo.  3 0 
  • 31. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE· Tasa de retención de la cohort eEs la proporción de alumnos ingresados al primer grado (o curso) quelograron culminar todos los grados (o cursos) correspondientes al nivel, enel período establecido.  N º de alumnos que cul  aron sus estudios en el  período establecid  min  o Tr = *  100  N º  de alumnos matriculad  al inicio del  período  os Ejemplo: Si en el mismo período considerado en el ejercicio anteriorterminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasade retención será: 391756 = 0 5374  .  Tr= 729048  Es decir que la Tasa de retención es aproximadamente del 54%. El 54% de los alumnos matriculados al inicio del período culminaronsus estudios al final del mismo.· Tasa de escolarizaciónProporción de la población en edad escolar que está efectivamenteescolarizada  N º de alumnos matriculad  os  Ez = *  100  Población en edad  escolar Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001según el INDEC es de 706794 habitantes. De ellos asisten a la escuela237708.La Tasa de escolarización es: 237708 I= *  100 = 33 63  .  %  706794 Es decir que el 33.63% de la población en edad escolar asiste a la escuela.  3 1 
  • 32. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCITACIÓNActividad 1Clasifique en base al siguiente listado las variables socio educativas, encualitativas nominales u ordinales y cuantitativas discretas o continuas Variable Tipo 1­ Religión 2­ Nº de alumnos promocionados por curso 3­ Barrios 4­ Nivel de educación alcanzado por el tutor 5­ Edad de los alumnos 6­ Sexo 7­ Nº de inasistencias mensuales 8­ Altura de los alumnos 9­ Lugar de nacimiento10­ Peso de los alumnos11­ Horas de estudio diario12­ Nº de materias que cursan13­ Nº de hermanos que tiene cada alumno14­ Grado de satisfacción por la asignatura 15 Superficie construída por escuela 16 Nº de escuelas por Departamento 17 Categorías de escuela 3 2 
  • 33. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 2 Los siguientes datos corresponden a Nº de inasistencias de losalumnos de un curso correspondientes al primer cuatrimestre xi : 8 5 3 4 2 5 4 4 10 6 6 7 5 5 3 9 7 2 6 4 9 4 5 0 8 6 5 1 1 4 5 7 2 7 6 4 9 4 5 3 a) ¿Que indica el subíndice i? b) ¿Cuál es la variable que se estudia?. Clasifíquela. c) Ud. debe presentar un cuadro de inasistencias de los alumnos. ¿Cómo construye el mismo? d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas, porcentaje y porcentaje acumulado correspondiente a cada valor de la variable. e) Presente los resultados con el gráfico apropiado.Actividad 3 En un curso de 50 alumnos de un establecimiento de la Capital del aPcia. De Sgo. Del Estero, se empleó la técnica de profundización de temaspor grupo en el desarrollo de contenidos teóricos. Se distribuyó uncuestionario con la finalidad de determinar la actitud de los mismos anteesta modalidad de estudio. Una de las preguntas estaba referida al gradode conformidad sobre el desarrollo de los contenidos teóricos.Los resultados obtenidos fueron los siguientes:xi : MC MD C I C MC D D MC MC I MC I MC D MC MD C D C MC D MC D MC D MD I C C C MD MC I C MC MC D C MC C MC D MD MC I D MC I MCDonde:MC: muy conformeC: conformeI: indiferenteD: disconformeMD: Muy disconforme 3 3 
  • 34. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE a) Indique el tamaño de la muestra b) Ud. debe representar al establecimiento en una reunión de profesores en la que participan distintos Colegios de la Capital. ¿Como presentaría la opinión del alumnado? c) Que título colocaría a la presentación? d) Incluya en la misma frecuencias relativas y porcentajes correspondiente a cada valor de la variable. e) Presente esos mismos resultados con un gráfico de barras simples. f) Indique si corresponde calcular frecuencia acumulada. En el caso de respuesta afirmativa obtenga dicha frecuencia. g) Analice los resultados obtenidosActividad 4En un estudio realizado en el Instituto Santo Tomás de Aquino paradeterminar la zona de influencia del mismo según el lugar de residencia delos alumnos, los resultados obtenidos fueron los siguientes:Alumnos del Instituto Santo Tomás de Aquino según el barrio en el queresiden. Barrios Número de alumnos Barrio Belgrano 300 Barrio Cabildo 150 Barrio Contreras 30 Barrio Ejército Argentino 20 Total 500 Fuente: Datos ficticios a) ¿Que representa el número 500? b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable se trata. c) Obtenga frecuencias relativas y los porcentajes correspondientes. d) Determine si corresponde calcular frecuencias acumulada. e) Realice gráfico de tortas. f) ¿Qué otro gráfico puede emplear para representar estos datos? 3 4 
  • 35. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 5Los siguientes datos corresponden a la edad de los tutores de alumnos queconcurren al EGB de un establecimiento escolar xi : 44 30 45 48 31 45 33 35 54 44 45 47 38 56 29 43 43 62 60 30 52 36 45 31 31 32 34 32 54 55 55 46 61 39 43 38 47 45 38 37 63 49 34 48 34 64 44 47 36 60 50 52 37 41 29 37 49 37 39 56 39 46 46 31 60 29 53 40 41 58Presentar los datos : a) En una tabla con un número aproximado de intervalos de clase. b) En una tabla con 5 intervalos c) ¿Que gráficos utilizaría para representar los datos contenidos en estas tablas? d) Con la tabla presentada en el item b, realice un histograma. e) Con la tabla presentada en el item a, realice un polígono de frecuencias.Actividad 6Los siguientes datos corresponden a alumnos analfabetos porDepartamento en la Pcia. de Santiago del Estero, discriminados por sexo.Año 2001 Departamento Total Sexo Varones Mujeres Capital 4587 2299 2288 Banda 4752 2461 2291 Río Hondo 3473 1960 1513 Robles 2116 1166 950FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.En base a los datos proporcionados en la tabla anterior realice: a) Gráfico de barras simples que muestre el número total de alumnos analfabetos por Departamento. ¿Que otro tipo de gráfico podría utilizar en la representación? b) Gráfico de tortas que muestre el número de alumnos analfabetos discriminados por sexo para el Departamento Robles. c) Realice un gráfico de barras agrupadas por Departamento 3 5 
  • 36. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE d) Realice un gráfico de barras porcentuales por Departamento discriminando dentro de cada una de ellas los porcentajes de varones y mujeres analfabetos.Actividad 7Utilice un gráfico lineal para mostrar la evolución de egresados delPolimodalAño Nº de egresados1980 2331985 2781990 3211995 3752000 391FUENTE: Datos ficticiosActividad 8En base a los datos de la siguiente tabla:Población en edad escolar, Nº de alumnos matriculados y Nº de maestroscorrespondiente a cuatro lugares de la República Argentina. Lugar Población en Nº de Nº de Nº de edad escolar alumnos alumnos no maestros matriculados matriculados A 300000 248.000 7.000 B 150000 106.000 4.000 C 25000 24.000 1.200 D 160000 142.000 4.750Fuente: Datos FicticiosCalcular para cada lugar: a) Proporción de alumnos matriculados b) Nº de alumnos por maestro c) Tasa de escolarización d) Número de alumnos No matriculados e) Porcentaje de alumnos No matriculados 3 6 
  • 37. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 9Dada la siguiente tabla, calcule la retención y el desgranamiento de cadacohorte y en base a los resultados realice el análisis correspondienteRetención y Desgranamiento de la Escuela Primaria. Su evolución en 3ciclos escolares del período 1964­1980Ciclo Escolar Alumnos matriculados 1er Grado 7º Grado1964 ­ 1970 723.264 321.9401969 ­ 1975 751.049 375.7231974 ­ 1980 729.048 391.756Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.Año a) Calcule la tasa de desgranamiento b) Calcule la tasa de retención c) Interprete los resultados obtenidosActividad 10La siguiente tabla fue extraída del Censo Nacional de Población, Hogares yVivienda . 2001.Población de 10 años y más de departamentos de Santiago del Estero, porcondición de alfabetismo y sexo. Año 2001.Provincia Población Condición de alfabetismo de 10 años Alfabetos Analfabetos y más Total Varones Mujeres Total Varones Mujeres Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685 Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288 Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291 Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513 Hondo Copo 19.241 17.264 9.156 8.108 1.977 948 1.029a) Calcular la tasa de analfabetismo de los distintos Departamentos que semuestran en la Tabla.b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que lapoblación total de Santiago del Estero, según el Censo del año 2001 es de804.457 ? 3 7 
  • 38. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEc) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintosdepartamentos?d) Calcule la tasa de analfabetismo correspondiente a los varones de losdistintos departamentos. 3 8 
  • 39. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DA D I I I MEDIDAS DE POSICIÓN Y DISPERSIÓNINTRODUCCIÓN En todo trabajo estadístico luego de recolectar los datos, ordenarlos,agruparlos en tablas y presentarlos gráficamente, es preciso extraer algunainformación que caracterice a la población de la cual se los extrajo. Por ello, el objetivo de éste capítulo es interiorizarlos acerca de lasmedidas de posición y variación más utilizadas para caracterizar a lapoblación en estudio, y en que caso se emplea cada una de ellas,interpretando los resultados a través del pensamiento crítico. Los métodos de éste capítulo suelen denominarse métodos deestadística descriptiva, porque su objetivo es resumir o describir lascaracterísticas importantes de un conjunto de datos. Éstas característicasse refieren al centro, variación, distribución, datos distantes y cambios através del tiempo. 1. Medida s de posición Supongamos que una directora está preocupada por las notasobtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá estener una idea de si las notas de una muestra de alumnos se ubican cercade la calificación cinco o cerca de la calificación nueve. Necesita resumirlos datos y calcular alguna medida que sirva para que, con un único valorsencillo y representativo pueda establecer si los alumnos se posicionancerca de una calificación de 5 puntos o si por el contrario se posicionancerca de la calificación de nueve puntos; a estas medidas se las denominanMedidas de Posición, y si además indican el centro de ése conjunto devalores, se denominan Medidas de posición y tendencia central. Se conocen varias formas de determinar el centro de un conjunto dedatos. A continuación, se indicarán tres que son las más comúnmenteutilizadas: media, mediana y modo. 3 9 
  • 40. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE1.1. Media aritmét icaLa media (aritmética) es la medida de posición y tendencia central másempleada para describir los datos; constituye lo que la mayoría de la gentedenomina promedio. Es quizás la más conocida y usada.La media aritmética en una serie simple de datos, se la obtiene al dividir lasuma de todos los valores de la variable entre la cantidad de valoressumados. A la media aritmética se la representa con  x :a)Cálculo de las media aritmética en series simples Ø Ejempl o 1Se registró los días de inasistencias en un año, de una muestra de cincoalumnos del primer ciclo del EGB y se desea averiguar cuál es el promediode inasistencias de esa muestra. La variable en estudios es:X = nº de inasistencias de los alumnosLos valores de la variable son:xi : 0; 16; 12; 5; 7  5  0 + 16 + 12 + 5 + 7  x  + x 2  + x  + x  + x  å x i  i  x  =  = 1 3  4  5  = =1  5  5  5  ,y su fórmula de cálculo es la siguiente  n  å x i i  =1  x =  n  2.1En la fórmula se utiliza la letra griega å (sigma mayúscula) que indicaque los valores de la variable deben sumarse.El símbolo n denota el tamaño de la muestra, que es el número dealumnos observados.Cuando los datos provienen de una muestra el símbolo de la mediaaritmética es  x (se denomina “x barra”); si se calcula la media aritméticacon los datos de toda la población se simboliza con  N å x i i  =1 m =  N  2.2 4 0 
  • 41. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEå denota la sumatoria del conjunto de valores.xi expresan los diferentes valores que toma la variable.n tamaño de la muestra, cantidad de valores observadosN tamaño de la población Como nuestros datos constituyen una muestra para calcular lamedia utilizamos la fórmula 2.1  5  å x i  i    =1 0 + 16 + 12 + 5 + 7  40  x = = = = 8  5  5  5 Int erpretación: Los alumnos tienen en promedio 8 inasistencias por año.Algunas propiedades de la media aritmética1­La media aritmética es reproductora del total.2­ Si llamamos desvío a la diferencia entre un valor y la media aritmética å (d i ) = å (x i  - x ) = 0 x i  d i = x  - x  i  0 0 – 8 =­8 5 5 ­ 8 =­3 7 7 ­ 8 =­1 12 12 – 8 = 4 16 16 – 8 = 8 Total 0Una desventaja de la media es su sensibilidad a valores extremos, de modoque un valor excepcional puede afectarla de una manera drástica, en estecaso no representa en forma adecuada al centro de dicho conjunto y tiendea dirigirse a ese valor extremo.Si por equivocación al pasar los datos en el ejemplo de las inasistencias delos 5 alumnos colocamos 66 en vez de 16: Ø Ejempl o 2X = inasistencias de alumnosxi : 0; 66; 12; 5; 7 4 1 
  • 42. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La inasistencia promedio toma el valor 18, alejándose el promediohacia al valor extremo 66.  5  å x i  i    =1 0 + 66 + 12 + 5 + 7  90  x  == = = = 18  5  5  5  La media aritmética no representa el centro del conjunto de datos.Este problema o desventaja se resuelve utilizando otra medida de resumende datos que se denomina: mediana. La medi a aritmética se puede cal cula r cua ndo los val ores dela s varia bles son cua ntitativos ta nto conti nuos como discretos.1. 2 Mediana. La mediana (de un conjunto de datos):es una medida de tendenciacentral que divide a la serie ordenada de datos en dos partes iguales, de talforma que el 50% de los datos son menores o iguales a la mediana y el otro50% mayores o iguales a ella. La mediana se designa con Me.a) Cálculo de la mediana en series simples Ø Ejempl o 3 Ø Se va n a consi derar dos ca sos: cua ndo el ta ma ño de la muestra es i mpar y cua ndo n es par ØSe desea determinar el valor mediano de las inasistencias de los alumnosdel ejemplo 2, El tamaño de la muestra, “n” es impar.X: inasistencias de alumnosxi : 0; 66; 12; 5; 7 Para su cálculo debemos ordenar primero los datos en formaascendente o descendente. Si el número de observaciones es impar, la mediana es el valor de lavariable que se localiza exactamente en la mitad de la lista. En caso de que el número de observaciones fuera par, el valor de la 4 2 
  • 43. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEmediana se obtiene promediando los dos valores centrales. Esos valores centrales se posicionan en el lugar  n + 1 2 Solución. Primero se ordenan los datos 0; 5; 7; 12; 66.La muestra posee tamaño impar n = 5 y el valor mediano está posicionadoen el lugar  5 + 1  6  = = 3  2  2 , o sea que el valor de la mediana es el valor de la variable ubicado en el 3ºlugar. 0; 5; 7; 12; 66.Me = 7 inasistenciasInt erpretación: el 50% de los alumnos tiene inasistencia menores oiguales a 7. Ø Ejempl o 4En el caso de que n sea parSupongamos que contamos las inasistencias de 6 alumnos.X = inasistencias de alumnosxi : 0; 66; 12; 5; 7;10Solución. Primero se ordenan los datos0; 5; 7; 10; 12; 66.Las muestra posee tamaño par n = 6, 6 + 1  7  = = 3 5  , Posición de los valores centrales  2  2 Los valores centrales ocupan el tercer y cuarto lugar, la mediana seobtiene como el promedio de los dos valores centrales: 4 3 
  • 44. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 0; 5; 7; 10; 12; 66  7 + 10 Me  =  = 8 5 » 8  ,  2 Int erpretación: el 50% de los alumnos tienen inasistencias menores oiguales a 8.Deben quedar claro dos conceptos:Primero: La mediana no se ve influenciada por los valores extremos, yaque en su cálculo interviene el orden y no la magnitud de los valores.Segundo: la media aritmética es sensible a valores extremos. La medi a na se puede determinar para va ria bles cua ntitati va scontinua s discreta s y para varia bles cua litati va s que se miden enesca l a ordi nal.1. 3. Modo. El Modo es el valor de la variable que ocurre con mayor frecuencia.Se designa frecuentemente como Mo. Se debe hacer notar aquí que el Mo es un valor de variable y lafrecuencia de este valor sugiere su importancia estadística. Cuando dos valores ocurren con la misma frecuencia y ésta es lamás alta, ambos valores son modas, por lo que el conjunto de datos esbimodal. Cuando más de dos valores ocurren con la misma frecuencia y éstaes la más alta, todos los valores son modas, por lo que el conjunto dedatos es multimodal. Cuando ningún valor se repite, se dice que no hay moda. Ø Ejempl o 5 . Calcule las modas para los siguientes conjuntos de datos:Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6Serie B: 4; 5; 3; 4; 6; 8; 5Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99Serie D: 1; 2; 3; 6; 7; 8; 9; 10 4 4 
  • 45. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESolución:En l a seri e A. El número 4,5 es la moda pues es el valor que ocurre conmayor frecuencia(2 veces).En l a seri e B. Los números 4 y 5 son modas, ya que ambos ocurren conla frecuencia más alta (2 veces).En l a serie C. Los números 27 y 55 son modas, ya que ambos ocurrencon la frecuencia más alta (3 veces).En l a seri e D. No hay moda, ya que ningún valor se repite. En reali da d, l a moda no se utiliza mucho con da tos numéricos.Sin embargo, entre l a s di stinta s medi da s de tendencia central queconsi dera mos, la moda es la úni ca que puede usarse cua ndo se tratade va ri a bles cualitativa s nominal es. Ø Ejempl o 6 . Una encuesta efectuada a estudiantes mostró que el 84 tieneaparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductorde DVD. En tanto que el televisor es el aparato más frecuente, es posibleafirmar que la moda es el televisor. No podemos calcular una media o mediana para datos como éstos,cualitativos a nivel nominal.3.­ Cálculo de las medidas de posición en series de frecuenciasVeremos como se calculan la medidas de posición y tendencia centralcuando los datos están agrupados en una serie de frecuencias.3.1. Variables agrupadas en serie de frecuencias simple3.1.a. Media aritmética.Como en una serie de frecuencias, fi nos indica las veces que se repite elvalor de la variable, debemos considerarlas en el cálculo de la mediaaritmética. 4 5 
  • 46. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Ø Ejemplo 7Una maestra esta interesada en conocer el número promedio de hermanosde su alumnos. Para ello tomó de una muestra de 25 alumnos.Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmientoclasificados según el número de hermanos Nº de hermanos Nº de alumnos (x i) (fi) 0 1 1 9 2 7 3 5 4 3 Total 25 Fuente: Datos ficticios Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueveveces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa sumaentre 25 que es el tamaño de la muestra.xi: nº de hermanosfi : número de alumnos que poseen xi hermanos  25  å x i  i    =1 0 + 1  + 1 + 2  + 3  + 4  + 4  50  ...  ...  ...  ...  x  == = = = 2  25  25  25  Pero, este cálculo se podría realizar en forma más simple y esobtener esa misma suma reemplazándola por la multiplicación. Utilizandola frecuencia fi que indica las veces que se repite el valor de la variable xi.  x  f 1  + x 2  f 2  + ... + x 5  f 5  i x  = f 1  + f 2  + ... + f 5 ahora expresando literalmente la fórmula de la media aritmética tenemos n  1  x =  å x i  f i  n  i =1  Este promedio se conoce como media aritmética ponderada. Parapoder calcular la media aritmética ponderada correspondiente al ejemploplanteado, agregamos a la tabla de frecuencias anterior una columna 4 6 
  • 47. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEauxiliar que facilitará el cálculo de la media.Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmientoclasificados según el número de hermanos Nº de hermanos Nº de alumnos xi*fi (xi) (fi) 0 1 0 1 9 9 2 7 14 3 5 15 4 3 12 Total 25 50 Fuente: Datos ficticiosx  =  1  n  å x i  f i  .  =  1  50 =  2 25  n  i =1  Podemos concluir diciendo que los alumnos de tercer año depolimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.3.1.b. MedianaUna maestra esta interesada en conocer la mediana del número dehermanos de una muestra de 44 alumnos que concurren a una escuelarural.Tabla 3. Alumnos de una Escuela rural clasificados según el número dehermanos Nº de hermanos Nº de alumnos (x i) (frecuencia, fi) 2 5 3 5 4 30 5 4 Total 44 Fuente: Datos ficticios En esta serie de frecuencias de variable cuantitativa discreta, losdatos ya están ordenados, por lo que solo resta encontrar el valor central,cuya posición se encuentra en el lugar  n + 1 44 + 1  45  = = = 22 5  ,  2  2  2  4 7 
  • 48. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE O sea el valor mediano será el promedio de los valores de la variableubicados en el lugar 22 y 23. Para ello se deben seguir los siguientespasos:1.­Calcular las frecuencias acumuladas correspondientes a cada valor dela variable.2.­Calcular el orden de localización de la mediana efectuando el cociente  n + 1 44 + 1  45  = = = 22 5  ,  2  2  2  donde n = tamaño de la muestraTabla 4. Alumnos de una Escuela rural clasificados según el número dehermanos Nº de hermanos Nº de alumnos Frecuencias (x i) (frecuencia, fi) acumulada (Fi) 2 5 5 3 5 10 4 30 40 5 4 44 Total 44 Fuente: Datos ficticios Como el valor de la mediana se encuentra entre la posición 22 y laposición 23, se busca en la columna de frecuencias acumuladas, el menorvalor que contiene a 22 (es 40), al que corresponde el valor de variable 4 yel menor valor que contiene a 23 (es 40), al que corresponde el valor devariable 4. Por lo que el valor mediano es el promedio de los dos valorescentrales.  4 + 4  Me  =  = 4  2 Int erpretación: el 50 % de los alumnos de escuelas rurales, tienen 4hermanos o menos. 4 8 
  • 49. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE3.1.c. ModaEjemplo: Calcular el valor más frecuente del número de hermanos de losalumnos de tercer año de polimodal de la Escuela Sarmiento (Tabla 2).Solución: La variable que se estudia es una variable cuantitativa discreta.Se busca en la columna fi el valor más alto, en este ejemplo es 9.El valor de la moda es el valor de la variable que tiene frecuencia 9, esdecir Mo = 1Int erpretación: La mayoría de los alumnos de tercer año de polimodal dela Escuela Sarmiento. poseen un hermano .3.2. Variable agrupada en serie de frecuencias con intervalos de clase,para variable aleat oria cont inua3.2.a. Media aritmética. Ø Ejemplo Para realizar un estudio sobre la nutrición de la población infantilque concurre a la escuela en una localidad rural, se consultaron los pesos,en kilogramos, de los 50 alumnos de la escuela, los que se muestran en laTabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y conlímite superior abierto. Determine el valor promedio del peso de losalumnos.Solución1.­ Se calcula las marcas de clase Al organizar de esta forma los datos, se pierde información, pues latabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un únicovalor que represente o resuma a todos los valores del intervalo: ese valor esel promedio o media aritmética de los límites del intervalo y se denominapunto medio de la clase o marca de clase. Este valor representará elvalor xi de la fórmula de la media. 4 9 
  • 50. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  38 + 40  x1 =    = 39  2  40 + 42  x 2 =  = 41 = x  + a  = 39 + 2 = 41  i  2 Se introduce una nueva columna en la tabla que la denominaremos xiTabla 4. Peso de los alumnos de una escuela rural Intervalo Nº de alumnos Marca de clase x i * fi (kg) fi xi 38 a 40 12 39 468 40 a 42 19 41 779 42 a 44 7 43 301 44 a 46 6 45 270 46 a 48 6 47 282 Total 50 2100 Fuente: Datos ficticiosLa fórmula para encontrar la media en serie de frecuencias es n  1  x  =  å x i  f i  n  i  =1 Pero en este caso xi representa a la marca de clase n=tamaño de la muestra= å  f i  Ahora ya estamos en condiciones de aplicar la fórmula para elcálculo de la media aritmética, por ello agregamos una columna que es elproducto de cada marca de clase por su frecuencia (xi*fi).  n  1  1  x = å x i f i  = 50 * 2100 = 42 kg  n  i  =1  Interpret ación: Los alumnos pesan en promedio 42 kg. 5 0 
  • 51. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE3.2.b. Mediana Ø Ejemplo Se desea conocer el peso mediano de los 50 alumnos de una escuelarural (Tabla 4). El cálculo de la mediana en serie de frecuencias paravariable cuantitativa continua se efectúa utilizando la siguiente fórmula  å f i - F    ant  Me  Me = L inf + 2  * a  f Me  L inf : límite inferior de la clase mediana  å f i  2 : Suma de la frecuencia entre 2  F  ant  Me  : frecuencia acumulada anterior a la clase mediana  f Me  : frecuencia absoluta de la clase mediana a: amplitud del intervalo a = Lsup­ Linf Peso de los alumnos de una escuela rural Intervalo Nº de alumnos (kg) fi 38 a 40 12 40 a 42 19 42 a 44 7 44 a 46 6 46 a 48 6 Total 50 Fuente: Datos ficticiosSolución1­En la tabla se agrega una columna para valores de frecuenciasacumuladas. Peso de los alumnos de una escuela rural Intervalo (kg) Nº de alumnos fi Fi 38 a 40 12 12 40 a 42 19 31 42 a 44 7 38 44 a 46 6 44 46 a 48 6 50 Total 50 5 1 
  • 52. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Fuente: Datos ficticios2­ Se calcula  å f i  2 El tamaño de la muestra se divide entre 2 porque la Mediana es el valorde la variable que divide la serie ordenada de datos en 2 partes iguales.  å f i  = 50  = 25  2 2 3­ Se busca en la columna Fi el menor valor que contiene a 25. En esteejemplo el valor que corresponde es 31. Se señala la clase mediana y seaplica la fórmula.  å f i - F    ant  Me  Me = L inf + 2  * a  f Me  50  - 12  2  25 - 12  13 * 2  Me = 40 + * 2 = 40 + * 2 = 40 + = 40 + 1 37 = 41 37  ,  ,  19  19  19 Int erpretación:El 50% de los alumnos pesan 41,37 kg o menos.3.2.c. Moda Ø EjemploSe desea conocer el peso más frecuente de los 50 alumnos. El cálculo delmodo en serie de frecuencias para variable cuantitativa continua se realizautilizando la siguiente fórmula  D  1  Mo = L  Mo  + inf * a  D  + D  1  2 Donde: D1  =  f Mo  - f anterior  a la clase  Modal D 2 =  f Mo  - f posterior  a la clase  Modal a: amplitud del intervalo 5 2 
  • 53. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESolución En la columna fi se busca el valor más alto, en nuestro ejemplo 19,se señala la fila, ella constituye la clase modal.Se calcula:  D1 = 19 - 12 = 7    D2 = 19 - 7 = 12  a = 42­ 40 = 2 Se aplica la fórmula  7  7  14  Mo = 40 + * 2 = 40 + * 2 = 40 + ,  kg  = 40 74  12 + 7  19  19 Int erpretación: el peso más frecuente del grupo de alumnos es de 40,74kgRelación entre media, mediana y modoCuando la media, la mediana y el modo coinciden, la serie de datospresenta una distribución simétrica unimodal. m= Me=Mo Cuando esa coincidencia no existe, se dice que la distribuciónunimodal es asimétrica. La asimetría es positiva cuando la media es mayor que la mediana yla mediana mayor que el modo, en éste caso vemos que la media aritméticase dirige hacia el o los valores extremadamente grandes 5 3 
  • 54. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Mo < Me <m La distribución presenta asimetría negativa cuando la media esmenor que la mediana y la mediana menor que el modo; en éste casovemos que la media aritmética se dirige hacia el o los valoresextremadamente pequeños. m<  Me< MoLa distancia entre la media aritmética y el modo podría usarse como unamedida de asimetría (Ya­Lun Chou, 1990).Asimetría = media – modoCuánto mayor es esta distancia, negativa o positiva, tanto más asimétricaes la distribución4­ Medidas de localizaciónSon Medidas de Posición que dividen los valores ordenados de una serie encuatro, diez o cien partes iguales y se denominan cuartiles, deciles ypercentiles.4.1 Cua rtil esLos cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenadaen cuatro partes iguales.Por debajo del primero quedan el 25% de los datos; por debajo del segundoel 50% de los mismos y por debajo del tercero el 75%. El segundo cuartilcoincide con la Mediana.  5 4 
  • 55. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE4.2 DecilesLos Deciles son nueve valores de la variable y dividen a la serie ordenadade datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decirel 50% de los valores son menores o iguales al D5.4.3 Percentil esLos percentiles son 99 valores de la variable, que dividen al conjunto dedatos (ordenados de menor a mayor) en cien partes iguales el percentil 50coincide con la mediana. Los percentiles se designan con la letra Pi, elsubíndice i, varía de 1 a 99, indicando el valor del percentil, que se deseacalcular. ü Cálculo de percent iles: Forma analíticaPara calcular los percentiles de una distribución de frecuencias se procededel mismo modo que en el caso de la mediana, salvo que ahora dividiremos n = å f i al tamaño de la muestra en cien partes iguales, en vez de dos. Ø Ejempl oSe desea conocer P20 de licencia en las escuelas del centro de la ciudad deSantiago del Estero en el año 2004.Tabla 5. Días de inasistencia de los docentes de escuelas de la capital deSantiago del Estero en el período escolar 2004. Intervalo de clase Nº de docentes Fi (días de licencia) (fi) 0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530 Total 530 Fuente: Datos ficticios 5 5 
  • 56. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE El cálculo de percentiles para variables agrupadas en serie defrecuencias con intervalos de clase, se efectúa utilizando la siguientefórmula:  i å f i  - F  P  ant  i  P  = L inf + 100  i  * a  f P  i L inf : Límite inferior de la clase donde se encuentra el percentili = valor del percentil que se buscaFantPi: frecuencia acumulada anterior a la clase donde se encuentra elPercentil if Pi :frecuencia absoluta de la clase donde se encuentra el Pia: amplitud del intervalo a =Lsup­ LinfSoluciónCálculo del percentil 20Pasos1.­ Se agrega una columna de frecuencias acumuladas (Fi)2.­ Se calcula    i å f i  20 * 530  = = 106  100 100 3.­ Se ubica en la columna Fi el menor valor que contiene a 106, ennuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase quecontiene al Percentil buscado4.­ Se calcula a: Lsup –Linf = 30­20=105.­ Se aplica la fórmula  106 - 90  16 *  10  P20 = 20 +   *  = 20 + 10  = 22 67 » 23 días  ,  60  60  5 6 
  • 57. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEInt erpretaciónP20 = 23 díasEl 20 % de los docentes toman 23 días de licencia o menos ü Rango percentil Forma analítica Se puede presentar, el problema inverso, es decir, conocer cuántosdocentes toman 52 días de licencia o menos, es decir nos dan como datoun valor de la variable y nos preguntan que percentil le corresponde; a esteprocedimiento se lo denomina calcular el Rango percentil. Es decir el rango percentil de un valor dado es el porcentaje de valorescomprendidos debajo del valor solicitado. Ø Ejemplo:Calcular el rango percentil que le corresponde a 52 días de licencia de losdocentes de las escuelas de la ciudad de Santiago del EsteroRepetimos la tabla 5 para visualizar mejor el cálculoDías de inasistencia de los docentes de escuelas de la capital de Santiagodel Estero en el período escolar 2004. Intervalo de clase Nº de docentes Fi (días de licencia) (fi) 0 a 10 30 30 10 a 20 60 90 20 a 30 60 150 30 a 40 70 220 40 a 50 90 310 50 a 60 100 410 60 a 70 60 470 70 a 80 40 510 80 a 90 10 520 90 a 100 10 530 Total 530 Fuente: Datos ficticiosSolución1.­ Ubicamos en la tabla el intervalo de clase donde se encuentra el valor52 es el intervalo que va de 50 a 60.2.­ Se calcula la Frecuencia acumulada que le correspondería al valor 52 5 7 
  • 58. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEcon la siguiente fórmula  ( x  - L  )  i  inf  F ( x  ) =  i  *  f int erv  + F  anterior  Clase  a Donde:F(xi)= frecuencia acumulada correspondiente al valor que se buscaLinf Límite inferior del intervalo de clase donde se encuentra xifinterv Frecuencia absoluta del intervalo donde se encuentra xia amplitud del intervaloF clase ant. Frecuencia acumulada de la clase anterior al intervalo dondese encuentra xi  (  - 50  52  )  2 *  100  F (52  =  )  *  + 310 = 100  + 310 = 330  10  10 3.­ Se calcula ahora el rango percentil con la siguiente fórmula  F ( x  )  i  R p  =  *  100  å f i  330 R p  =  * 100 = 62 26  » 62  .  %  %  530 Int erpretación:Xi= 52 díasPi= 52 El 62% de los docentes toman 52 días de licencia o menos.(Cálculo gráfico de percentiles y rango percentilEjemploCalcular gráficamente el percentil 20SoluciónSe debe construir un gráfico de líneas; los pares de valores a graficarcorresponden al límite superior del intervalo con el porcentaje acumuladocorrespondiente a dicha clase.1.­ Calcular porcentaje acumulados. Para ello se necesita calcular:a) frecuencia relativa para cada intervalo 5 8 
  • 59. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEb) porcentajec) porcentaje acumulado2.­ Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene sedenomina ojiva.Días de inasistencia de los docentes de escuelas de la capital de Santiagodel Estero en el período escolar 2004.Interv alo de c lase Nº de doce nte s f ri Porcentaje Porcentaje (días de lice ncia) (f i) f ri*100 acumulado 0 a 10 30 0,0566 5,67= 6 6 10 a 20 60 0,1132 11,32 = 11 17 20 a 30 60 0,1132 11,32 = 11 28 30 a 40 70 0,1321 13,21 = 13 41 40 a 50 90 0,1698 16,98 = 17 58 50 a 60 100 0,1887 18,87 = 19 77 60 a 70 60 0,1132 11,32 = 11 88 70 a 80 40 0,0755 7,55 = 8 96 80 a 90 10 0,0189 1,89 = 2 98 90 a 100 10 0,0189 1,89 = 2 100 Total 530 100  100  90  80  70  60  %  50  40  30  20  10  0  0  10  20  30  40  50  60  70  80  90  100  Días 5.­Si deseamos calcular el valor que corresponde al percentil 20. Se ubicael valor 20 en el eje vertical y se traza una paralela al eje horizontal hastala curva y luego se traza una vertical hasta encontrar el valor de díascorrespondiente, el que aproximadamente es 23.Int erpretación: El 20 % los docentes incurren en 23 días de licencia o menos 5 9 
  • 60. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE6.­Si deseamos conocer cual es el rango percent il que corresponde a 52días, ubicamos ese valor en el eje horizontal y trazamos una paralela al ejevertical hasta la curva y desde allí una paralela al eje horizontal, leemos enel eje vertical el valor correspondiente al rango percentil (aproximadamente60).  100  90  80  70  60  %  50  40  30  20  10  0  0  10  20  30  40  50  60  70  80  90  100  Días Los valores correctos se obtienen utilizando las fórmulas presentadasanteriormente.MEDIDAS DE VARIABILIDAD O DISPERSIÓN Las Medidas de Posición no son suficientes por si solas paradescribir el conjunto de datos es necesario tener además una idea de comose distribuyen los datos alrededor del centro de la distribución. Para esosurgen las Medidas de Dispersión o variabilidad. 6 0 
  • 61. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE1.­Medidas de variabilidad en series simple. Su cálculo1.1. RANGOEs llamado también amplitud total de variación de la variable. Se loobtiene como la diferencia entre el valor máximo y mínimo de la variable.Distribución A: 1 5 5 5 5 5 5 5 5 9Distribución B: 1 1 2 4 5 6 7 7 8 9RA=9­1=8RB=9­1=8 En este caso el valor del rango es el mismo, a pesar de que notamosque la variabilidad de las dos distribuciones es diferente. La desventaja de esta medida es que solo considera los valoresextremos sin tener en cuenta el comportamiento del resto de lasobservaciones. Por lo que observamos que a pesar de tener variabilidadesdiferentes las dos distribuciones, el rango no la capta. Para solucionar este problema surgen otras medidas de variabilidadcomo el desvío medio.¿Cómo se puede medir la variabilidad de un conjunto de datos? Si porvariabilidad se entiende el grado en que los valores de la distribucióndifieren de la media y entre si, entonces la desviación promedio de losvalores a partir de la media puede resultar una medida razonable devariabilidad: å (x i - x )  n  Se denomina desvío a la diferencia entre cada valor de la variableysu medio. Cuando el valor de la variable es mayor que el valor medio el desvioes positivo; cuando el valor de la variable es menor que el valor promediolos desvíos son negativos. Pero por propiedades de la media sabemos que la suma de losdesvíos de los valores respecto a la media es siempre es cero, pues lasdesviaciones positivas respecto a la media, anulan siempre a las 6 1 
  • 62. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEdesviaciones negativas, con lo que resulta siempre una suma igual a cero ypor ende el valor promedio. Como esta medida de variabilidad parece razonable, debemosredefinir nuestra medida para evitar los valores negativos. Una manera dehacerlo es considerar el valor absoluto de los desvíos; la medida que seobtiene se denomina:1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los desvíos; se designa con DM.  DM  = å d i = å x i  - x  n  n Tabla 6: Distribución de puntajes de un grupo de alumnos xi x  - x  d i  d i =  i 1 ­4 4 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 4 å xi  = 50  å (d i ) = 0 å d i  = 8 x = 5 8 DM  =  = 0 8  ,  10  Fuente: Datos ficticios Pero generalmente no se puede operar fácilmente cuando se trabajacon valor absoluto, por eso se considera una segunda forma de modificaresos signos negativos y consiste en elevar los desvíos al cuadrado, lo quedará desvíos al cuadrado positivos. Esta nueva medida de variabilidad sedenomina varianza.1.3. Varianza es el promedio de los desvíos al cuadrado y se designa con S2 cuando se trata de una muestra y es un mejor estimador de 2 la varianza poblacional( s ) cuando la suma de los desvíos al cuadrado se divide entre el tamaño de la muestra menos 1; por ello para una muestra la fórmula es: 6 2 
  • 63. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE n  å (x i - x )  2 S 2 = i    =1  Variancia de una muestra, para series simples n - 1  n  å ( x i - m )  2  Variancia poblacionals 2 =  i  =1  N  Cuántos más tiendan los valores a diferir de la media, mayor será lavarianza. El valor numérico de la varianza de una distribución depende dela unidad de medida que se utilice. Por consiguiente, cuando se comparala varianza de dos o más distribuciones, hay que estar seguro que launidad de medida empleada es igual en todas las distribuciones. En elejemplo de la Tabla 7: Distribución de puntajes de un grupo de alumnos xi di=  x  - x  i ( d 2  = x  - x  1  i )  2  1 ­4 16 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 5 0 0 9 4 16 å (d i ) = 0 å (x i - x )  = 32  2 å xi  = 50    x = 5 32  S 2 =  = 3 56  ,  9  Fuente: Datos ficticios n  å (x i - x )  2  32  S 2 = i    =1  = = 3 56  ,  n - 1  9  6 3 
  • 64. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otra desventaja es que la varianza se expresa, en unidades alcuadrado y no en término de las unidades originales de medición, lo quehace difícil la tarea de relacionar en forma significativa el valor de lavarianza con el conjunto original de datos. Por eso es conveniente, considerar una medida de variabilidad quese exprese en unidades originales. Esta nueva medida denominadadesviación estándar se obtiene al extraer a la varianza la raíz cuadrada.1.4.Desv iación est ándar muestral n  å (x i - x )  2 i    =1  S  = n - 1  n  å (x i - x )  2 i    =1  32  S  = = = 3 56  = 1 89  ,  ,  n - 1  9 Desviación estándar poblacional n  å ( x i -m )  2 i  =1  s =  N  Nos debe quedar claro que la desviación estándar mide la variaciónentre los valores. Los valores cercanos producirán una desviación estándarpequeña, mientras que los valores dispersos producirán una desviaciónestándar más grande.2.­Medidas de variabilidad en series de frecuencia simple. Su cálculoEjemplo: Calcular la variabilidad de las inasistencias de 32 alumnos 6 4 
  • 65. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSETabla N° 7. Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos (x i) (fi) 11 12 12 9 14 5 15 4 23 2 Total 32 FUENTE: Datos ficticiosCuando se trata de variables cuantitativas discretas el Rango se calcula:2.1 Rango= Valor máximo ­Valor mínimo + 1 Rango=R = 23 ­ 11+1=13 inasistencia2.2 Desv ío medio en serie de frecuencia simple d i  *  f i  å x  - x  * f i DM  =  å i  å f i  å f i Cálculo: 1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se obtiene el valor absoluto y se lo multiplica por su frecuencia 4) Se aplica la fórmula Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos x i*fi  d i =  x  - x  d    d i  *  f i  i  1 (x i) (fi) 11 12 132 ­2 2 24 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 2 8 23 2 46 10 10 20 32 416 66  x= å x i  * f i  = 416  = 13  å f i  32  6 5 
  • 66. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  DM  = å d i  * f i  = 66  = 2 , 06  å f i  32 2.3. Varianza en serie de frecuencia simple n  n  å (x i - x ) å (x i - x )  f i  2  2  f i  S 2 = i    =1  = i =1  n - 1  å f i  - 1  1) Se calcula la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula Inasistencias de 32 alumnos Nº de inasistencias Nº de alumnos x i*fi  d i =  x  - x  d i 2  d i 2  *  f i  i  (x i) (fi) 11 12 132 ­2 4 48 12 9 108 ­1 1 9 14 5 70 1 1 5 15 4 60 2 4 16 23 2 46 10 100 200 32 416 278 FUENTE: Datos ficticios n  å (x i - x )  f i  2  278  278  S 2  = i  =1  = = 2  = 8 97 días  ,  n - 1  32 - 1  31 2.4 Desviación estándar en serie de frecuencia simple n  n  å (x  - x ) *  f  å (x i - x )  *  f i  2 2  i  i  i =1    i  =1  S= = n - 1  å f i  - 1  n  å (x i - x )  *  f i  2 i    =1  278  278  S  = = = = 8 97  = 2 99  ,  ,  n - 1  32 - 1  31  6 6 
  • 67. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE3.­ Medida de variabilidad en serie de frecuencias con int erv alos declaseLos siguientes datos corresponden a edades de los alumnos de los 2 ciclosde EGB.Tabla N°9. Edades de los alumnos de segundo ciclo del EGB Clases de Marca de fi x i*fi  d i = ( x  - x )  d1    d    i  1 edad en año clase (xi) *fi 6 a 8 7 4 28 ­4 4 16 8 a 10 9 8 72 ­2 2 16 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 2 24 14 a 16 15 2 30 4 4 8 Total 37 407 64 Fuente: Datos ficticios3.1.RangoL.superior de la última clase – L.inferior de la primera clase. Como loslímites superiores de las clases son abiertos, es decir no toma el valor 16,debemos colocar el valor 15,99 R = 15,99 – 6 = 9,99 años 1) Se calculan las marcas de clase y luego la media aritmética 2) Se calcula los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmula3.2. Desvío medio en serie de frecuencia de intervalos  DM  = å d i  * f i  = 64  = 1 . 73  å f i  37  1) Se calculan las marcas de clase y luego la media aritmética 6 7 
  • 68. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  x = å x i  * f i  = 407  = 11  å f i  37  2) Se calcula los desvíos 3) Se obtiene el valor absoluto de los desvíos 4) Se multiplica cada desvío absoluto por su frecuencia, se suma 5) Se aplica la fórmula3.3. Variancia serie de frecuencia con intervalos de clase 1) Se calculan las marcas de clase y luego la media aritmética 2) Se calculan los desvíos 3) Se elevan los desvíos al cuadrado 4) Se multiplica cada desvío al cuadrado por su frecuencia 5) Se aplica la fórmulaEdades de los alumnos de segundo ciclo del EGB Clases de Marca de fi x i*fi  d i = ( x  - x )  d i 2  d i 2 *fi i  edad en año clase (xi) 6 a 8 7 4 28 ­4 16 64 8 a 10 9 8 72 ­2 4 32 10 a 12 11 11 121 0 0 0 12 a 14 13 12 156 2 4 48 14 a 16 15 2 30 4 16 32 Total 37 407 176 Fuente: Datos ficticios Varianza en serie de frecuencias con intervalos de clase, la únicadiferencia con las fórmulas para serie de frecuencias simples es que xi,representa el punto medio de la clase o marca de clase n å (x i - x )  f i  2  i  176  176  S 2  = =1  = = 2  = 4 89 años  ,  n - 1  37 - 1  36  6 8 
  • 69. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.4 Desv iación estándar en serie de frecuencias con intervalos de clase. n  å (x i - x )  *  f i  2   i  =1  176  176  S  = = = = 4 89  = 2 21 años  ,  ,  n - 1  37 - 1  36 COEFICIENTE DE VARIACIÓN Las cuatro medidas de variabilidad enunciadas precedentemente sonmedidas de variabilidad absoluta. El coeficiente de variación es unamedida de variabilidad relativa. Expresa la desviación estándar como un porcentaje de la media. Esuna medida adimensional, se expresa en % y sirve para comparar lavariabilidad entre dos o más distribuciones que provengan de diferentesunidades de medidas o teniendo igual unidad de medida los valores dediferente magnitud.Coeficiente de variación muestral C.V . = S 100    x EjemploDecir cual de las siguientes distribuciones es más variable:xi: peso de los alumnos de nivel inicial (kg)34; 29; 28; 31; 40yi: altura de los alumnos de nivel inicial (m)1,24 1,54 1,38 1,37 1,56 x =32,4 kg Sx=4,83kg  y =1,42 m Sy=0,13m No podemos decir que la variabilidad en peso es mayor que lavariabilidad en altura, ya que las variables están medidas en distintasunidades, para poder compararlas la debemos expresar como porcentajede sus medias 6 9 
  • 70. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSECVx=(4,83/32,4)*100=14,91%CVy=(0,13/1,42)*100=9,15%Conclusión: los alumnos tienen menor variabilidad en altura que en peso.­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­Uso de la ca lcul a dora científi ca para el cá lculo de Medi da s dePosi ción y Di spersión Cal cul a dora s Casio model o f x­82W.Seguir la s si guientes i nstrucciones: Debe procurar que la calculadora se encuentre en disposición paraefectuar cálculos estadísticos. Para ello apriete mode 2. En la partesuperior de la pantalla aparece la notación SD. Debe cerciorarse de que no hay nada acumulado en la memoria.Para ello pulse SHIFT AC = y en su pantalla aparece el número cero. Seestá ahora en condiciones de introducir los datos.Por ejemplo para serie simple: xi: 1 2 3 4 5Marque el nº 1 y luego la tecla M+Marque el nº 2 y luego la tecla M+Marque el nº 3 y luego la tecla M+ Así sucesivamente hasta haber cargado todos los datos. Para cerciorarse de la cantidad de datos introducidos Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, aprieteahora = y aparecerá el 5, pues Ud. introdujo los 5 valores.Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantallaaparece  x  apriete = y en su pantalla aparece el valor 3 que es el valor dela media.Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece ensu pantalla  s n-1   presione = y en su pantalla aparecerá el valor 1,58 Si aprieta ahora la tecla x2 obtendrá 2,50 que es el valor de la 7 0 
  • 71. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEvarianza muestral S2 Si desea obtener la suma de los valores de x presione Alpha y la tecla 2. Para el caso de que la serie sea de frecuencia simple Se coloca la máquina en modo estadística Mode 2 Presione SHIFT AC =; ya tiene la memoria limpia. Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma.Aparece en la pantalla x i ; ahora introduzca el valor de fi y una vez quetenga en la pantalla x i ; f i recién apriete M+ ; continúe así hasta introducirtodos los valores de su serie, para el cálculo de la media, desviaciónestándar y varianza se procede luego apretando las teclas indicadasanteriormente. Cuando se trabaja con todos los datos de una población para elcálculo de la desviación estándar se aprieta SHIFT y la tecla 2 GUÍA DE EJERCITACIÓNActividad 1a) Los siguientes son pesos individuales de 10 alumnos de primer año deEGB: 30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35b) En la etapa de diagnóstico destinada a implementar un Plan de SaludBucal en alumnos de EGB, en una escuela el odontólogo determinó elnúmero de caries que presentaba cada alumno. Los siguientes son númerode caries que presentaban 9 de dichos alumnos: 7 1 
  • 72. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE2, 4, 0, 2, 3, 5, 1, 2, 2c) En un curso se tomó ocho alumnos al azar y se les preguntó cuál era elsalario que percibía mensualmente su padre. Ellos son los siguientes:3000, 1000, 570, 400, 600, 1500, 500, 5701.­ En cada caso determine y clasifique el tipo de variable que seconsidera.2.­ ¿Cómo se denomina en cada caso el conjunto de datos obtenidos parala variable que se estudia?3.­ Determine en cada uno de los incisos a, b y c, la Media Aritmética,Mediana y Modo.4.­ En cuál de los casos arriba detallados ¿la media no es una Medida dePosición adecuada?Actividad 2a) En cada una de las series de datos de la Actividad 1, calcule Rango,Desviación Media, Desviación estándar y Coeficiente de Variación.b) Si Ud. quiere comparar la variabilidad de los datos de cada una de lasseries presentadas en la Actividad 1, cuál medida de dispersión emplearía? 7 2 
  • 73. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 3Para realizar una evaluación del Número de puntos obtenidos en unaPrueba de Matemáticas realizada a los 30 alumnos de 6° de EGB, seordenó dicha variable en la siguiente serie de frecuencias: N° de puntos 0 1 2 3 4 5 6 7 8 9 10 xi N° de alumnos 0 1 0 4 3 8 6 4 1 2 1 fia) Calcule Media, Mediana y Modo.b) Determine Desviación Estándar, Varianza y Coeficiente de Variación.c) Indique si la distribución que se analiza es simétrica o no. En caso deser asimétrica, indique que tipo de asimetría presenta.d) A los fines de la evaluación, cuál de las tres Medidas de Posición seríamás correcta utilizar?Actividad 4 Los siguientes datos corresponden a Tipo de Deportes que prefierenlos alumnos de una escuela. Tipo de deportes N° de alumnos fi Basquet 220 Fútbol 500 Pelota al cesto 180 Hockey 100 Total 1000a) Indique qué tipo de variable es.b) Determine la Medida de Posición que corresponda a este caso. 7 3 
  • 74. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 5Las alturas de alumnos de un curso de Polimodal en una escuela semuestran en la siguiente Tabla: altura fi (m) 1.10­1.15 3 1.15­1.20 4 1.20­1.25 6 1.25­1.30 5 1.30­1.35 9 1.35­1.40 9 1.40­1.45 6 1.45­1.50 2 1.50­1.55 1 1.55­1.60 1 1.60­1.65 1a) Qué tipo de variable se considera?b) Encuentre frecuencias acumuladas, porcentajes y porcentajesacumulados.c) Encuentre Media Aritmética, Mediana y Modo.d) Calcule Desviación estándar y Coeficiente de variación.e) Realice el gráfico de la distribución porcentual acumulada.f) Determine gráfica y analíticamente el rango percentil para las siguientesalturas:1.18, 1.47, 1.56, 1.62.g) Determine gráfica y analíticamente las alturas correspondientes a lospercentiles:10, 25, 50, 75 7 4 
  • 75. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UNI DA D I V PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES – INFERENCIA ESTADÍSTICA1.­ INTRODUCCIÓN La teoría de probabilidad tiene sus orígenes en la teoría de lacasualidad. Históricamente, la teoría de la Probabilidad comenzó con elestudio de los juegos de azar, tales como la ruleta y las cartas. La teoría de la Probabilidad no es tan extraña como pudierapensarse. Sin duda alguna, en la vida diaria con mucha frecuenciaemitimos juicios probabilísticos, aunque a menudo no lo reconocemoscomo tales. Por ejemplo, supongamos que, por razones diferentes, usted no estápreparado para la clase de hoy. Seriamente usted considera faltar a clase.¿Qué factores influirán en su decisión? Obviamente una consideraciónserá la probabilidad de que el profesor descubra su falta de preparación. Siel riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativasposibles: 1. Su falta de preparación será descubierta. 2. Su falta de preparación no será descubierta. Hay incertidumbre en esta situación porque hay más de unaalternativa posible. Su decisión de asistir a clase, dependerá del grado decerteza asociado con cada una de estas alternativas. Así, si usted estábastante seguro de que prevalezca la primera alternativa, usted decidirá noir a clase. Supóngase que su profesor con frecuencia pide a los estudiantes queparticipen en clase activamente. De hecho, usted ha notado que la mayoríade los estudiantes son interrogados en cada sesión de clase. Este es unejemplo en el cual hay un alto grado de certeza asociada con la primeraalternativa. Dicho de esta manera, la probabilidad del primero es mayorque la del segundo. Por consiguiente usted decide no ir a clase. Usted hatomado una decisión con base en un empleo intuitivo, de la probabilidad. Antes de estudiar la teoría de la probabilidad, es convenientecomprender bien uno de los conceptos más importantes de la InferenciaEstadística: el concepto de a zar 7 5 
  • 76. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE2.­ EL CONCEPT O DE AZAR Definimos una población como el conjunto completo de individuos,objetos o medidas que tienen alguna característica común observable. Muyrara vez se puede estudiar una población. Seleccionamos muestras de unapoblación con la esperanza de que los estadísticos de la muestra nospermitan calcular los parámetros de la población. Para obtener unacorrespondencia entre un estadístico y un parámetro, la muestra deberepresentar una selección aleatoria de la población. Una forma de obteneruna muestra aleatoria, es mediante el Muestreo al Azar Simple, de talmanera que cada individuo , objeto o medida tenga igual probabilidad deser seleccionado. Una característica sobre los sucesos aleatorios, es queningún suceso tiene efecto predecible sobre el siguiente. Podremoscomprender más clara y fácilmente el concepto de azar en relación con los“juegos de azar, si suponemos que se juegan limpiamente. Conocer elresultado del lanzamiento de una moneda al aire, del lanzamiento de undado, del resultado de un juego de ruleta, no nos ayudará en absoluto enla predicción de los resultados por venir. Esta característica de los sucesosal azar se conoce como i ndependenci a . Si la independencia existe,podemos hablar de sucesos realmente al azar. La segunda característica importante del azar es que cuando lamuestra se extrae de una población, cada elemento debe tener unaprobabilidad igual de selección. Así, si nuestra selección o modo deselección favorece ciertos sucesos o ciertas colecciones de sucesos, nopodemos afirmar que los resultados son al azar.3.­ PROBABILIDAD Y ESTADÍSTICA La Estadística Descriptiva, hace referencia a los datos que se tienenen la mano. Cuando se quiere ir más allá de los datos disponibles, esnecesario inferir o sea utilizar la Estadística Inferencial. Como ella infiereel todo (población) a partir de la información que da una parte de ese todo(muestra), el conocimiento que adquiere es incompleto y por lo tanto no“totalmente cierto” es decir, se debe trabajar con probabilidades. Por ello,antes de estudiar las aplicaciones de la Estadística Inferencial es necesarioestudiar probabilidades. 7 6 
  • 77. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE4.­ TEORÍAS DE PROBABILIDAD Se puede considerar la probabilidad como la teoría que tiene que vercon los posibles resultados de los experimentos. Estos deben serpotencialmente repetitivos, es decir, debemos ser capaces de reproducirlosbajo condiciones similares. Debe ser posible enumerar cada resultado quepueda ocurrir, y debemos ser capaces de establecer las frecuenciasrelativas de estos resultados. Se distingue el enfoque clásico , frecuencial y axiomático de la teoríade probabilidad.4.1.­EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS. El lanzamiento de un dado, o de una moneda, la extracción de unnaipe de la baraja, de las bolillas de la lotería son experiencias aleatorias,pues sus resultados dependen del azar. También son aleatorios: el tiempode espera de una persona en la parada del autobús, sexo de los hijos enun matrimonio, el número de hijos que tendrá un matrimonio, etc. Los primeros (lanzamiento, extracciones) son fáciles de seguir, puesse pueden repetir tantas veces como se quiera de forma rápida. A partir deellos se obtienen leyes que rigen los fenómenos aleatorios y se aplican alestudio de situaciones aleatorias. Conceptos necesarios para definir probabilidadesExperimentos aleat orios: son aquellos que, repetidos bajo idénticas condiciones, no arrojan un único resultado sino un conjunto de ellos. ü Ejemplos: Arrojar un dado ü Arrojar una monedaEspacio muestral. Es el conjunto de los resultados posibles de un experimento aleatorio y se denota con M.Ejemplos. ü Para el caso de arrojar un dado, el espacio muestral resultante es: 7 7 
  • 78. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE M= {1,  ,  ,  ,  ,  }  2 3 4 5 6  ü Para el caso de arrojar una moneda, el espacio muestral resultante es: M={C, S} Para el caso de arrojar una moneda y un dado simultáneamente ,el espacio muestral resultante es: M = í(cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)ýEvent o simple .Es cada uno de los resultados de un experimento aleatorio que no puede desglosarse en componentes más simples. Se designan con la letra minúscula.Ejemplos ü Para el caso de arrojar un dado. Obtener el número 1, es un evento simple, lo mismo ocurre con los números restantes e={1} e={2} ü Para el experimento aleatorio arrojar una moneda al aire, los evento simples son e={c} e={s}Event o compuest o. Es un subconjunto del Espacio Muestral. Es el resultado de la unión de eventos simples. Se lo representa con letra mayúscula. ü Para el caso de arrojar un dado. El espacio muestral es M= {1,  ,  ,  ,  ,6  2 3 4 5 }  · Obtener número par, es el resultado de la unión de los eventos simples 2, 4, 6, y constituyen un subconjunto del espacio muestral. P={2, 4, 6} · Obtener número impar I={3, 5, 7} · Obtener un número menor que 4 A={1, 2,3}Suceso seguro: es el conjunto total M(espacio muestral). 7 8 
  • 79. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESuceso imposible: es el conjunto vacío. Opera ciones con sucesos En las aplicaciones de la teoría de probabilidades trataremosmuchas veces con eventos relacionados entre sí, más que con un soloevento. Por esta razón consideraremos ahora un experimento aleatorioarbitrario, con su espacio muestral correspondiente M, y cualesquiera doseventos A y B en el experimento. Entonces:*Union de Eventos A È B ( A unión B , A o B ) representa el evento que ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notación más antigua que representa a A È B es A + B, y el nombre correspondiente es suma de dos eventos)*Intersección de Event os. A Ç B ( A intersección B ó A y B ) representa el evento que ocurre si, y solo si, ocurren A y B simultáneamente, esto es, si ocurren en la misma ejecución del experimento en consideración.Event os mutuament e exclusivos. Son los eventos que no ocurren simultáneamente. Este caso se representa solamente cuandoA Ç B = Ø, el evento vacío, de tal manera que A y B no tienen puntos en común.*. El evento  A  es el complemento del evento A con respecto al espaciomuestral M y contiene a todos los resultados de M que no se encuentranen A. Ø Ejemplo Para el caso del arrojar una dado, el espacio muestral es M= {1,  ,  ,  ,  ,  }  2 3 4 5 6  ü Evento A obtener un nº par A={2, 4, 6}  A ={1, 3, 5 } Ø Ejemplo: Un experimento consiste en tirar un dado y observar el número depuntos que aparece en la cara superior. El espacio muestral se puede 7 9 
  • 80. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEdescribir fácilmente, ya que es finito. Las posibilidades para el dado sonseis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son: M = {1, 2, 3,4, 5, 6}b) Describir los siguientes eventos: A: Sale un numero par. A: Sale un numero par. B: Sale un número impar. B: Sale un número impar. C: Sale un número menor que 4 C: Sale un número menor que D: Sale un número mayor que 3. D: Sale un número mayor que 3. E: Sale un número impar o mayor que 3. E: Sale un número impar mayor que 3. F. Sale un número par y menor que 4. F. Sale un número par menor que 4. G: Sale un número par y un impar. G: Sale un número par un impar.SoluciónSolución v El evento:”Sale un número par” , está representado por la letra A, su descripción puede realizarse mediante el siguiente conjunto : A = {2 4 6  , ,  ,  }  v El evento “ Sale un número impar ”, está representado por la letra B, su descripción puede realizarse mediante el siguiente conjunto : B = { 1 , 3 , 5 }. v El evento “ Sale un número menor que 4” ”, está representado por la letra C, su descripción puede realizarse mediante el siguiente conjunto : C= í1 , 2 , 3 ý v El evento “Sale un número mayor que 3”, está representado por la letra D, su descripción puede realizarse mediante el siguiente conjunto : D= í4 , 5 , 6 ý v El evento “ Sale un número impar o mayor que 3”, se representa por la letra E, está formado por todos los resultado de B o de D o de ambos. Este evento recibe el nombre de unión de B y D, se denota por B È D y su 8 0 
  • 81. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE descripción puede realizarse mediante el siguiente conjunto: B È D = E =í1 , 3 , 4 , 5 , 6ý v El evento “ Sale un número par y menor que 4”, se representa por la letra F, está formado por los resultados comunes tanto a A como a C. Este evento recibe el nombre de intersección de A y C, se denota por A Ç C y su descripción puede realizarse mediante el siguiente conjunto : A Ç C = F = í2 ý v El evento “ Sale Un número par y un número impar”, se representa mediante la letra G, está formado por la intersección de los eventos A y B, estos eventos no tienen nada en común, por lo tanto la intersección de ellos es vacía. A y B son mutuament e excluyentes o disjuntos.. A Ç B = G = íý = Æ 4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A PRIORI) Supóngase que queremos conocer la probabilidad de que unamoneda caiga con la cara hacia arriba. Como hay solo dos posiblesresultados (cara o seca) adoptamos una situación ideal en la cualesperamos que cada resultado tenga igual probabilidad de ocurrir. Así, la 1 probabilidad de que se presente una cara, P ( C) =  2  Definición :La probabilidad de un evento A en un experimento aleatorioestá dado por: el cociente entre el número de casos favorables y el númerode casos igualmente posibles  N º de casos  favorables  a  A  P   A  = ( )  N º  total  de casos  igualmente  posibles  Por ejemplo, la probabilidad de extraer el as de espada de una baraja ordinaria de 52 cartas es 1/52. 8 1 
  • 82. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  ü Pero la probabilidad de sacar un as de espada rojo es cero (puesto que no hay figuras de espadas rojas en la baraja) no hay sucesos posibles que favorezcan este resultado. ü Si los ev entos son mut uamente excluyentes (esto es, si los dos eventos no pueden ocurrir simultáneamente), pues A Ç B = Ø , la P (Ø ) = 0 4.3. DEFINICIÓN DE PROBABILIDAD FRECUENCIAL (PROBABILIDAD A POSTERIORI) Las probabilidades se aproximan después de realizar la experiencia.Por ejemplo, para saber cuál es la probabilidad de obtener el as con undado determinado, se arroja el dado 600 veces en las cuales se obtienen113 veces un as. La probabilidad de obtener un as con ese dado es estimada por lafrecuencia relativa = 113/600 = 0.1883. Realice ( u observe) un procedimiento un gran número de veces ycuente las ocasiones que el suceso A ocurre en realidad. Con base en estosresultados reales, P(As) se estima de la siguiente forma :  f (As)  P(As)  » = f r(As) å f  4.4. AXIOMAS DE PROBABILIDAD1.­ Si E es un evento cualquiera en un espacio muestral M , entonces 0≤  P ( E ) ≤ 1 La probabilidad de un suceso varía entre 0 y 1.2.­ Al espacio muestral M completo le corresponde P(M)=13.­ Si A y B son eventos mutuamente exclusivos, entonces se cumple P(AÈB)=P(A)+P(B) 8 2 
  • 83. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESi el espacio muestral es infinito, debemos reemplazar el axioma 3 por3* .­ Si E1 , E 2 , . . . . son eventos mutuamente exclusivos, entoncestenemos que P (E1 È E 2 È . . . ) = P ( E1 ) + P ( E 2 ) + ........ 4.5. PROPIEDADES:1.­ Si Ø es el conjunto vacio, entonces P (Ø ) = 0 . Imposibilidad Por ejemplo, la probabilidad de extraer el as de espada de una barajaordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as deespada rojo es cero (puesto que no hay figuras de espadas rojas en labaraja).no hay sucesos posibles que favorezcan este resultado.2.­ Si E c es el complemento de un evento E , entonces P (E c ) = 1 – P( E )3.­ Si A Ì B , entonces P ( A ) menor o igual a P ( B ). v La probabilidad de que ocurra el evento A , es decir que al lanzar un dado salga un número par , se calcula como P(A) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que A = í2, 4, 6 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento B, es decir que al lanzar un dado salga un número impar , se calcula como P(B) =3/6 = 1/2 donde: · el número de resultados favorables es 6, ya que B = í1,3,5 ý, tiene 3 elementos. · el número total de resultados es 6, ya que M = {1 ,2 ,3, 4, 5 , 6} tiene 6 elementos. 8 3 
  • 84. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  v La probabilidad de que ocurra el evento C, es decir que al lanzar un dado salga un número menor que 4 , se calcula como P(C) =3/6 = 1/2donde:· el número de resultados favorables es 6, ya que C= í1 ,2, 3 ý, tiene 3 elementos.· el número total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 , 6} tiene 6 elementos. v La probabilidad de que ocurra el evento D, es decir que al lanzar un dado salga un número mayor que 3 , se calcula como P(D) =3/6 = 1/2donde:· el número de resultados favorables es 6, ya que D= í4, 5, 6 ý, tiene 3 elementos.· el número total de resultados es 6, ya que M = {1 , 2,3 , 4, 5 , 6} tiene 6 elementos. v La probabilidad de que ocurra el evento E, es decir que al lanzar un dado salga un número impar o mayor que 3 , se calcula como P(E) =5 / 6donde:· el número de resultados favorables es 5,ya que E=í1,3,4,5,6 ý, tiene 5 elementos.· el número total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento F, es decir que al tirar un dado salga un número par y menor que 4 , se calcula como P(F) =1 / 6donde:· el número de resultados favorables es 1, ya que F = í2 ý, tiene 1 elemento.· el número total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6} tiene 6 elementos. v La probabilidad de que ocurra el evento G, esta formado por la intersección de los eventos A y B que son 8 4 
  • 85. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE mut uamente excluy entes, decir que al lanzar un dado ,” un número impar y par “ , es cero, ya que es imposible de que ocurra dicho evento. La probabilidad del evento nulo o vacio siempre es 0.se calcula como P(G) = P (Ø ) = 0 donde: · el número de resultados favorables es vacio, ya que G = íý. · el número total de resultados es 6, ya que M = {1, 2, 3, 4 , 5 , 6} tiene 6 elementos.4.5.TEOREMA DE LA SUMA DE PROBABILIDADES Sean A y B dos eventos del espacio muestral M generado por unexperimento aleatorio. El teorema de la suma de probabilidades diceque la probabilidad de la unión de A y B es la suma de lasprobabilidades menos la probabilidad de la intersección. En símbolos: Sean A y B Ì  M  entonces P(AÈB)=P(A)+P(B)­ P(AÇB) Si los eventos son mutuamente excluyentes, el último término desaparece, pues A Ç B = Ø y P (Ø ) = 0 P(AÈB)=P(A)+P(B)ü En el ejemplo, calcule la probabilidad del evento “ sale cara o sale un número par” correspondiente al experimento de lanzar simultáneamente un dado y una moneda, utilizando el teorema de la suma de probabilidades.El espacio muestral M= {(1,c); (1,s); (2,c); (2,s) ; (3,c); (3,s) ; (4,c); (4,s); (5,c); (5,s) ; (6,c); (6,s)c: salga caraP: salga número par P(CÈP)=P(C)+P(P)­ P(CÇP) 6 6  3  9  3  + - = = = 0 75  ,  P (C È P )= 12  12  12  12  4  8 5 
  • 86. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.6. PROBABILIDAD CONDICIONAL Muchas veces necesitamos encontrar la probabilidad de un evento Bsi se sabe que ha ocurrido un evento A. Esta probabilidad se llamaprobabilidad condicional de B dado A, y se representa como P ( B / A ) .En este caso A sirve como un espacio muestral nuevo ( reducido ) , y laprobabilidad es la fracción de P( A) que corresponde a A ÇB. Así que P ( A Ç B ) P(B/A) = P  A    ( ) Del mismo modo, la probabilidad condicional de A dado B es P ( A Ç B ) P  ( A / B )  = P  B    ( ). Volviendo al ejemplo del dado:a) halle la probabilidad de que aparezca un número menor que 4 dado queapareció un número mayor que 3b) halle la probabilidad de que aparezca un número impar dado queapareció un número mayor que 3Solución :a) P ( C / D ) se denomina probabilidad condicional de C dado que haocurrido el evento D , se define como P ( C / D ) = P ( C Ç D ) / P( D )En este caso M = í1 , 2 , 3 , 4 , 5 , 6 ýC = í 1 , 2 , 3 ý , D = í 4 , 5 , 6 ý , P( D ) = 3 / 6 = 1 /2 , P( C Ç ) = 0 P(C/D)= 0/½ =0b) P ( B / D) es la probabilidad condicional de que aparezca un númeroimpar dado que apareció un número mayor que 3.P( D )= 3 / 6 = 1 / 2 P ( B Ç D ) = 1/6 P ( B / D = P( B Ç D ) / P( D ) = 1/6 / 12 = 1/3 8 6 
  • 87. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES En ocasiones, nos encontramos con la necesidad de determinar laprobabilidad de ocurrencia simultánea de dos o mas eventos. Para obtenereste resultado, deberemos aplicar la regla de multiplicaciónRegla de la Multiplicación : Si A y B son eventos conteni dos en unespa cio muestral M , y P ( A ) > 0 y P ( B ) > 0, entonces se cumpleque P ( A y B ) = P(AÇB) = P(A) · P(B /A) = P ( B ) · P ( A /B)Cuando los eventos son independientes: En el caso especial en el que laocurrencia de A no está en absoluto relacionada con la ocurrencia de B yviceversa , se dice que los sucesos son independientes. La independenciase representa simbólicamente por P ( B/ A ) = P(B) y P (A /B)=P(A).Cuando los event os son independient es la regla de la multiplicación sesimplifica a : Si A y B son eventos contenidos en un espacio muestral M yP(A)> 0 y P(B)> 0, entonces “La probabilidad de la intersección es elproducto de las probabilidades” : P ( A y B ) = P(AÇB) = P(A) · P(B) En el ejemplo del dado : son A y C independientes? Si la probabilidad del resultado A no depende de la ocurrencia de unsegundo evento C ( o viceversa) se dice que A y C son eventosindependientes. En términos de probabilidad se expresa que A y C soneventos independientes si P ( A / C ) = P ( A ) ó bien P ( C / A ) = P ( C ) En este caso A y C no son eventos independientes ( se denominandependientes), debido a que 8 7 
  • 88. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Si al lanzar un dado M:{1,2,3,4,5,6} A: número par B: numero impar P (A)= 3  6  P (C)= 3  6  P (A Ç C)= 1  6  1  6  1  P (A/C): 3  3  6  3  1  P(A)= 6  2  P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 , Y P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2 Debemos notar que los sucesos mutuamente exclusivos no son nunca independientes, puesto que la ocurrencia de uno niega la posibilidad deocurrencia del segundo. Entonces : P( A/ B ) = P( B/ A) = 0Muestreo con y sin reemplazo Hay dos maneras de extraer objetos para obtener una muestra deun conjunto dado de objetos, conocido como muestreo de una población;estas son las siguientes. 8 8 
  • 89. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE1.­ Muestreo con reemplazo significa que el objeto que se extrajo al azarse coloca de nuevo en el conjunto dado, se mezcla completamente y seprecede a extraer al azar el siguiente objeto.2. Muestreo sin reemplaz o significa que el objeto que se extrajo se dejaaparte y no se lo introduce nuevamente. Ø Ejemplo Una caja contiene 10 cuadernos, de los cuales 3 están con fallas. Dos cuadernos se extraen al azar sin reemplazo. Encontrar la probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas. Solución: Consideremos los eventos A : El primer cuaderno extraído no tiene fallas. B: El segundo cuaderno extraído no tiene fallas. Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no sondefectuosos y estamos muestreando aleatoriamente, por lo cual cadacuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido. Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cualestienen fallas, por lo que P ( B / A )= = 6 / 9 = 2 / 3Y por el teorema de la multiplicación, la respuesta es P ( A Ç B ) = 7 /10 . 2 / 3 = 0,47 Ø Ejemplo Si se seleccionan dos cartas de un paquete de naipes bien barajado, ¿ cuál es la probabilidad de que ambas sean reinas?. Solución Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar una carta, reponerla en la baraja , barajar y extraer una segunda carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos cartas consecutivamente sin reemplazar la primera en la baraja (Muestreo sin reemplazo) 8 9 
  • 90. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1º. Sea A el suceso de una reina en la primera extracción, y B el suceso de una reina en la segunda extracción. Cuando el muestreo es con reemplazo, la probabilidad de extraer una reina permanece igual en las dos extracciones. Así, puesto que P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son independientes, por lo tanto P ( A Ç B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69 2º. Cuando se emplea el muestreo sin reemplazo la probabilidad de obtener una reina en la segunda extracción se reduce siempre que la primera carta seleccionada haya sido una reina. En otras palabras , cuando P ( B / A ) ¹ P ( B ) o P ( A / B ) ¹ P ( A ) , los sucesos no son independientes.. La probabilidad de extraer una reina en el segundo intento es 3 / 51. Empleando la fórmula correspondiente, encontramos que la probabilidad de seleccionar dos reinas en extracciones consecutivas procedentes de una baraja sin reemplazo , es : P ( A Ç B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221Se debe notar que la diferencia entre ambos muestreos es despreciablecuando la población es grande en relación con el tamaño de la muestra. Ø Ejemplo: Para un estudio, se obtiene una muestra de alumnos de una escuela y se los clasifica según lugar de residencia y el medio de transporte que utilizan para llegar a la misma, obteniéndose los siguientes resultados: Lugar de residencia Medio para llegar a la e sc uela Total Caminado Bicicleta Ómnibus Barrio A 100 20 50 170 Barrio B 50 20 30 100 Barrio C 30 10 5 45 Total 180 50 85 315 Suponga que se selecciona un alumno al azar de este grupo. Obtenga las probabilidades siguientes ü Que el alumno resida en el barrio A 9 0 
  • 91. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 170  P ( A  =  )  = 315  0.5397ü Que el alumno resida en el barrio A o en el B 170 100  270  + = = 0 8571  .  P(AÈB)=P(A)+P(B)= 315  315  315 ü Que el alumno no sea del Barrio A  315 - 170  145 P ( A  =  )  = 0 4603  .  315  = 315 ü Que el alumno sea del Barrio A y vaya caminando a la escuela 100  P(AÇC)= 315 =0.3175ü Probabilidad que el alumno vaya en ómnibus a la escuela dado que vive en el barrio B 30  P ( B I O  315  30  )  =  = = 0 3  ,  P ( B )  100  100  P(B/O)=  315 ü Probabilidad que el alumno vaya en ómnibus a la escuela o viva en el barrio B 85 100  30  155  + - = P(OÈB)=P(O)+P(B)­ P(OÇB)= 315  315  315  315 =0.4921 9 1 
  • 92. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 5.­ DISTRIBUCIÓN DE PROBABILIDAD Una distribución de probabilidad no es más que, como su nombre loindica, la asignación a cada evento posible, de un experimento, de laprobabilidad que le corresponde.Definición. Cualquier regla o mecanismo que sirva para determinar P( X = x) , probabilidad de que la variable aleatoria X tome cada uno de los valores posibles x , se denomina una Di stribución de Proba bilida d Existen dos tipos de distribuciones que son importantes en lasaplicaciones prácticas, a saber: las distribuciones discretas y lascontinuas. Una distribución discreta surge al contar ( por ejemplo, obtenerun 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una cartade la baraja española). Una distribución continua aparecerá si se mide (por ejemplo altura de los alumnos y alumnas de la clase). Entre todas las distribuciones discretas, la Distribución Binomial esla más sencilla. Entre las distribuciones continuas veremos la DistribuciónNormal. 5.1. VARIABLE ALEATORIA Una variable aleatoria X es una función cuyos valores son númerosreales y dependen del “azar” . 5.2.DIST RIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA DISCRETA La siguiente es la distribución de la variable aleatoriaXi = nº de puntos obtenidos al arrojar un dado perfecto , o sea que todassus caras son igualmente posibles: xi 1 2 3 4 5 6 Total P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1 Obsérvese que se cumplen dos condiciones que son necesarias paraque un conjunto de pares ordenados (x,y) sea considerada unadistribución de probabilidades: 9 2 
  • 93. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1) Para cada valor de x le corresponde un único valor de y que es un valor de probabilidad (no negativo y menor o igual a 1), å P ( x i ) 2) M  =1 3) Esta distribución recibe el nombre de uniforme, es una distribución de variable aleatoria discontinua y sus parámetros son los valores mínimo (a) y máximo (b) que puede tomar x. Esto se indica como  X  ~ U (a, b). 5.2.1. DISTRIBUCIÓN BINOMIAL. La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y biendeterminado). Se puede considerar que la Distribución Binomial es larepetición de n pruebas independientes (por ejemplo tomar 4 pruebas enun año). La función de probabilidades es:  P ( x  =  C x  p x q n - x  , )  n  x  donde  C n  son las combinaciones de n elementos tomadas de a x, p= probabilidad de éxito en una sola prueba, q = 1­ p = probabilidad de fracaso. x  La combinaciones se calculan como sigue:  C n  = (n.(n­1). (n­2)...(n­x+1))/x! Los parámetros que definen a la distribución Binomial son n y p Las dos características necesarias de una distribución de probabilidadconsisten en que cada valor de P ( X = x½n , p ) tiene que ser mayor oigual a 0 y que la suma de todos los valores de P ( X = x÷ n , p ) debe serigual a 1. Ø Ejemplo :Cuando se recibe un envío de lápices en la escuela, se seleccionan de manera aleatoria, 15 unidades con el propósito de verificar el porcentaje de unidades defectuosas en el envío. Con base en información pasada, la probabilidad de tener una unidad defectuosa es de 0.05. La directora ha decidido no recibir el envío cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, se rechace el envío? 9 3 
  • 94. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESoluciónEl modelo de distribución apropiado para esta situación es la distribuciónbinomial, se puede suponer que las 15 unidades que se seleccionan al día,constituyen un conjunto de ensayos independientes de manera tal que laprobabilidad de tener una unidad defectuosa es de 0.05 entre ensayos.Definimos a la variable aleatoria X : “número de unidades defectuosas”que se encuentran entre las 15 unidades seleccionadas. El evento sedefinirá como A : unidad defectuosa. La probabilidad de A es P(A) = 0,05 El número de ensayos n = 15 La probabilidad de que el envío no se reciba, es igual a la probabilidad de que X sea igual o mayor que dos: P(X ³ 2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] 15!  (0 05  0 (  - 0 05  15 -0  ,  )  1  ,  )  P(0÷ 15, 0,05) =  0! (15 ­ 0)!  = 1(0,95)15 = 0.4631 15!  (0 05 1 (  - 0 05 15 -1  ,  )  1  ,  )  P(1÷ 15, 0,05) =  1! (15 ­ 1)!  = = 15(0,05)(0,95)14 = 0,3658 P(X ³ 2÷ 15, 0,05) = 1 – P(X < 2) = =1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711.La distribución binomial es realmente una familia de distribuciones,puesto que para cada valor diferente de n y p , que se denominanparámetros de la distribución binomial, se puede definir una distribucióndiferente. Sin tener en cuenta el valor de n , la distribución es simétricacuando p = 0,5. Cuando p es mayor que 0,5, la distribución es asimétricay su máximo se encuentra a la derecha del centro. Cuando p es menor que0,5, la distribución es asimétrica y su máximo se encuentra a la izquierdadel centro. 9 4 
  • 95. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSETablas de la Distribución Binomial El cálculo de las probabilidadesbinomiales mediante la ecuación anterior puede resultar laborioso cuandon es grande .Afortunadamente hay tablas de probabilidades binomiales yentonces no es necesario el uso directo de la ecuación. Solamentenecesitamos utilizar una tabla con los valores dados de n , p y x paraobtener la probabilidad deseada Para explicar el uso de la Tabla consideremos nuevamente elejemplo en el cuál deseábamos conocer: La probabilidad de que ladirección rechace el envío es igual a la probabilidad de que X sea igual omayor que dos : para hallar esta probabilidad en la tabla ,localizamosprimero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filasmarcadas con un 0 y un 1P(X ³ 2÷ 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0.463 +0.366] = 0.171 pn x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1 2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3 4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4 5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5 6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6 7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7 8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8 9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9 10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10 11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11 12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12 13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 1314 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1 2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2 3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3 4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4 5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5 6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6 7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7 8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8 9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9 10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10 9 5 
  • 96. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11 12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12 13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 1415 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0 1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1 2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2 3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3 4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4 5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5 6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6 7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7 8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8 9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9 10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10 11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11 12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12 13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13 14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14 15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15 5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE ALEATORIA CONTINUA En estas distribuciones no es posible calcular la probabilidad enpuntos sino que hay que hacerlo en intervalos. Recuérdese que en lasvariables discontinuas las probabilidades de intervalos se obteníansumando las probabilidades que corresponden a cada punto o valor de lavariable. En variables continuas, los valores que puede tomar la variableson infinitos por lo que es necesario hacer una suma infinita es decir unaintegral. En las variables continuas, la probabilidad de un intervalo seobtiene integrando la función de densidad. ü Ejemplo: la distribución rectangular X ~ R (0,2). Esta es una distribución rectangular (todos sus puntos tienen igualdensidad de probabilidad) que se extiende desde 0 a 2. El gráfico de sufunción de densidad es el siguiente: 9 6 
  • 97. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEen el que se puede observar que la función de densidad f(x) = 1/2La probabilidad de encontrar valores de variables entre 1 y 2 se encuentraintegrando la función de densidad entre esos límites.La integral entre esos límites corresponde al área bajo de la curva entre losmismos. 5.3.1.LA DISTRIBUCIÓN NORMAL Si una variable es continua, varía desde -¥ hasta + ¥ y sufunción de densidad es:  2  1 æ x - m ö 1  - ç ÷  f (x)  =  e  2 è s  ø s 2p ,se dice que x tiene distribución normal con parámetros m y  s  (mediaaritmética y desviación estándar). Esto se simboliza como sigue : X ~ N ( m ,  s  ) 9 7 
  • 98. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Su gráfica es la siguiente: 0,40  0,30  f (x) 0,20  0,10  0,00  4  6  8  10  12  14  x  La distribución normal presenta las siguientes características:1) Presenta un máximo en x = m , por lo tanto Mo = m2) Es simétrica y su eje de simetría es  f ( m ) , por lo que se deduce que Md =m = Mo.3) Tiene dos puntos de inflexión ubicados en  x  = m ± s4) Toda transformación lineal de x da otra distribución normal.5) Algunos sectores usados de la función son:  x  = m ± s corresponde aproximadamente al 68 % central  x  =  m ± 2 s corresponde aproximadamente al 95 % central  x  =  m ± 3 s corresponde aproximadamente al 99 % central6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0. +¥ ò f ( x ) dx  =  11) Por ser función de densidad, el área bajo de la curva es  -¥ Para calcular la probabilidad de un intervalo en la distribución normal,por tratarse de una variable continua, debe hacerse mediante la  9 8 
  • 99. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEintegración de la función de densidad, lo cual equivale a calcular el áreabajo de la curva. Considérese por ejemplo que la altura de los alumnos dela escuela tiene distribución normal con media m = 1,6 m y desviaciónestándar s = 0,1 m. La probabilidad de que al seleccionar un alumno alazar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtieneintegrando la función de densidad f(x), (en la cual se debe reemplazar losvalores correspondientes de m y s por 1,6 y 0,1 respectivamente) entre loslímites 1,5 y 1,65. La di stribuci ón normal está ndar Usando la propiedad que dice que la transformación lineal  x  ­ mz  =  s conduce a una distribución también normal, cuyosparámetros son m z  =  O    y  s z  =  1 , se obtiene una nueva distribución que seconoce con el nombre de distribución normal est ándar o normal 0,1 yse la describe comoZ ~ N(0,1) cuya representación gráfica es la siguiente:  ­5  ­3  0  3  5  z 9 9 
  • 100. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ta bla s de l a di stribuci ón normal El cálculo de probabilidades en la normal involucra el cálculo deintegrales que son muy engorrosas de resolver manualmente. Por ello, lasintegrales están tabuladas para una distribución normal que es laestándar. Vamos a aprender el uso de tablas de una colaTabla de “ 1 cola” En ella, los valores de probabilidad se encuentran en el cuerpo de latabla y los valores de z se forman utilizando la primera columna y laprimera fila (es decir en lo que se conoce como matriz de la tabla). En estatabla es importante considerar el signo de z.Como su nombre lo indica, para el valor de z considerado, da el valor delárea bajo de la curva desde menos infinito hasta z. Por ejemplo si z = ­2.1la tabla da P(z < ­2.1) = 0.0179. Ø Ejemplo :Una población de pesos de alumnos en gr tiene distribución normal conmedia y desviación estándar ( m y  s  ) de 50 y 5 Kg. respectivamente. ¿Cuáles la probabilidad de ü que los alumnos pesen menos de 55 kg En símbolos, la probabilidad buscada es P(x £ 55) Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:  x  ­ m z  =  s en este caso x = 55 ,  m = 50  y s =  5  por lo que z = (55 ­ 50)/5 = 1. P(x £ 55) = P(z £ 1) = 0,8413 Cuando se busca una valor por menor, la probabilidad se obtiene directamente en la tabla. ü que los alumnos pesen más de 57,75 kg En símbolos, la probabilidad buscada es P(x ³ 57,75) 1 0 0 
  • 101. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el siguiente cambio de variable:  x  ­ m z  =  s en este caso x = 57.75 ,  m = 50  y s =  5  por lo quez = (57,75 ­ 50)/5 = 7,7/5 = 1,54.P(x ³ 57,75)= P(z ³ 1,54) = 1­ P(z £ 1,54)=1­0,9382=0,0618 z .00 .01 .02 .03 .04 1.0 0.841 0.843 0.846 0.8485 0.850 3 8 1 8 1.1 0.864 0.866 0.868 0.8708 0.872 3 5 6 9 1.2 0.884 0.886 0.888 0.8907 0.892 9 9 8 5 1.3 0.903 0.904 0.906 0.9082 0.909 2 9 6 9 1.4 0.919 0.920 0.922 0.9236 0.925 2 7 2 1 1.5 0.933 0.934 0.935 0.9370 0.938 2 5 7 2 1.6 0.945 0.946 0.947 0.9484 0.949 2 3 4 5 1.7 0.955 0.956 0.957 0.9582 0.959 4 4 3 1 1.8 0.964 0.964 0.965 0.9664 0.967 1 9 6 1 1.9 0.971 0.971 0.972 0.9732 0.973 3 9 6 8 2.0 0.977 0.977 0.978 0.9788 0.979 2 8 3 3 2.1 0.982 0.982 0.983 0.9834 0.983 1 6 0 8 2.2 0.986 0.986 0.986 0.9871 0.987 1 4 8 5 1 0 1 
  • 102. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  ü que los alumnos pesen entre de 52,75 kg y 60 kg En símbolos, la probabilidad buscada es P(52,75 £ x £ 60) Para solucionar esto es necesario pasar de la normal que nos interesa a la normal estándar. Esto se consigue mediante el x ­ m  z =  siguiente cambio de variable s , se buscan dos valores de z, primero para el valor mayor de x, luego para el menor  60 ­ 50  10  52,75 ­ 50  2 75  ,  z    =  2 =  = 2  z  =  1  =  = 0 55  ,  5  5  5  5  Se buscan los valores en la tabla para z=2; P(z £ 2)=0,9861 Se buscan los valores en la tabla para z=0,55; P(z £ 0,55)=0,7088 Luego se restan los valores P(52,75 £ x £ 60)= P(0,55 £ z £ 2)=0,9861­0,7088=0,2773 Los valores de z a más usados y que determinan intervalos centrales (1­a) son: z  = ±1 64  ,  ·  0, 10  para el 90 % central z  , 05  = ±1 96  ,  ·  0 para el 95% central z  = ±2 58  ,  ·  0, 01  para el 99% central EjemploEn la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo quecorresponde al 95 % central de la población?En la distribución de z, el 95 % central de la población corresponde alintervalo que va desde ­1.96 a +1.96, o sea ± 1.96. Es muy simple, si sedesea que en el centro esté el 95 % o, en tanto por uno, 0.95, entonces en z  = ±1 96  , las colas debe quedar el 0.05. el valor que corresponde  0, 05  .Ya se determinó el intervalo en z, ¿cómo se pasa a la normal con media 50y desviación estándar 5? Se debe hacer el cambio inverso de variable:  x  ­  m z  =  entonces  x  =  m ± z s s . 1 0 2 
  • 103. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEPara indicar que el intervalo corresponde a un porcentaje centraldeterminado se acostumbra a llamar a a lo que queda en las colas.  x  =  m ± z a sVolviendo entonces al ejemplo, por ser  z a = 1.96, el intervalo quecorresponde al 95 % central de la población de pesos de los alumnos es: x = 50 ± 1.96 5 = 50 ± 9,80 .El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg. 1 0 3 
  • 104. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCITACIÓNActividad 1El Director de una escuela debe establecer turnos para que elestablecimiento siempre tenga dos administrativos durante el mes deenero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debeformar grupos de dos seleccionados al azar, sin reemplazo.Describa el espacio muestral de este experimento aleatorio.Actividad 2a) ¿Cómo sería el espacio muestral en la actividad anterior si el muestreo fuera con reemplazo?b) ¿Cuál es la forma correcta de efectuar este experimento, para que el Director del establecimiento siempre tenga dos administrativos en el mes de enero?Actividad 3Dé dos ejemplos de sucesos seguros y dos de sucesos imposibles.Actividad 4En el experimento aleatorio de la Actividad N°1,a) ¿Cuántos grupos de dos personas se formaron?b) ¿En cuántos está A?c) ¿En cuántos está B?d) ¿En cuántos están A y B?e) ¿En cuántos no ha sido seleccionado C?f) ¿En cuántos han sido seleccionados A ó B ó C?g) Calcule la probabilidad de cada uno de estos sucesos.Actividad 5Una oficina donde asignan becas para estudio a alumnos de EGB, realizala selección de los mismos para dos Becas de distinto origen de fondos; losresultados posibles son Seleccionado (S) o No Seleccionado (NS). Elexperimento consiste en tomar al azar un alumno y observar el resultadoen las dos selecciones.a) Describa el espacio muestral de este experimento (suponga que todos los alumnos han estado inscriptos en las dos Becas)b) ¿Cuál es la probabilidad de que el alumno haya sido seleccionado en las dos Becas? 1 0 4 
  • 105. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEc) ¿Cuál es la probabilidad que el alumno no haya sido seleccionado ninguna de las dos Becas?d) ¿Cuál es la probabilidad que el alumno haya sido seleccionado en una Beca por lo menos?e) ¿Cuál es la probabilidad que el alumno haya sido seleccionado a lo sumo en una Beca?Actividad 6Cada uno de los items siguientes representan las probabilidades de cadauno de tres eventos simples.Marque el item correcto, justificando al mismo tiempo su respuesta.a) P(E1) = 0.8 P(E2) = 0.3 P(E3) = 0.1b) P(E1) = 0.3 P(E2) = 0.2 P(E3) = 0.5c) P(E1) = ­0.6 P(E2) = 0.2 P(E3) = 0.2d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6Actividad 7En una encuesta realizada a 90 alumnos que egresan del Polimodal en unestablecimiento educativo, se les preguntaba sobre el nivel de instrucciónalcanzado por los padres y si seguirían estudiando o no una carrerasuperior. El resultado de la encuesta figura en la tabla siguiente: Nivel de educación ¿Seguirán Total de los padres estudiando? Si No Superior 20 10 30 Secundario 30 10 40 Primario 15 5 20 Total 65 25 90Si se selecciona un alumno al azar, cuál es la probabilidad de:a) ¿Qué el alumno tenga padres con educación superior?b) ¿Qué el alumno siga estudiando?c) ¿Qué el alumno siga estudiando y tenga padres con educación primaria?d) ¿Qué el alumno tenga padres con educación superior o secundaria?e) ¿Qué el alumno tenga padres que no posean educación superior? 1 0 5 
  • 106. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEf) ¿Qué el alumno siga estudiando dado que posee padres con educación primaria?g) ¿Qué el alumno no siga estudiando dado que posee padres con educación secundaria?h) El evento que siga estudiando es independiente del nivel de educación Superior alcanzado por los padres?Actividad 8En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es laprobabilidad que le toquen justamente las dos bolillas que no sabe?Actividad 9Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F).a) ¿Cuál es la probabilidad de que acierte en las dos?b) ¿Cuál es la probabilidad de que acierte por lo menos en una?c) ¿Cuál es la probabilidad de que a las dos las conteste incorrectamente?Actividad 10En una escuela hay tres Profesores de Educación Física. La probabilidadde que no asistan a clase cada uno de ellos es de 0.05. ¿ Cuál es laprobabilidad de que un día cualquiera falten los tres juntos?Actividad 11En un análisis realizado por el Director de un establecimiento educativo,se determinó que de los alumnos ingresantes en EGB en una cohorte, soloel 70% (en promedio) completó el polimodal. De ellos solo el 15% lo hizo enel mismo establecimiento. ¿Cuál es la probabilidad de que un nuevoalumno ingresante en EGB termine el Polimodal en la misma escuela?Actividad 12La probabilidad de que a un alumno le interese Matemáticas en un cursoes de 0.1. Si se toman 3 alumnos de dicho curso al azar:¿Cuál es la probabilidad de que:a) No le agrade a ninguno Matemáticas?b) Le agrade por lo menos a un alumno esta materia?c) Le agrade como máximo a 2 alumnos? 1 0 6 
  • 107. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 13La probabilidad de que un alumno apruebe una Prueba Integradora deconocimientos de Matemática en el último año del Polimodal es de 0.25. Sise seleccionan al azar 10 alumnos de un curso:a) ¿Cuál es la probabilidad de que 5 alumnos aprueben?b) ¿Cuál es la probabilidad de que no apruebe ningún alumno?c) ¿Cuál es la probabilidad de que todos aprueben?d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos?e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos?Actividad 14La probabilidad de que la última semana de clase los alumnos que egresancometan un acto de indisciplina serio es de 0.004. De 300 alumnos queterminan este año:¿Cuál es la probabilidad de que:a) 8 alumnos terminen sus estudios con una sanción por este acto de indisciplina?b) De qué más de 5 alumnos terminen sus estudios con una sanción por este acto de indisciplina?c) De que menos de 4 terminen sus estudios con una sanción por este acto de indisciplina?d) De qué ningún alumno cometa un acto de indisciplina serio?Actividad 15Los pesos de los alumnos de un curso de EGB se distribuyen normalmentecon m = 48 kg y s = 2 kg.a) Obtenga los pesos estándar correspondientes a:43 kg ; 44.5 kg ; 46 kg ; 49.5 kg ; 50 kgb) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a 44.5 kg?c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a 46 kg?d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre 44.5 kg y 49.5 kg?e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo menos 46 kg?f) Obtenga el Rango Percentil correspondiente a los pesos del item a). Interprete que significa cada uno de ellos.g) Si el número de alumnos a los que se ha medido el peso en ese curso fuera de 200, ¿ cuántos alumnos tendrán un peso inferior a la media?. ¿Cuántos alumnos tendrán un peso superior a 52 kg? 1 0 7 
  • 108. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEh) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45 kg y 47 kg?Actividad 16Los puntajes promedio con su correspondiente desviación estándar,obtenidos por los alumnos del último curso de Polimodal en una escuelaen los exámenes finales de una asignatura son los siguientes: CURSO m s A 5.9 1.5 B 6.75 1 Se supone que los puntajes se distribuyen normalmente:a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en los dos cursos?. Justifique su respuesta.b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada curso? Analice en base a esto el rendimiento de cada curso.c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada curso?d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada curso?e) ¿En base a estos resultados qué conclusión puede enunciar? 1 0 8 
  • 109. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UNI DA D  V INFERENCIA ESTADÍSTICA 1. INTRODUCCIÓN En capítulos anteriores se vió:Est adíst ica Descriptiva : Su objetivo es la recolección y reducción dedatos . Se estudian técnicas para presentar los datos de una forma mascomprensible y así poder visualizar propiedades de los mismos.Cálculo de Probabilidades :La razón de su estudio es que la Estadísticaincluye la toma de decisiones en presencia de incertidumbre. Estasdecisiones tomadas se basan en probabilidades. Aquí conocemos ( osuponemos conocido) por completo el modelo probabilístico que usamos,es decir, la población a estudiar la podemos representar por una variablealeatoria X Recordemos que una población está constituida por todos loselementos que poseen unos caracteres por cuyo estudio estamosinteresados. Una muestra, en cambio, es una parte de los elementos de lapoblación; pero esta parte ha de ser representativa del total. Cuando el estadístico puede observar todos los elementos de lapoblación ( observación exhaustiva) , entonces su tarea se reduce adescribir las características y regularidades de la población. Pero si laobservación no puede ser exhaustiva, entonces aquellas característicashay que estudiarlas a través de una muestra representativa. Hay que distinguir entre poblaciones finitas y poblaciones infinitas.Se dice que una población es finita si tiene un número limitado desucesos o unidades elementales. Ejemplo de población finita son, en unaño dado los salarios recibidos por todos los docentes de un Colegio, lostítulos recibidos por todos los estudiantes de un país. Mientras el númerototal de observaciones posibles sea limitado, se trata de una poblaciónfinita. 1 0 9 
  • 110. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE En cambio, una población infinita es la que, consiste en un número infinitamente grande de observaciones. Por lo menos es teoría , no hay límite alguno al número de unidades que puede abarcar. Por ejemplo, los resultados obtenidos al jugar dos dados constituyen una población infinita , lo mismo que los pesos al nacer de todos los seres humanos.. Una población infinita puede ser siempre generada a partir de un conjunto finito de valores o unidades si el muestreo se hace con reemplazo. 2. INFERENCIA ESTADÍSTICA Definición: La Inferencia Est adística es el procedimiento por medio del cual se llega a inferencias acerca de una población mediante los resultados que se obtienen a part ir de una muestra extraída de esa población. El objetivo principal de la Est adíst ica Inferencial es la esti ma ción, esto es que mediante el estudio de una muestra aleatoria seleccionada deuna población se quiere generalizar las conclusiones al total de la misma.Defi nición de muestra alea tori a Todo conjunto de n unidades de observación elementales tomadasde una población dada, se puede considerar como una muestra de tamañon. Pero el tipo de muestra que aquí interesa es el de muestra aleatoriaUna muestra aleatoria se puede tomar con o sin reemplazo. Si la muestrase toma con reemplazo, de una población , finita o infinita , la unidadtomada se vuelve a dejar en la población y el número de unidadesdisponibles para seguir la operación no se afecta. Esto tambien es ciertocuando la muestra se toma de una población infinita sin reemplazo, esdecir, cuando la unidad escogida no se vuelve a la población. Cuando setoma un elemento, sin reemplazar, de una población finita, el número deunidades que quedan tras cada unidad que se saca se reduce en unaunidad, y en consecuencia la probabilidad de sacar cualquier unidadrestante en operaciones sucesivas se aumenta. Es necesario formular nuestro concepto en forma precisa. Pordefinición, una muestra debe tener ciertas propiedades como sigue: Se supone que las muestras dan información acerca de la poblacióna que corresponde, ya que por lo general es demasiado costoso, requiere 1 1 0 
  • 111. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEdemasiado tiempo, o es imposible observar o medir todos los objetospertenecientes a la población.. La muestra debe ser una selecciónaleat oria . Es decir, cada elemento de la población debe tener unaprobabilidad conocida de ser extraído, esto es, de ser tomado en lamuestra; el caso mas sencillo y más común es en donde la probabilidad esla misma para todos los elementos de la población , y solo si se satisfaceeste requisito ( al menos aproximadamente) , los métodos estadísticosdarán resultados razonables y útiles. Además, es necesario que las n ejecuciones del experimentoaleatorio con el que obtenemos n valores de la muestra seanindependientes, esto es, el resultado de una ejecución no debe influir enlas otras ejecuciones. Esto equivales a decir que la probabilidad de quecualquier miembro de la población aparezca en una muestra, no dependede la aparición o no aparición de los otros miembros de la población en lamuestra. Hay que tener presente que el conocimiento de las características deuna población, salvo algunas excepciones, no puede conseguirse con todaexactitud mediante una muestra. Si se tiene una población humana ysuponemos que no existen errores de observación, la única manera deobtener exactamente la estatura media, el porcentaje de analfabetos, , etc., en dicha población es observando todos los elementos de ella. Pero si estaobservación exhaustiva no es posible y se utiliza como medio supletoriouna muestra, entonces lo único que puede obtenerse, salvo en algunoscasos particulares, son estimaciones de aquellas características. El problema de la Inf erencia Esta dística se acostumbra a enfocarde dos maneras distintas. Partiendo del hecho cierto de que una muestra,en ge­ neral, no da una información exacta de las características de lapoblación que deseamos estudiar, puede procederse asi: 1º Utilizar la muestra para estimar dichas características. Este enfoque origina la Teoría de la Esti ma ción , mediante la cual se da solución a los problemas específicos que se plantean. 2º Emitir hipótesis sobre aquellas características tomando como base la experiencia, otras informaciones o incluso el presentimiento o la corazonada. Una hipótesis así formulada tiene, evidentemente, poco valor científico. Este valor se adquiere tomando una muestra de la población y utilizándola para verificar o contrastar 1 1 1 
  • 112. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE la hipótesis., Este enfoque da lugar a la Teorí a de la Verifi ca ci ón o Contra sta ción de hipótesis. Para distinguir claramente entre ambas , considérense lossiguientes ejemplos . Un candidato para un puesto público desea estimarla proporción real de votantes que lo apoyan mediante la obtención de lasopiniones de una muestra aleatoria de 100 votantes. La fracción de ellosque lo apoye puede utilizarse como una estimación de la proporción real dela población total de votantes. Este problema pertenece al área deestimación. Ahora considérese el caso en el cual una Profesora se interesa endeterminar si el sistema nuevo de evaluación( A ) implementado por elColegio es mejor que el sistema anterior de evaluación ( B ). Esta Profesorapodría suponer que el sistema A es mejor al sistema B y , después derealizar las pruebas apropiadas , aceptar o rechazar esta hipótesis .En esteejemplo se intenta tomar una decisión correcta respecto a la hipótesispreestablecida.( La prueba de hipótesis no se verá en el desarrollo de estaAsignatura ).3. DISEÑOS DE MUESTREO La operación de tomar una muestra de una población se denominamuestreo y los métodos de muestreo que se utilicen deben garantizaraquella representatividad para que pueda hablarse correctamente de unamuestra estadística. Si se desea conocer, por ejemplo, el consumo medio de proteínas poralumno y dia en una ciudad y tomamos para ello un grupo de familiasintegrado por la de mas alto nivel de vida, se concluirá que ese grupo no esrepresentativo del total de familias de la ciudad.. Por tanto, el consumomedio que se obtenga del citado grupo no es una buena estimación porqueentraña un error de un tipo distinto del que cabe esperar en una muestrarepresentativa. Conviene distinguir entre dos clases de error. De una parte existenlos errores muestrales, que son aquellos que están latentes en todamuestra representativa, pues aun siéndolo no proporciona , salvo rarasexcepciones, una medida exacta de las características de la población; porello hay que contar siempre con los errores muestrales o errores demuestreo. 1 1 2 
  • 113. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Y por otra parte están los sesg os, bajo cuya denominación seincluyen algunos errores específicos de las muestras como los debidos a sufalta de representatividad, y otros que son comunes a toda investigaciónestadística, tanto si es exhaustiva como si no lo es. A este último grupopertenecen los errores de observa ci ón , los originados por definicionesdefectuoasas de los elementos de la población, de los caracteres ainvestigar , los debidos a respuestas o medidas mal efectuadas , afórmulas inadecuadas, a cálculos equivocados, etc.Ejemplo :Supongamos que deseamos tomar una muestra de 100estudiantes de un Colegio para conocer la opinión del alumnado respecto ala adecuación de las evaluaciones. Un posible método es situarse a lasnueve de la mañana en una entrada del Colegio y preguntar a los 100primeros alumnos que aparezcan. Con este procedimiento los alumnos quesolo tienen clase por la tarde no estarán representaos en la muestra.Además, estarán muy poco o nada representados los estudiantes que notengan clase a primera hora o los que teniéndola no acudanhabitualmente. Cuando algunos miembros de la población tienen una probabilidadmás alta que los otros de estar representados en una muestra se dice queexiste un sesgo de selección y la muestra puede no ser representativa dela población. Por ejemplo, si existen diferencias marcadas de opinión entrelos alumnos nuevos y los veteranos, y la muestra sólo incluye a losveteranos, tendrá un sesgo de selección.Una forma de evitar este sesgo estomar la muestra mediante un procedimiento de selección objetivo quegarantice a todos los elementos de la población la misma oportunidad deaparecer en la muestra. El método anterior presenta además el riesgo de un sesgo adicional:el sesgo por no respuesta. Si los estudiantes que no responden son losmás disconformes con las evaluaciones, la muestra contendrá unaproporción menor de estudiantes de estas categorías y, de nuevo, puedeno ser representativa de la población que tratamos de investigar. El sesgode no respuesta no puede evitarse con certeza pero deben tomarseprecauciones para prevenir que ocurra.3.1. MUESTREO AL AZAR SIMPLE El muestreo aleatorio simple está fundamentado en el puro azar. Sepuede decir que es un muestreo en el que si se saca al azar una muestrade n unidades, toda posible muestra de n unidades tiene la mismaprobabilidad de ser seleccionada, Una muestra obtenida por esteprocedimiento se dice muestra aleatoria si mpl e . 1 1 3 
  • 114. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Uno de los métodos comúnmente utilizados para lograr que lamuestra sea aleatoria es numerar todos los elementos de una población,escribir los números en tarjetas o fichas o bolillas o cualesquiera cosasfísicamente homogéneas; poner luego en una bolsa estos objetosnumerados y mezclarlos completamente. Se define el tamaño n de lamuestra y se sacan los objetos al azar uno por uno, hasta que se obtengael número deseado de partidas para anotar. El procedimiento se puedesimplificar utilizando una tabla de números aleatorios.3.2. MUESTREO ALEATORIO SISTEMÁTICO Cuando los elementos de la población están ordenados en listas, unaalternativa más fácil de ejecutar que el muestreo aleatorio simple es elmuestreo sist emát ico. Muy a menudo, si se desea un muestreo aleatoriosimple se sigue un procedimiento sistemático en vez de un método al azar.Según el procedimiento sistemático, se obtiene una muestra tomando cadak­ésima unidad de la población tras numerar las unidades de la poblacióno haberlas ordenado de alguna manera. La letra k representa un númeroentero, que es aproximadamente la razón de muestreo entre el tamaño dela población y el tamaño de la muestra. Así, si la población consiste en10.000 unidades de muestreo y se desea una muestra de 500 unidades,entonces K = 10.000 / 500 = 20 Y la muestra se obtiene tomando una unidad cada veinte de la población. Para que toda unidad de la población tenga igual probabilidad desalir, el procedimiento debe empezar al azar. Con una razón de muestreode 20, se puede utilizar el procedimiento de la bolsa o del bolilleroponiendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero obolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar.Si se saca la bolilla 11, se empieza con este número y se incluye enlamuestra cada vigésima bolilla a partir de esta, es decir, la treinta y una, lacincuenta y una , y así sucesivamente. 1 1 4 
  • 115. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 3.3. MUESTREO POR ESTRATOS El muestreo aleatorio simple debe utilizarse cundo los elementos dela población son homogéneos respecto a la característica a estudiar, esdecir, a priori la predicción que haríamos del valor de la variable sería elmismo para todos los elementos. Un muestreo que sería mas efectivo queeste, es el muestreo aleatorio por estratos, procedimiento que exige tenerconocimiento previo de la población. El proceso de estratificacióncontempla dividir la población en grupos o clases llamados estratos .Dentro de cada uno de tales estratos, están los elementos situados demanera más homogénea con respecto a las características que estén enestudio. Para cada estrato se toma una submuestra mediante elprocedimiento aleatorio simple, y la muestra global se obtiene combinandolas submuestras de todos los estratos. El muestreo por estratos es el más efectivo cuando se trata depoblaciones heterogéneas tales como datos de desempleo ( que varían deocupación a ocupación ), ventas al por menor ( que difieren entre lasdistintas regiones geográficas) , y las actitudes de los consumidoresrespecto de malos nuevos modelos de automóviles ( en las que influyenfactores teles como el sexo, la edad, y la categoría de ingreso). Al hacerse laestratificación, las clases se establecen de modo que las unidades demuestreo tienden a ser uniformes dentro de cada clase, y las clasestienden a ser diferentes entre sí. Así se puede controlar la proporción decada estrato en la muestra global y no dejarla al azar y queda aseguradoel carácter representativo de la muestra. El muestreo por estrato es por consiguiente una combinación desubmuestras de los estratos, que son muestras aleatorias simples osistemáticas. En cuanto tales, todo elemento disponible de cada estratotiene igual probabilidad de ser seleccionado, y esta será la situación aunen el caso en que la muestra no sea proporcionada, en el cual lasprobabilidades de ser seleccionado cada elemento individual de lapoblación no son iguales.3.4.MUESTREO POR CONGLOMERADO Diametralmente opuesto al muestreo por estratos está el muestreopor conglomerados, que consiste en seleccionar primero al azar grupos,llamados conglomerados , de elementos individuales de la población, y entomar luego todos los elementos o una submuestra de ellos dentro de cadaconglomerado para constituir así la muestra global. Para lograr los mejores 1 1 5 
  • 116. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEresultados ern el plan del muestreo por conglomerado, se hacen tanpequeñas como sea posible las diferencias entre conglomerados, en tantoque las diferencias entre los elementos individuales dentro de cadaconglomerado se hacen tan grandes como sea posible. Por ejemplo, si queremos extraer una muestra aleatoria simple de losestudiantes universitarios de un país sería necesario disponer de una listade todos ellos y de sus direcciones y teléfonos. Esta información puede noestar disponible o ser muy cara de conseguir. Sin embargo, en este caso,los estudiantes aparecen clasificados en universidades, facultades ycursos. Podemos seleccionar en una primera etapa algunas universidades,después algunas facultades al azar de cada universidad, dentro de lasfacultades algunas clases y, dentro de las clases, estudiantes mediantemuestreo aleatorio. Para la primera etapa solo necesitamos una lista de universidades.Para las universidades seleccionadas es necesario luego conocer lasfacultades que incluyen. En las facultades elegidas necesitamos una listade las clases, y de las clases que se tomen, una relación de losestudiantes. Esta información estará disponible por lo que este tipo demuestreo será factible. Llamaremos conglomerados a estas unidades amplias donde seclasifican los elementos de la población. En cada etapa de muestreo , enlugar de seleccionar elementos al azar , seleccionamos conglomerados. Losconglomerados se refieren a formas de agrupación física de las unidadesen el espacio o en el tiempo. Idealmente los conglomerados tienen que ser lo más parecido posiblea muestras aleatorias de la población , de manera que cada conglomeradosea tan heterogéneo como la población a investigar. El muestreo por conglomerado tiene la ventaja de simplificarenormemente la recogida de la información muestral. El inconvenienteobvio es que si los conglomerados son heterogéneos entre sí, como sólo seanalizan algunos de ellos, la muestra final puede no ser representativa dela población. 1 1 6 
  • 117. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE3.5. MUESTREO POR CUOTAS A veces la estratificación no es posible, o es muy cara, y se recurreen su lugar al muestreo por cuot as. Por ejemplo, se desea tomar unamuestra de una población para estudiar la proporción de personas queestán de acuerdo con el uso de remedios especiales. Si suponemos que laedad y el sexo pueden influir en la opinión, deberíamos tomar unamuestra donde estas características sean las mismas que en la poblaciónbase, lo que implica una muestra estratificada. Sin embargo, esto requiereuna lista de las personas de la población que incluya su sexo y edad, loque puede no estar disponible. Sin embargo, si conocemos la proporciónde cada sexo y la distribución de la edad en la población, una soluciónfrecuente es exigir que estas características aparezcan en la muestra en lamisma proporción que en la población. Esto conduce a fijar cuotas dehombres y mujeres por grupos de edad. El entrevistador debe conseguirlos elementos de la muestra respetando esta restricción de cuotas. 4. ESTIMACIÓN DE PARÁMETROS Algunas cantidades que aparecen en las funciones de distribución,como p de la distribución binomial , m y s en la distrIbución normal, sellaman parámetros. Generalmente estamos interesados en conocer lospa rá metros de la población, es decir , aquellas características que sirvenpara determinarla. Ahora veremos como obtener estimaciones deparámetros a partir de una muestra dada. Dada una población, se trata de estimar, esto es, de valorar, algunoo algunos parámetros característicos de la misma, como, por ejemplo, a lamedia aritmética. Recurriremos a la inferencia estadística, y mediante elanálisis de una muestra obtendremos una estimación de los valorescorrespondientes a la población completa. Esta estimación puede ser por punto o por i nterval o, según setrate de determinar un valor único del parámetro en cuestión o bien unintervalo dentro del cual quede comprendido, con una cierta probabilidad,el valor correspondiente al parámetro de toda la población .El intervalo encuestión recibe el nombre de intervalo de confianza y la probabilidad, el denivel de significación. 1 1 7 
  • 118. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.1. ESTIMACIÓN PUNTUAL La Inferencia Estadística está casi siempre concentrada en obteneralgún tipo de conclusión acerca de uno o más parámetros (característicaspoblacionales). Para hacerlo, se requiere que se obtenga datos muestralesde las poblaciones en estudio. Entonces, las conclusiones pueden estarbasadas en los valores calculados de varias cantidades muestrales. Una esti ma ción puntual ó estima ci ón por punto es un solo valornumérico utilizado para estimar el parámetro correspondiente de lapoblación. La estimación puntual se obtiene al seleccionar una estadísticaapropiada y calcular su valor a partir de datos de la muestra dada. Sirve como una aproximación del valor exacto desconocido delparámetro El estadíst ico que se utiliza para obtener una estimación puntualrecibe el nombre de esti ma dor puntual del pará metro . Es conveniente notar que se ha dado el nombre de estimación a unsolo valor calculado. La regla para calcular este valor o estimación seconoce como estima dor. Los estimadores generalmente se presentancomo fórmulas. Por ejemplo la media  x  de una muestra es un estimadorde la media m de la población correspondiente. El valor numéricoindividual que resulta de la evaluación de la fórmula de la media se conocecomo estimación del parámetro m. De esta manera se tiene la estimaciónm @  x  para m De forma similar , la variancia muestral, S2 , se puede utilizar parainferir algo acerca de s 2 . Ejemplo: Una muestra aleatoria de 3 baterías para calculadora podríapresentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 =5.9 . El valor calculado de la duración media muestral es  x  = 5.77 , y esrazonable considerar 5.77 como el valor adecuado de m . El enunciado : la estimación puntual de m es 5.77 “ se puedeescribir en forma abreviada m = 5.77. 1 1 8 
  • 119. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.2. ESTIMACIÓN POR INTERVALO EN EL MUESTREO AL ZAR SIMPLE Supóngase que un grupo de investigadores quiere estimar la mediade una población que sigue una distribución normal y que, para ello,extraen una muestra aleatoria de tamaño n de la población y calculan elvalor de  x , el cual utilizan como una estimación puntual de m . Aunqueeste estimador de m posee todas las cualidades de un buen estimador, sesabe que, debido a los caprichos del muestreo, no se puede esperar que  x sea igual a m. Un estimador puntual por ser un solo número, no proporciona por símismo información alguna sobre la precisión y confiabilidad de laestimación. El estimador puntual nada dice sobre lo cercano que está dem  x  . Si se quiere llegar a asignar determinadas garantías o “confianza” alos resultados de un proceso inferencial de estimación, cabe la posibilidadde ampliar la óptica de la Esti ma ción Puntual analizada en el temaanterior, pasando a la estimación mediante Intervalos de Confi a nza . En términos estadísticos las “garantías” asignables consisten enafirmaciones de tipo probabilístico. La estimación de una magnitud desconocida mediante Intervalo deConfi a nza consiste en derivar unos límites aleatorios que contendrán alparámetro desconocido con una probabilidad fijada de antemano. Los extremos de un intervalo de conf ia nza son aleatorios, por loque podrán o no contener al verdadero parámetro y será posible evaluar laprobabilidad de que así ocurra. A la probabilidad de que un Intervalo deConfianza contenga al parámetro poblacional objeto de análisis se ledenomina Nivel de Confi a nza y la denotaremos por g ( 1 ­ a ) Por ejemplo, si escogemos g = 1 ­ a = 95 % , implica que 95 % detodas las muestras daría lugar a un intervalo que incluye m o cualquierotro parámetro que se esté estimando , y sólo 5 % de las muestrasproducirá un intervalo erróneo. Cuánto mayor sea el nivel de confianzapodremos creer que el valor del parámetro que se estima está dentro delintervalo. Al estimar un parámetro q , el problema correspondiente debería serla determinación de dos cantidades numéricas que dependen de los 1 1 9 
  • 120. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEvalores de la muestra, y en cuyo intervalo se incluya el valor desconocidodel parámetro con certeza. Sin embargo, sabemos que a partir de unamuestra no podemos obtener conclusiones acerca de la poblacióncorrespondiente que sean 100 % verdaderas. Así, tenemos que ser másmodestos y modificar nuestro problema, de la siguiente manera. Escogemos una probabilidad g cercana a 1 , ( por ejemplo, g = 95 %, 99 % o alguna semejante) . Luego, determinamos dos cantidades q 1 y q2tales que la probabilidad de que incluyan el valor exacto desconocido delparámetro q sea igual a g . Los n valores de la muestra se pueden considerar como valoresobservados de n variables aleatorias X1 , X2 , ......., Xn . Entonces q1 y q2son funciones de estas variables aleatorias y , por lo tanto, también sonvariables aleatorias. . Nuestro requisito anterior se puede escribir como P(q1 £ q £ q2 ) = gSi conocemos q1 y q2 y se dá una muestra, podemos calcular un valornumérico q1 de q1 , y un valor numérico q2 de q2 . El intervalo conpuntos extremos q1 y q2 se llaman intervalos de confianza o estimaciónpor intervalo para el parámetro desconocido q , y se representa CONF í q1 £ q £ q2 ýLos valores q1 y q2 se llaman límites de confianza inferior y superiorpara q. El número g se llama nivel de confianza. Se elige g = 95 % , 99%o algunas veces 99,9 %. Es evidente que si se intenta obtener una muestra y determinar unintervalo de confianza correspondiente, entonces g es la probabilidad dedisponer de un intervalo que incluya el valor exacto desconocido delparámetro. 1 2 0 
  • 121. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL CUYA VARIANCIA ES CONOCIDA Sea x1 , · · · · , xn una muestra extraída de una poblacióndistribuida normalmente o , a falta de esto, si n es lo bastante grande,ycuya variancia s 2 es conocida. Suponemos que la media m esdesconocida , y que deseamos ­determinar un intervalo de confianza param . Los pasos necesarios para determinar un intervalo de confianza bajolas suposiciones anteriores son . 1 ª paso .Elegir un nivel de confianza g ( 95 % , 99 % ,o unosemejante ). 2 ª paso . Determinar el valor de z correspondiente mediante la tablade distribución normal estandarizada. Por ejemplo: g 0,90 0,95 0,99 0,999 Z 1,645 1,960 2,576 3,291 3ª paso . Calcular la media  x  de la muestra 4ª paso . Calcular z s k =  (1) n  Por lo tanto : Si  x  es la media de una muestra aleatoria de tamaño n deuna población con variancia conocida el intervalo de confianza de ( g ) 100% para la media poblacional es. CONF í  x  ­ k £ m £  x  + k ý Z  S ≤  m ≤ X  S X  +  Z  n nEjemplo: Se calcula que la media de los promedios de los puntos de calidad deuna muestra aleatoria de 36 alumnos de los últimos años del nivel medioes 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la 1 2 1 
  • 122. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEmedia total de alumnos del último año. Asuma que la desviación estándarde la población es 0,3.Solución: La estimación puntual de m es 2,6. El valor de z para el 95 % es z =1,96. De aquí que el intervalo de confianza es : 0,  3  0,  3  ( 2,6 – 1,96  · £ m £ 2,6 + 1,96  · ) 36  36 el cual se re duce a, ( 2,50 , 2,70 )Par a e nc ontr ar un i nter val o de l 99 % , se e nc ue ntr a e l valorde z, donde z = 2,576 0,  3  0,  3  ( 2 , 6 – 2 , 5 7 6  · £ m £ 2,6 + 2 , 5 7 6  · ) 36  36 o simp le me nte : ( 2,47 , 2,73 )Aho ra se obse rva que se re quie re un int ervalo más grandepara e stimar m con mayor precisión.Si no se conoce la variabilidad de la población y solo sedispone de la información proporcionada por la muestra, esd e c i r s e c o n o c e  X  y s , s i e m p r e q u e s e t r a b a j e c o n u nt a m a ñ o d e m u e s t r a g r a n d e :  Z  S ≤  m ≤ X  S X  +  Z  n n 1 2 2 
  • 123. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCICIOSACTIVIDAD 1 El Departamento de Biología de una escuela desea estimar lacantidad promedio de agua que consume diariamente cierta especieanimal en condiciones experimentales, para completar un estudio que seestá realizando.Esta investigación supone que la población de valores deconsumo diario de agua está normalmente distribuida y, con base enexperiencias pasadas, que la variancia de la población es de 4 gramoscuadrados. Una muestra aleatoria de 40 animales arroja una media de16,5 gramos. a) Estime puntualmente la cantidad promedio de agua . b) Con un nivel de confianza del 95 estime la cantidad promedio de agua. c) Realice los cálculos solicitados en el inciso b) pero con un nivel de confianza de 90 % . Compare los intervalos obtenidos.ACTIVIDAD 2 En una escuela para adultos , se seleccionó una muestra de 100alumnos aparentemente sanos, de 25 años de edad, donde se muestra unapresión sanguínea media de 125. Si se supone que la desviación estándarde la población es de 15, calcule a) El intervalo de confianza del 90 por ciento para m b) El intervalo confianza del 95 por ciento para m ACTIVIDAD 3 Una investigación realizada en el área de educación sostiene que laedad promedio de los docentes del área rural ha disminuido . La edadpromedio de los docentes rurales en elos últimos años fue de 35 años. Para ello,se extrae una muestra aleatoria de 100 docentes en la quela edad promedio es de 28 años con una desviación estándar de 8 año. 1 2 3 
  • 124. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE¿Confirman estos datos la hipótesis de esta investigación?. Trabaje cona = 0,01 y a = 0,05.ACTIVIDAD 4 Una muestra aleatoria que representa el tiempo ( en minutos) quetardaron 36 estudiantes en familiarizarse con el manejo de un softwareadquirido por las Autoridades del Colegio, dio un tiempo promedio de 10minutos . El tiempo se distribuye normalmente. con una desviaciónestándar de 3 minutos. a) Determine e interprete un intervalo del 95 % de confianza para el verdadero tiempo promedio. b) El instructor considera que el tiempo promedio requerido por los alumnos es mayor que 10 minutos, ¿ qué se puede decir de acuerdo con el intervalo hallado?. 1 2 4 
  • 125. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  A N EXO TABLA S ESTADÍ STI CAS 1 2 5 
  • 126. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 2 6 
  • 127. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 2 7 
  • 128. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 2 8 
  • 129. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 2 9 
  • 130. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 3 0 
  • 131. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 1 3 1 
  • 132. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE BIBLIOGRAFÍA ­  Benít ez, Celia de; Pece, Marta G.; Galíndez , Margarit a de. (2003). Serie Didáctica N°7: “Elementos de Estadística para técnicos en vivero y plantaciones forestales”, con guía de ejercitación. ­  Barbancho, A. (1983). Estadística Elemental Moderna . 9a Edición. Ariel, S. A. – Barcelona. ISBN 84­344­2005­8. ­  Daniel, W.W. (1997) Bioestadística. ISBN 968­18­5196­X. ­  Kreyszig, E. (1994). Introducción a la Estadística Matemática . Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968­18­ 0729­4. ­  Peña, D. y Romo, J. (1999) . Introducción a la Estadística para las Ciencias Sociales. ISBN 84­481­1617­8. ­  Triola, M.F.(2004). Estadística. Novena edición.ISBN 970­26­0519­ 9. Editorial Pearson. México. 837 pags. ­  Ya­Lun, Chou. (1990). Análisis Estadístico. ISBN 970­10­0046­3. pags.808. 1 3 2