7. metodologia y estadistica aplicada a la educacion

14,119 views

Published on

  • Hola María Fatima, gracias por compartir, excelente trabajo de estadistica que lleva de la mano para la creación de un trabajo de investigación aplicando cada una de las fases de maner clara y precisa. Saludos.
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

7. metodologia y estadistica aplicada a la educacion

  1. 1. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  LGE ESPACIO CURRICULARMETODOLOGÍA Y ESTADÍSTICA APLICADA A LA EDUCACIÓN Autores:  Dra. Marta Graciela del Valle Pece  Mg. Ing. Margarita Juárez de Galíndez  Mg. Lic. María Mercedes Simonetti 1 
  2. 2. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE PROGRAMA DE ESPACIO CURRICULARUNIDAD I: EstadísticaConcepto. Etapas en el trabajo estadístico. Estadística Descriptiva eInferencial. Variable: concepto. Clasificación de variables. Seriessimples. Agrupamiento de datos en series de frecuencias. Frecuenciasabsolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,frecuencias relativas acumuladas y porcentajes acumulados. Tasas deuso común: de escolarización, de analfabetismo, de desgranamiento, deretención.UNIDAD II: Presentación de dat os est adísticos.Partes funcionales y construcción de tablas estadísticas. Elementosestructurales de las tablas. Tablas simples, cruzadas. Análisis de tablasestadísticas. Técnicas de representaciones gráficas. Reglas deconstrucción. Gráficos según los distintos tipos de variables.UNIDAD III: Medidas de resumen.Medidas de tendencia central. Media aritmética, mediana y moda.Comparación de media, mediana y moda. Distribuciones simétricas yasimétricas. Medidas de dispersión. Rango, variancia y desviaciónestándar y desviación mediana. Coeficiente de variación. Medidas delocalización. Percentiles y rango percentil. Aplicaciones.UNIDAD IV: Nociones element ales de probabilidad. Inferenciaestadística.Experimentos aleatorios: conceptos básicos. Probabilidad clásica,frecuencial y axiomática. Teorema de la suma y del producto deprobabilidades.Tabla de contingencia. Cálculo de probabilidades.Distribución de probabilidades de variables aleatorias discretas:Uniforme y Binomial.Cálculo de probabilidad en variables aleatorias continuas: distribuciónnormal y distribución normal estándar.Población. Definición de muestra aleatoria. Diseños de muestreo.Muestreo al azar simple. Muestreo sistemático. Muestreo por estratos.Muestreo por conglomerados. Concepto.Estimación puntual y por Intervalos de confianza para muestrasgrandes en el Muestreo al Azar Simple. 2 
  3. 3. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DADES I  y I I INTRODUCCIÓN La palabra Estadística proviene del latín status (estado).Precisamente la primera aplicación de la estadística consistió en larecopilación de datos y la construcción de gráficos para describir el estadode un país. Con el correr del tiempo esta herramienta fue evolucionandohasta que en la actualidad podríamos decir que no hay aspectos de la vidacotidiana donde no se aplique la Estadística. Hogares, gobiernos ynegocios se apoyan en datos estadísticos para dirigir sus acciones. El objetivo que se persigue con este módulo es proporcionar aldocente herramientas y técnicas para obtener datos, procesarlos paraobtener información que sirva para la interpretación correcta defenómenos que se producen en su ámbito de trabajo. ESTADÍSTICA. CONCEPTOS. La Estadíst ica es una colección de métodos para planearexperimentos, obtener datos, y después organizar, resumir, presentar,analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004). Otra definición considera a la Estadística como una disciplinaperteneciente a la Matemática Aplicada que se dedica al estudiocuantitativo de fenómenos colectivos. Proporciona los métodos para:· La recolección de datos· Su ordenamiento, resumen y presentación,· Su análisis e interpretación y· Posterior enunciado de conclusiones. Los cuatro pasos que se han enumerado constituyen las etapas deltrabajo estadístico. La primera etapa tiene como objetivo recolectar datos proveniente demedición, conteo u observación efectuado sobre el material objeto deestudio en base a un plan formulado según los principios del diseñoexperimental y las técnicas de muestreo. 3 
  4. 4. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La segunda etapa consiste en ordenar los datos en tablas estadísticas,presentarlos mediante gráficos y diagramas y resumirlos a través delcálculo de promedios, porcentajes e índices. En la tercera etapa se analizan los resultados obtenidos en la etapaanterior, y comienzan a distinguirse las características del fenómeno, loque permite utilizar diferentes métodos para analizarlos e interpretarlos. En la última etapa se debe concluir acerca del estudio realizado. Si las conclusiones, se refieren exclusivamente a los datos de los quese dispone (una parte de la población que se desea estudiar), se dice quela Esta dísti ca es Descriptiva . Si por el contrario, las conclusiones van más allá de los datos que sedispone y se refieren a un conjunto mayor (población), del cual seextrajeron, se dice que la Esta dí stica es Inf erencial ; las conclusionesvan de lo particular (muestra) a lo general (la población).Esta se basa en elestudio de la teoría de probabilidades que nos permite medir el error denuestras afirmaciones. Las est adísticas (en plural) se obtienen como resultado del trabajoestadístico y están constituidas por porcentajes, promedios, tablas,gráficos y otros elementos que describen un fenómeno y ayudan a sucomprensión (Ej.: estadísticas demográficas, estadísticas del fútbol,estadísticas de accidentes de tránsito, estadísticas universitarias, etc.). Es necesario definir algunos conceptos importantes: por ejemplo Población. Se define población como el conjunto de individuos u objetos que comparten una característica común, en la que el investigador está interesado. Muestra. Es un subconjunto de la población. Debe ser representativa, es decir se deben mantener las mismas características de la población en estudio. Una población puede ser finita o infinita. Población finita Una población finita es aquella que puede ser físicamente listada Población infinita. Una población es infinita, cuando en la práctica no puede ser físicamente listada 4 
  5. 5. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o. Una población puede ser definida como los alumnos de la escuela San Francisco. Los alumnos pueden ser listados e individualizados a través de los registros áulicos. Es un ejemplo de pobl a ción f inita . Personas portadoras de SIDA en Santiago del Estero, constituyen un ejemplo de pobl a ción i nfinita . Unidad de observación: es aquélla sobre la cual se efectúan las mediciones u observaciones. La unidad de observación puede ser una persona, una familia, una planta, una parcela, etc. Dat o: es el valor que se obtiene de la medición, observación o conteo efectuada en la unidad de observación o unidad de muestreo. Por ejemplo si el objetivo de una investigación es el rendimiento de los alumnos, la unidad de observación es el alumno. El número de materias rendidas contadas en un alumno es el dato. El conjunto de datos obtenidos de cada unidad de observación constituirá la base para el análisis estadístico del rendimiento de los alumnos de la escuela San Francisco.Va ri a bles. Concepto y ti pos. Variable. Una variable es cualquier característica que varía de una unidad de muestreo a otra en la población o en la muestra Ejempl o 1: Supóngase que interesa conocer la salud de los alumnos,entonces la variable a observa r en cada alumno será el esta do de sa l ud,el que podrá asumir dos valores: sano o enfermo. Ejempl o 2: Si interesa saber el número de herma nos que poseeca da a lumno, se tendrá valores que van desde 0(ningún hermano), 1, 2...,ny se deberá contar cuantos hermanos posee cada alumno. 5 
  6. 6. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada poralumnos, se debe medir la variable altura la que, expresada en metrospodrá tener valores mayores a 1 metro. En los tres ejemplos anteriores, el nombre de la variable y la formade obtener sus valores está resaltado en negrita. En el primer ejemplo, losvalores que puede asumir la variable son calidades, por lo que se dice quela variable es cualitat iva. Las calidades o categorías pueden ser naturalescomo al definir la variable sexo, o arbitrarias como la clasificación dealturas en bajas, medianas y altas. Por el contrario, en los otros dos ejemplos los valores que asumenlas variables pueden expresarse mediante números, por lo que las dosúltimas variables son cuant it ativas. En el caso de número de hermanos,la variable toma sólo determinados valores en el intervalo que va de cero an por lo que se la denomina variable cuantitat iva discreta odiscontinua; cuando la variable toma los infinitos valores dentro delintervalo se dice que la variable es cuantitat iv a continua Otra forma de clasificación de las variables es mediante el empleo decuatro niveles de medición: nominal, ordinal, de intervalo y de razón.Cuando se manejan datos reales el nivel de medición es importante ya queorienta sobre el procedimiento estadístico a utilizar. Un nivel de medición es nominal cuando los valores de variablesson nombres, etiquetas o categorías y no se puede establecer un ordenentre ellos.Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de unalumno. Aunque las ciudades pueden ser ordenadas según su tamaño,densidad poblacional, grado de contaminación del aire, etc., en general, lavariable “lugar de nacimiento” no tiene un orden establecido Con estos datos no es posible realizar cálculos. A veces se asignannúmeros a las diferentes categorías; a la variable salud que posee dosvalores sano y enfermo, podemos codificarlas numéricamente de lasiguiente manera 1= sano, 2= enfermo pero esto no es nada más que unacodificación y tales números no tienen significado computacional. Un nivel de medición es ordinal cuando se puede establecer unorden entre las categorías de la variable. Ejemplo: máximo nivel deinstrucción alcanzado por los padres de los alumnos: analfabeto, primario,secundario, terciario, universitario. 6 
  7. 7. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Lo único que podemos decir es que el nivel de instrucciónsecundario es mayor que el primario y que el universitario es mayor que elprimario, secundario o terciario, pero no podemos decir cuanto mayor esuna categoría de la variable respecto a la otra. Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5. Si bien se podría hacer la diferencia entre 2­1=1 y 4­3=1, esteresultado 1 no significa que entre el primario y el analfabeto hay la mismacantidad de conocimiento que entre el universitario y el nivel terciario. Otro niv el de medición es el de int erv alo. En este nivel ladiferencia entre dos valores de datos tiene un significado. En este nivel nohay un cero natural, donde nada de la cantidad esté presente. El valor delcero es convencionalEjempl o: La variable Temperatura está medida en escala de intervalo. Untermómetro por ejemplo, mide la temperatura en grados que son del mismotamaño en cualquier punto de la escala. Aquí no existe un punto de partidanatural, el valor 0° es arbitrario y no representa la ausencia total de calor.La diferencia entre 20ºC y 21ºC es la misma que entre 12ºC y 13ºC Sepueden realizar operaciones de suma y resta pero no cociente entre valores. Por último el nivel de medición de razón o cociente aunque separece al nivel de medición de intervalo tiene un punto de partida o ceroinherente (donde cero indica que nada de la cantidad está presente). Paralos valores en este nivel tanto las diferencias como los cocientes tienensignificado. En este nivel se pueden realizar todas las operaciones.Ejemplo: Los precios de los libros de texto (0$ representa ningún costo yun precio de $60 es dos veces más costoso que uno de $30). 7 
  8. 8. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Datos Variable  Variable  Categórica o  numérica o  cualitativa  cuantitativa  Escala  Escala  Escala de  Escala de  nominal  ordinal  intervalo  razón  minal Seri es de datos. Series si mples El conjunto de valores de una variable constituye una serie de datos.Se presentan a continuación series de datos referidas a los tres ejemplosque se dieron para ilustrar tipos de variables: Ejemplo 1: En el año 2004, se examinan 30 alumnos de un Cursode EGB1 de la escuela San Francisco y se anota su estado de salud(S=Sano, E=Enfermo). Generalmente las variables se designan con las últimas letras delabecedario en mayúscula por ej. X y los valores que toma la variable con xminúscula; incluso se coloca x i donde el subíndice i indica el número deindividuo observado; de éste modo las 30 observaciones son:x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,S, S, S, S.El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S; X14 = E; . . . x30 =S.Ejempl o 2: Un maestro de la Escuela San Martín interroga a sus 30alumnos de primer grado de EGB1 sobre el número de hermanos queposeen.Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.  8 
  9. 9. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; . .;x30 =0. Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de SecciónMaternal de la Escuela San Francisco la que expresada en cm es lasiguiente:xi(cm):70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,74. Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .; x25 =74. Los datos en brut o, t al cual fueron obt enidos, sin agruparconst it uyen una serie simple.Tablas y gráficosOrga ni za ci ón de datos ca tegóricos o cua litativos. Cuando la masa de datos obtenidos es muy grande y éstos estándesordenados, no dan información alguna; conviene por lo tantoordenarlos y tabularlos, haciendo uso de tablas estadísticas, que debenconfeccionarse de tal modo que los datos resulten fáciles de ser leídos einterpretados. Con los datos del ejemplo 1 se puede construir una tabla defrecuencias.Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa, es una tabla que asocia cada categoría de la variable con el número de veces que se repite la categoría.Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, segúnestado de salud. Año 2004. i Categorías:xi Frecuencias: fi (Estado de salud) (nº de alumnos) 1 Sano 24 2 Enfermo 6 Total 30 Fuente: Datos ficticios 9 
  10. 10. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEFrecuencia absoluta: Es el nº de veces que se repite cada categoría de la variable. Se la simboliza con fi.La suma de las frecuencias absolutas, es igual al nº total de observaciones, 2  å  f i en éste caso 30 ( = 1 =30). Nótese que “ i “ ahora se refiere a las i categorías, x1 = Sano, f1 = 24; x2 = Enfermo, f2= 6. La tabla de frecuencias, es la más sencilla de las tablas y es unatabla de simple entrada pues los individuos se clasifican según una únicavariable, estado de salud en el ejemplo. Los datos organizados en tabla de simple entrada para variablecualit ativa, pueden presentarse mediante gráficos, que tiene la finalidadde que la información entre por los ojos. El gráfico que puede usarse enéste caso es el gráfico de barras.Gráfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,según estado de salud. Año 2004.  30  25  Nº de alumnos  20  15  10  5  0  Sanos  Enfermos  Estado de salud  Fuente: Datos ficticios. Para su construcción se utiliza el sistema de coordenadasortogonales. Sobre el eje horizontal se colocan las distintas categorías de lavariable en estudio (estado de salud) y sobre el eje vertical con una escalaadecuada, se representan las frecuencias. Se dibujan barras de ancho 1 0 
  11. 11. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEconstante, una para cada valor de la variable, con una altura querepresenta el valor de la frecuencia que corresponde a cada categoría. Esconveniente que la separación entre las barras sea menor que el ancho delas mismas. El ancho de las barras debe elegirse teniendo en cuenta el espaciodisponible, el número de categorías de la variable a representar y la alturaque les corresponde, con el objeto de obtener un gráfico proporcionado.Las barras pueden dibujarse en sentido vertical u horizontal.Gráfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,según estado de salud. Año 2004 Estado de salud  Enfermos  Sanos  0  5  10  15  20  25  30  Nº de alumnos Fuente: Datos ficticios En algunos trabajos es necesario calcular frecuencias relativas.Frecuencia relativa de una categoría es la proporción de veces que ocurre dicha categoría.Se obtiene dividiendo la frecuencia absoluta de cada categoría entre lasuma de las frecuencias de todas las categorías. La suma en éste caso esf1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo å quese denomina sumatoria, así  i  = 2  å  i  = 1 fi  = f  1  + f  2  = 24  + 6  = 30  1 1 
  12. 12. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEa la frecuencia relativa de la clase i­ésima se la simboliza con fri y se lacalcula de la siguiente manera:  f i  fr  = i  å f i La suma de las frecuencias relativas es siempre igual a 1. n  å fri   = 1  i  =1 Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes.En éste ejemplo sería:Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, segúnestado de salud. Año 2004. i xi fi f ri Porcentajes: (Estado de salud) % 1 Sano 24 24/30=0,80 80 2 Enfermo 6 6/30=0,20 20 Total 30 1.00 100 Fuente: Datos ficticios Se pueden representar los datos de la tabla 2 mediante un gráfico debarras, sólo que en el eje vertical van los porcentajes.Gráfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,según estado de salud. Año 2004. % 100  80  60  40  20  0  sanos  enfermos  Estado de salud  Fuente: Datos ficticios  1 2 
  13. 13. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro gráfico adecuado para representar series de frecuencias devariable cualitativa es el gráfico de sectores circulares, llamado gráficode tortas o pie charts .Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, segúnsexo. Año 2004 Sexo fi f ri 360ºxf ri (nº de alumnos) Varones 15 0,38 137º Mujeres 25 0,62 223º Total 40 1,00 360º Fuente: Datos ficticiosSe elige un radio por ej 3cm (el valor del radio se elige según el espacio quese disponga para el gráfico) y se grafica un círculo. La superficie de dichocírculo representa el total de alumnos (40), en consecuencia, lecorresponde un ángulo de 360°. Se puede discriminar mediante sectorescirculares la porción que corresponde a las mujeres y a los varones. Losgrados correspondientes a los sectores se obtienen multiplicando lafrecuencia relativa por 360º.Gráfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,según sexo. Año 2004 Varones  Mujeres 38%  62%  Fuente: Datos ficticios  1 3 
  14. 14. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEVa ri a bles cua ntitativa s.Ejemplo: Nº de hermanos que tienen los alumnos de primer grado deEGB1 de la escuela San MartínXi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0 Para el caso de v ariables cuantitat ivas discretas, la tabla defrecuencias se construye de la siguiente manera: se ubica el valor mayor yel menor valor de la variable (en el ejemplo 2 del n° de hermanos poralumno, el menor valor es cero y el valor mayor 6), se colocan todos losvalores correspondientes en la primera columna de la tabla, y luego secuentan las veces que se presentan dichos valores. La tabla resultante es:Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martínsegún Nº de hermanos Xi fi Fi fr % 0 5 5 0,17 17 1 5 10 0,17 17 2 6 16 0,20 20 3 3 19 0,10 10 4 4 23 0,13 13 5 3 26 0,10 10 6 4 30 0,13 13 Total 30 1,0 100 Fuente: Datos ficticios La diferencia que existe entre cada clase es constante e igual a 1. Además de las frecuencias relativas (cuyo cálculo se explicó enpárrafos anteriores) aquí se puede calcular también las frecuenciasacumuladas Fi. La frecuencia acumulada de una clase se obtienesumándole a la frecuencia de la clase, la frecuencia de las clasesanteriores. F (0)=5 F (1)=5+5=10 F (2)=5+5+6=16 = Fi (1)+6 La tabla de frecuencias para variables cuantitativas discretas serepresenta mediante un gráfico de bastones. En la abscisa se colocan losvalores de la variable y se levanta para cada uno de ellos una línea dealtura igual a su frecuencia. 1 4 
  15. 15. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 4. Alumnos de primer grado de EGB1 de la escuela SanMartín según Nº de hermanos  6  5  4  frecuencia  3  2  1  0  0  1  2  3  4  5  6  Número de hermanos  Fuente: Datos ficticiosInt erpretación:El número 6 en la columna de fi significa que 6 alumnos tienen 2hermanosEl número 19 en la columna Fi significa que 19 alumnos tienen 3hermanos o menosEl número 20 en la columna de porcentajes significa que el 20% de losalumnos tienen 2 hermanos Para el caso de variables cuantit ativas continuas como los datosdel ejemplo 3 (altura en cm. de 25 alumnos de una sección maternal de laEscuela San Francisco) que fueron obtenidos por medición, se recomiendaconstruir intervalos de clase, cuya amplitud depende de la cantidad deintervalos que se deseen construir y la cantidad de datos que posee la seriesimple. Es recomendable que los intervalos de clases sean iguales, es decirque la amplitud de los mismos (a) sea constante. La técnica a emplear parael agrupamiento de una serie simple de variable cuantitativa continua essencilla. 1 5 
  16. 16. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSExi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,78, 95, 99, 97, 84, 86, 78, 741. ­Se ubica el valor mayor que toma la variable (99 cm) y el valor menor(70 cm).2. ­ Se obtiene la diferencia, la que se denomina Rango o amplitud devariación y se designa con la letra R.  R = x  - x  = 99 - 70 = 29  max min 3.– El número de intervalos aproximado se puede calcular con la siguientefórmula:  log(n + 1)  n   de intervalos = ° log(2) dónde n: n° de valores de la serie o tamaño de la muestra log: logaritmo decimal  log(  + 1  25  )  n °de int erv  = .  = 4 7004 » 5 int ervalos  .  log(  )  2 Cuando en la variable que se estudia existen intervalos predeterminados,el número de clases o intervalos dependerá de la amplitud que se usahabitualmente.4. ­ El rango se divide entre el nº de clases o intervalos de clases, 5 paraéste ejemplo, (se recomienda que el número de intervalos no sea menorque 5, ni mayor de 15, pues en el primer casos se reduce demasiado lainformación y en el segundo no se cumple con el objetivo delagrupamiento) obteniéndose una idea aproximada de la longitud oamplitud del intervalo de clase.  Rango  29  a =  = = 5 8 @ 6  .  n º de int ervalos  5  Éste valor de amplitud es orientativo, por lo que se decide tomar unaamplitud de intervalo 5 cm para facilitar el agrupamiento.5.­ Se delimitan las clases buscando preferentemente valores enteros parasus límites. Se debe elegir el límite inferior del 1er intervalo de tal maneraque contenga al menor valor de la serie (70 cm). La elección recae en el 70.El límite superior del 1er intervalo, se obtiene sumando al Li la amplitud. 1 6 
  17. 17. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSELi del 1er intervalo = 70Ls del 1er intervalo = Li + a= 70 + 5 = 75 El límite inferior del 2do intervalo debe coincidir con el límite superiordel primer intervalo.Li del 2do intervalo = 75Ls del 2do intervalo Li + a= 75+ 5 = 80 El límite inferior del 3er intervalo debe coincidir con el límitesuperior del 2do intervalo, y así sucesivamente, hasta que el límite superiordel último intervalo, contenga el valor observado más alto de la variable.6.­ Una vez formadas las clases se procede al conteo, que consiste endeterminar el nº de observaciones (frecuencias) de cada clase. Una manerasencilla de hacerlo es leyendo la serie simple y ubicando mediante marcascada valor de la variable en su clase correspondiente. De ésta maneracuando se termine de pasar lista a la serie simple, el agrupamiento hasido efectuado.Tabla 6. Alumnos de Sección maternal de la escuela San Francisco segúnsu altura. Intervalo de clase xi fi fri (altura en cm) (marca de clase) 70 a 75 72.5 4 0.16 75 a 80 77.5 5 0.20 80 a 85 82.5 4 0.16 85 a 90 87.5 5 0.20 90 a 95 92.5 1 0.04 95 a 100 97.5 6 0.24 Total 25 1.00 Fuente: Datos ficticios Un problema que se puede presentar es el siguiente: si un valor de lavariable coincide con uno de los límites del intervalo, por ejemplo la altura95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo de clase?La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si seelige un criterio se lo debe respetar hasta el final del agrupamiento. Enéste ejemplo al nº 95 se lo ubica en el 6° intervalo, de la misma manera,cuando aparezca por ejemplo un valor 85, debe ser anotado comoperteneciente al intervalo en el que el nº 85 se encuentra como límiteinferior. El intervalo de clase es cerrado en el límite inferior y abierto en elsuperior. Esto se indica de la siguiente forma [75 80  los valores del ;  ) intervalo van desde 75 a 79,9999. 1 7 
  18. 18. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE7.­ Se agrega una tercera columna, titulada “marca de clase” o “puntomedio de clase” que se designa con xi que contiene los valorescorrespondientes a los puntos medios de cada uno de los intervalos y secalcula así:  Li  + Ls  1  1  70 + 75  x1 =    = = 72 5  ,  2  2  Li  + Ls 2  75 + 80  x 2 =  2  = = 77 5  ,  2  2  También se puede calcular de la siguiente manera  x 2 =  x  + a  = 72 5 + 5 = 77 5  1  ,  ,  Al efectuar el agrupamiento, se pierde detalle de la información yaque, por ejemplo, de los valores que resultaron ubicados en la primeraclase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en casode ser necesario asignar un valor a cada uno de ellos, como es en elcálculo de la media aritmética a partir de la tabla de frecuencias, se optapor pensar que todos tienen igual valor, que es el correspondiente al puntomedio de clase. Un gráfico adecuado para representar una serie de frecuencias devariable cuantitativa continua es el hist ograma (gráfico nº 5). Suconstrucción es fácil. Se utiliza el sistema de coordenadas cartesianasortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias(fi) y en el de las abscisas (horizontal), la variable según la cual se efectuóla clasificación (altura). Consiste en rectángulos adyacentes (uno por cadaclase) con bases materializadas por la amplitud de clases (5 cm). La alturaestá dada por la frecuencia correspondiente a la clase. Cuando las clasesson iguales, el área del histograma es proporcional a la frecuencia total. 1 8 
  19. 19. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEGráfico 5.Alumnos de Sección maternal de la escuela San Francisco segúnsu altura 7  6  5  4  Nº alum. 3  2  1  0  70  75  80  85  90  95  100  Altura (cm)  Fuente: Datos ficticios Otro gráfico adecuado para representar la serie de frecuencias devariable cuantitativa continua es el polígono de frecuencias (gráfico 6).Se emplea para su realización el sistema de coordenadas cartesianasortogonales. Se coloca la variable clasificadora en el eje horizontal y lasfrecuencias en el vertical. La construcción es sencilla, se marcan tantos puntos como pares devalores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En latabla Nº 6 vemos que hay 6 pares de valores; el primer par tiene abscisa72,5 y ordenada 4 y así sucesivamente hasta marcar el sexto par. Luego seunen los puntos mediante trazos rectos. Algunos autores, en su afán demantener la proporcionalidad entre la superficie y la frecuencia aconsejancerrar el polígono de frecuencias uniendo el primer punto con la marca declase inmediata anterior y el último punto con la inmediata superior; enéstos dos casos la unión de los puntos se realiza con trazos cortados. La principal ventaja de los polígonos de frecuencias consiste en queellos permiten dibujar en el mismo sistema de eje dos o más polígonoscorrespondientes a series diferentes que tengan similar posición sobre eleje de las x, así se puede compararlos, lo cual resulta engorroso efectuarcon los histogramas a causa de la superposición de las superficies de losrectángulos.  1 9 
  20. 20. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco segúnsu altura 7  6  Nº de alum nos  5  4  3  2  1  0  65  70  75  80  85  90  95  100  105  Altura(cm)  Fuente: Datos ficticios Como cada miembro de una población presenta diversascaracterísticas, se puede necesitar clasificarlos de acuerdo a dos de ellas.Cuando el número de individuos medidos es pequeño, se enumeran todoslos pares de observaciones, si alguno de ellos aparece dos veces, se lorepite y la presentación suele hacerse de modo que una de las dosvariables esté ordenada.Tabla 9. Alumnos de una escuela según su peso y altura. Peso 39 40 41 42 43 43 44 45 50 52 (kg)Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49 Fuente: Datos ficticios Para representar estos datos que corresponden a dos variablescuantitativas continuas se utilizan los g ráf icos de dispersión o scatterplot , que se construye de la siguiente manera: se coloca una de lasvariables en las abscisas o eje horizontal, por ejemplo la altura y la otravariable, el peso, en el eje vertical, con sus escalas correspondientes, luegose marcan tantos puntos como pares de valores (xi, yi) se tengan. 2 0 
  21. 21. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Gráfico 7. Alumnos de una escuela según su peso y altura 1,55  1,5  1,45  Al tura (m)  1,4  1,35  1,3  1,25  35  40  45  50  55  Peso (kg)  Fuente: Datos ficticios Éste gráfico sirve para mostrar la relación entre las dos variables yse usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Siesto no ocurre puede utilizarse el gráfico lineal, que se construye de igualmanera que el anterior, con la única diferencia que se unen los puntos.Éste gráfico, se suele emplear, especialmente, en los casos donde lavariable que se representa en el eje horizontal es el tiempo. De éste modose puede ver la evolución de la otra variable en el período considerado.Pueden representar simultáneamente en el mismo gráfico dos o másvariables, como se observará al representar gráficamente los datos de latabla Nº 10Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A deEGB1 de la Escuela San Martín según sexo Meses N° de inasist. Mujeres Varones Marzo 3 4 Abril 5 7 Mayo 2 4 Junio 6 5 Julio 8 8 Agosto 4 5 Sept. 3 4 Octubre 4 3 Noviem. 5 2 Diciem. 1 6 Fuente: Datos ficticios 2 1 
  22. 22. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Gráfico 8. Inasistencias mensuales de alumnos de Segundo grado A deEGB1 de la Escuela San Martín según sexo 9  Mujeres  8  Varones  7  Nº de inas is tenc ias  6  5  4  3  2  1  0  M  A  M  J  J  A  S  O  N  D  Meses  Fuente: Datos ficticios Cuando los pares de valores son muy numerosos, las tablas sepresentan según lo muestra la tabla 11; en éste caso se dice que las tablasson de doble entrada pues son dos las variables de clasificación.Tabla 11. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia. Ocupación Barrios Total de la Madre A B C A. de casa 400 500 200 1100 Profesional 200 200 50 450 Empleada 300 400 100 800 Total 900 1100 350 2350 Fuente: Datos ficticios En este ejemplo cada alumno se caracteriza según la variableOcupación de la madre (variable cualitativa nominal) y Barrio deresidencia (variable cualitativa nominal). 2 2 
  23. 23. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Los valores que se encuentran en la celda son frecuencias, es decirrepresentan la cantidad de alumnos que comparten las dos características.Las partes de una tabla son:La ma triz , formada por la primera fila, lleva los encabezamientos de lascolumnas y / o la primera columna que titula a las filas.El cuerpo constituido por celdas. La información proporcionada por los valores de las celdas se completacon la suministrada por los encabezamientos de las filas y columnas; enlas celdas se encuentra la frecuencia, es decir la cantidad de elementos oindividuos que poseen las dos características. Por ejemplo el 100 de la última celda significa que en esa escuela hay100 alumnos que viven en el Barrio C y cuyas madres son empleadas. El gráfico que se utiliza para representar éste tipo de tablas es el gráf ico de barra s compuesta s (gráfico 9) y el gráfi co de barra s a grupa da s (gráfico 10).Gráfi co de barra s compuesta s La construcción del gráfico de barras compuestas es sencilla. Secomienza dibujando las barras como si fueran simples es decir con lasalturas correspondientes a los totales y luego se yuxtaponen los valoresparciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procedede la siguiente manera: se marca una barra de altura 900, en ella se indicala subdivisión que corresponde a alumnos cuyas madres son amas de casacon el valor 400; para marcar el nº de alumnos que es 200, se marca400+200=600 en el eje vertical lo que queda corresponde nº de alumnoscuyas madres son empleadas. De igual manera se procede con los barriosB y C. 2 3 
  24. 24. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEGráfico 9. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia  1200  Empleada  Profesional  1000  Nº de alumnos  A. de casa  800  600  400  200  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos ficticiosGráfi co de barra s a grupa da s Sirven para representar fenómenos similares a los que originanbarras compuestas. La diferencia con éstas estriba en que, para cada valorde la variable independiente “x” en éste ejemplo lugar de residencia, sedibujan grupo de barras . El número de barras en cada grupo es el delnúmero de categorías de la segunda variable, en este ejemplo ocupación delas madres.Gráfico 10. Alumnos de la escuela Nº 42 según ocupación de la madre ylugar de residencia  600  A. de casa  Prof esional  500  Empleada  Nº de alumnos  400  300  200  100  0  A  B  C  Lu gar  de  r e sid en cia  Fuente: Datos fict ic ios 2 4 
  25. 25. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Otro tipo de gráficos son los gráficos de figuras o pictogramas. Sonlos más indicados para publicaciones de divulgación popular , por su fácil einmediata interpretación. Consisten en dibujos esquemáticos yrelacionados con el fenómeno a representar. Cada figura es equivalente auna cantidad determinada, preferentemente entera, de unidades de lavariable dependiente y el número de unidades no su tamaño, esproporcional a la magnitud a representar. Cart ogramas: Se emplean cuando es importante señalar ladistribución geográfica de un determinado acontecimiento, razón por lacual se construyen sobre planos o mapas. Cart ogramas de señalización (Gráfico 11): Sirven para indicar ladistribución de una variable cualitativa sobre una base geográfica.Mediante figuras, colores o diferentes rayados se señala que hay enlugares determinados. Gráfico 11. Qué es lo que caracteriza a cada provincia argentina. Fuente: Pensando en Plural. División de educación tributaria. AFIP. Mayo 2005.ISBN Nº987­9101­26­X 2 5 
  26. 26. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE En este mapa, se observa lo que caracteriza a cada provinciaargentina. Por ejemplo en Santiago del Estero las aguas termales; en LaPampa la producción de trigo, etc... Cart ogramas de densidad: además de indicar que hay y dónde, deellos se puede obtener la información de cuánto hay. Mediante diferenterayado o colores y también utilizando barras sobre la base geográfica, sepuede expresar la cuantía del fenómeno como así también su ubicación.Suelen utilizarse pictogramas, gráficos de líneas, en general cualquiera delos descriptos, sobre el mapa o plano. Resumiendo: los datos se ordenan, clasifican y presentan en formasde tablas. Las tablas pueden de ser de simple entrada(cuando losindividuos se clasifican según una variable), de doble entrada(cuando losindividuos se clasifican según dos características) y de triple o másentradas (cuando se clasifican los datos según tres o más variables).Lastablas se complican a medida que se agregan más variables, por lo tantoes preferible varias tablas sencillas a una complicada. Toda tabla debe llevar título, el cuál debe responder a las preguntas¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?. No se debe olvidar la fuente de datos que indica de donde proviene lainformación. Se debe incluir los totales. En caso de expresar los datos en porcentajes, deben indicarse lostotales de los cuales provienen. Con respecto a los gráficos, éstos constituyen una de las formas másútiles de presentación de datos estadísticos. Su importancia reside en lasmúltiples formas que pueden adoptar, lo que permite su aplicación a unaamplia gama de finalidades: didácticas, de investigación, etc. Sirven paramostrar la relación entre una o más variables. La variedad de tipo derepresentaciones gráficas exige una cautelosa elección de acuerdo a sufinalidad. La selección de la presentación gráfica debe, por lo tanto tenerlos siguientes aspectos: Tipo de análisis estadístico, características y número de losfenómenos o variables a representar y público al que va dirigido. 2 6 
  27. 27. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE Recomendaciones para la construcción correcta de un gráfico. Una vez elegido el tipo de gráfico adecuado, es conveniente nodescuidar las siguientes consideraciones: · Decidir cuál de las variables es la independiente “x” y cuál la dependiente “y”. · La representación gráfica debe ser sencilla, simple y explicarse por sí misma. · Título se coloca encabezando el gráfico y debe responder a las preguntas; qué, según, cuándo, dónde?. · Fuente de datos. Se coloca al pie del gráfico. · Escalas se elige de tal modo que no alteren la objetividad de la representación, hecho éste muy utilizado para fines publicitarios donde es común ver escalas construidas con el propósito de alterar el fenómeno exagerando ventajas y enmascarando la realidad, o lo que es peor aún eliminando la graduación de los ejes, evitando de ésta forma todo patrón de comparación. Las escalas deben construirse buscando obtener como resultado un dibujo armónico y proporcionado. · Debe nominarse los ejes de modo tal que no quede duda alguna acerca de las variables que en ellos se representan. · No olvidar el corte de ejes en caso de ser necesario. Éste debe efectuarse entre el 0 y el valor mínimo a representar. · Aclaración de las unidades de representación. · Las referencias serán colocadas al pie o al costado del gráfico. · En caso de usarse abreviaturas, éstas serán aclaradas con la debida extensión, en el renglón siguiente al correspondiente a las fuentes. · En lo posible acompañar los gráficos con las tablas estadísticas que lo originen. · Si el tra ba jo lo requiere y es necesario expresar al gunos va l ores en %, deben consignarse la s cifra s de la s cual es provienen éstos porcenta jes. 2 7 
  28. 28. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEÍNDICES El Índice es un indicador útil tanto para fijar situaciones como parahacer un diagnóstico. Cuando interesa comparar los valores de unacaracterística de la educación (matrícula, asistencia de alumnos, númerode profesores, etc...) en el tiempo o en el espacio, ya sea comparando dosvalores entre sí o todos con uno de ellos se puede realizar un cociente cuyoresultado se denomina Índice simple.Ejemplo: Se desea comparar la matrícula escolar de una escuela en el año2004 con la matrícula en el año 1994. Si la primera es de 4000 alumnos yla de 1994 es de 2000, el Indice será: 4000 I2004/1994= = 2  2000  Lo que indica que la matrícula en el año 2004 es el doble que lamatrícula de 10 años atrás, en esa escuela. El valor que va en el denominador se llama ba se . El Indice del año base es 1: 2000 I1994/1994= 2000  = 1  Con frecuencia se multiplica por 100 los índices con lo que entonceslos índices son los porcentajes correspondientes siendo 100 el porcentajedel índice base.Los Índices más comunes utiliz ados en educación son:· Razón de alumnos mat riculados en las escuelas con respecto a la población en edad escolar. N °alumnos  matriculad os  I=  Población en edad  escolar  2 8 
  29. 29. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEEjemplo: En el año 2001, en la localidad de La Banda según el INDEC, lapoblación en edad escolar fue de 88735 y los alumnos matriculados fue de32613. La razón de alumnos matriculados es entonces en ese año de: 32613 I= = 0 37  .  88735 Es decir que solo el 37% del total de la población en edad escolar asiste ala escuela.· Alumnos por maestro en las escuelas primarias. N °  alumnos  I= N °maestros Ejemplo: Si el total de alumnos de una escuela es de 1000 y el planteldocente informa que hay 40 maestros( Datos ficticios), la razón alumnospor maestro es: 1000 I= = 25  40  Es decir que en esa escuela hay 25 alumnos por cada maestro.· Porcentaje de población analfabeta de 15 años y más. N °  analfabeto  .de 15  s   años  y  más  I= *  100  Población de 15  años  y  más Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el año2001 el total de población de 15 años y más fue de 571546 personas. Deellas, 31625 no tenían ninguna instrucción. El Porcentaje de población analfabeta para la provincia es entonces, 31625 I=  *  100 = 5 53  .  %  571546  2 9 
  30. 30. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE · Tasa de ausentismo de docent esEs el porcentaje de ausentismo de docentes en un período de tiempodeterminado. N º de días de ausencia de todos  los docentes  un período  en  Ta= * 100  N º de días de clase de todos los docentes en ese período Ejemplo: Si en una escuela hay una planta docente de 115 personas y eltotal de inasistencias de los docentes(por diversas causas) en el año es de3101días, la Tasa de ausentismo se calcula como sigue(considere que losdías de clase en el año son 180): 3101 Ta= * 100 = 14 98  .  %  115 * 180 · Tasa de desgranamientoEs la proporción de alumnos ingresados al primer grado (o curso) que nolograron culminar todos los grados (o cursos) correspondientes al nivel, enel período establecido.  N º de alumnos que no cul  aron sus estudios en el  período establecid  min  o  Td = * 100  N º de alumnos matriculad  al inicio del  período  os Ejemplo: Si en el estudio de la cohorte 1974­1980 el número de alumnosmatriculados en la Argentina en la escuela primaria al inicio del período esde 729048 y los que no culminaron sus estudios es de 337292 (Fuente:Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.Año 1999)la Tasa de desgranamiento es: 337292 Td= 729048  = 0 46  . Es decir que en ese período hay un desgranamiento del 46%.El 46% de los alumnos matriculados al inicio del período no culminaronsus estudios al final del mismo.  3 0 
  31. 31. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE· Tasa de retención de la cohort eEs la proporción de alumnos ingresados al primer grado (o curso) quelograron culminar todos los grados (o cursos) correspondientes al nivel, enel período establecido.  N º de alumnos que cul  aron sus estudios en el  período establecid  min  o Tr = *  100  N º  de alumnos matriculad  al inicio del  período  os Ejemplo: Si en el mismo período considerado en el ejercicio anteriorterminan el 7ª grado 391756 alumnos de los 729048 matriculados, la Tasade retención será: 391756 = 0 5374  .  Tr= 729048  Es decir que la Tasa de retención es aproximadamente del 54%. El 54% de los alumnos matriculados al inicio del período culminaronsus estudios al final del mismo.· Tasa de escolarizaciónProporción de la población en edad escolar que está efectivamenteescolarizada  N º de alumnos matriculad  os  Ez = *  100  Población en edad  escolar Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001según el INDEC es de 706794 habitantes. De ellos asisten a la escuela237708.La Tasa de escolarización es: 237708 I= *  100 = 33 63  .  %  706794 Es decir que el 33.63% de la población en edad escolar asiste a la escuela.  3 1 
  32. 32. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE GUÍA DE EJERCITACIÓNActividad 1Clasifique en base al siguiente listado las variables socio educativas, encualitativas nominales u ordinales y cuantitativas discretas o continuas Variable Tipo 1­ Religión 2­ Nº de alumnos promocionados por curso 3­ Barrios 4­ Nivel de educación alcanzado por el tutor 5­ Edad de los alumnos 6­ Sexo 7­ Nº de inasistencias mensuales 8­ Altura de los alumnos 9­ Lugar de nacimiento10­ Peso de los alumnos11­ Horas de estudio diario12­ Nº de materias que cursan13­ Nº de hermanos que tiene cada alumno14­ Grado de satisfacción por la asignatura 15 Superficie construída por escuela 16 Nº de escuelas por Departamento 17 Categorías de escuela 3 2 
  33. 33. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 2 Los siguientes datos corresponden a Nº de inasistencias de losalumnos de un curso correspondientes al primer cuatrimestre xi : 8 5 3 4 2 5 4 4 10 6 6 7 5 5 3 9 7 2 6 4 9 4 5 0 8 6 5 1 1 4 5 7 2 7 6 4 9 4 5 3 a) ¿Que indica el subíndice i? b) ¿Cuál es la variable que se estudia?. Clasifíquela. c) Ud. debe presentar un cuadro de inasistencias de los alumnos. ¿Cómo construye el mismo? d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas, porcentaje y porcentaje acumulado correspondiente a cada valor de la variable. e) Presente los resultados con el gráfico apropiado.Actividad 3 En un curso de 50 alumnos de un establecimiento de la Capital del aPcia. De Sgo. Del Estero, se empleó la técnica de profundización de temaspor grupo en el desarrollo de contenidos teóricos. Se distribuyó uncuestionario con la finalidad de determinar la actitud de los mismos anteesta modalidad de estudio. Una de las preguntas estaba referida al gradode conformidad sobre el desarrollo de los contenidos teóricos.Los resultados obtenidos fueron los siguientes:xi : MC MD C I C MC D D MC MC I MC I MC D MC MD C D C MC D MC D MC D MD I C C C MD MC I C MC MC D C MC C MC D MD MC I D MC I MCDonde:MC: muy conformeC: conformeI: indiferenteD: disconformeMD: Muy disconforme 3 3 
  34. 34. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE a) Indique el tamaño de la muestra b) Ud. debe representar al establecimiento en una reunión de profesores en la que participan distintos Colegios de la Capital. ¿Como presentaría la opinión del alumnado? c) Que título colocaría a la presentación? d) Incluya en la misma frecuencias relativas y porcentajes correspondiente a cada valor de la variable. e) Presente esos mismos resultados con un gráfico de barras simples. f) Indique si corresponde calcular frecuencia acumulada. En el caso de respuesta afirmativa obtenga dicha frecuencia. g) Analice los resultados obtenidosActividad 4En un estudio realizado en el Instituto Santo Tomás de Aquino paradeterminar la zona de influencia del mismo según el lugar de residencia delos alumnos, los resultados obtenidos fueron los siguientes:Alumnos del Instituto Santo Tomás de Aquino según el barrio en el queresiden. Barrios Número de alumnos Barrio Belgrano 300 Barrio Cabildo 150 Barrio Contreras 30 Barrio Ejército Argentino 20 Total 500 Fuente: Datos ficticios a) ¿Que representa el número 500? b) ¿Cuál es la variable de clasificación? Indique de que tipo de variable se trata. c) Obtenga frecuencias relativas y los porcentajes correspondientes. d) Determine si corresponde calcular frecuencias acumulada. e) Realice gráfico de tortas. f) ¿Qué otro gráfico puede emplear para representar estos datos? 3 4 
  35. 35. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 5Los siguientes datos corresponden a la edad de los tutores de alumnos queconcurren al EGB de un establecimiento escolar xi : 44 30 45 48 31 45 33 35 54 44 45 47 38 56 29 43 43 62 60 30 52 36 45 31 31 32 34 32 54 55 55 46 61 39 43 38 47 45 38 37 63 49 34 48 34 64 44 47 36 60 50 52 37 41 29 37 49 37 39 56 39 46 46 31 60 29 53 40 41 58Presentar los datos : a) En una tabla con un número aproximado de intervalos de clase. b) En una tabla con 5 intervalos c) ¿Que gráficos utilizaría para representar los datos contenidos en estas tablas? d) Con la tabla presentada en el item b, realice un histograma. e) Con la tabla presentada en el item a, realice un polígono de frecuencias.Actividad 6Los siguientes datos corresponden a alumnos analfabetos porDepartamento en la Pcia. de Santiago del Estero, discriminados por sexo.Año 2001 Departamento Total Sexo Varones Mujeres Capital 4587 2299 2288 Banda 4752 2461 2291 Río Hondo 3473 1960 1513 Robles 2116 1166 950FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas. 2001.En base a los datos proporcionados en la tabla anterior realice: a) Gráfico de barras simples que muestre el número total de alumnos analfabetos por Departamento. ¿Que otro tipo de gráfico podría utilizar en la representación? b) Gráfico de tortas que muestre el número de alumnos analfabetos discriminados por sexo para el Departamento Robles. c) Realice un gráfico de barras agrupadas por Departamento 3 5 
  36. 36. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE d) Realice un gráfico de barras porcentuales por Departamento discriminando dentro de cada una de ellas los porcentajes de varones y mujeres analfabetos.Actividad 7Utilice un gráfico lineal para mostrar la evolución de egresados delPolimodalAño Nº de egresados1980 2331985 2781990 3211995 3752000 391FUENTE: Datos ficticiosActividad 8En base a los datos de la siguiente tabla:Población en edad escolar, Nº de alumnos matriculados y Nº de maestroscorrespondiente a cuatro lugares de la República Argentina. Lugar Población en Nº de Nº de Nº de edad escolar alumnos alumnos no maestros matriculados matriculados A 300000 248.000 7.000 B 150000 106.000 4.000 C 25000 24.000 1.200 D 160000 142.000 4.750Fuente: Datos FicticiosCalcular para cada lugar: a) Proporción de alumnos matriculados b) Nº de alumnos por maestro c) Tasa de escolarización d) Número de alumnos No matriculados e) Porcentaje de alumnos No matriculados 3 6 
  37. 37. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEActividad 9Dada la siguiente tabla, calcule la retención y el desgranamiento de cadacohorte y en base a los resultados realice el análisis correspondienteRetención y Desgranamiento de la Escuela Primaria. Su evolución en 3ciclos escolares del período 1964­1980Ciclo Escolar Alumnos matriculados 1er Grado 7º Grado1964 ­ 1970 723.264 321.9401969 ­ 1975 751.049 375.7231974 ­ 1980 729.048 391.756Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D. Filmus. Troquil­Bs.As.­1996­Pág.87.Citado por Lic,. Julio Zurita: Guía de actividades de la asignatura:Introducción a la Estadística Educativa. Escuela para la Innovación Educativa. UNSE.Año a) Calcule la tasa de desgranamiento b) Calcule la tasa de retención c) Interprete los resultados obtenidosActividad 10La siguiente tabla fue extraída del Censo Nacional de Población, Hogares yVivienda . 2001.Población de 10 años y más de departamentos de Santiago del Estero, porcondición de alfabetismo y sexo. Año 2001.Provincia Población Condición de alfabetismo de 10 años Alfabetos Analfabetos y más Total Varones Mujeres Total Varones Mujeres Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685 Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288 Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291 Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513 Hondo Copo 19.241 17.264 9.156 8.108 1.977 948 1.029a) Calcular la tasa de analfabetismo de los distintos Departamentos que semuestran en la Tabla.b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que lapoblación total de Santiago del Estero, según el Censo del año 2001 es de804.457 ? 3 7 
  38. 38. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEc) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintosdepartamentos?d) Calcule la tasa de analfabetismo correspondiente a los varones de losdistintos departamentos. 3 8 
  39. 39. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  UN I DA D I I I MEDIDAS DE POSICIÓN Y DISPERSIÓNINTRODUCCIÓN En todo trabajo estadístico luego de recolectar los datos, ordenarlos,agruparlos en tablas y presentarlos gráficamente, es preciso extraer algunainformación que caracterice a la población de la cual se los extrajo. Por ello, el objetivo de éste capítulo es interiorizarlos acerca de lasmedidas de posición y variación más utilizadas para caracterizar a lapoblación en estudio, y en que caso se emplea cada una de ellas,interpretando los resultados a través del pensamiento crítico. Los métodos de éste capítulo suelen denominarse métodos deestadística descriptiva, porque su objetivo es resumir o describir lascaracterísticas importantes de un conjunto de datos. Éstas característicasse refieren al centro, variación, distribución, datos distantes y cambios através del tiempo. 1. Medida s de posición Supongamos que una directora está preocupada por las notasobtenidas en las pruebas de Matemáticas. Lo primero que se le ocurrirá estener una idea de si las notas de una muestra de alumnos se ubican cercade la calificación cinco o cerca de la calificación nueve. Necesita resumirlos datos y calcular alguna medida que sirva para que, con un único valorsencillo y representativo pueda establecer si los alumnos se posicionancerca de una calificación de 5 puntos o si por el contrario se posicionancerca de la calificación de nueve puntos; a estas medidas se las denominanMedidas de Posición, y si además indican el centro de ése conjunto devalores, se denominan Medidas de posición y tendencia central. Se conocen varias formas de determinar el centro de un conjunto dedatos. A continuación, se indicarán tres que son las más comúnmenteutilizadas: media, mediana y modo. 3 9 
  40. 40. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE1.1. Media aritmét icaLa media (aritmética) es la medida de posición y tendencia central másempleada para describir los datos; constituye lo que la mayoría de la gentedenomina promedio. Es quizás la más conocida y usada.La media aritmética en una serie simple de datos, se la obtiene al dividir lasuma de todos los valores de la variable entre la cantidad de valoressumados. A la media aritmética se la representa con  x :a)Cálculo de las media aritmética en series simples Ø Ejempl o 1Se registró los días de inasistencias en un año, de una muestra de cincoalumnos del primer ciclo del EGB y se desea averiguar cuál es el promediode inasistencias de esa muestra. La variable en estudios es:X = nº de inasistencias de los alumnosLos valores de la variable son:xi : 0; 16; 12; 5; 7  5  0 + 16 + 12 + 5 + 7  x  + x 2  + x  + x  + x  å x i  i  x  =  = 1 3  4  5  = =1  5  5  5  ,y su fórmula de cálculo es la siguiente  n  å x i i  =1  x =  n  2.1En la fórmula se utiliza la letra griega å (sigma mayúscula) que indicaque los valores de la variable deben sumarse.El símbolo n denota el tamaño de la muestra, que es el número dealumnos observados.Cuando los datos provienen de una muestra el símbolo de la mediaaritmética es  x (se denomina “x barra”); si se calcula la media aritméticacon los datos de toda la población se simboliza con  N å x i i  =1 m =  N  2.2 4 0 
  41. 41. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEå denota la sumatoria del conjunto de valores.xi expresan los diferentes valores que toma la variable.n tamaño de la muestra, cantidad de valores observadosN tamaño de la población Como nuestros datos constituyen una muestra para calcular lamedia utilizamos la fórmula 2.1  5  å x i  i    =1 0 + 16 + 12 + 5 + 7  40  x = = = = 8  5  5  5 Int erpretación: Los alumnos tienen en promedio 8 inasistencias por año.Algunas propiedades de la media aritmética1­La media aritmética es reproductora del total.2­ Si llamamos desvío a la diferencia entre un valor y la media aritmética å (d i ) = å (x i  - x ) = 0 x i  d i = x  - x  i  0 0 – 8 =­8 5 5 ­ 8 =­3 7 7 ­ 8 =­1 12 12 – 8 = 4 16 16 – 8 = 8 Total 0Una desventaja de la media es su sensibilidad a valores extremos, de modoque un valor excepcional puede afectarla de una manera drástica, en estecaso no representa en forma adecuada al centro de dicho conjunto y tiendea dirigirse a ese valor extremo.Si por equivocación al pasar los datos en el ejemplo de las inasistencias delos 5 alumnos colocamos 66 en vez de 16: Ø Ejempl o 2X = inasistencias de alumnosxi : 0; 66; 12; 5; 7 4 1 
  42. 42. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE La inasistencia promedio toma el valor 18, alejándose el promediohacia al valor extremo 66.  5  å x i  i    =1 0 + 66 + 12 + 5 + 7  90  x  == = = = 18  5  5  5  La media aritmética no representa el centro del conjunto de datos.Este problema o desventaja se resuelve utilizando otra medida de resumende datos que se denomina: mediana. La medi a aritmética se puede cal cula r cua ndo los val ores dela s varia bles son cua ntitativos ta nto conti nuos como discretos.1. 2 Mediana. La mediana (de un conjunto de datos):es una medida de tendenciacentral que divide a la serie ordenada de datos en dos partes iguales, de talforma que el 50% de los datos son menores o iguales a la mediana y el otro50% mayores o iguales a ella. La mediana se designa con Me.a) Cálculo de la mediana en series simples Ø Ejempl o 3 Ø Se va n a consi derar dos ca sos: cua ndo el ta ma ño de la muestra es i mpar y cua ndo n es par ØSe desea determinar el valor mediano de las inasistencias de los alumnosdel ejemplo 2, El tamaño de la muestra, “n” es impar.X: inasistencias de alumnosxi : 0; 66; 12; 5; 7 Para su cálculo debemos ordenar primero los datos en formaascendente o descendente. Si el número de observaciones es impar, la mediana es el valor de lavariable que se localiza exactamente en la mitad de la lista. En caso de que el número de observaciones fuera par, el valor de la 4 2 
  43. 43. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEmediana se obtiene promediando los dos valores centrales. Esos valores centrales se posicionan en el lugar  n + 1 2 Solución. Primero se ordenan los datos 0; 5; 7; 12; 66.La muestra posee tamaño impar n = 5 y el valor mediano está posicionadoen el lugar  5 + 1  6  = = 3  2  2 , o sea que el valor de la mediana es el valor de la variable ubicado en el 3ºlugar. 0; 5; 7; 12; 66.Me = 7 inasistenciasInt erpretación: el 50% de los alumnos tiene inasistencia menores oiguales a 7. Ø Ejempl o 4En el caso de que n sea parSupongamos que contamos las inasistencias de 6 alumnos.X = inasistencias de alumnosxi : 0; 66; 12; 5; 7;10Solución. Primero se ordenan los datos0; 5; 7; 10; 12; 66.Las muestra posee tamaño par n = 6, 6 + 1  7  = = 3 5  , Posición de los valores centrales  2  2 Los valores centrales ocupan el tercer y cuarto lugar, la mediana seobtiene como el promedio de los dos valores centrales: 4 3 
  44. 44. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE 0; 5; 7; 10; 12; 66  7 + 10 Me  =  = 8 5 » 8  ,  2 Int erpretación: el 50% de los alumnos tienen inasistencias menores oiguales a 8.Deben quedar claro dos conceptos:Primero: La mediana no se ve influenciada por los valores extremos, yaque en su cálculo interviene el orden y no la magnitud de los valores.Segundo: la media aritmética es sensible a valores extremos. La medi a na se puede determinar para va ria bles cua ntitati va scontinua s discreta s y para varia bles cua litati va s que se miden enesca l a ordi nal.1. 3. Modo. El Modo es el valor de la variable que ocurre con mayor frecuencia.Se designa frecuentemente como Mo. Se debe hacer notar aquí que el Mo es un valor de variable y lafrecuencia de este valor sugiere su importancia estadística. Cuando dos valores ocurren con la misma frecuencia y ésta es lamás alta, ambos valores son modas, por lo que el conjunto de datos esbimodal. Cuando más de dos valores ocurren con la misma frecuencia y éstaes la más alta, todos los valores son modas, por lo que el conjunto dedatos es multimodal. Cuando ningún valor se repite, se dice que no hay moda. Ø Ejempl o 5 . Calcule las modas para los siguientes conjuntos de datos:Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6Serie B: 4; 5; 3; 4; 6; 8; 5Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99Serie D: 1; 2; 3; 6; 7; 8; 9; 10 4 4 
  45. 45. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSESolución:En l a seri e A. El número 4,5 es la moda pues es el valor que ocurre conmayor frecuencia(2 veces).En l a seri e B. Los números 4 y 5 son modas, ya que ambos ocurren conla frecuencia más alta (2 veces).En l a serie C. Los números 27 y 55 son modas, ya que ambos ocurrencon la frecuencia más alta (3 veces).En l a seri e D. No hay moda, ya que ningún valor se repite. En reali da d, l a moda no se utiliza mucho con da tos numéricos.Sin embargo, entre l a s di stinta s medi da s de tendencia central queconsi dera mos, la moda es la úni ca que puede usarse cua ndo se tratade va ri a bles cualitativa s nominal es. Ø Ejempl o 6 . Una encuesta efectuada a estudiantes mostró que el 84 tieneaparato de televisión; 76 videocasetera; 39 videojuegos y el 35 reproductorde DVD. En tanto que el televisor es el aparato más frecuente, es posibleafirmar que la moda es el televisor. No podemos calcular una media o mediana para datos como éstos,cualitativos a nivel nominal.3.­ Cálculo de las medidas de posición en series de frecuenciasVeremos como se calculan la medidas de posición y tendencia centralcuando los datos están agrupados en una serie de frecuencias.3.1. Variables agrupadas en serie de frecuencias simple3.1.a. Media aritmética.Como en una serie de frecuencias, fi nos indica las veces que se repite elvalor de la variable, debemos considerarlas en el cálculo de la mediaaritmética. 4 5 
  46. 46. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSE  Ø Ejemplo 7Una maestra esta interesada en conocer el número promedio de hermanosde su alumnos. Para ello tomó de una muestra de 25 alumnos.Tabla 1. Alumnos de tercer año de polimodal de la Escuela Sarmientoclasificados según el número de hermanos Nº de hermanos Nº de alumnos (x i) (fi) 0 1 1 9 2 7 3 5 4 3 Total 25 Fuente: Datos ficticios Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueveveces 1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa sumaentre 25 que es el tamaño de la muestra.xi: nº de hermanosfi : número de alumnos que poseen xi hermanos  25  å x i  i    =1 0 + 1  + 1 + 2  + 3  + 4  + 4  50  ...  ...  ...  ...  x  == = = = 2  25  25  25  Pero, este cálculo se podría realizar en forma más simple y esobtener esa misma suma reemplazándola por la multiplicación. Utilizandola frecuencia fi que indica las veces que se repite el valor de la variable xi.  x  f 1  + x 2  f 2  + ... + x 5  f 5  i x  = f 1  + f 2  + ... + f 5 ahora expresando literalmente la fórmula de la media aritmética tenemos n  1  x =  å x i  f i  n  i =1  Este promedio se conoce como media aritmética ponderada. Parapoder calcular la media aritmética ponderada correspondiente al ejemploplanteado, agregamos a la tabla de frecuencias anterior una columna 4 6 
  47. 47. Licenciatura en Gestión Educativa – Escuela para la Innovación Educativa ­ UNSEauxiliar que facilitará el cálculo de la media.Tabla 2. Alumnos de tercer año de polimodal de la Escuela Sarmientoclasificados según el número de hermanos Nº de hermanos Nº de alumnos xi*fi (xi) (fi) 0 1 0 1 9 9 2 7 14 3 5 15 4 3 12 Total 25 50 Fuente: Datos ficticiosx  =  1  n  å x i  f i  .  =  1  50 =  2 25  n  i =1  Podemos concluir diciendo que los alumnos de tercer año depolimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.3.1.b. MedianaUna maestra esta interesada en conocer la mediana del número dehermanos de una muestra de 44 alumnos que concurren a una escuelarural.Tabla 3. Alumnos de una Escuela rural clasificados según el número dehermanos Nº de hermanos Nº de alumnos (x i) (frecuencia, fi) 2 5 3 5 4 30 5 4 Total 44 Fuente: Datos ficticios En esta serie de frecuencias de variable cuantitativa discreta, losdatos ya están ordenados, por lo que solo resta encontrar el valor central,cuya posición se encuentra en el lugar  n + 1 44 + 1  45  = = = 22 5  ,  2  2  2  4 7 

×