SlideShare a Scribd company logo
1 of 36
Download to read offline
372.7
And.
Cuaderno N° 17
Introducción a la Estadística
Federación Internacional Fe y Alegría,
junio 2007
32 p.; 21,5 x 19 cm.
ISBN: 978-980-6418-94-3
Matemáticas, Estadística




2
“La base educativa que debemos
consolidar, pensando siempre en el
influjo político que alcanzarán un
día nuestros alumnos, debe ser de
plenitud humana, de fortalecimien-
to de su personal identidad, de do-
tación instrumental de los recursos
culturales, tecnológicos y creativos
que hacen a un hombre más fuerte,
más digno y más generoso.”

            Padre José María Vélaz




                                  3
EQUIPO EDITORIAL
Beatriz Borjas y Carlos Guédez

Dimensión: Desarrollo del pensamiento
matemático
Cuaderno N° 17
Introducción a la Estadística
Autor: Martín Andonegui Zabala

Este libro se ha elaborado con el
propósito de apoyar la práctica
educativa de los cientos de educadores
de Fe y Alegría. Su publicación se
realizó en el marco del Programa
Internacional de Formación de
Educadores Populares desarrollado por
la Federación Internacional Fe y Alegría
desde el año 2001.

Diseño y Diagramación: Moira Olivar
Ilustraciones: Corina Álvarez
Concepto gráfico: Juan Bravo
Corrección de textos: Carlos Guédez
y Martín Andonegui

Edita y distribuye: Federación
Internacional de Fe y Alegría. Esquina
de Luneta. Edif. Centro Valores, piso 7
Altagracia, Caracas 1010-A, Venezuela.
Teléfonos: (58) (212)5631776 / 5632048
/ 5647423.
Fax: (58) (212) 5645096
www.feyalegria.org

© Federación Internacional
Fe y Alegría

Depósito legal: lf 60320073102352
Caracas, junio 2007

Publicación realizada con el apoyo de:
Centro Magis - Instituto Internacional
para la Educación Superior en
América Latina y el Caribe (IESALC) -
Corporación Andina de Fomento (CAF)


4
introducción
             A modo de introducción...,
                  nuestro recordatorio
          L   a sugerencia que proponíamos en
              el Cuaderno No 1 y que siempre
       presidirá los demás Cuadernos: Vamos a
                                                       diciona nuestro trabajo docente. De esta
                                                       forma, integrar nuestra práctica docente en
                                                       nuestro estudio.
       estudiar matemática, pero no lo vamos a
       hacer como si fuéramos simplemente unos             • Como complemento a lo anterior,
       alumnos que posteriormente van a ser eva-       construir el conocer de cada tópico mate-
       luados, y ya. No. Nosotros somos docentes       mático pensando en cómo lo podemos lle-
       –docentes de matemática en su momento-          var al aula. Para ello, tomar conciencia del
       y este rasgo debe caracterizar la forma de      proceso que seguimos para su construcción,
       construir nuestro pensamiento matemático.       paso a paso, así como de los elementos
       ¿Qué significa esto?                             –cognitivos, actitudinales, emocionales...-
                                                       que se presenten en dicho proceso. Porque
           • La presencia constante de la meta         a partir de esta experiencia reflexiva como
       última de nuestro estudio: alcanzar unos        estudiantes, podremos entender y evaluar
       niveles de conocimiento tecnológico y re-       mejor el desempeño de nuestros alumnos
       flexivo, lo cual debe abrir ese estudio hacia    –a su nivel- ante los mismos temas.
       la búsqueda de aplicaciones de lo aprendi-
       do, hacia el análisis de los sistemas que dan       • En definitiva, entender que la mate-
       forma a nuestra vida y utilizan ese conoci-     mática es la base de su didáctica: la forma
       miento matemático, y hacia criterios socia-     en que se construye el conocimiento ma-
       les y éticos para juzgarlos.                    temático es una fuente imprescindible a la
                                                       hora de planificar y desarrollar su enseñan-
          • Construir el conocer de cada tópico        za.
       matemático pensando en cómo lo enseña-
       mos en el aula, además de reflexionar acer-          Y ahora, vamos al tema de este Cuader-
       ca de cómo nuestro conocer limita y con-        no, la Estadística.

                                                                                                5
vivienda de cada uno de nuestros alumnos.
                                                                                                      Este tipo de variables que se miden contan-
     1. El significado de la Estadística                                                               do recibe el nombre de discretas. Como se
                                                                                                      ve, estas variables sólo pueden tomar valo-
   Vivimos bombardeados de información por todas partes; a veces, hasta en exceso. Los                res enteros.
medios de comunicación, los libros, lo que nos dicen los demás, lo que observamos en
nuestro caminar por la ciudad o el pueblo, lo que recordamos, lo que leemos o estudia-                    La segunda manera de medir se refiere
mos... Hay información permanente, abundante; quizás, hasta excesiva...                               y aplica a las variables que se denominan
                                                                                                      continuas porque, entre dos valores fijos,
    Los elementos que componen esta información son de naturaleza muy diversa: noti-                  pueden tomar todos los valores interme-
cias puntuales, ideas, descripciones de objetos y acontecimientos, comentarios, aprecia-              dios (decimales). Tal es el caso, por ejem-
ciones, rumores... También hay otros que se refieren a ciertas características de personas             plo, del peso o la estatura de las personas,
u objetos, características que son susceptibles de clasificación; por ejemplo, el género               o la velocidad de un carro...
(sexo) de las personas, su color de piel, su nacionalidad, su lugar de residencia, sus creen-
cias religiosas, sus inclinaciones políticas...; o las clases de animales, de plantas..., los tipos       Claro que, para estas variables, los ins-
de viviendas...                                                                                       trumentos de medición tienen sus limitacio-
                                                                                                      nes y siempre se termina por fijar la preci-
    Finalmente, hay otros elementos que nos proporcionan información y que son sus-                   sión de las medidas hasta cierto punto. Por
ceptibles de algún tipo de medición cuantitativa, es decir, que pueden presentarse como               ejemplo, en la estatura se llega hasta los
números que se refieren a múltiples aspectos o fenómenos: costos de los alimentos, de los              centímetros: 1 m y 52 cm, ó 152 cm; y en el
servicios, de las medicinas...; temperaturas ambientes a lo largo de un día o de un año, o            peso, hasta los hectogramos: 37,5 Kg; rara
niveles de humedad en las distintas regiones del país; calificaciones de nuestros alumnos;             vez se detallan con más precisión...
distribución de la población nacional de acuerdo a su género, a sus edades, o a su ubica-
ción por departamentos, provincias o estados; porcentajes anuales de mortalidad infantil;                  1. Identifique cada una de las siguien-
resultados de encuestas de opinión sobre innumerables temas...                                         tes variables como cualitativa o cuantita-
                                                                                                       tiva; en este último caso, determine si es
   Las características de los objetos o personas que son susceptibles de clasificación o                discreta o continua:
de medición cuantitativa suelen presentar rasgos de variabilidad; por ejemplo, existen
diversos colores de la piel o de los ojos, diversas nacionalidades, diversos precios de las              a) Estado civil
cosas y de los servicios, diversas calificaciones escolares, diversas estaturas y pesos en las            b) Ingresos mensuales familiares
personas, etc. En razón de esta variabilidad, tales características se denominan variables.              c) Número del documento de identi-
                                                                                                         dad
    Por lo que acabamos de decir, ya vemos que las variables pueden ser de dos tipos:                    d) Peso de una persona
                                                                                                         e) Número de páginas de un libro
    • Cualitativas (también llamadas atributos): sólo susceptibles de clasificación.                      f) Profesión u ocupación
    • Cuantitativas: susceptibles de medición numérica.                                                  g) Estatura de una persona
                                                                                                         h) Simpatía por un movimiento políti-
    Entre estas últimas encontramos dos maneras de medir. La primera se refiere y aplica                  co
a las características que se miden por medio del conteo. Por ejemplo, las inasistencias                  i) Temperatura ambiente
diarias de los alumnos de nuestra escuela; o el número de personas que habitan en la                     j) Precio del transporte público

6
k) Número de personas del grupo fa-         de características ambientales..., que portan   son las estadísticas propias de esa variable
   miliar                                      alguna información relativa a la variable que   poblacional. Esta expresión se deriva del
   l) Número de calzado                        se estudia: el género, la edad, la ubicación    término Estadística, utilizado para designar
   m) Mascota o animal preferido               geográfica, o las opiniones de las perso-        a la ciencia que se ocupa del tratamiento
                                               nas; la tasa de mortalidad de los niños; los    de la información; es decir, de estudiar los
    Conviene diferenciar a las variables       precios de los objetos y de los servicios; la   fenómenos de cualquier tipo por medio de
cualitativas y cuantitativas por otro rasgo.   temperatura o grado de humedad de nues-         datos observados y cuantificados, que son
Las primeras manifiestan su variabilidad        tro ambiente; las calificaciones de nuestros     recogidos, organizados, representados y
en el abanico de categorías en que se cla-     alumnos... Cada uno de los elementos de         analizados con el fin de precisar su signi-
sifican, categorías que no mantienen una        una población (sean personas, objetos, etc.)    ficado e inferir, en lo posible, predicciones
relación de orden entre sí.                    recibe el nombre de individuo.                  de cara al futuro. Para todas estas tareas
                                                                                               contamos, pues, con métodos estadísticos.
    Por ejemplo, no es posible establecer           Los resultados de la medición de una
cuál de los colores está por encima de los     variable en el seno de una población reci-          El nombre de Estadística se atribuye al
otros, o cómo se ordenan las diversas na-      ben el nombre de datos. Los datos –sean         economista alemán Gottfried Achenwall
cionalidades u ocupaciones... (claro que       categorías o clases de un atributo, o núme-     (siglo XVIII), quien lo derivó del término
hay quien lo hace, pero por razones exter-     ros- reflejan la variabilidad de la caracte-     “estadistas” aplicado a los empleados del
nas a las propias variables: gustos, razones   rística estudiada en esa población. En este     Estado dedicados a elaborar los censos po-
subjetivas, ansias de poder y dominio...).     sentido, los datos son mediciones en un         blacionales, (censos de los que se tienen
                                               contexto específico, condición indispensa-       registros históricos mucho más antiguos).
    En cambio, entre los valores que pue-      ble para que puedan transmitir información      Los campos de aplicación iniciales fueron
den tomar las variables cuantitativas sí       (Moore, 1998).                                  los demográficos y los económicos.
existe un cierto orden. Por ejemplo, es po-
sible ordenar los valores de las estaturas,        Por ejemplo, el número 3,2 no nos                Pero volvamos al hilo conductor de
de las edades de las personas, de los nú-      aporta información alguna; pero si decimos      nuestra reflexión. Tenemos que aprender a
meros de páginas de los libros, etc.           que una niña pesó 3,2 Kg al nacer, sí po-       convivir con la información, a seleccionar-
                                               demos establecer algunas interpretaciones       la, a quedarnos con la que nos puede ser
    Por esta razón se dice que las variables   acerca de su estado saludable en el mo-         útil. Porque esa lluvia de información debe
cualitativas se miden en una escala nomi-      mento de su nacimiento. Y si disponemos         tener un objetivo para nosotros; en otras
nal (sus valores se reducen a los “nom-        de una colección de datos similares como,       palabras, debemos estar en condiciones de
bres” de las categorías en que se clasifica     por ejemplo, los pesos de los niños nacidos     responder a la pregunta: ¿Para qué nos sir-
el atributo) y que las variables cuantitati-   en la población en estudio durante un lapso     ve la información?
vas se miden en una escala ordinal (tiene      de tiempo determinado, tendremos nuevos
sentido ordenar sus valores).                  elementos informativos para interpretar el          Probablemente ya tenemos alguna res-
                                               peso de nuestra recién nacida; por ejemplo,     puesta a esa cuestión. Primero, para man-
   Dentro de toda esta diversidad, hay al-     si está dentro de lo normal, o no.              tenernos en conexión con nuestro mundo
gunos rasgos comunes a destacar. En primer                                                     y con quienes lo comparten con nosotros,
lugar, las variables y los resultados de las       Todos sabemos el nombre de estas lis-       familiares, colegas, alumnos, personas de
mediciones se refieren a poblaciones, que       tas o colecciones de datos referidos a una      nuestra comunidad, compatriotas... Nece-
son los conjuntos de personas, de objetos,     variable de una determinada población:          sitamos compartir un saber, un conocer; es

                                                                                                                                        7
preciso estar enterados, no descolgarnos de su desarrollo físico y a su salud, características familiares, condiciones socioeconómicas,
los demás ni del mundo.                     anotaciones acerca del rendimiento escolar...).

     Pero también –y sobre todo- necesita-             Si nos limitásemos al simple registro y posterior archivo de esos datos, la información
mos la información para tomar decisiones.         recolectada no tendría ninguna relevancia ni trascendencia. Pero si, por el contrario, or-
Y esto, en todos los niveles de nuestra vida:     ganizamos y analizamos las diversas relaciones entre ellos, podremos establecer conclu-
familiar, profesional, social, política, cultu-   siones interesantes en relación con los grupos estudiados, así como compararlos entre
ral... Si no disponemos de la información         sí. E, incluso, podremos llegar a ver que las regularidades que presentan algunas de esas
adecuada, podemos errar en nuestras de-           características nos permitirán inferir conclusiones acerca de los rasgos que tendrán las
cisiones.                                         poblaciones de estudiantes futuros.

    De modo que manejar oportunamen-                 Por otro lado, resulta muy importante la tarea de lograr que nuestros alumnos com-
te la información se ha convertido en una         prendan y sepan utilizar las herramientas estadísticas, con el fin de facilitarles la interpreta-
competencia imprescindible en nuestra             ción de la información que les llega, la organización y presentación de la que ellos pueden
vida. Para alcanzar esa competencia, para         producir, y la correcta toma de decisiones.
saber procesar la información, es muy con-
veniente que ésta venga expresada de una              Estamos, pues, a las puertas de un campo bien interesante, bien útil, bien sencillo... y
manera organizada. Así se nos facilitará la       asequible desde los primeros niveles de escolaridad. No pensemos, de entrada, en cosas
tarea de interpretarla como es debido y to-       complicadas. El requisito básico para adentrarnos en la Estadística es tener hábitos de
mar las decisiones del caso.                      organización. Con esta predisposición no nos debe costar ir adquiriendo las técnicas co-
                                                  rrespondientes que, por lo demás, son muy lógicas y asequibles.
    Pero no siempre la información circula
del entorno hacia nosotros. También ca-
mina en sentido inverso, también nosotros
somos productores de información. Y en                2. ¿Qué hacemos con los datos?
este caso, sigue siendo válida la necesidad
de expresarla de manera organizada, para
que sus receptores puedan interpretarla sin          2.1. En primer lugar, reconocer su necesidad
dificultad y sentirse apoyados en su toma
de decisiones.                                        Quizá la proposición de –antes que nada- reconocer la necesidad de los datos puede
                                                  llamar la atención de más de un(a) lector(a). Porque estamos acostumbrados a la idea de
    De las consideraciones anteriores po-         que las tareas estadísticas significan exclusivamente la recolección de datos, la elabora-
demos derivar las razones del interés que         ción de tablas, de gráficos, el cálculo de la media, la determinación de la moda...; es decir,
la Estadística puede tener para nosotros, no      en Estadística hay que “hacer cosas” con los datos y para ello existen una serie de fórmulas
sólo como ciudadanos sino, particularmen-         y procedimientos a utilizar correctamente.
te, como docentes. A este respecto, recor-
demos todos los registros que anualmente       Sin embargo, si queremos hacer “nuestra” la Estadística, tenemos que empezar por
efectuamos en la escuela, referidos a di- indagar nuestra actitud ante las situaciones de la vida real; tenemos que preguntarnos
versas características de nuestros alumnos si deseamos comprenderlas para manejarlas adecuadamente y tomar las decisiones más
(grado, género, edad, aspectos referidos a pertinentes frente a ellas.

8
Sobre esta base se apoya la Estadística;    ción, aunque sin negar ni agotar su riqueza     estadísticos nos permite, no sólo asimilar la
y, en particular, sobre la hipótesis de que      y su originalidad. Dentro de ciertos límites,   información que contienen sino, además,
muchas situaciones de la vida real sólo pue-     los métodos estadísticos nos permiten bus-      observar la forma en que se presentan.
den ser comprendidas a partir del análisis       car explicaciones y causas de la variación y,
de un conjunto de datos de carácter cuan-        sobre todo, aprender del contexto.                  Pero, como hemos dicho antes, noso-
titativo que hayan sido recogidos en forma                                                       tros mismos podemos señalar alguna va-
adecuada.                                            Reúnase con sus compañeros(as) y tra-       riable que nos interesa en nuestro desem-
                                                 te de hacer una lista de aquellas variables     peño profesional y, seguramente, también
    Así, como decíamos en el ejemplo ante-       de su entorno cuyos datos pueden resultar       podemos recolectar datos referentes a esa
rior, el peso de 3,2 kg de una niña al nacer     de interés para su desempeño profesio-          variable. Tomemos, por ejemplo, el núme-
cobra todo su sentido cuando “disponemos         nal.                                            ro de inasistencias diarias de alumnos a
de una colección de datos similares como,                                                        nuestra escuela durante un mes (20 días).
por ejemplo, los pesos de los niños nacidos         2.2. En segundo lugar, recolectarlos         Estos datos pueden proporcionarnos cierta
en la población en estudio durante un lapso                                                      información acerca de la vida escolar, sobre
de tiempo determinado”. Lo mismo pode-               ¿Dónde recolectamos los datos? Bueno,       todo si se comparan con los de otros meses
mos decir de la consideración del peso y la      hay muchos datos que se producen regu-          del año escolar; es decir, tienen interés para
estatura, o de las calificaciones escolares,      larmente, con una periodicidad al menos         nosotros.
de uno solo de nuestros alumnos.                 anual. En cada uno de nuestros países,
                                                 todos los ministerios y despachos guber-            Supongamos que estos son los datos,
     Ahora bien, tenemos que reconocer que       namentales elaboran sus Anuarios, con los       día a día, empezando por el primer lunes:
la observación de un caso aislado, o recu-       datos y tablas referentes a sus actividades     {15, 19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21,
rrir a la experiencia de una sola persona, o     y a las variables poblacionales que son de      23, 26, 24, 21, 20, 17, 15, 12}.
intentar encontrar evidencias determinantes      su incumbencia. En todos ellos existen tam-
en un suceso anecdótico, puede confundir-        bién instituciones nacionales de Estadística,      2.3. En tercer lugar, organizar su
nos y llevarnos a una toma de decisiones         encargadas de recopilar los datos estadísti-       presentación
equivocada (Batanero, 2002).                     cos de interés para estudiosos y curiosos...
                                                 En el campo educativo, desde cada escuela          ¿Qué hacemos con esos 20 datos (N
    Por ello, resulta muy importante percibir    y desde cada instancia municipal, regional      = 20)? Podemos hacer muchas cosas; por
y valorar la variación que afecta a esas ca-     y nacional, se producen cantidades de da-       ejemplo:
racterísticas (variables) que se manifiestan      tos propios de este ámbito educativo.
en una forma cuantitativa en nuestro entor-                                                          1. Ordenarlos de menor a mayor: {11,
no. Los datos nos hablan de la presencia de          Incluso, son muchos los bancos de datos     12, 13, 15, 15, 17, 17, 17, 18, 18, 18, 19, 19,
la variabilidad en muchas de las situaciones     que son publicados por organismos interna-      20, 20, 21, 21, 23, 24, 25}. O, también, de
que conforman nuestra vida. De entrada,          cionales, en los cuales se recogen y compa-     mayor a menor. Eso nos permite observar
percibimos que no todo es uniforme, hecho        ran los que se producen en cada uno de los      y anotar los valores mayor y menor: 26 y
con una sola medida (afortunadamente).           países involucrados. En lo que a Latinoamé-     11, respectivamente. O el valor (los dos va-
                                                 rica se refiere, tenemos a la mano los ban-      lores, en este caso) que se encuentra(n) en
    Ante este panorama, la Estadística nos       cos de datos presentados por la UNESCO,         el medio de los datos. O el (los) que más
ofrece algunos métodos para intentar com-        la OEA, la CEPAL-ECLAC (2005), etc., entre      veces se repite(n)...
prender y analizar, en lo posible, esta varia-   otros muchos. La lectura de estos cuadros

                                                                                                                                              9
2. Presentarlos en una tabla en la que se      Datos agrupados          Frecuencias         ción de ciertos valores más representativos
señale cada número de inasistencias (dato)                                   (N = 20)          de la misma.
con el número de veces (frecuencia) con el
                                                      11 al 14                  3
que aparece (distribución de frecuencias):                                                          La segunda forma de representar los da-
                                                      15 al 18                  8              tos (distribución de frecuencias) es la que
      Datos          Frecuencias (N = 20)                                                      mejor y con más detalle nos permite resu-
                                                      19 al 22                  6              mir todos los datos y volverlos a “leer” orga-
        11                     1                                                               nizadamente. La tercera forma (distribución
                                                      23 al 26                  3              de frecuencias para datos agrupados) es, a
        12                     1                                                               su vez, un resumen de la anterior, y es muy
                                                   Quizás al (a la) lector(a) se le puedan     útil cuando los datos son muy numerosos y
        13                     1               ocurrir otras formas de representar los datos   están muy dispersos o presentan frecuen-
                                               anteriores, o algunas particularidades de los   cias muy bajas. Se pierde algo del detalle
        15                     2               mismos; pero vamos a quedarnos con las          que ofrece la forma de representación ante-
                                               tres señaladas. Veamos algunas caracterís-      rior, pero nos permite una lectura más sin-
        17                     3               ticas de algunas de ellas.                      tetizada de la distribución de los datos.

        18                     3                   La primera nos permite determinar el            Suponga que en el siguiente mes, que
                                               rango o recorrido de la distribución, es        tiene 23 días lectivos, se recolectan estos
        19                     2               decir, determinar la amplitud del intervalo     datos de inasistencia diaria de alumnos a
                                               en que se mueven los valores. La forma de       la escuela: {12, 11, 12, 13, 14, 13, 15, 16,
        20                     2               calcularlo es restar los valores extremos; en   14, 15, 18, 16, 19, 15, 21, 20, 24, 23, 22,
                                               nuestro ejemplo, el rango de los datos es:      23, 23, 23, 22}.
        21                     2               26 – 11 = 15.
                                                                                                     a) Determine los valores extremos de
        23                     1                   Ese resultado no coincide con el nú-          la distribución
                                               mero de valores diferentes que podrían                b) Calcule el rango de la distribución
        24                     1               aparecer entre los valores extremos de la             c) Ordene los datos de mayor a me-
                                               colección de datos. Para obtener este últi-       nor
        26                     1               mo número volvemos a restar estos valores             d) Elabore la tabla de distribución de
                                               extremos... y sumamos 1 unidad; en nues-          frecuencias correspondiente
                                               tro ejemplo es: 26 – 11 + 1 = 16. Si alguien          e) Forme intervalos o clases de am-
    3. Como en la tabla anterior aparecen      duda por qué se debe sumar 1 unidad, pón-         plitud 4 (de 10 a 13, etc.) y elabore la
muchos datos diferentes (12), podemos          gase a contar cuántos valores seguidos hay        correspondiente tabla de distribución de
pensar en agruparlos un poco y presen-         desde 11 hasta 26, ambos incluidos.               frecuencias
tarlos en otra tabla en la que se señalen
las inasistencias agrupadas por intervalos        Esa primera forma de representación or-          La representación de los datos, particu-
o clases, con el número de veces en que        denada de los datos va a tener utilidad más     larmente las referentes a la distribución de
se presentan (distribución de frecuencias      adelante, a la hora de analizar la distribu-    frecuencias y a la distribución de frecuen-
para datos agrupados):                         ción de los mismos, mediante la determina-      cias de datos agrupados, puede hacerse

10
también de forma gráfica y no sólo mediante las tablas del tipo que acabamos de presen-                 También puede construirse una gráfica
tar (forma tabular).                                                                                de barras correspondiente a la tabla que re-
                                                                                                    coge la distribución de los datos agrupados
    Tomemos el ejemplo de la distribución de frecuencias antes presentada. Para llevarla            en clases. Para nuestro ejemplo:
a una gráfica, vamos a trazar dos segmentos perpendiculares (ejes), con sus marcas o
medidas correspondientes; en el horizontal vamos a colocar, ordenados, los valores de                8
la variable (número de inasistencias diarias) y en el segmento vertical, las frecuencias de          7
esos valores.
                                                                                                     6
    Marcados así esos dos segmentos, vamos a levantar, en cada punto del eje horizontal,             5
un segmento perpendicular cuya medida sea exactamente la de la frecuencia correspon-                 4
diente a ese valor de la variable. Haciendo esta tarea para cada uno de los valores de la
variable, llegamos a esta gráfica:                                                                    3
                                                                                                     2
                                                                                                     1
                                                                                                         11    14 15     18 19     22 23     26

                                                                                                        Tome ahora los datos y las tablas co-
                                                                                                    rrespondientes a las inasistencias del se-
                                                                                                    gundo mes, y elabore:

                                                                                                       a) la gráfica de barras
    Esta representación recibe el nombre de gráfica de barras. Obsérvese que para con-                  b) el polígono de frecuencias
servar la secuencia de los valores de la variable, desde 11 hasta 26, se han marcado los               c) la gráfica de barras para los datos
valores 14, 16, 22 y 25, cuya frecuencia es 0. También puede “invertirse” la gráfica, es             agrupados en clases (10 a 13, etc.)
decir, colocar en el eje vertical los valores de la variable y en el eje horizontal, las frecuen-
cias de esos valores.                                                                          Hasta ahora hemos trabajado con una
                                                                                           variable (inasistencias diarias de los alum-
    Si se toman solamente los vértices superiores de los segmentos o barras verticales co- nos a la escuela) discreta. Veamos un ejem-
rrespondientes a las frecuencias, se construye una nueva gráfica, conocida como polígono plo para una variable continua, como el
de frecuencias. Para nuestro ejemplo:                                                      peso o la estatura de las personas.

                                                                                                        En nuestro medio escolar, el conoci-
                                                                                                    miento (y seguimiento) del peso y de la
                                                                                                    estatura de nuestros alumnos tiene su im-
                                                                                                    portancia, ya que éstos se encuentran en
                                                                                                    pleno proceso de desarrollo; vale la pena,
                                                                                                    pues, recolectar los datos correspondientes
                                                                                                    e, incluso, hacerlo periódicamente.

                                                                                                                                            11
En cuanto a la organización de su pre-       cuarto, en 38,1 + 3,1 = 41,2. A partir de estos valores deducimos cuáles son los valores
sentación, que es lo que ahora nos ocupa,        mayores de cada intervalo: 34,9; 38; 41,1 y 44,2 (observe que la diferencia entre dos de
enseguida percibimos que lo más práctico         estos valores seguidos es también 3,1.
es distribuir los datos individuales en clases
o intervalos ya que, con seguridad, habrá           Ahora podemos construir la tabla que representa la distribución de datos agrupados:
muchos datos diferentes. De aquí se sigue
que las representaciones más apropiadas
                                                                Datos agrupados                            Frecuencias (N = 31)
para estos datos serán la tabla y la gráfica
correspondientes a la distribución de datos
agrupados.                                                       De 31,9 a 34,9                                     8

   Supongamos que los pesos de 31 alum-
nos de una clase son (en Kg): {37,8; 35,6;                        De 35 a 38                                       15
34; 31,9; 40,5; 34,2; 35,6; 38,7; 32,8; 35,4;
41,6; 39,8; 34,5; 37; 42; 36,6; 31,9; 36,5;
35,7; 36; 38; 44,1; 37,2; 36,8; 35; 33,5;                        De 38,1 a 41,1                                     4
38,9; 37,5; 34; 36,5; 42,5}.
                                                                 De 41,2 a 44,2                                     4
    La primera actividad de observación nos
lleva a buscar los valores extremos; éstos
son: 31,9 y 44,1 Kg. Ahora podemos deci-             y la gráfica correspondiente, que en el caso de las variables continuas, se denomina
dir en cuantas clases o intervalos dividimos     histograma (histos [tejido] + gramma [gráfico]):
el grupo, tomando en cuenta que tampoco
nos conviene tener un número excesivo de                                                           Obsérvese que en el histograma los rec-
clases; para nuestro caso, un número apro-                                                     tángulos se adosan unos a otros, ya que la
piado puede ser 4 ó 5 clases.                                                                  variable es continua. Por esta razón, en el
                                                                                               eje horizontal se colocan valores divisorios
     Supongamos que optamos por 4 clases.                                                      de las sucesivas clases o intervalos. ¿Cómo
Esto significa que el gran intervalo entre los                                                  se obtiene cada uno de ellos? Se toman dos
valores extremos (de 31,9 a 44,1), cuya di-                                                    valores sucesivos, el final de una clase y el
ferencia es 12,2, debe repartirse en cuatro                                                    inicial de la clase siguiente, y se busca el
lotes de igual tamaño. El tamaño de cada                                                       valor intermedio.
intervalo debe ser, pues, el cociente de 12,2
/ 4, que es 3,05, que puede redondearse a            Por ejemplo, 34,95 es el valor intermedio entre 34,9 (valor final del primer intervalo)
3,1.                                             y 35 (valor inicial del segundo intervalo). Calculado uno de estos valores divisorios, los
                                                 demás pueden obtenerse agregando o restando el valor de la amplitud del intervalo (3,1).
   Esto significa que si el primer intervalo      Así se llega, en particular, a los valores divisorios extremos (31,85 y 44,25).
empieza en el valor menor (31,9), el segun-
do debe empezar en 31,9 + 3,1 = 35; el ter-         Recolecte los datos de peso y de estatura de los alumnos de su clase y elabore, para
cero debe empezar en 35 + 3,1 = 38,1; y el       cada variable, la tabla y la gráfica de la distribución de datos agrupados correspondiente.

12
2.4. En cuarto lugar, analizarlos                La tabla de distribución de frecuencias       Datos       Frecuencias     Frecuencias
                                              nos permite volver a encontrar y, además,        agrupados       (N = 20)      acumuladas
    Los dos puntos anteriores, referidos      ampliar la información anterior. Por ejem-
a la recolección de datos y a la orga-        plo, nos permite averiguar en cuántos días           11             1               1
nización de su presentación, no tienen        del mes se contaron 20 ó más inasistencias
ningún sentido si no desembocan en un         (este dato puede ser de interés si, por ejem-        12             1               2
análisis de los mismos. Porque recorde-       plo, 20 es un número crítico para la escue-          13             1               3
mos que los datos –y la información que       la, en el sentido de que cuando se alcanzan
se deriva de ellos- tienen como objetivo      o superan las 20 inasistencias diarias, se de-       15             2               5
facilitar nuestra toma de decisiones.         termina una emergencia escolar...).
                                                                                                   17             3               8
    El análisis de los datos es un campo          ¿Cómo calcular ese número de días                18             3               11
muy complejo, cuyo desarrollo ocupa el        del mes en que se contaron 20 ó más in-
espacio más extenso e importante de la        asistencias diarias? A partir de la tabla de         19             2               13
Estadística (lo que se llama la Estadística   distribución de frecuencias, basta con su-
Inferencial). En este Cuaderno no vamos       mar las frecuencias correspondientes a los           20             2               15
a entrar en él. Pero sí vamos a propo-        datos 20, 21, 23, 24 y 26 (2 + 2 + 1 + 1
                                                                                                   21             2               17
nernos analizar y sacar conclusiones de       + 1 = 7): durante 7 días las inasistencias
estas primeras formas sencillas de orga-      llegaron a 20 o estuvieron por encima de             23             1               18
nizar los datos (Estadística Descriptiva),    ese número.
con el fin de percibir cómo la informa-                                                            24             1               19
ción ya fluye realmente de ellos.                 Como se ve, la tabla de distribución de
                                                                                                   26             1               20
                                              frecuencias puede servirnos para obtener
    Volvamos a nuestro primer ejem-           información nueva referida a la acumula-
plo, el de las inasistencias diarias de los   ción de frecuencias entre ciertos valores de         Como se puede observar, la frecuen-
alumnos a la escuela, y las tres formas       la variable. Por ejemplo, podemos pregun-        cia acumulada correspondiente al valor
en que organizamos su presentación (or-       tar cuántos datos estuvieron por debajo de       más alto debe coincidir con el total de
denados de menor a mayor, la tabla de         tal valor, o entre dos valores dados, o fue-     la población estudiada (20). Si queremos
distribución de frecuencias, y la tabla de    ron superiores a determinado valor.              saber durante cuántos días el número de
distribución de frecuencias para datos                                                         inasistencias diarias estuvo por debajo de
agrupados).                                       Para responder más directamente a            18, basta con leer la frecuencia acumula-
                                              este tipo de tareas, podemos construir una       da correspondiente a 17: durante 8 días.
    La primera forma de organización          nueva tabla de distribución de frecuencias       Y para saber durante cuántos días estuvo
nos sugiere que el número de inasisten-       en la que aparece una nueva columna, la          por encima de 19 (la pregunta inicial),
cias diarias, durante el mes estudiado,       referente a las frecuencias acumuladas;          basta restar de 20 la frecuencia acumula-
oscila entre una y dos docenas, aproxi-       es decir, para cada dato, además de su           da correspondiente a 19: 20 – 13 = 7.
madamente; que es irregular, es decir,        frecuencia propia, vamos a anotar la suma
que varía de día en día; y que el número      de las frecuencias correspondientes a los            2. ¿Tiene algún sentido elaborar una ta-
más frecuente de inasistencias ha sido        datos inferiores, más la suya propia. En         bla con frecuencias acumuladas cuando se
de 17 y 18 (3 veces cada uno).                nuestro ejemplo sería:                           trata de una variable cualitativa? ¿Por qué?

                                                                                                                                       13
Siguiendo con el análisis de las inasis-          La organización de los datos en esta ta-       • Comparar los mismos días de cada se-
tencias diarias, nos damos cuenta de que          bla de doble entrada nos permite otro tipo     mana: Por ejemplo, los lunes no han sido,
la tabla de distribución de frecuencias para      de análisis:                                   durante este mes, los días críticos para la
datos agrupados no nos aporta mayor infor-                                                       inasistencia escolar; tampoco los viernes.
mación adicional: solamente que la mayoría            • Comparar las semanas: Desde el final      No se manifiestan hábitos de ausencia alre-
de los datos (8 de 20) está en el intervalo de    de la 2a semana y, particularmente, durante    dedor del fin de semana...
15 a 18 inasistencias diarias [Notemos que        la 3a, hubo un notable incremento de inasis-
también es posible elaborar la columna de         tencias; esto nos dice que la tercera sema-        Como se puede apreciar, ninguna de
frecuencias acumuladas para el caso en que        na ocurrió algo particular, actuó una causa    estas informaciones nos ha sido propor-
los datos vengan agrupados en clases].            especial (alguna enfermedad, inclemencias      cionada por las herramientas estadísticas
                                                  climáticas...) cuyo efecto posiblemente fue    de organización de los datos que hemos
    Hemos utilizado tres de las herramien-        menguando durante la última semana....         manejado con anterioridad. Esta afirmación
tas habituales de organización de los datos                                                      nos reafirma en el convencimiento de que
para analizar los datos relativos a una va-                                                      el último tipo de organización de los datos
riable (también podíamos habernos servido                                                        que hemos manejado es pertinente para su
de las representaciones gráficas correspon-                                                       registro y análisis, ya que se trata de una
dientes...). Sin embargo, esto no significa                                                       secuencia de datos en el tiempo y, en este
que hayamos agotado todas las posibles                                                           caso, es de suma importancia no perder el
vías de su representación y análisis subse-                                                      carácter temporal de la información.
cuente.
                                                                                                     De todo lo anterior queremos extraer
    Por ejemplo, podíamos haber separado                                                         algunas conclusiones importantes:
los datos de inasistencias en lotes de a cin-
co días, con el fin de destacar lo que ocu-                                                           • Hay que saber seleccionar, en cada
rrió cada semana, de lunes a viernes: (15,                                                       caso, los instrumentos estadísticos de or-
19, 18, 18, 17), (17, 11, 13, 19, 18), (20, 21,                                                  ganización de los datos que nos puedan
23, 26, 24), (21, 20, 17, 15, 12). O también                                                     aportar información pertinente. En nuestro
de esta manera:                                                                                  ejemplo, no nos interesa la distribución de
                                                                                                 frecuencias para los datos agrupados en cla-
                    No de inasistencias                                                          ses, ya que no aporta nada adicional.
  Semana
              Lun    Mar   Mié    Jue     Vie                                                        • No debemos cerrarnos a la posibilidad
                                                                                                 de construir y utilizar otras formas adiciona-
 1a          15     19     18     18      17                                                     les de organización de los datos, con el fin
                                                                                                 de extraer información valiosa. En nuestro
 2a          17     11     13     19      18                                                     ejemplo, la tabla de doble entrada resultó
                                                                                                 ser un instrumento de registro que permitió
 3a          20     21     23     26      24                                                     obtener información adicional muy perti-
                                                                                                 nente.
 4a          21     20     17     15      12


14
Tome el ejemplo de los pesos de los 31 alumnos antes considerado, analice los datos               • El ahorro prácticamente no cuenta
presentes en la tabla correspondiente y llegue a algunas conclusiones.                           para las familias; puede presumirse que
                                                                                                 no hay cultura de ahorro o que, con más
    He aquí una gráfica de barras relativa a la distribución porcentual del ingreso familiar      seguridad, las necesidades básicas son tan
para atender a los gastos correspondientes a los rubros indicados (datos de uno de nues-         perentorias que no existe la posibilidad de
tros países latinoamericanos, año 2003):                                                         ahorrar.
                                                                                                     • En resumen, se trata de la distribución
                                                                                                 propia de un país en el que la población
                                                                                                 destina el ingreso familiar prácticamente
                                                                                                 para intentar garantizar la supervivencia
                                                                                                 del día a día...

                                                                                                     La información contenida en esta gráfica
                                                                                                 puede ser todavía mayor si, por ejemplo, los
                                                                                                 datos se recolectan periódicamente, lo que
                                                                                                 permitiría un seguimiento temporal con el
                                                                                                 fin de analizar las variaciones poblacionales
                                                                                                 en la distribución de su ingreso familiar.

                                                                                                     Cuando se trata de una variable cuali-
                                                                                                 tativa cuya distribución en categorías viene
                                                                                                 cuantificada en porcentajes, puede utili-
                                                                                                 zarse también otro tipo de representación,
                                                                                                 denominada gráfica circular o de pastel.
                                                                                                 Veamos un ejemplo similar al anterior, en el
                                                                                                 que se muestra la distribución de los gastos
                                                                                                 mensuales de un estudiante universitario
                                                                                                 fuera de su casa (Shadian, 1998):
                                                                                                                8%
   Obsérvese que la variable distribución porcentual del ingreso familiar es cualitativa, y                                        38%
que sus categorías son, precisamente los rubros o áreas de necesidad indicadas. Por otro
                                                                                                     10%
lado, las barras son horizontales y, en lugar de las frecuencias de cada valor de la variable,
aparecen los porcentajes correspondientes.                                                        14%
   ¿Qué información podemos inferir de esta gráfica? Pues, entre otras cosas:
                                                                                                     30%
    • Un poco más de la tercera parte del ingreso (35,4 %) se dedica a alimentación; este
rubro aparece como prioritario.                                                                      Alimentación
    • Los rubros de alimentación, vivienda y servicios, y transporte son los que absorben            Renta                Libros
casi las dos terceras partes (63,6 %) del ingreso familiar.                                          Ropa                 Otros
                                                                                                                                          15
Como se ve, los porcentajes no se representan como barras de diferente longitud, sino          Y saquen sus conclusiones acerca de
como sectores circulares de diferente área (ver Cuaderno 15). Las áreas de estos sectores       las posibilidades que tiene la escuela para
son proporcionales a los números que indican los porcentajes; a mayor (menor) porcen-           satisfacer los deseos de los niños y niñas;
taje, mayor (menor) área del sector, es decir, mayor (menor) abertura del ángulo central        por ejemplo, ¿existen las instalaciones, los
correspondiente.                                                                                preparadores y los implementos que esos
                                                                                                deportes requieren?; ¿se organizan periódi-
  Para determinar la medida de este ángulo central podemos utilizar una regla de tres           camente competiciones o campeonatos de
muy sencilla:                                                                                   esas disciplinas deportivas?; ¿se valoran y
                                                                                                estimulan los logros de los alumnos y alum-
               Porcentaje (%)             Medida del ángulo central del sector circular         nas en sus prácticas deportivas?...¿cómo
                    100                                       360o                              mejorar las situaciones deficientes?
                     p                                          a

    De esta forma, si conocemos el porcentaje correspondiente a una categoría de la varia-
ble, obtendremos el ángulo del sector circular así: a = px 360 . En caso de que conozcamos
                                                         100
                                                                                   ax100
                                                                                                    3. Las medidas de
este ángulo, podemos calcular el porcentaje correspondiente de esta forma: p =             .
                                                                                    360             tendencia central
    En el ejemplo, verificamos primero que la suma de los porcentajes sea 100 (hágalo). A
partir de ahí, al porcentaje del 38 % le corresponde un ángulo central cuya medida es a =
(38 x 360)/100 = 136,8o; y así se calculan todas las demás medidas. Luego, se traza una             Ya hemos visto lo que podemos hacer
circunferencia y, con ayuda de un transportador, se van montando los sucesivos ángulos          con los datos: valorarlos, recolectarlos,
centrales adosando cada uno al anterior.                                                        organizar su presentación y analizarlos.
                                                                                                Vamos a verlos ahora desde otra perspec-
   3. a) Si el estudiante del ejemplo anterior necesita 20.000 pesos en un mes dado,            tiva. Por ejemplo, podemos preguntarnos si
   ¿cuánto gasta en alimentación durante ese mes?                                               existe(n) algún(os) dato(s) que sea(n) como
   b) Si durante otro mes mantiene sus porcentajes de gastos y compra ropa por 2.100            especial(es), que pueda(n) mostrarnos algu-
   pesos, ¿a cuánto ascienden sus gastos de ese mes en libros?                                  na característica muy particular de nuestra
                                                                                                colección de datos o que pueda(n), incluso,
    Hagan una pequeña encuesta en su escuela pidiendo por separado, a los niños y a las         representar a la colección completa.
niñas, que indiquen cuál es el deporte de su preferencia. En cada uno de los dos casos,
tomen los cuatro deportes más destacados y agrupen los demás como “Otros”. Conviertan               En el punto 2.3., al presentar los datos
las frecuencias de selección en porcentajes (la suma de éstos debe ser igual a 100).            ordenados de menor a mayor (o viceversa),
                                                                                                decíamos que tal orden nos permite obser-
    Con esta información, construyan las dos gráficas circulares correspondientes. A partir      var y anotar los valores mayor y menor,
de ellas, analicen las preferencias manifestadas por los alumnos (niños y niñas), por separa-   o el valor que se encuentra en el medio
do y comparativamente; valoren los pros y contras (si existen) de la práctica de cada uno de    de los datos, o el (los) que más veces se
los deportes señalados (individualismo vs. labor de equipo; posibilidades de inclusión o de     repite(n)... A estos valores particulares po-
exclusión de una porción significativa de alumnos; propensión o no hacia la violencia o ha-      demos agregar otro, de uso muy frecuente:
cia la tolerancia; excesiva o moderada competitividad; habilidades que se desarrollan...).      el valor promedio de todos los datos.

16
3.1. La media                                  5. Calcule la media de inasistencias para
                                              los datos del ejemplo inicial: {15, 19, 18, 18,
    El valor promedio de todos los datos 17, 17, 11, 13, 19, 18, 20, 21, 23, 26, 24, 21,
poblacionales recibe el nombre de media. 20, 17, 15, 12}.
Existen diversos tipos de valores promedio,
pero aquí nos vamos a referir a la media          6. Calcule la media de los pesos (en Kg)
aritmética. Para obtenerla, se suman todos de los niños del ejemplo dado anteriormen-
los datos y esta suma se divide entre el nú- te: {37,8; 35,6; 34; 31,9; 40,5; 34,2; 35,6;
mero de datos considerados.                   38,7; 32,8; 35,4; 41,6; 39,8; 34,5; 37; 42;
                                              36,6; 31,9; 36,5; 35,7; 36; 38; 44,1; 37,2;
    4. ¿Tiene sentido calcular la media de 36,8; 35; 33,5; 38,9; 37,5; 34; 36,5; 42,5}.
los datos cuando la variable es cualitativa?
¿Por qué?                                         Con el fin de presentar una fórmula ge-
                                              neralizada para calcular la media de cual-
    En realidad, la media es el valor que quier conjunto de datos, procedemos así:
cada sujeto de la población tendría si se
repartiera “equitativamente” entre todos el       • Denotamos con n el número de datos
valor de la suma total de los datos de la po- del conjunto (31, en el último ejercicio).
blación. La media puede coincidir o no con        • Denotamos los n datos del conjunto
alguno de los datos del conjunto.             con los símbolos x1, x2,..., xn, donde, por
                                              ejemplo, x3 representa el tercer dato (34
     a) Sea el conjunto de datos: {11, 7, 10, Kg, en el último ejercicio) y x18 es el que
 9, 10, 8, 7, 10}                             ocupa la posición 18 (36,5 Kg, en el último
     La media es: (11+7+10+9+8+7+10) / 8 ejercicio).
 = 72 / 8 = 9                                     • Si denotamos la media con el símbolo
     La media coincide con uno de los da- x, la fórmula que permite calcular su valor
 tos del conjunto                             se expresa así:                                       Para calcular la media efectuaríamos la
                                                                                                suma: 11 + 12 + 13 + 15 + 15 + 17 + 17 +
    b) Sea el conjunto de datos: {11, 8, 10,                                                    17 + ...; está claro que podemos abreviar la
8, 10, 8, 7, 10}                                   x=
                                                        x1 + x 2 + x 3 + ... + x n   [1]        suma si los sumandos que se repiten se co-
    La media es: 72 / 8 = 9                                         n                           locan en forma de producto; por ejemplo:
    La media no coincide con ninguno de                                                         11 + 12 + 13 + (2 x 15) + (3 x 17) + ... Estos
los datos del conjunto                             Como se ve, para calcular la media no        paréntesis recogen el producto del dato por
                                                hace falta que los datos estén ordenados, ya    la frecuencia con que aparece; incluso 11
    c) Sea el conjunto de datos: {10, 11, 12,   que la suma es conmutativa.                     puede verse como uno de esos productos,
13, 14, 15, 16, 17, 18, 19}                                                                     ya que la frecuencia de aparición del dato
    La media es: 145 / 10 = 14,5                   Por otro lado, veamos el caso en que los     11 es 1.
     La media no coincide con ninguno de        datos se presentan en una tabla de distri-
los datos del conjunto                          bución de frecuencias, como la del primer           De modo que la suma de todos los da-
                                                ejemplo de inasistencias a la escuela:          tos, uno por uno, puede sustituirse por la

                                                                                                                                          17
suma de los productos de cada dato por la                 Finalmente, nos queda el caso de hallar la media de un conjunto de datos cuando éstos
frecuencia correspondiente. Evidentemente,            se presentan en una tabla de frecuencias para datos agrupados en clases. Para nuestro
ahora habrá menos sumandos; si antes eran             primer ejemplo de inasistencias:
20 datos sueltos a sumar, ahora serán 12,
de los cuales 6 serán pequeños productos                             Datos agrupados                              Frecuencias (N = 20)
(15x2, 17x3, 18x3, 19x2, 20x2, 21x2). De
esta forma, la expresión adecuada para el                               De 11 a 14                                          3
cálculo de la media es:
                                                                        De 15 a 18                                          8
    x=
         x1 . f 1 + x 2 . f 2 + ... + x k . f k [2]
                            n                                           De 19 a 22                                          6

    Obsérvese que en el numerador, el su-                               De 23 a 26                                          3
bíndice del último sumando es k y no n ya
que, como acabamos de decir, ahora habrá                  No podemos utilizar la fórmula [1], ya que desconocemos los datos sueltos; en prin-
menos sumandos, porque algunos datos es-              cipio, tampoco la fórmula [2], por la misma razón. Pero esta última fórmula sí nos brinda
tán repetidos (tienen una frecuencia mayor            un camino para utilizarla en el caso de datos agrupados en clases, ya que en su cálculo
que 1). Es decir, los x1, x2, ..., xk, representan    intervienen frecuencias.
ahora cada uno de los valores distintos de
los datos.                                                Pues bien, ahora también conocemos frecuencias, las de cada clase; la pregunta es:
                                                      ¿por qué valor se va a multiplicar la frecuencia 3, correspondiente a la clase (11, 14) y, así,
     Esta fórmula es, en realidad, una expre-         las demás frecuencias? Hay que seleccionar un valor en cada clase. ¿Qué nos dice la ló-
sión muy relacionada con la [1]; de hecho,            gica, a falta de mayores precisiones? Que seleccionemos el valor que queda exactamente
si todos los datos de una colección fueran            en la mitad del intervalo. ¿Cómo se calcula este valor? Sencillamente, sumando los dos
distintos, sus frecuencias valdrían 1, k se-          extremos de la clase y dividiendo la suma entre 2. Por ejemplo, el valor intermedio en la
ría igual a n (¿por qué?), y la fórmula [2] se        clase (11, 14) es: (11 + 14)/2 = 25/2 = 12,5; este valor equidista de 11 y de 14.
convertiría en la [1].
                                                          Este nuevo valor va a representar a la clase (11, 14) a la hora de calcular la media de
    7. Calcule la media de los datos que              todos los datos; y no importa si pertenece o no al conjunto inicial de datos. A este valor
aparecen en la tabla anterior, aplicando la           intermedio de cada clase se le denomina marca de la clase; vamos a representarlo por
fórmula [2]. Ahora, compare este valor con            m1, m2, ... hasta mj, donde j indica el número de clases que tenemos en la distribución de
el obtenido en el ejercicio 5. ¿Son iguales?          datos agrupados (en nuestro ejemplo, j = 4).

    8. Considere ahora el segundo conjunto               Con todas estas precisiones, la expresión de la media para el caso de datos agrupados
de datos de inasistencias a la escuela pre-           en clases es:
sentado anteriormente: {12, 11, 12, 13, 14,
                                                                                     m . f + m2 . f 2 + ... + m j . f j [3]
                                                                                x= 1 1
13, 15, 16, 14, 15, 18, 16, 19, 15, 21, 20, 24,                                                        n
23, 22, 23, 23, 23, 22}. Obtenga el prome-
dio de inasistencias de la forma que usted               Para facilitar este cálculo, podemos ayudarnos con una tabla más completa que la
desee.                                                anterior:

 18
Marcas de clase            Frecuencias       Marcas x Frecuencias          2. Tomar de entrada un valor imagina-
      Clases                                                                                   rio para la media y luego ajustarlo con los
                             (mj)                      (fj)                (mj x fj)
                                                                                               datos. Veamos qué significa esto. Supon-
      (11, 14)               12,5                       3                     37,5
                                                                                               gamos que las edades de un grupo de 20
      (15, 18)               16,5                       8                     132              niños son las siguientes: 8, 7, 8, 6, 9, 7, 8, 6,
      (19, 22)               20,5                       6                     123              7, 7, 8, 8, 6, 10, 9, 10, 7, 8, 7 y 10 años. En
                                                                                               este caso, tomemos 8 como valor de entra-
      (23, 26)               24,5                       3                     73,5
                                                                                               da de la media de edades de los 20 niños.
      Totales:                                        n = 20                  366              Ahora recorremos ese conjunto de datos y
                                                                                               anotamos la diferencia de cada uno de ellos
                                                  Ahora basta con dividir entre sí los tota-   con respecto a 8:
                                              les de las columnas 4a y 3a: = 366 / 20 =
                                                  18,3. Este es el promedio de inasisten-       Datos    8       7   8   6   9   7   8   6   7       7
                                                   cias diarias durante el mes considera-
                                                   do. Como debe ser un número entero,          dif +                        1
                                                 podemos aproximarlo a 18.                      dif -            1       2       1       2   1       1

                                                 Al comparar este valor con el obtenido en
                                            los ejercicios 5. y 6. (hágalo), quizá descubra-    8 8 6 10 9 10 7 8 7 10 Total
                                            mos una pequeña diferencia; y es que cuando                      2       1 2                 2       8
                                           los datos están agrupados en clases, se pierde
                                          un poco de precisión (aunque se gana en otros                 2                    1       1           12
                                          aspectos, como ya dijimos anteriormente).
                                                                                                   La suma de las diferencias positivas es
                                          Hay otras formas prácticas de obtener la me-         8; y la de las negativas, 12. Al compensar-
                                     dia o el promedio de un conjunto de datos. Vea-           se entre ambas, nos queda una diferencia
                                    mos estas dos:                                             negativa de 4. ¿Diferencia respecto a qué?
                                                                                               A la suma total de los 20 datos, si todos hu-
                                      1. Utilizar la calculadora. Si ésta posee funcio-        bieran tenido el valor de la media, 8. Esta
                                 nes estadísticas, basta con introducir los datos y pulsar     suma total hubiera sido: 20 x 8 = 160. Por
                                luego la tecla correspondiente a la media. Si la calcu-        consiguiente, la suma total verdadera de los
                               ladora no posee tales funciones, podemos efectuar la            20 datos es: 160 – 4 = 156. Ahora se divide
                              suma progresiva de todos los datos (directamente o en el         entre 20 y obtenemos la media: 7,8 años.
                             registro de memoria M+) y dividir el resultado final entre
                           el número de datos.                                                     También podemos proceder dividiendo
                                                                                               esa diferencia negativa final, 4, entre 20, lo
    Este es uno de los casos en que la calculadora puede servirnos como herramienta,           que nos da el valor de 0,2; basta restar ahora
aliviándonos del tedioso trabajo de efectuar sumas tan largas. Lo importante es conocer        este valor de la supuesta media inicial 8, con
el significado de lo que estamos haciendo y su por qué; garantizado este conocimiento           lo que obtendremos la media verdadera: 8
conceptual, bienvenida sea la calculadora (una vez más).                                       – 0,2 = 7,8 años.

                                                                                                                                                 19
En principio, este procedimiento puede                                                              b) Sea el conjunto de datos: {10, 13, 12,
parecer engorroso, pero la verdad es que                                                            19, 17, 11, 15, 14, 16, 18}
puede hacerse mentalmente, recorriendo                                                                  Ordenado de mayor a menor: {19, 18,
los datos uno por uno y compensando su-                                                             17, 16, 15, 14, 13, 12, 11, 10}
cesivamente las diferencias positivas y ne-                                                             Valores centrales: 15 y 14
gativas sobre la marcha: “7 me da 1 negati-                                                             Mediana: (15 + 14) / 2 = 14,5
vo; 6 me da 2 negativos, llevo 3 negativos;                                                             La mediana no coincide con ninguno de
9 me da 1 positivo, llevo 2 negativos; 7 me                                                         los datos del conjunto
da 1 negativo, llevo 3 negativos; etc.”.
                                                                                                       c) Sea la distribución de datos:
    Como puede verse, este procedimiento
nos da mayor soltura en el cálculo, más que                                                                 Datos              Frecuencias
si utilizáramos los datos reales, que siempre                                                                                    (N = 20)
son más “pesados” de manejar. Además,                                                                         12                    4
tenemos libertad para elegir el valor inicial
                                                                                                              15                    6
para la media que, incluso, puede no coin-
cidir con ninguno de los datos.                                                                               17                    8
                                                                                                             20                     2
    Por ejemplo, podríamos haber tomado
7 como valor inicial; o incluso, 7,5... En es-                                                          Los datos centrales son el 10° (15) y el
tos casos, ¿cómo hubieran sido los cálculos                                                         11° (17)
de las diferencias? ¿Cómo hubieran sido                                                                 La mediana es: (15 + 17) / 2 = 16
las sumas finales de las diferencias? ¿Y la                                                              La mediana no coincide con ninguno de
media verdadera? Verifíquelo, para salir de                                                         los datos de la distribución
dudas... y saque sus propias conclusiones.
Y trate de justificarlas. Digamos, finalmen-                                                              Cuando los datos se presentan en una
te, que el procedimiento que acabamos de                                 centro de la distribu-     tabla de frecuencias para datos agrupados
describir es ideal para estimar (dar un valor                           ción ordenada.              en clases, es suficiente con indicar la cla-
aproximado de) la media de una distribu-                                                            se mediana, es decir, la clase en la que se
ción de datos.                                                            a) Sea el conjunto        encuentra el dato que ocupa el lugar cen-
                                                                     de datos: {11, 7, 10, 9,       tral de la distribución. Por ejemplo, para el
   3.2. La mediana                                                  10, 8, 7, 10, 9}                caso:
                                                                       Ordenado de menor a
    La mediana es el valor que, una vez or-                        mayor: {7, 7, 8, 9, 9, 10, 10,      Datos agrupados     Frecuencias (N = 20)
denados todos los datos, se encuentra en                          10, 11}
                                                                                                          De 11 a 14                3
el “medio”, en la mitad de la distribución.                          Valor central (en la quin-
Si el número de datos es impar, coincidirá                     ta posición): 9                            De 15 a 18                8
con uno de los datos; si es par, puede que           9 es la mediana del conjunto
                                                                                                         De 19 a 22                 6
no ocurra esa coincidencia: hay que pro-             La mediana coincide con uno de los da-
mediar los dos valores que se hallen en el       tos del conjunto                                        De 23 a 26                 3

20
la clase mediana es la que va de 15 a                                                              Datos agrupados       Frecuencias (N = 20)
18 (ahí se encuentran los datos 10o y 11o
de la distribución) [puede obtenerse con
                                                                                                          De 11 a 14                   3
más precisión un valor para la mediana,
pero esto sólo nos llenaría de fórmulas más
complejas que pueden verse en cualquier
                                                                                                          De 15 a 18                   8
tratado de Estadística].

    9. Calcule la mediana de las inasisten-                                                               De 19 a 22                   6
cias para los datos del ejemplo inicial: {15,
19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21, 23,
26, 24, 21, 20, 17, 15, 12}.                                                                              De 23 a 26                   3

    10. Calcule la mediana de los pesos (en
Kg) de los niños del ejemplo dado anterior-                                                             la clase modal es la que va de 15 a 18
mente: {37,8; 35,6; 34; 31,9; 40,5; 34,2;                                                           (presenta la mayor frecuencia, 8).
35,6; 38,7; 32,8; 35,4; 41,6; 39,8; 34,5; 37;
42; 36,6; 31,9; 36,5; 35,7; 36; 38; 44,1; 37,2;                                                         12. Indique la moda de las inasisten-
36,8; 35; 33,5; 38,9; 37,5; 34; 36,5; 42,5}.                                                        cias para los datos del ejemplo inicial: {15,
                                                                                                    19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21, 23,
    11. ¿Tiene sentido calcular la mediana                                                          26, 24, 21, 20, 17, 15, 12}.
de los datos cuando la variable es cualitati-
va? ¿Por qué?                                                                                           13. Indique la moda de los pesos (en
                                                                                                    Kg) de los niños del ejemplo dado ante-
                                                      a) Sea el conjunto de datos: {7, 12, 8, 7,    riormente: {37,8; 35,6; 34; 31,9; 40,5;
           3.3. La moda                           10, 10, 8, 9, 12, 10}                             34,2; 35,6; 38,7; 32,8; 35,4; 41,6; 39,8;
                                                      La moda es 10 (se repite 3 veces)             34,5; 37; 42; 36,6; 31,9; 36,5; 35,7; 36;
               La moda es, sencillamente, el          La distribución es unimodal                   38; 44,1; 37,2; 36,8; 35; 33,5; 38,9; 37,5;
           valor que más se repite (el que                                                          34; 36,5; 42,5}.
           está más “de moda”); por lo tanto,         b) Sea el conjunto de datos: {8, 7, 15, 13,
           puede haber una o más modas en         7, 10, 13, 15, 9, 11}                                 Ya tenemos los conceptos de media,
          la distribución de los datos. Lo que        La moda corresponde a los valores 7, 13       mediana y moda de una distribución de
          sí es cierto –a diferencia de lo que    y 15 (se repiten dos veces cada uno)              datos, así como la forma de calcularlos o
          ocurre con la media y la mediana-           La distribución es trimodal                   descubrirlos. Al hallar sus valores en los
         es que la moda siempre coincide con                                                        ejercicios anteriores nos habremos dado
         un dato de la distribución. Y que es         Cuando los datos se presentan en una          cuenta de que, habitualmente, estos valores
        la única medida que puede obtenerse       tabla de frecuencias para datos agrupados         se ubican entre los valores del centro de la
       cuando los datos son cualitativos; por     en clases, sólo se puede indicar la clase         distribución, cuando están ordenados los
       ejemplo, si se trata de la distribución    modal, es decir, la clase que presenta ma-        datos. De ahí viene su calificativo de me-
        por lugares de origen, etc.               yor frecuencia. Por ejemplo, para el caso:        didas de tendencia central –o valores cen-

                                                                                                                                               21
trales, o medidas centrales- de un conjunto    decirse que el grupo, en promedio, apro-      cada pregunta con alguno de los siguien-
de datos.                                      bó? ¿Por qué?                                 tes códigos: 1. aumenta; 2. disminuye; 3.
                                                                                             permanece igual; 4. no se puede asegurar
   3.4. Otros aspectos matemáticos de              Veamos ahora el siguiente cuadro de       nada].
   las medidas de tendencia central            posibles casos de calificaciones (en la es-
                                               cala de 1 a 20):                                  15. ¿Qué le ocurre a la media de una
    Con el fin de reforzar algunos aspectos                                                   distribución de datos si el número de da-
relativos al cálculo de la media y a la de-                                                  tos es par y:
terminación de la mediana y de la moda,                                                          a) todos los datos aumentan en 2 uni-
                                                 Caso       Media    Mediana      Moda
así como para destacar las relaciones entre                                                  dades?
ellas, vamos a proponer la resolución de al-                                                     b) todos los datos disminuyen en 3
gunos ejercicios.                                  1         12         12         12
                                                                                             unidades?
                                                                                                 c) la mitad de los datos aumenta en 2
    ¿Pueden coincidir las tres medidas cen-                                                  unidades y la otra mitad queda igual?
trales en una misma distribución de datos?                                                       d) la mitad de los datos aumenta en 3
Si su respuesta es positiva, construya un          2         15         13         18        unidades y la otra mitad disminuye en 1?
ejemplo de tal distribución. Si es negativa,
explique por qué.                                                                               16. ¿Qué le ocurre a la mediana en los
                                                                                             cuatro casos anteriores?
    a) Construya ahora, si es posible, una         3         11         10         08
distribución en la que no coincida ningu-                                                        Se ha calculado la media de un grupo
na de las tres medidas.                                                                      de 20 calificaciones. Pero posteriormen-
    b) Ídem, en la que coincidan la media                                                    te, 7 calificaciones suben en 2 puntos, 5
y la mediana, pero no así la moda.                 4         12         16         11        quedan igual, 3 disminuyen en 2 puntos,
    c) Ídem, en la que coincidan la moda y                                                   2 disminuyen en 3, 1 disminuye en 4, y 1
la mediana, pero no así la media.                                                            disminuye en 5 puntos. ¿Qué le ha ocu-
    d) Ídem, en la que coincidan la media           Suponga que el curso está integrado      rrido a la nueva media con respecto a su
y la moda, pero no así la mediana.             por 20 alumnos. Para cada uno de los 4        valor anterior?
                                               casos construya, si es posible, una distri-
     En una clase de 6° grado hay un grupo     bución de datos que se ajuste a los valores       No conocemos los datos, ni tampoco
 numeroso de alumnos muy capaces. Si las       dados de las medidas de tendencia cen-        el valor de la media; tampoco nos piden el
 calificaciones en Matemática se dan en la      tral.                                         valor de la nueva media, sino su variación
 escala de 1 a 20, ¿qué media de califica-                                                    con respecto a la anterior. Esto significa
 ciones puede esperarse? ¿Y qué mediana?           14. ¿Qué le ocurre (o le puede ocurrir)   que tenemos que centrarnos en la varia-
 ¿Y qué moda? ¿Es probable que la moda         a la media de un conjunto de datos no to-     ción que han experimentado los datos y,
 sea alta?                                     dos iguales, si se elimina de dicho con-      particularmente, el resultado final de las
                                               junto: a) el dato mayor; b) el dato menor;    variaciones de todos los datos.
    Si la mediana de un grupo de califica-      c) un dato de valor igual a la media; d)
 ciones de Historia es 7 (en la escala de 1    un dato de valor igual a la mediana; e) un        Calculamos los aumentos que han ex-
 a 10) y la nota aprobatoria es 5, ¿puede      dato de valor igual a la moda? [Responda      perimentado los datos: 7 x 2 = 14 puntos.

22
Y las disminuciones que han experimen-        más representativo(s) en cada caso. Para                En cuanto a la segunda restricción, en el
tado: 3 x 2 + 2 x 3 + 1 x 4 + 1 x 5 = 21          ello, comenzaremos por precisar las poten-          conjunto de datos: {7, 5, 3, 8, 4, 5, 3, 61}, la
puntos.                                           cialidades y las limitaciones de cada una de        media es: 96 / 8 = 12, valor que está afec-
    Variación total final: La suma de los da-      las tres medidas centrales.                         tado por el último dato (61) ya que la media
tos ha disminuido en 7 puntos.                                                                        de los siete primeros datos sería 35 / 7 = 5.
    Por consiguiente, la media habrá dismi-          La media es la medida de tendencia               Como se ve, el valor 12 no representa real-
nuido en 7/20 = 0,35 puntos.                      central de mayor uso, puesto que:                   mente al conjunto de los ocho datos.
    Obsérvese que la media depende di-                   • su cálculo es sencillo;
rectamente de la suma de todos los datos;                • nos da una idea resumida y más                 Por su parte, la mediana también se ob-
y que su variación depende de la variación           consistente del conjunto de datos (el            tiene fácilmente y no está influida por los
de esta suma.                                        promedio de sus valores);                        valores extremos, aunque tampoco nos dice
                                                         • varía en concordancia con los              nada de cómo son en realidad los datos de
    17. Un conjunto de 300 niños se reparte          datos, en el sentido de que si todos             ambas mitades de la distribución, ni acerca
en lotes de 10 niños. En cada lote, los niños        los datos aumentan o disminuyen en               de su variación con respecto a la mediana.
tienen exactamente las siguientes edades: 8          la misma cantidad, o se multiplican o
años (3 niños); 9 años (2 niños); 10 años (1         dividen por la misma cantidad, la me-                Así, por ejemplo, observe que estos dos
niño); y 11 años (4 niños). ¿Cuál es la media        dia queda afectada por la misma va-              conjuntos ordenados de datos: {1, 3, 3, 3,
de las edades de los 300 niños? ¿Y la me-            riación;                                         4, 14, 21, 27, 27, 27, 27} y {12, 12, 13, 14,
diana? ¿Y la moda?                                       • suele decirse que es más estable           14, 15, 15, 16, 16} tienen la misma mediana
                                                     que la mediana; esto significa que si ex-         (14), pero difieren significativamente entre
   3.5. Las medidas de tendencia                     traemos diversas muestras de la misma            sí.
   central como representativas del                  población, las medias de estas diversas
   conjunto de datos                                 muestras se parecen más entre sí que las             Finalmente, de la moda no hay mucho
                                                     medianas de las mismas muestras.                 más que decir, salvo insistir en su ambigüe-
    Los ejercicios anteriores son, sin duda,                                                          dad: puede darse incluso el caso de que no
útiles para desarrollar destrezas en la apli-         Pero, por otro lado, la media:                  represente a un valor del centro de la dis-
cación de los conceptos de las medidas de                 • no nos dice cuán variables son los        tribución, sino extremo. Por ejemplo, en el
tendencia central, así como de los procesos           datos, cómo difieren unos de otros;              siguiente conjunto de datos: {11, 13, 16, 17,
para su obtención o transformación. Pero                  •corre el riesgo de dejarse influir por      18, 20, 20, 20}, la moda es 20, que repre-
podemos formularnos otra pregunta de ma-              los valores extremos de la distribución, si     senta al mayor de los datos.
yor interés: ¿Para qué se obtienen las medi-          hay alguno(s) de ellos muy distante(s) de
das de tendencia central?                             los demás.                                          Conocer las potencialidades y limitacio-
                                                                                                      nes de cada uno de los valores centrales es
    En principio, hemos dicho que son                 Así, por ejemplo, estos tres conjuntos de       un prerrequisito necesario para poder res-
como representativas de todo el conjunto          datos: {11, 12, 13, 14, 15, 16, 17}, {14, 14, 14,   ponder a la pregunta del para qué se ob-
de datos, aun cuando cada una lo hace a           14, 14, 14, 14} y {2, 2, 2, 14, 26, 26, 26} tie-    tienen las medidas de tendencia central, o
su manera. Lo que nos interesa es tener cri-      nen la misma media (verifíquelo), pero son          de su equivalente, cuál de los valores re-
terio para que, a la vista de cada variable       completamente diferentes en la estructura           presenta mejor al conjunto de datos. Pero
y de la distribución de sus datos, podamos        de sus datos; la media no puede darnos una          el condicionante principal de la respuesta
decidir cuál(es) de los tres valores resulta(n)   idea de la variabilidad de los datos.               está en el análisis de los requerimientos

                                                                                                                                                 23
propios de cada situación, de la variable en   tenemos un carro” (Gilbert Chesterton,
juego y de los datos recolectados.             novelista inglés, 1874-1936)
                                                                                            4. Las medidas de
    Supongamos que tenemos la distri-
bución de las edades de los alumnos del                                                     dispersión
salón de clase y que calculamos los valo-
res de sus medidas de tendencia central.                                                    Ya hemos visto que las medidas de
¿Qué significa la media de tales edades?                                                 tendencia central nos aportan información
¿Y la mediana? ¿Y la moda? ¿Alguna de                                                   acerca de la distribución de los datos de
estas medidas es más representativa del                                                 una variable; información importante y ne-
conjunto de edades que las demás? ¿O to-                                                cesaria, pero no suficiente. Como dijimos y
das ellas tienen algo peculiar que aportar?                                             pudimos verlo en algunos ejemplos y ejer-
                                                                                        cicios, ninguna de las medidas de tendencia
    18. Para poder proceder a su posterior                                              central, ni siquiera las tres juntas, pueden
dotación, acabamos de obtener la distri-                                                ofrecernos el detalle de los datos, la varia-
bución de datos referentes a las tallas de                                              bilidad presente en ellos.
zapatos, camisetas, pantalones y faldas de
todos los niños y niñas de la escuela. En                                                   En efecto, consideremos estos dos con-
cada una de estas cuatro distribuciones,                                                juntos de datos ordenados, referentes a las
¿qué sentido tiene obtener la media de las                                              calificaciones escolares de dos grupos de 20
tallas? ¿Y la mediana? ¿Y la moda? ¿Algu-                                               alumnos (en una escala de 1 a 20 puntos):
na de estas medidas es más representativa
que las demás? ¿Podemos prescindir de                                                       Conjunto 1: {3, 4, 4, 4, 5, 5, 6, 6, 7, 10,
alguna(s) de estas medidas, tomando en                                                  10, 10, 10, 15, 16, 16, 17, 17, 17, 18}
cuenta el objetivo de su recolección?                                                       Conjunto 2: {9, 9, 9, 9, 9, 9, 10, 10, 10,
                                                                                        10, 10, 10, 10, 10, 10, 10, 12, 12, 12}
    Invente una situación en la que Ud. va
a recabar unos datos y en la que la moda                                                    La media, la mediana y la moda de am-
sea el valor más representativo del con-                                                bos conjuntos es la misma (10 puntos); y sin
junto. Análogamente para la mediana. Y,                                                 embargo, las distribuciones son muy dife-
finalmente, para la media.                                                               rentes. El segundo grupo de calificaciones
                                                                                        se presenta más homogéneo, las notas es-
   Para concluir este punto, permítasenos                                               tán más agrupadas; cosa que no ocurre en
presentar dos interpretaciones referentes al                                            el primer conjunto, en el que la dispersión
promedio, una de carácter irónico y la otra,                                            de las notas es muy marcada.
graciosamente distorsionada:
                                                                                            De modo que no basta con que intente-
   “La Estadística es la ciencia que esta-                                              mos caracterizar o resumir una distribución
blece que si mi vecino tiene dos carros                                                 de datos aportando sus medidas de tenden-
y yo no tengo ninguno, entonces los dos                                                 cia central; necesitamos también decir algo

24
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística
Introducción a la Estadística

More Related Content

Viewers also liked (20)

Ecuaciones en n
Ecuaciones en nEcuaciones en n
Ecuaciones en n
 
Problemas Operaciones con Radicales
Problemas Operaciones con RadicalesProblemas Operaciones con Radicales
Problemas Operaciones con Radicales
 
Polígonos. Triángulos
Polígonos. TriángulosPolígonos. Triángulos
Polígonos. Triángulos
 
La Adición
La AdiciónLa Adición
La Adición
 
Problemas con potenciación
Problemas con potenciaciónProblemas con potenciación
Problemas con potenciación
 
Introducción a la Probabilidad
Introducción a la ProbabilidadIntroducción a la Probabilidad
Introducción a la Probabilidad
 
Introducción al Algebra
Introducción al AlgebraIntroducción al Algebra
Introducción al Algebra
 
Fracciones I Concepto Y Representación
Fracciones I Concepto Y RepresentaciónFracciones I Concepto Y Representación
Fracciones I Concepto Y Representación
 
La Función Matemática
La Función MatemáticaLa Función Matemática
La Función Matemática
 
División
DivisiónDivisión
División
 
Matemáticas para los de Letras
Matemáticas para los de LetrasMatemáticas para los de Letras
Matemáticas para los de Letras
 
El Conocimiento Matemático
El Conocimiento MatemáticoEl Conocimiento Matemático
El Conocimiento Matemático
 
Divisibilidad
DivisibilidadDivisibilidad
Divisibilidad
 
Ecuaciones en z
Ecuaciones en zEcuaciones en z
Ecuaciones en z
 
Cuadriláteros Y Otros Polígonos. Simetrías
Cuadriláteros Y Otros Polígonos. SimetríasCuadriláteros Y Otros Polígonos. Simetrías
Cuadriláteros Y Otros Polígonos. Simetrías
 
Sustracción
SustracciónSustracción
Sustracción
 
Desarrollo de cuerpos geometricos
Desarrollo de cuerpos geometricosDesarrollo de cuerpos geometricos
Desarrollo de cuerpos geometricos
 
Razones y Proporciones
Razones y ProporcionesRazones y Proporciones
Razones y Proporciones
 
Cuerpos Geométricos
Cuerpos GeométricosCuerpos Geométricos
Cuerpos Geométricos
 
La Circunferencia y el Círculo
La Circunferencia y el CírculoLa Circunferencia y el Círculo
La Circunferencia y el Círculo
 

Similar to Introducción a la Estadística

Serie n° 17 introduccion estadistica
Serie n° 17 introduccion estadisticaSerie n° 17 introduccion estadistica
Serie n° 17 introduccion estadisticaReymundo Salcedo
 
Introduccion a la Estadistica Doc-1
Introduccion a la Estadistica Doc-1Introduccion a la Estadistica Doc-1
Introduccion a la Estadistica Doc-1francisco calero
 
PROYECTO DE AULA MATEMATICAS
PROYECTO DE AULA MATEMATICASPROYECTO DE AULA MATEMATICAS
PROYECTO DE AULA MATEMATICASlilitorres4872
 
Proyecto de aula matematicas
Proyecto de aula matematicasProyecto de aula matematicas
Proyecto de aula matematicaslilitorres4872
 
Proyecto de aula asignatura matematicas
Proyecto de aula asignatura matematicasProyecto de aula asignatura matematicas
Proyecto de aula asignatura matematicaslilitorres4872
 
competencias y su articulación con el proceso de evaluación
competencias y su articulación con el proceso de evaluacióncompetencias y su articulación con el proceso de evaluación
competencias y su articulación con el proceso de evaluaciónReyzon Pasaje
 
Planificación y evaluación
Planificación y evaluaciónPlanificación y evaluación
Planificación y evaluaciónubv/barquisimeto
 
La importancia de la investigacion cientifica
La importancia de la investigacion cientificaLa importancia de la investigacion cientifica
La importancia de la investigacion cientificaRosina Duran
 
EVALUACION DE ENSENANZA pedagogía educación
EVALUACION DE ENSENANZA pedagogía educaciónEVALUACION DE ENSENANZA pedagogía educación
EVALUACION DE ENSENANZA pedagogía educaciónValeCasales
 
Cuadro comparativo entre competencias educativas y competencias para la vida
Cuadro comparativo entre competencias educativas y competencias para la vidaCuadro comparativo entre competencias educativas y competencias para la vida
Cuadro comparativo entre competencias educativas y competencias para la vidaAurora Sáez Morales
 
Evaluación, un tema que nos convoca siempre
Evaluación, un tema que nos convoca siempreEvaluación, un tema que nos convoca siempre
Evaluación, un tema que nos convoca siemprectecolonia
 
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptx
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptxplanificación UNIDADES DE APRENDIZAJE_día01_2024.pptx
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptxlinaresmaterialeseda
 
Gestionar el conocimiento miguel A. santos
Gestionar el conocimiento miguel A. santos Gestionar el conocimiento miguel A. santos
Gestionar el conocimiento miguel A. santos andresienriquez
 
Proyecto comprension im_2red
Proyecto comprension im_2redProyecto comprension im_2red
Proyecto comprension im_2redimmaeso
 
Diagnostico en la Situación Educativa
Diagnostico en la Situación EducativaDiagnostico en la Situación Educativa
Diagnostico en la Situación EducativaFlorItzelalcantarsie
 
Proyecto educativo de implementacion curricular por enfoque por competencias ...
Proyecto educativo de implementacion curricular por enfoque por competencias ...Proyecto educativo de implementacion curricular por enfoque por competencias ...
Proyecto educativo de implementacion curricular por enfoque por competencias ...frehuaflo
 

Similar to Introducción a la Estadística (20)

Serie n° 17 introduccion estadistica
Serie n° 17 introduccion estadisticaSerie n° 17 introduccion estadistica
Serie n° 17 introduccion estadistica
 
Introduccion a la Estadistica Doc-1
Introduccion a la Estadistica Doc-1Introduccion a la Estadistica Doc-1
Introduccion a la Estadistica Doc-1
 
PROYECTO DE AULA MATEMATICAS
PROYECTO DE AULA MATEMATICASPROYECTO DE AULA MATEMATICAS
PROYECTO DE AULA MATEMATICAS
 
Proyecto de aula matematicas
Proyecto de aula matematicasProyecto de aula matematicas
Proyecto de aula matematicas
 
Proyecto de aula asignatura matematicas
Proyecto de aula asignatura matematicasProyecto de aula asignatura matematicas
Proyecto de aula asignatura matematicas
 
competencias y su articulación con el proceso de evaluación
competencias y su articulación con el proceso de evaluacióncompetencias y su articulación con el proceso de evaluación
competencias y su articulación con el proceso de evaluación
 
Planificación y evaluación
Planificación y evaluaciónPlanificación y evaluación
Planificación y evaluación
 
La importancia de la investigacion cientifica
La importancia de la investigacion cientificaLa importancia de la investigacion cientifica
La importancia de la investigacion cientifica
 
EVALUACION DE ENSENANZA pedagogía educación
EVALUACION DE ENSENANZA pedagogía educaciónEVALUACION DE ENSENANZA pedagogía educación
EVALUACION DE ENSENANZA pedagogía educación
 
int3uno.docx
int3uno.docxint3uno.docx
int3uno.docx
 
Proyecto
ProyectoProyecto
Proyecto
 
Los contenidos
Los contenidosLos contenidos
Los contenidos
 
El proceso de investigación 3
El proceso de investigación 3El proceso de investigación 3
El proceso de investigación 3
 
Cuadro comparativo entre competencias educativas y competencias para la vida
Cuadro comparativo entre competencias educativas y competencias para la vidaCuadro comparativo entre competencias educativas y competencias para la vida
Cuadro comparativo entre competencias educativas y competencias para la vida
 
Evaluación, un tema que nos convoca siempre
Evaluación, un tema que nos convoca siempreEvaluación, un tema que nos convoca siempre
Evaluación, un tema que nos convoca siempre
 
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptx
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptxplanificación UNIDADES DE APRENDIZAJE_día01_2024.pptx
planificación UNIDADES DE APRENDIZAJE_día01_2024.pptx
 
Gestionar el conocimiento miguel A. santos
Gestionar el conocimiento miguel A. santos Gestionar el conocimiento miguel A. santos
Gestionar el conocimiento miguel A. santos
 
Proyecto comprension im_2red
Proyecto comprension im_2redProyecto comprension im_2red
Proyecto comprension im_2red
 
Diagnostico en la Situación Educativa
Diagnostico en la Situación EducativaDiagnostico en la Situación Educativa
Diagnostico en la Situación Educativa
 
Proyecto educativo de implementacion curricular por enfoque por competencias ...
Proyecto educativo de implementacion curricular por enfoque por competencias ...Proyecto educativo de implementacion curricular por enfoque por competencias ...
Proyecto educativo de implementacion curricular por enfoque por competencias ...
 

Recently uploaded

Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIIsauraImbrondone
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfAngélica Soledad Vega Ramírez
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdfValeriaCorrea29
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdfMiNeyi1
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSYadi Campos
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfAlfaresbilingual
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxEliaHernndez7
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxlclcarmen
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 

Recently uploaded (20)

Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024Interpretación de cortes geológicos 2024
Interpretación de cortes geológicos 2024
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA IIAFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
AFICHE EL MANIERISMO HISTORIA DE LA ARQUITECTURA II
 
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdfSELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
SELECCIÓN DE LA MUESTRA Y MUESTREO EN INVESTIGACIÓN CUALITATIVA.pdf
 
Abril 2024 - Maestra Jardinera Ediba.pdf
Abril 2024 -  Maestra Jardinera Ediba.pdfAbril 2024 -  Maestra Jardinera Ediba.pdf
Abril 2024 - Maestra Jardinera Ediba.pdf
 
Unidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la InvestigaciónUnidad 3 | Metodología de la Investigación
Unidad 3 | Metodología de la Investigación
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdfTema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
Tema 8.- PROTECCION DE LOS SISTEMAS DE INFORMACIÓN.pdf
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VSSEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
SEPTIMO SEGUNDO PERIODO EMPRENDIMIENTO VS
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 

Introducción a la Estadística

  • 1.
  • 2.
  • 3.
  • 4. 372.7 And. Cuaderno N° 17 Introducción a la Estadística Federación Internacional Fe y Alegría, junio 2007 32 p.; 21,5 x 19 cm. ISBN: 978-980-6418-94-3 Matemáticas, Estadística 2
  • 5. “La base educativa que debemos consolidar, pensando siempre en el influjo político que alcanzarán un día nuestros alumnos, debe ser de plenitud humana, de fortalecimien- to de su personal identidad, de do- tación instrumental de los recursos culturales, tecnológicos y creativos que hacen a un hombre más fuerte, más digno y más generoso.” Padre José María Vélaz 3
  • 6. EQUIPO EDITORIAL Beatriz Borjas y Carlos Guédez Dimensión: Desarrollo del pensamiento matemático Cuaderno N° 17 Introducción a la Estadística Autor: Martín Andonegui Zabala Este libro se ha elaborado con el propósito de apoyar la práctica educativa de los cientos de educadores de Fe y Alegría. Su publicación se realizó en el marco del Programa Internacional de Formación de Educadores Populares desarrollado por la Federación Internacional Fe y Alegría desde el año 2001. Diseño y Diagramación: Moira Olivar Ilustraciones: Corina Álvarez Concepto gráfico: Juan Bravo Corrección de textos: Carlos Guédez y Martín Andonegui Edita y distribuye: Federación Internacional de Fe y Alegría. Esquina de Luneta. Edif. Centro Valores, piso 7 Altagracia, Caracas 1010-A, Venezuela. Teléfonos: (58) (212)5631776 / 5632048 / 5647423. Fax: (58) (212) 5645096 www.feyalegria.org © Federación Internacional Fe y Alegría Depósito legal: lf 60320073102352 Caracas, junio 2007 Publicación realizada con el apoyo de: Centro Magis - Instituto Internacional para la Educación Superior en América Latina y el Caribe (IESALC) - Corporación Andina de Fomento (CAF) 4
  • 7. introducción A modo de introducción..., nuestro recordatorio L a sugerencia que proponíamos en el Cuaderno No 1 y que siempre presidirá los demás Cuadernos: Vamos a diciona nuestro trabajo docente. De esta forma, integrar nuestra práctica docente en nuestro estudio. estudiar matemática, pero no lo vamos a hacer como si fuéramos simplemente unos • Como complemento a lo anterior, alumnos que posteriormente van a ser eva- construir el conocer de cada tópico mate- luados, y ya. No. Nosotros somos docentes mático pensando en cómo lo podemos lle- –docentes de matemática en su momento- var al aula. Para ello, tomar conciencia del y este rasgo debe caracterizar la forma de proceso que seguimos para su construcción, construir nuestro pensamiento matemático. paso a paso, así como de los elementos ¿Qué significa esto? –cognitivos, actitudinales, emocionales...- que se presenten en dicho proceso. Porque • La presencia constante de la meta a partir de esta experiencia reflexiva como última de nuestro estudio: alcanzar unos estudiantes, podremos entender y evaluar niveles de conocimiento tecnológico y re- mejor el desempeño de nuestros alumnos flexivo, lo cual debe abrir ese estudio hacia –a su nivel- ante los mismos temas. la búsqueda de aplicaciones de lo aprendi- do, hacia el análisis de los sistemas que dan • En definitiva, entender que la mate- forma a nuestra vida y utilizan ese conoci- mática es la base de su didáctica: la forma miento matemático, y hacia criterios socia- en que se construye el conocimiento ma- les y éticos para juzgarlos. temático es una fuente imprescindible a la hora de planificar y desarrollar su enseñan- • Construir el conocer de cada tópico za. matemático pensando en cómo lo enseña- mos en el aula, además de reflexionar acer- Y ahora, vamos al tema de este Cuader- ca de cómo nuestro conocer limita y con- no, la Estadística. 5
  • 8. vivienda de cada uno de nuestros alumnos. Este tipo de variables que se miden contan- 1. El significado de la Estadística do recibe el nombre de discretas. Como se ve, estas variables sólo pueden tomar valo- Vivimos bombardeados de información por todas partes; a veces, hasta en exceso. Los res enteros. medios de comunicación, los libros, lo que nos dicen los demás, lo que observamos en nuestro caminar por la ciudad o el pueblo, lo que recordamos, lo que leemos o estudia- La segunda manera de medir se refiere mos... Hay información permanente, abundante; quizás, hasta excesiva... y aplica a las variables que se denominan continuas porque, entre dos valores fijos, Los elementos que componen esta información son de naturaleza muy diversa: noti- pueden tomar todos los valores interme- cias puntuales, ideas, descripciones de objetos y acontecimientos, comentarios, aprecia- dios (decimales). Tal es el caso, por ejem- ciones, rumores... También hay otros que se refieren a ciertas características de personas plo, del peso o la estatura de las personas, u objetos, características que son susceptibles de clasificación; por ejemplo, el género o la velocidad de un carro... (sexo) de las personas, su color de piel, su nacionalidad, su lugar de residencia, sus creen- cias religiosas, sus inclinaciones políticas...; o las clases de animales, de plantas..., los tipos Claro que, para estas variables, los ins- de viviendas... trumentos de medición tienen sus limitacio- nes y siempre se termina por fijar la preci- Finalmente, hay otros elementos que nos proporcionan información y que son sus- sión de las medidas hasta cierto punto. Por ceptibles de algún tipo de medición cuantitativa, es decir, que pueden presentarse como ejemplo, en la estatura se llega hasta los números que se refieren a múltiples aspectos o fenómenos: costos de los alimentos, de los centímetros: 1 m y 52 cm, ó 152 cm; y en el servicios, de las medicinas...; temperaturas ambientes a lo largo de un día o de un año, o peso, hasta los hectogramos: 37,5 Kg; rara niveles de humedad en las distintas regiones del país; calificaciones de nuestros alumnos; vez se detallan con más precisión... distribución de la población nacional de acuerdo a su género, a sus edades, o a su ubica- ción por departamentos, provincias o estados; porcentajes anuales de mortalidad infantil; 1. Identifique cada una de las siguien- resultados de encuestas de opinión sobre innumerables temas... tes variables como cualitativa o cuantita- tiva; en este último caso, determine si es Las características de los objetos o personas que son susceptibles de clasificación o discreta o continua: de medición cuantitativa suelen presentar rasgos de variabilidad; por ejemplo, existen diversos colores de la piel o de los ojos, diversas nacionalidades, diversos precios de las a) Estado civil cosas y de los servicios, diversas calificaciones escolares, diversas estaturas y pesos en las b) Ingresos mensuales familiares personas, etc. En razón de esta variabilidad, tales características se denominan variables. c) Número del documento de identi- dad Por lo que acabamos de decir, ya vemos que las variables pueden ser de dos tipos: d) Peso de una persona e) Número de páginas de un libro • Cualitativas (también llamadas atributos): sólo susceptibles de clasificación. f) Profesión u ocupación • Cuantitativas: susceptibles de medición numérica. g) Estatura de una persona h) Simpatía por un movimiento políti- Entre estas últimas encontramos dos maneras de medir. La primera se refiere y aplica co a las características que se miden por medio del conteo. Por ejemplo, las inasistencias i) Temperatura ambiente diarias de los alumnos de nuestra escuela; o el número de personas que habitan en la j) Precio del transporte público 6
  • 9. k) Número de personas del grupo fa- de características ambientales..., que portan son las estadísticas propias de esa variable miliar alguna información relativa a la variable que poblacional. Esta expresión se deriva del l) Número de calzado se estudia: el género, la edad, la ubicación término Estadística, utilizado para designar m) Mascota o animal preferido geográfica, o las opiniones de las perso- a la ciencia que se ocupa del tratamiento nas; la tasa de mortalidad de los niños; los de la información; es decir, de estudiar los Conviene diferenciar a las variables precios de los objetos y de los servicios; la fenómenos de cualquier tipo por medio de cualitativas y cuantitativas por otro rasgo. temperatura o grado de humedad de nues- datos observados y cuantificados, que son Las primeras manifiestan su variabilidad tro ambiente; las calificaciones de nuestros recogidos, organizados, representados y en el abanico de categorías en que se cla- alumnos... Cada uno de los elementos de analizados con el fin de precisar su signi- sifican, categorías que no mantienen una una población (sean personas, objetos, etc.) ficado e inferir, en lo posible, predicciones relación de orden entre sí. recibe el nombre de individuo. de cara al futuro. Para todas estas tareas contamos, pues, con métodos estadísticos. Por ejemplo, no es posible establecer Los resultados de la medición de una cuál de los colores está por encima de los variable en el seno de una población reci- El nombre de Estadística se atribuye al otros, o cómo se ordenan las diversas na- ben el nombre de datos. Los datos –sean economista alemán Gottfried Achenwall cionalidades u ocupaciones... (claro que categorías o clases de un atributo, o núme- (siglo XVIII), quien lo derivó del término hay quien lo hace, pero por razones exter- ros- reflejan la variabilidad de la caracte- “estadistas” aplicado a los empleados del nas a las propias variables: gustos, razones rística estudiada en esa población. En este Estado dedicados a elaborar los censos po- subjetivas, ansias de poder y dominio...). sentido, los datos son mediciones en un blacionales, (censos de los que se tienen contexto específico, condición indispensa- registros históricos mucho más antiguos). En cambio, entre los valores que pue- ble para que puedan transmitir información Los campos de aplicación iniciales fueron den tomar las variables cuantitativas sí (Moore, 1998). los demográficos y los económicos. existe un cierto orden. Por ejemplo, es po- sible ordenar los valores de las estaturas, Por ejemplo, el número 3,2 no nos Pero volvamos al hilo conductor de de las edades de las personas, de los nú- aporta información alguna; pero si decimos nuestra reflexión. Tenemos que aprender a meros de páginas de los libros, etc. que una niña pesó 3,2 Kg al nacer, sí po- convivir con la información, a seleccionar- demos establecer algunas interpretaciones la, a quedarnos con la que nos puede ser Por esta razón se dice que las variables acerca de su estado saludable en el mo- útil. Porque esa lluvia de información debe cualitativas se miden en una escala nomi- mento de su nacimiento. Y si disponemos tener un objetivo para nosotros; en otras nal (sus valores se reducen a los “nom- de una colección de datos similares como, palabras, debemos estar en condiciones de bres” de las categorías en que se clasifica por ejemplo, los pesos de los niños nacidos responder a la pregunta: ¿Para qué nos sir- el atributo) y que las variables cuantitati- en la población en estudio durante un lapso ve la información? vas se miden en una escala ordinal (tiene de tiempo determinado, tendremos nuevos sentido ordenar sus valores). elementos informativos para interpretar el Probablemente ya tenemos alguna res- peso de nuestra recién nacida; por ejemplo, puesta a esa cuestión. Primero, para man- Dentro de toda esta diversidad, hay al- si está dentro de lo normal, o no. tenernos en conexión con nuestro mundo gunos rasgos comunes a destacar. En primer y con quienes lo comparten con nosotros, lugar, las variables y los resultados de las Todos sabemos el nombre de estas lis- familiares, colegas, alumnos, personas de mediciones se refieren a poblaciones, que tas o colecciones de datos referidos a una nuestra comunidad, compatriotas... Nece- son los conjuntos de personas, de objetos, variable de una determinada población: sitamos compartir un saber, un conocer; es 7
  • 10. preciso estar enterados, no descolgarnos de su desarrollo físico y a su salud, características familiares, condiciones socioeconómicas, los demás ni del mundo. anotaciones acerca del rendimiento escolar...). Pero también –y sobre todo- necesita- Si nos limitásemos al simple registro y posterior archivo de esos datos, la información mos la información para tomar decisiones. recolectada no tendría ninguna relevancia ni trascendencia. Pero si, por el contrario, or- Y esto, en todos los niveles de nuestra vida: ganizamos y analizamos las diversas relaciones entre ellos, podremos establecer conclu- familiar, profesional, social, política, cultu- siones interesantes en relación con los grupos estudiados, así como compararlos entre ral... Si no disponemos de la información sí. E, incluso, podremos llegar a ver que las regularidades que presentan algunas de esas adecuada, podemos errar en nuestras de- características nos permitirán inferir conclusiones acerca de los rasgos que tendrán las cisiones. poblaciones de estudiantes futuros. De modo que manejar oportunamen- Por otro lado, resulta muy importante la tarea de lograr que nuestros alumnos com- te la información se ha convertido en una prendan y sepan utilizar las herramientas estadísticas, con el fin de facilitarles la interpreta- competencia imprescindible en nuestra ción de la información que les llega, la organización y presentación de la que ellos pueden vida. Para alcanzar esa competencia, para producir, y la correcta toma de decisiones. saber procesar la información, es muy con- veniente que ésta venga expresada de una Estamos, pues, a las puertas de un campo bien interesante, bien útil, bien sencillo... y manera organizada. Así se nos facilitará la asequible desde los primeros niveles de escolaridad. No pensemos, de entrada, en cosas tarea de interpretarla como es debido y to- complicadas. El requisito básico para adentrarnos en la Estadística es tener hábitos de mar las decisiones del caso. organización. Con esta predisposición no nos debe costar ir adquiriendo las técnicas co- rrespondientes que, por lo demás, son muy lógicas y asequibles. Pero no siempre la información circula del entorno hacia nosotros. También ca- mina en sentido inverso, también nosotros somos productores de información. Y en 2. ¿Qué hacemos con los datos? este caso, sigue siendo válida la necesidad de expresarla de manera organizada, para que sus receptores puedan interpretarla sin 2.1. En primer lugar, reconocer su necesidad dificultad y sentirse apoyados en su toma de decisiones. Quizá la proposición de –antes que nada- reconocer la necesidad de los datos puede llamar la atención de más de un(a) lector(a). Porque estamos acostumbrados a la idea de De las consideraciones anteriores po- que las tareas estadísticas significan exclusivamente la recolección de datos, la elabora- demos derivar las razones del interés que ción de tablas, de gráficos, el cálculo de la media, la determinación de la moda...; es decir, la Estadística puede tener para nosotros, no en Estadística hay que “hacer cosas” con los datos y para ello existen una serie de fórmulas sólo como ciudadanos sino, particularmen- y procedimientos a utilizar correctamente. te, como docentes. A este respecto, recor- demos todos los registros que anualmente Sin embargo, si queremos hacer “nuestra” la Estadística, tenemos que empezar por efectuamos en la escuela, referidos a di- indagar nuestra actitud ante las situaciones de la vida real; tenemos que preguntarnos versas características de nuestros alumnos si deseamos comprenderlas para manejarlas adecuadamente y tomar las decisiones más (grado, género, edad, aspectos referidos a pertinentes frente a ellas. 8
  • 11. Sobre esta base se apoya la Estadística; ción, aunque sin negar ni agotar su riqueza estadísticos nos permite, no sólo asimilar la y, en particular, sobre la hipótesis de que y su originalidad. Dentro de ciertos límites, información que contienen sino, además, muchas situaciones de la vida real sólo pue- los métodos estadísticos nos permiten bus- observar la forma en que se presentan. den ser comprendidas a partir del análisis car explicaciones y causas de la variación y, de un conjunto de datos de carácter cuan- sobre todo, aprender del contexto. Pero, como hemos dicho antes, noso- titativo que hayan sido recogidos en forma tros mismos podemos señalar alguna va- adecuada. Reúnase con sus compañeros(as) y tra- riable que nos interesa en nuestro desem- te de hacer una lista de aquellas variables peño profesional y, seguramente, también Así, como decíamos en el ejemplo ante- de su entorno cuyos datos pueden resultar podemos recolectar datos referentes a esa rior, el peso de 3,2 kg de una niña al nacer de interés para su desempeño profesio- variable. Tomemos, por ejemplo, el núme- cobra todo su sentido cuando “disponemos nal. ro de inasistencias diarias de alumnos a de una colección de datos similares como, nuestra escuela durante un mes (20 días). por ejemplo, los pesos de los niños nacidos 2.2. En segundo lugar, recolectarlos Estos datos pueden proporcionarnos cierta en la población en estudio durante un lapso información acerca de la vida escolar, sobre de tiempo determinado”. Lo mismo pode- ¿Dónde recolectamos los datos? Bueno, todo si se comparan con los de otros meses mos decir de la consideración del peso y la hay muchos datos que se producen regu- del año escolar; es decir, tienen interés para estatura, o de las calificaciones escolares, larmente, con una periodicidad al menos nosotros. de uno solo de nuestros alumnos. anual. En cada uno de nuestros países, todos los ministerios y despachos guber- Supongamos que estos son los datos, Ahora bien, tenemos que reconocer que namentales elaboran sus Anuarios, con los día a día, empezando por el primer lunes: la observación de un caso aislado, o recu- datos y tablas referentes a sus actividades {15, 19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21, rrir a la experiencia de una sola persona, o y a las variables poblacionales que son de 23, 26, 24, 21, 20, 17, 15, 12}. intentar encontrar evidencias determinantes su incumbencia. En todos ellos existen tam- en un suceso anecdótico, puede confundir- bién instituciones nacionales de Estadística, 2.3. En tercer lugar, organizar su nos y llevarnos a una toma de decisiones encargadas de recopilar los datos estadísti- presentación equivocada (Batanero, 2002). cos de interés para estudiosos y curiosos... En el campo educativo, desde cada escuela ¿Qué hacemos con esos 20 datos (N Por ello, resulta muy importante percibir y desde cada instancia municipal, regional = 20)? Podemos hacer muchas cosas; por y valorar la variación que afecta a esas ca- y nacional, se producen cantidades de da- ejemplo: racterísticas (variables) que se manifiestan tos propios de este ámbito educativo. en una forma cuantitativa en nuestro entor- 1. Ordenarlos de menor a mayor: {11, no. Los datos nos hablan de la presencia de Incluso, son muchos los bancos de datos 12, 13, 15, 15, 17, 17, 17, 18, 18, 18, 19, 19, la variabilidad en muchas de las situaciones que son publicados por organismos interna- 20, 20, 21, 21, 23, 24, 25}. O, también, de que conforman nuestra vida. De entrada, cionales, en los cuales se recogen y compa- mayor a menor. Eso nos permite observar percibimos que no todo es uniforme, hecho ran los que se producen en cada uno de los y anotar los valores mayor y menor: 26 y con una sola medida (afortunadamente). países involucrados. En lo que a Latinoamé- 11, respectivamente. O el valor (los dos va- rica se refiere, tenemos a la mano los ban- lores, en este caso) que se encuentra(n) en Ante este panorama, la Estadística nos cos de datos presentados por la UNESCO, el medio de los datos. O el (los) que más ofrece algunos métodos para intentar com- la OEA, la CEPAL-ECLAC (2005), etc., entre veces se repite(n)... prender y analizar, en lo posible, esta varia- otros muchos. La lectura de estos cuadros 9
  • 12. 2. Presentarlos en una tabla en la que se Datos agrupados Frecuencias ción de ciertos valores más representativos señale cada número de inasistencias (dato) (N = 20) de la misma. con el número de veces (frecuencia) con el 11 al 14 3 que aparece (distribución de frecuencias): La segunda forma de representar los da- 15 al 18 8 tos (distribución de frecuencias) es la que Datos Frecuencias (N = 20) mejor y con más detalle nos permite resu- 19 al 22 6 mir todos los datos y volverlos a “leer” orga- 11 1 nizadamente. La tercera forma (distribución 23 al 26 3 de frecuencias para datos agrupados) es, a 12 1 su vez, un resumen de la anterior, y es muy Quizás al (a la) lector(a) se le puedan útil cuando los datos son muy numerosos y 13 1 ocurrir otras formas de representar los datos están muy dispersos o presentan frecuen- anteriores, o algunas particularidades de los cias muy bajas. Se pierde algo del detalle 15 2 mismos; pero vamos a quedarnos con las que ofrece la forma de representación ante- tres señaladas. Veamos algunas caracterís- rior, pero nos permite una lectura más sin- 17 3 ticas de algunas de ellas. tetizada de la distribución de los datos. 18 3 La primera nos permite determinar el Suponga que en el siguiente mes, que rango o recorrido de la distribución, es tiene 23 días lectivos, se recolectan estos 19 2 decir, determinar la amplitud del intervalo datos de inasistencia diaria de alumnos a en que se mueven los valores. La forma de la escuela: {12, 11, 12, 13, 14, 13, 15, 16, 20 2 calcularlo es restar los valores extremos; en 14, 15, 18, 16, 19, 15, 21, 20, 24, 23, 22, nuestro ejemplo, el rango de los datos es: 23, 23, 23, 22}. 21 2 26 – 11 = 15. a) Determine los valores extremos de 23 1 Ese resultado no coincide con el nú- la distribución mero de valores diferentes que podrían b) Calcule el rango de la distribución 24 1 aparecer entre los valores extremos de la c) Ordene los datos de mayor a me- colección de datos. Para obtener este últi- nor 26 1 mo número volvemos a restar estos valores d) Elabore la tabla de distribución de extremos... y sumamos 1 unidad; en nues- frecuencias correspondiente tro ejemplo es: 26 – 11 + 1 = 16. Si alguien e) Forme intervalos o clases de am- 3. Como en la tabla anterior aparecen duda por qué se debe sumar 1 unidad, pón- plitud 4 (de 10 a 13, etc.) y elabore la muchos datos diferentes (12), podemos gase a contar cuántos valores seguidos hay correspondiente tabla de distribución de pensar en agruparlos un poco y presen- desde 11 hasta 26, ambos incluidos. frecuencias tarlos en otra tabla en la que se señalen las inasistencias agrupadas por intervalos Esa primera forma de representación or- La representación de los datos, particu- o clases, con el número de veces en que denada de los datos va a tener utilidad más larmente las referentes a la distribución de se presentan (distribución de frecuencias adelante, a la hora de analizar la distribu- frecuencias y a la distribución de frecuen- para datos agrupados): ción de los mismos, mediante la determina- cias de datos agrupados, puede hacerse 10
  • 13. también de forma gráfica y no sólo mediante las tablas del tipo que acabamos de presen- También puede construirse una gráfica tar (forma tabular). de barras correspondiente a la tabla que re- coge la distribución de los datos agrupados Tomemos el ejemplo de la distribución de frecuencias antes presentada. Para llevarla en clases. Para nuestro ejemplo: a una gráfica, vamos a trazar dos segmentos perpendiculares (ejes), con sus marcas o medidas correspondientes; en el horizontal vamos a colocar, ordenados, los valores de 8 la variable (número de inasistencias diarias) y en el segmento vertical, las frecuencias de 7 esos valores. 6 Marcados así esos dos segmentos, vamos a levantar, en cada punto del eje horizontal, 5 un segmento perpendicular cuya medida sea exactamente la de la frecuencia correspon- 4 diente a ese valor de la variable. Haciendo esta tarea para cada uno de los valores de la variable, llegamos a esta gráfica: 3 2 1 11 14 15 18 19 22 23 26 Tome ahora los datos y las tablas co- rrespondientes a las inasistencias del se- gundo mes, y elabore: a) la gráfica de barras Esta representación recibe el nombre de gráfica de barras. Obsérvese que para con- b) el polígono de frecuencias servar la secuencia de los valores de la variable, desde 11 hasta 26, se han marcado los c) la gráfica de barras para los datos valores 14, 16, 22 y 25, cuya frecuencia es 0. También puede “invertirse” la gráfica, es agrupados en clases (10 a 13, etc.) decir, colocar en el eje vertical los valores de la variable y en el eje horizontal, las frecuen- cias de esos valores. Hasta ahora hemos trabajado con una variable (inasistencias diarias de los alum- Si se toman solamente los vértices superiores de los segmentos o barras verticales co- nos a la escuela) discreta. Veamos un ejem- rrespondientes a las frecuencias, se construye una nueva gráfica, conocida como polígono plo para una variable continua, como el de frecuencias. Para nuestro ejemplo: peso o la estatura de las personas. En nuestro medio escolar, el conoci- miento (y seguimiento) del peso y de la estatura de nuestros alumnos tiene su im- portancia, ya que éstos se encuentran en pleno proceso de desarrollo; vale la pena, pues, recolectar los datos correspondientes e, incluso, hacerlo periódicamente. 11
  • 14. En cuanto a la organización de su pre- cuarto, en 38,1 + 3,1 = 41,2. A partir de estos valores deducimos cuáles son los valores sentación, que es lo que ahora nos ocupa, mayores de cada intervalo: 34,9; 38; 41,1 y 44,2 (observe que la diferencia entre dos de enseguida percibimos que lo más práctico estos valores seguidos es también 3,1. es distribuir los datos individuales en clases o intervalos ya que, con seguridad, habrá Ahora podemos construir la tabla que representa la distribución de datos agrupados: muchos datos diferentes. De aquí se sigue que las representaciones más apropiadas Datos agrupados Frecuencias (N = 31) para estos datos serán la tabla y la gráfica correspondientes a la distribución de datos agrupados. De 31,9 a 34,9 8 Supongamos que los pesos de 31 alum- nos de una clase son (en Kg): {37,8; 35,6; De 35 a 38 15 34; 31,9; 40,5; 34,2; 35,6; 38,7; 32,8; 35,4; 41,6; 39,8; 34,5; 37; 42; 36,6; 31,9; 36,5; 35,7; 36; 38; 44,1; 37,2; 36,8; 35; 33,5; De 38,1 a 41,1 4 38,9; 37,5; 34; 36,5; 42,5}. De 41,2 a 44,2 4 La primera actividad de observación nos lleva a buscar los valores extremos; éstos son: 31,9 y 44,1 Kg. Ahora podemos deci- y la gráfica correspondiente, que en el caso de las variables continuas, se denomina dir en cuantas clases o intervalos dividimos histograma (histos [tejido] + gramma [gráfico]): el grupo, tomando en cuenta que tampoco nos conviene tener un número excesivo de Obsérvese que en el histograma los rec- clases; para nuestro caso, un número apro- tángulos se adosan unos a otros, ya que la piado puede ser 4 ó 5 clases. variable es continua. Por esta razón, en el eje horizontal se colocan valores divisorios Supongamos que optamos por 4 clases. de las sucesivas clases o intervalos. ¿Cómo Esto significa que el gran intervalo entre los se obtiene cada uno de ellos? Se toman dos valores extremos (de 31,9 a 44,1), cuya di- valores sucesivos, el final de una clase y el ferencia es 12,2, debe repartirse en cuatro inicial de la clase siguiente, y se busca el lotes de igual tamaño. El tamaño de cada valor intermedio. intervalo debe ser, pues, el cociente de 12,2 / 4, que es 3,05, que puede redondearse a Por ejemplo, 34,95 es el valor intermedio entre 34,9 (valor final del primer intervalo) 3,1. y 35 (valor inicial del segundo intervalo). Calculado uno de estos valores divisorios, los demás pueden obtenerse agregando o restando el valor de la amplitud del intervalo (3,1). Esto significa que si el primer intervalo Así se llega, en particular, a los valores divisorios extremos (31,85 y 44,25). empieza en el valor menor (31,9), el segun- do debe empezar en 31,9 + 3,1 = 35; el ter- Recolecte los datos de peso y de estatura de los alumnos de su clase y elabore, para cero debe empezar en 35 + 3,1 = 38,1; y el cada variable, la tabla y la gráfica de la distribución de datos agrupados correspondiente. 12
  • 15. 2.4. En cuarto lugar, analizarlos La tabla de distribución de frecuencias Datos Frecuencias Frecuencias nos permite volver a encontrar y, además, agrupados (N = 20) acumuladas Los dos puntos anteriores, referidos ampliar la información anterior. Por ejem- a la recolección de datos y a la orga- plo, nos permite averiguar en cuántos días 11 1 1 nización de su presentación, no tienen del mes se contaron 20 ó más inasistencias ningún sentido si no desembocan en un (este dato puede ser de interés si, por ejem- 12 1 2 análisis de los mismos. Porque recorde- plo, 20 es un número crítico para la escue- 13 1 3 mos que los datos –y la información que la, en el sentido de que cuando se alcanzan se deriva de ellos- tienen como objetivo o superan las 20 inasistencias diarias, se de- 15 2 5 facilitar nuestra toma de decisiones. termina una emergencia escolar...). 17 3 8 El análisis de los datos es un campo ¿Cómo calcular ese número de días 18 3 11 muy complejo, cuyo desarrollo ocupa el del mes en que se contaron 20 ó más in- espacio más extenso e importante de la asistencias diarias? A partir de la tabla de 19 2 13 Estadística (lo que se llama la Estadística distribución de frecuencias, basta con su- Inferencial). En este Cuaderno no vamos mar las frecuencias correspondientes a los 20 2 15 a entrar en él. Pero sí vamos a propo- datos 20, 21, 23, 24 y 26 (2 + 2 + 1 + 1 21 2 17 nernos analizar y sacar conclusiones de + 1 = 7): durante 7 días las inasistencias estas primeras formas sencillas de orga- llegaron a 20 o estuvieron por encima de 23 1 18 nizar los datos (Estadística Descriptiva), ese número. con el fin de percibir cómo la informa- 24 1 19 ción ya fluye realmente de ellos. Como se ve, la tabla de distribución de 26 1 20 frecuencias puede servirnos para obtener Volvamos a nuestro primer ejem- información nueva referida a la acumula- plo, el de las inasistencias diarias de los ción de frecuencias entre ciertos valores de Como se puede observar, la frecuen- alumnos a la escuela, y las tres formas la variable. Por ejemplo, podemos pregun- cia acumulada correspondiente al valor en que organizamos su presentación (or- tar cuántos datos estuvieron por debajo de más alto debe coincidir con el total de denados de menor a mayor, la tabla de tal valor, o entre dos valores dados, o fue- la población estudiada (20). Si queremos distribución de frecuencias, y la tabla de ron superiores a determinado valor. saber durante cuántos días el número de distribución de frecuencias para datos inasistencias diarias estuvo por debajo de agrupados). Para responder más directamente a 18, basta con leer la frecuencia acumula- este tipo de tareas, podemos construir una da correspondiente a 17: durante 8 días. La primera forma de organización nueva tabla de distribución de frecuencias Y para saber durante cuántos días estuvo nos sugiere que el número de inasisten- en la que aparece una nueva columna, la por encima de 19 (la pregunta inicial), cias diarias, durante el mes estudiado, referente a las frecuencias acumuladas; basta restar de 20 la frecuencia acumula- oscila entre una y dos docenas, aproxi- es decir, para cada dato, además de su da correspondiente a 19: 20 – 13 = 7. madamente; que es irregular, es decir, frecuencia propia, vamos a anotar la suma que varía de día en día; y que el número de las frecuencias correspondientes a los 2. ¿Tiene algún sentido elaborar una ta- más frecuente de inasistencias ha sido datos inferiores, más la suya propia. En bla con frecuencias acumuladas cuando se de 17 y 18 (3 veces cada uno). nuestro ejemplo sería: trata de una variable cualitativa? ¿Por qué? 13
  • 16. Siguiendo con el análisis de las inasis- La organización de los datos en esta ta- • Comparar los mismos días de cada se- tencias diarias, nos damos cuenta de que bla de doble entrada nos permite otro tipo mana: Por ejemplo, los lunes no han sido, la tabla de distribución de frecuencias para de análisis: durante este mes, los días críticos para la datos agrupados no nos aporta mayor infor- inasistencia escolar; tampoco los viernes. mación adicional: solamente que la mayoría • Comparar las semanas: Desde el final No se manifiestan hábitos de ausencia alre- de los datos (8 de 20) está en el intervalo de de la 2a semana y, particularmente, durante dedor del fin de semana... 15 a 18 inasistencias diarias [Notemos que la 3a, hubo un notable incremento de inasis- también es posible elaborar la columna de tencias; esto nos dice que la tercera sema- Como se puede apreciar, ninguna de frecuencias acumuladas para el caso en que na ocurrió algo particular, actuó una causa estas informaciones nos ha sido propor- los datos vengan agrupados en clases]. especial (alguna enfermedad, inclemencias cionada por las herramientas estadísticas climáticas...) cuyo efecto posiblemente fue de organización de los datos que hemos Hemos utilizado tres de las herramien- menguando durante la última semana.... manejado con anterioridad. Esta afirmación tas habituales de organización de los datos nos reafirma en el convencimiento de que para analizar los datos relativos a una va- el último tipo de organización de los datos riable (también podíamos habernos servido que hemos manejado es pertinente para su de las representaciones gráficas correspon- registro y análisis, ya que se trata de una dientes...). Sin embargo, esto no significa secuencia de datos en el tiempo y, en este que hayamos agotado todas las posibles caso, es de suma importancia no perder el vías de su representación y análisis subse- carácter temporal de la información. cuente. De todo lo anterior queremos extraer Por ejemplo, podíamos haber separado algunas conclusiones importantes: los datos de inasistencias en lotes de a cin- co días, con el fin de destacar lo que ocu- • Hay que saber seleccionar, en cada rrió cada semana, de lunes a viernes: (15, caso, los instrumentos estadísticos de or- 19, 18, 18, 17), (17, 11, 13, 19, 18), (20, 21, ganización de los datos que nos puedan 23, 26, 24), (21, 20, 17, 15, 12). O también aportar información pertinente. En nuestro de esta manera: ejemplo, no nos interesa la distribución de frecuencias para los datos agrupados en cla- No de inasistencias ses, ya que no aporta nada adicional. Semana Lun Mar Mié Jue Vie • No debemos cerrarnos a la posibilidad de construir y utilizar otras formas adiciona- 1a 15 19 18 18 17 les de organización de los datos, con el fin de extraer información valiosa. En nuestro 2a 17 11 13 19 18 ejemplo, la tabla de doble entrada resultó ser un instrumento de registro que permitió 3a 20 21 23 26 24 obtener información adicional muy perti- nente. 4a 21 20 17 15 12 14
  • 17. Tome el ejemplo de los pesos de los 31 alumnos antes considerado, analice los datos • El ahorro prácticamente no cuenta presentes en la tabla correspondiente y llegue a algunas conclusiones. para las familias; puede presumirse que no hay cultura de ahorro o que, con más He aquí una gráfica de barras relativa a la distribución porcentual del ingreso familiar seguridad, las necesidades básicas son tan para atender a los gastos correspondientes a los rubros indicados (datos de uno de nues- perentorias que no existe la posibilidad de tros países latinoamericanos, año 2003): ahorrar. • En resumen, se trata de la distribución propia de un país en el que la población destina el ingreso familiar prácticamente para intentar garantizar la supervivencia del día a día... La información contenida en esta gráfica puede ser todavía mayor si, por ejemplo, los datos se recolectan periódicamente, lo que permitiría un seguimiento temporal con el fin de analizar las variaciones poblacionales en la distribución de su ingreso familiar. Cuando se trata de una variable cuali- tativa cuya distribución en categorías viene cuantificada en porcentajes, puede utili- zarse también otro tipo de representación, denominada gráfica circular o de pastel. Veamos un ejemplo similar al anterior, en el que se muestra la distribución de los gastos mensuales de un estudiante universitario fuera de su casa (Shadian, 1998): 8% Obsérvese que la variable distribución porcentual del ingreso familiar es cualitativa, y 38% que sus categorías son, precisamente los rubros o áreas de necesidad indicadas. Por otro 10% lado, las barras son horizontales y, en lugar de las frecuencias de cada valor de la variable, aparecen los porcentajes correspondientes. 14% ¿Qué información podemos inferir de esta gráfica? Pues, entre otras cosas: 30% • Un poco más de la tercera parte del ingreso (35,4 %) se dedica a alimentación; este rubro aparece como prioritario. Alimentación • Los rubros de alimentación, vivienda y servicios, y transporte son los que absorben Renta Libros casi las dos terceras partes (63,6 %) del ingreso familiar. Ropa Otros 15
  • 18. Como se ve, los porcentajes no se representan como barras de diferente longitud, sino Y saquen sus conclusiones acerca de como sectores circulares de diferente área (ver Cuaderno 15). Las áreas de estos sectores las posibilidades que tiene la escuela para son proporcionales a los números que indican los porcentajes; a mayor (menor) porcen- satisfacer los deseos de los niños y niñas; taje, mayor (menor) área del sector, es decir, mayor (menor) abertura del ángulo central por ejemplo, ¿existen las instalaciones, los correspondiente. preparadores y los implementos que esos deportes requieren?; ¿se organizan periódi- Para determinar la medida de este ángulo central podemos utilizar una regla de tres camente competiciones o campeonatos de muy sencilla: esas disciplinas deportivas?; ¿se valoran y estimulan los logros de los alumnos y alum- Porcentaje (%) Medida del ángulo central del sector circular nas en sus prácticas deportivas?...¿cómo 100 360o mejorar las situaciones deficientes? p a De esta forma, si conocemos el porcentaje correspondiente a una categoría de la varia- ble, obtendremos el ángulo del sector circular así: a = px 360 . En caso de que conozcamos 100 ax100 3. Las medidas de este ángulo, podemos calcular el porcentaje correspondiente de esta forma: p = . 360 tendencia central En el ejemplo, verificamos primero que la suma de los porcentajes sea 100 (hágalo). A partir de ahí, al porcentaje del 38 % le corresponde un ángulo central cuya medida es a = (38 x 360)/100 = 136,8o; y así se calculan todas las demás medidas. Luego, se traza una Ya hemos visto lo que podemos hacer circunferencia y, con ayuda de un transportador, se van montando los sucesivos ángulos con los datos: valorarlos, recolectarlos, centrales adosando cada uno al anterior. organizar su presentación y analizarlos. Vamos a verlos ahora desde otra perspec- 3. a) Si el estudiante del ejemplo anterior necesita 20.000 pesos en un mes dado, tiva. Por ejemplo, podemos preguntarnos si ¿cuánto gasta en alimentación durante ese mes? existe(n) algún(os) dato(s) que sea(n) como b) Si durante otro mes mantiene sus porcentajes de gastos y compra ropa por 2.100 especial(es), que pueda(n) mostrarnos algu- pesos, ¿a cuánto ascienden sus gastos de ese mes en libros? na característica muy particular de nuestra colección de datos o que pueda(n), incluso, Hagan una pequeña encuesta en su escuela pidiendo por separado, a los niños y a las representar a la colección completa. niñas, que indiquen cuál es el deporte de su preferencia. En cada uno de los dos casos, tomen los cuatro deportes más destacados y agrupen los demás como “Otros”. Conviertan En el punto 2.3., al presentar los datos las frecuencias de selección en porcentajes (la suma de éstos debe ser igual a 100). ordenados de menor a mayor (o viceversa), decíamos que tal orden nos permite obser- Con esta información, construyan las dos gráficas circulares correspondientes. A partir var y anotar los valores mayor y menor, de ellas, analicen las preferencias manifestadas por los alumnos (niños y niñas), por separa- o el valor que se encuentra en el medio do y comparativamente; valoren los pros y contras (si existen) de la práctica de cada uno de de los datos, o el (los) que más veces se los deportes señalados (individualismo vs. labor de equipo; posibilidades de inclusión o de repite(n)... A estos valores particulares po- exclusión de una porción significativa de alumnos; propensión o no hacia la violencia o ha- demos agregar otro, de uso muy frecuente: cia la tolerancia; excesiva o moderada competitividad; habilidades que se desarrollan...). el valor promedio de todos los datos. 16
  • 19. 3.1. La media 5. Calcule la media de inasistencias para los datos del ejemplo inicial: {15, 19, 18, 18, El valor promedio de todos los datos 17, 17, 11, 13, 19, 18, 20, 21, 23, 26, 24, 21, poblacionales recibe el nombre de media. 20, 17, 15, 12}. Existen diversos tipos de valores promedio, pero aquí nos vamos a referir a la media 6. Calcule la media de los pesos (en Kg) aritmética. Para obtenerla, se suman todos de los niños del ejemplo dado anteriormen- los datos y esta suma se divide entre el nú- te: {37,8; 35,6; 34; 31,9; 40,5; 34,2; 35,6; mero de datos considerados. 38,7; 32,8; 35,4; 41,6; 39,8; 34,5; 37; 42; 36,6; 31,9; 36,5; 35,7; 36; 38; 44,1; 37,2; 4. ¿Tiene sentido calcular la media de 36,8; 35; 33,5; 38,9; 37,5; 34; 36,5; 42,5}. los datos cuando la variable es cualitativa? ¿Por qué? Con el fin de presentar una fórmula ge- neralizada para calcular la media de cual- En realidad, la media es el valor que quier conjunto de datos, procedemos así: cada sujeto de la población tendría si se repartiera “equitativamente” entre todos el • Denotamos con n el número de datos valor de la suma total de los datos de la po- del conjunto (31, en el último ejercicio). blación. La media puede coincidir o no con • Denotamos los n datos del conjunto alguno de los datos del conjunto. con los símbolos x1, x2,..., xn, donde, por ejemplo, x3 representa el tercer dato (34 a) Sea el conjunto de datos: {11, 7, 10, Kg, en el último ejercicio) y x18 es el que 9, 10, 8, 7, 10} ocupa la posición 18 (36,5 Kg, en el último La media es: (11+7+10+9+8+7+10) / 8 ejercicio). = 72 / 8 = 9 • Si denotamos la media con el símbolo La media coincide con uno de los da- x, la fórmula que permite calcular su valor tos del conjunto se expresa así: Para calcular la media efectuaríamos la suma: 11 + 12 + 13 + 15 + 15 + 17 + 17 + b) Sea el conjunto de datos: {11, 8, 10, 17 + ...; está claro que podemos abreviar la 8, 10, 8, 7, 10} x= x1 + x 2 + x 3 + ... + x n [1] suma si los sumandos que se repiten se co- La media es: 72 / 8 = 9 n locan en forma de producto; por ejemplo: La media no coincide con ninguno de 11 + 12 + 13 + (2 x 15) + (3 x 17) + ... Estos los datos del conjunto Como se ve, para calcular la media no paréntesis recogen el producto del dato por hace falta que los datos estén ordenados, ya la frecuencia con que aparece; incluso 11 c) Sea el conjunto de datos: {10, 11, 12, que la suma es conmutativa. puede verse como uno de esos productos, 13, 14, 15, 16, 17, 18, 19} ya que la frecuencia de aparición del dato La media es: 145 / 10 = 14,5 Por otro lado, veamos el caso en que los 11 es 1. La media no coincide con ninguno de datos se presentan en una tabla de distri- los datos del conjunto bución de frecuencias, como la del primer De modo que la suma de todos los da- ejemplo de inasistencias a la escuela: tos, uno por uno, puede sustituirse por la 17
  • 20. suma de los productos de cada dato por la Finalmente, nos queda el caso de hallar la media de un conjunto de datos cuando éstos frecuencia correspondiente. Evidentemente, se presentan en una tabla de frecuencias para datos agrupados en clases. Para nuestro ahora habrá menos sumandos; si antes eran primer ejemplo de inasistencias: 20 datos sueltos a sumar, ahora serán 12, de los cuales 6 serán pequeños productos Datos agrupados Frecuencias (N = 20) (15x2, 17x3, 18x3, 19x2, 20x2, 21x2). De esta forma, la expresión adecuada para el De 11 a 14 3 cálculo de la media es: De 15 a 18 8 x= x1 . f 1 + x 2 . f 2 + ... + x k . f k [2] n De 19 a 22 6 Obsérvese que en el numerador, el su- De 23 a 26 3 bíndice del último sumando es k y no n ya que, como acabamos de decir, ahora habrá No podemos utilizar la fórmula [1], ya que desconocemos los datos sueltos; en prin- menos sumandos, porque algunos datos es- cipio, tampoco la fórmula [2], por la misma razón. Pero esta última fórmula sí nos brinda tán repetidos (tienen una frecuencia mayor un camino para utilizarla en el caso de datos agrupados en clases, ya que en su cálculo que 1). Es decir, los x1, x2, ..., xk, representan intervienen frecuencias. ahora cada uno de los valores distintos de los datos. Pues bien, ahora también conocemos frecuencias, las de cada clase; la pregunta es: ¿por qué valor se va a multiplicar la frecuencia 3, correspondiente a la clase (11, 14) y, así, Esta fórmula es, en realidad, una expre- las demás frecuencias? Hay que seleccionar un valor en cada clase. ¿Qué nos dice la ló- sión muy relacionada con la [1]; de hecho, gica, a falta de mayores precisiones? Que seleccionemos el valor que queda exactamente si todos los datos de una colección fueran en la mitad del intervalo. ¿Cómo se calcula este valor? Sencillamente, sumando los dos distintos, sus frecuencias valdrían 1, k se- extremos de la clase y dividiendo la suma entre 2. Por ejemplo, el valor intermedio en la ría igual a n (¿por qué?), y la fórmula [2] se clase (11, 14) es: (11 + 14)/2 = 25/2 = 12,5; este valor equidista de 11 y de 14. convertiría en la [1]. Este nuevo valor va a representar a la clase (11, 14) a la hora de calcular la media de 7. Calcule la media de los datos que todos los datos; y no importa si pertenece o no al conjunto inicial de datos. A este valor aparecen en la tabla anterior, aplicando la intermedio de cada clase se le denomina marca de la clase; vamos a representarlo por fórmula [2]. Ahora, compare este valor con m1, m2, ... hasta mj, donde j indica el número de clases que tenemos en la distribución de el obtenido en el ejercicio 5. ¿Son iguales? datos agrupados (en nuestro ejemplo, j = 4). 8. Considere ahora el segundo conjunto Con todas estas precisiones, la expresión de la media para el caso de datos agrupados de datos de inasistencias a la escuela pre- en clases es: sentado anteriormente: {12, 11, 12, 13, 14, m . f + m2 . f 2 + ... + m j . f j [3] x= 1 1 13, 15, 16, 14, 15, 18, 16, 19, 15, 21, 20, 24, n 23, 22, 23, 23, 23, 22}. Obtenga el prome- dio de inasistencias de la forma que usted Para facilitar este cálculo, podemos ayudarnos con una tabla más completa que la desee. anterior: 18
  • 21. Marcas de clase Frecuencias Marcas x Frecuencias 2. Tomar de entrada un valor imagina- Clases rio para la media y luego ajustarlo con los (mj) (fj) (mj x fj) datos. Veamos qué significa esto. Supon- (11, 14) 12,5 3 37,5 gamos que las edades de un grupo de 20 (15, 18) 16,5 8 132 niños son las siguientes: 8, 7, 8, 6, 9, 7, 8, 6, (19, 22) 20,5 6 123 7, 7, 8, 8, 6, 10, 9, 10, 7, 8, 7 y 10 años. En este caso, tomemos 8 como valor de entra- (23, 26) 24,5 3 73,5 da de la media de edades de los 20 niños. Totales: n = 20 366 Ahora recorremos ese conjunto de datos y anotamos la diferencia de cada uno de ellos Ahora basta con dividir entre sí los tota- con respecto a 8: les de las columnas 4a y 3a: = 366 / 20 = 18,3. Este es el promedio de inasisten- Datos 8 7 8 6 9 7 8 6 7 7 cias diarias durante el mes considera- do. Como debe ser un número entero, dif + 1 podemos aproximarlo a 18. dif - 1 2 1 2 1 1 Al comparar este valor con el obtenido en los ejercicios 5. y 6. (hágalo), quizá descubra- 8 8 6 10 9 10 7 8 7 10 Total mos una pequeña diferencia; y es que cuando 2 1 2 2 8 los datos están agrupados en clases, se pierde un poco de precisión (aunque se gana en otros 2 1 1 12 aspectos, como ya dijimos anteriormente). La suma de las diferencias positivas es Hay otras formas prácticas de obtener la me- 8; y la de las negativas, 12. Al compensar- dia o el promedio de un conjunto de datos. Vea- se entre ambas, nos queda una diferencia mos estas dos: negativa de 4. ¿Diferencia respecto a qué? A la suma total de los 20 datos, si todos hu- 1. Utilizar la calculadora. Si ésta posee funcio- bieran tenido el valor de la media, 8. Esta nes estadísticas, basta con introducir los datos y pulsar suma total hubiera sido: 20 x 8 = 160. Por luego la tecla correspondiente a la media. Si la calcu- consiguiente, la suma total verdadera de los ladora no posee tales funciones, podemos efectuar la 20 datos es: 160 – 4 = 156. Ahora se divide suma progresiva de todos los datos (directamente o en el entre 20 y obtenemos la media: 7,8 años. registro de memoria M+) y dividir el resultado final entre el número de datos. También podemos proceder dividiendo esa diferencia negativa final, 4, entre 20, lo Este es uno de los casos en que la calculadora puede servirnos como herramienta, que nos da el valor de 0,2; basta restar ahora aliviándonos del tedioso trabajo de efectuar sumas tan largas. Lo importante es conocer este valor de la supuesta media inicial 8, con el significado de lo que estamos haciendo y su por qué; garantizado este conocimiento lo que obtendremos la media verdadera: 8 conceptual, bienvenida sea la calculadora (una vez más). – 0,2 = 7,8 años. 19
  • 22. En principio, este procedimiento puede b) Sea el conjunto de datos: {10, 13, 12, parecer engorroso, pero la verdad es que 19, 17, 11, 15, 14, 16, 18} puede hacerse mentalmente, recorriendo Ordenado de mayor a menor: {19, 18, los datos uno por uno y compensando su- 17, 16, 15, 14, 13, 12, 11, 10} cesivamente las diferencias positivas y ne- Valores centrales: 15 y 14 gativas sobre la marcha: “7 me da 1 negati- Mediana: (15 + 14) / 2 = 14,5 vo; 6 me da 2 negativos, llevo 3 negativos; La mediana no coincide con ninguno de 9 me da 1 positivo, llevo 2 negativos; 7 me los datos del conjunto da 1 negativo, llevo 3 negativos; etc.”. c) Sea la distribución de datos: Como puede verse, este procedimiento nos da mayor soltura en el cálculo, más que Datos Frecuencias si utilizáramos los datos reales, que siempre (N = 20) son más “pesados” de manejar. Además, 12 4 tenemos libertad para elegir el valor inicial 15 6 para la media que, incluso, puede no coin- cidir con ninguno de los datos. 17 8 20 2 Por ejemplo, podríamos haber tomado 7 como valor inicial; o incluso, 7,5... En es- Los datos centrales son el 10° (15) y el tos casos, ¿cómo hubieran sido los cálculos 11° (17) de las diferencias? ¿Cómo hubieran sido La mediana es: (15 + 17) / 2 = 16 las sumas finales de las diferencias? ¿Y la La mediana no coincide con ninguno de media verdadera? Verifíquelo, para salir de los datos de la distribución dudas... y saque sus propias conclusiones. Y trate de justificarlas. Digamos, finalmen- Cuando los datos se presentan en una te, que el procedimiento que acabamos de centro de la distribu- tabla de frecuencias para datos agrupados describir es ideal para estimar (dar un valor ción ordenada. en clases, es suficiente con indicar la cla- aproximado de) la media de una distribu- se mediana, es decir, la clase en la que se ción de datos. a) Sea el conjunto encuentra el dato que ocupa el lugar cen- de datos: {11, 7, 10, 9, tral de la distribución. Por ejemplo, para el 3.2. La mediana 10, 8, 7, 10, 9} caso: Ordenado de menor a La mediana es el valor que, una vez or- mayor: {7, 7, 8, 9, 9, 10, 10, Datos agrupados Frecuencias (N = 20) denados todos los datos, se encuentra en 10, 11} De 11 a 14 3 el “medio”, en la mitad de la distribución. Valor central (en la quin- Si el número de datos es impar, coincidirá ta posición): 9 De 15 a 18 8 con uno de los datos; si es par, puede que 9 es la mediana del conjunto De 19 a 22 6 no ocurra esa coincidencia: hay que pro- La mediana coincide con uno de los da- mediar los dos valores que se hallen en el tos del conjunto De 23 a 26 3 20
  • 23. la clase mediana es la que va de 15 a Datos agrupados Frecuencias (N = 20) 18 (ahí se encuentran los datos 10o y 11o de la distribución) [puede obtenerse con De 11 a 14 3 más precisión un valor para la mediana, pero esto sólo nos llenaría de fórmulas más complejas que pueden verse en cualquier De 15 a 18 8 tratado de Estadística]. 9. Calcule la mediana de las inasisten- De 19 a 22 6 cias para los datos del ejemplo inicial: {15, 19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21, 23, 26, 24, 21, 20, 17, 15, 12}. De 23 a 26 3 10. Calcule la mediana de los pesos (en Kg) de los niños del ejemplo dado anterior- la clase modal es la que va de 15 a 18 mente: {37,8; 35,6; 34; 31,9; 40,5; 34,2; (presenta la mayor frecuencia, 8). 35,6; 38,7; 32,8; 35,4; 41,6; 39,8; 34,5; 37; 42; 36,6; 31,9; 36,5; 35,7; 36; 38; 44,1; 37,2; 12. Indique la moda de las inasisten- 36,8; 35; 33,5; 38,9; 37,5; 34; 36,5; 42,5}. cias para los datos del ejemplo inicial: {15, 19, 18, 18, 17, 17, 11, 13, 19, 18, 20, 21, 23, 11. ¿Tiene sentido calcular la mediana 26, 24, 21, 20, 17, 15, 12}. de los datos cuando la variable es cualitati- va? ¿Por qué? 13. Indique la moda de los pesos (en Kg) de los niños del ejemplo dado ante- a) Sea el conjunto de datos: {7, 12, 8, 7, riormente: {37,8; 35,6; 34; 31,9; 40,5; 3.3. La moda 10, 10, 8, 9, 12, 10} 34,2; 35,6; 38,7; 32,8; 35,4; 41,6; 39,8; La moda es 10 (se repite 3 veces) 34,5; 37; 42; 36,6; 31,9; 36,5; 35,7; 36; La moda es, sencillamente, el La distribución es unimodal 38; 44,1; 37,2; 36,8; 35; 33,5; 38,9; 37,5; valor que más se repite (el que 34; 36,5; 42,5}. está más “de moda”); por lo tanto, b) Sea el conjunto de datos: {8, 7, 15, 13, puede haber una o más modas en 7, 10, 13, 15, 9, 11} Ya tenemos los conceptos de media, la distribución de los datos. Lo que La moda corresponde a los valores 7, 13 mediana y moda de una distribución de sí es cierto –a diferencia de lo que y 15 (se repiten dos veces cada uno) datos, así como la forma de calcularlos o ocurre con la media y la mediana- La distribución es trimodal descubrirlos. Al hallar sus valores en los es que la moda siempre coincide con ejercicios anteriores nos habremos dado un dato de la distribución. Y que es Cuando los datos se presentan en una cuenta de que, habitualmente, estos valores la única medida que puede obtenerse tabla de frecuencias para datos agrupados se ubican entre los valores del centro de la cuando los datos son cualitativos; por en clases, sólo se puede indicar la clase distribución, cuando están ordenados los ejemplo, si se trata de la distribución modal, es decir, la clase que presenta ma- datos. De ahí viene su calificativo de me- por lugares de origen, etc. yor frecuencia. Por ejemplo, para el caso: didas de tendencia central –o valores cen- 21
  • 24. trales, o medidas centrales- de un conjunto decirse que el grupo, en promedio, apro- cada pregunta con alguno de los siguien- de datos. bó? ¿Por qué? tes códigos: 1. aumenta; 2. disminuye; 3. permanece igual; 4. no se puede asegurar 3.4. Otros aspectos matemáticos de Veamos ahora el siguiente cuadro de nada]. las medidas de tendencia central posibles casos de calificaciones (en la es- cala de 1 a 20): 15. ¿Qué le ocurre a la media de una Con el fin de reforzar algunos aspectos distribución de datos si el número de da- relativos al cálculo de la media y a la de- tos es par y: terminación de la mediana y de la moda, a) todos los datos aumentan en 2 uni- Caso Media Mediana Moda así como para destacar las relaciones entre dades? ellas, vamos a proponer la resolución de al- b) todos los datos disminuyen en 3 gunos ejercicios. 1 12 12 12 unidades? c) la mitad de los datos aumenta en 2 ¿Pueden coincidir las tres medidas cen- unidades y la otra mitad queda igual? trales en una misma distribución de datos? d) la mitad de los datos aumenta en 3 Si su respuesta es positiva, construya un 2 15 13 18 unidades y la otra mitad disminuye en 1? ejemplo de tal distribución. Si es negativa, explique por qué. 16. ¿Qué le ocurre a la mediana en los cuatro casos anteriores? a) Construya ahora, si es posible, una 3 11 10 08 distribución en la que no coincida ningu- Se ha calculado la media de un grupo na de las tres medidas. de 20 calificaciones. Pero posteriormen- b) Ídem, en la que coincidan la media te, 7 calificaciones suben en 2 puntos, 5 y la mediana, pero no así la moda. 4 12 16 11 quedan igual, 3 disminuyen en 2 puntos, c) Ídem, en la que coincidan la moda y 2 disminuyen en 3, 1 disminuye en 4, y 1 la mediana, pero no así la media. disminuye en 5 puntos. ¿Qué le ha ocu- d) Ídem, en la que coincidan la media Suponga que el curso está integrado rrido a la nueva media con respecto a su y la moda, pero no así la mediana. por 20 alumnos. Para cada uno de los 4 valor anterior? casos construya, si es posible, una distri- En una clase de 6° grado hay un grupo bución de datos que se ajuste a los valores No conocemos los datos, ni tampoco numeroso de alumnos muy capaces. Si las dados de las medidas de tendencia cen- el valor de la media; tampoco nos piden el calificaciones en Matemática se dan en la tral. valor de la nueva media, sino su variación escala de 1 a 20, ¿qué media de califica- con respecto a la anterior. Esto significa ciones puede esperarse? ¿Y qué mediana? 14. ¿Qué le ocurre (o le puede ocurrir) que tenemos que centrarnos en la varia- ¿Y qué moda? ¿Es probable que la moda a la media de un conjunto de datos no to- ción que han experimentado los datos y, sea alta? dos iguales, si se elimina de dicho con- particularmente, el resultado final de las junto: a) el dato mayor; b) el dato menor; variaciones de todos los datos. Si la mediana de un grupo de califica- c) un dato de valor igual a la media; d) ciones de Historia es 7 (en la escala de 1 un dato de valor igual a la mediana; e) un Calculamos los aumentos que han ex- a 10) y la nota aprobatoria es 5, ¿puede dato de valor igual a la moda? [Responda perimentado los datos: 7 x 2 = 14 puntos. 22
  • 25. Y las disminuciones que han experimen- más representativo(s) en cada caso. Para En cuanto a la segunda restricción, en el tado: 3 x 2 + 2 x 3 + 1 x 4 + 1 x 5 = 21 ello, comenzaremos por precisar las poten- conjunto de datos: {7, 5, 3, 8, 4, 5, 3, 61}, la puntos. cialidades y las limitaciones de cada una de media es: 96 / 8 = 12, valor que está afec- Variación total final: La suma de los da- las tres medidas centrales. tado por el último dato (61) ya que la media tos ha disminuido en 7 puntos. de los siete primeros datos sería 35 / 7 = 5. Por consiguiente, la media habrá dismi- La media es la medida de tendencia Como se ve, el valor 12 no representa real- nuido en 7/20 = 0,35 puntos. central de mayor uso, puesto que: mente al conjunto de los ocho datos. Obsérvese que la media depende di- • su cálculo es sencillo; rectamente de la suma de todos los datos; • nos da una idea resumida y más Por su parte, la mediana también se ob- y que su variación depende de la variación consistente del conjunto de datos (el tiene fácilmente y no está influida por los de esta suma. promedio de sus valores); valores extremos, aunque tampoco nos dice • varía en concordancia con los nada de cómo son en realidad los datos de 17. Un conjunto de 300 niños se reparte datos, en el sentido de que si todos ambas mitades de la distribución, ni acerca en lotes de 10 niños. En cada lote, los niños los datos aumentan o disminuyen en de su variación con respecto a la mediana. tienen exactamente las siguientes edades: 8 la misma cantidad, o se multiplican o años (3 niños); 9 años (2 niños); 10 años (1 dividen por la misma cantidad, la me- Así, por ejemplo, observe que estos dos niño); y 11 años (4 niños). ¿Cuál es la media dia queda afectada por la misma va- conjuntos ordenados de datos: {1, 3, 3, 3, de las edades de los 300 niños? ¿Y la me- riación; 4, 14, 21, 27, 27, 27, 27} y {12, 12, 13, 14, diana? ¿Y la moda? • suele decirse que es más estable 14, 15, 15, 16, 16} tienen la misma mediana que la mediana; esto significa que si ex- (14), pero difieren significativamente entre 3.5. Las medidas de tendencia traemos diversas muestras de la misma sí. central como representativas del población, las medias de estas diversas conjunto de datos muestras se parecen más entre sí que las Finalmente, de la moda no hay mucho medianas de las mismas muestras. más que decir, salvo insistir en su ambigüe- Los ejercicios anteriores son, sin duda, dad: puede darse incluso el caso de que no útiles para desarrollar destrezas en la apli- Pero, por otro lado, la media: represente a un valor del centro de la dis- cación de los conceptos de las medidas de • no nos dice cuán variables son los tribución, sino extremo. Por ejemplo, en el tendencia central, así como de los procesos datos, cómo difieren unos de otros; siguiente conjunto de datos: {11, 13, 16, 17, para su obtención o transformación. Pero •corre el riesgo de dejarse influir por 18, 20, 20, 20}, la moda es 20, que repre- podemos formularnos otra pregunta de ma- los valores extremos de la distribución, si senta al mayor de los datos. yor interés: ¿Para qué se obtienen las medi- hay alguno(s) de ellos muy distante(s) de das de tendencia central? los demás. Conocer las potencialidades y limitacio- nes de cada uno de los valores centrales es En principio, hemos dicho que son Así, por ejemplo, estos tres conjuntos de un prerrequisito necesario para poder res- como representativas de todo el conjunto datos: {11, 12, 13, 14, 15, 16, 17}, {14, 14, 14, ponder a la pregunta del para qué se ob- de datos, aun cuando cada una lo hace a 14, 14, 14, 14} y {2, 2, 2, 14, 26, 26, 26} tie- tienen las medidas de tendencia central, o su manera. Lo que nos interesa es tener cri- nen la misma media (verifíquelo), pero son de su equivalente, cuál de los valores re- terio para que, a la vista de cada variable completamente diferentes en la estructura presenta mejor al conjunto de datos. Pero y de la distribución de sus datos, podamos de sus datos; la media no puede darnos una el condicionante principal de la respuesta decidir cuál(es) de los tres valores resulta(n) idea de la variabilidad de los datos. está en el análisis de los requerimientos 23
  • 26. propios de cada situación, de la variable en tenemos un carro” (Gilbert Chesterton, juego y de los datos recolectados. novelista inglés, 1874-1936) 4. Las medidas de Supongamos que tenemos la distri- bución de las edades de los alumnos del dispersión salón de clase y que calculamos los valo- res de sus medidas de tendencia central. Ya hemos visto que las medidas de ¿Qué significa la media de tales edades? tendencia central nos aportan información ¿Y la mediana? ¿Y la moda? ¿Alguna de acerca de la distribución de los datos de estas medidas es más representativa del una variable; información importante y ne- conjunto de edades que las demás? ¿O to- cesaria, pero no suficiente. Como dijimos y das ellas tienen algo peculiar que aportar? pudimos verlo en algunos ejemplos y ejer- cicios, ninguna de las medidas de tendencia 18. Para poder proceder a su posterior central, ni siquiera las tres juntas, pueden dotación, acabamos de obtener la distri- ofrecernos el detalle de los datos, la varia- bución de datos referentes a las tallas de bilidad presente en ellos. zapatos, camisetas, pantalones y faldas de todos los niños y niñas de la escuela. En En efecto, consideremos estos dos con- cada una de estas cuatro distribuciones, juntos de datos ordenados, referentes a las ¿qué sentido tiene obtener la media de las calificaciones escolares de dos grupos de 20 tallas? ¿Y la mediana? ¿Y la moda? ¿Algu- alumnos (en una escala de 1 a 20 puntos): na de estas medidas es más representativa que las demás? ¿Podemos prescindir de Conjunto 1: {3, 4, 4, 4, 5, 5, 6, 6, 7, 10, alguna(s) de estas medidas, tomando en 10, 10, 10, 15, 16, 16, 17, 17, 17, 18} cuenta el objetivo de su recolección? Conjunto 2: {9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 12, 12, 12} Invente una situación en la que Ud. va a recabar unos datos y en la que la moda La media, la mediana y la moda de am- sea el valor más representativo del con- bos conjuntos es la misma (10 puntos); y sin junto. Análogamente para la mediana. Y, embargo, las distribuciones son muy dife- finalmente, para la media. rentes. El segundo grupo de calificaciones se presenta más homogéneo, las notas es- Para concluir este punto, permítasenos tán más agrupadas; cosa que no ocurre en presentar dos interpretaciones referentes al el primer conjunto, en el que la dispersión promedio, una de carácter irónico y la otra, de las notas es muy marcada. graciosamente distorsionada: De modo que no basta con que intente- “La Estadística es la ciencia que esta- mos caracterizar o resumir una distribución blece que si mi vecino tiene dos carros de datos aportando sus medidas de tenden- y yo no tengo ninguno, entonces los dos cia central; necesitamos también decir algo 24