Organizacion y reporte1

414 views

Published on

Articulo académico sobre estadistica descriptiva

Published in: Education
  • Be the first to comment

  • Be the first to like this

Organizacion y reporte1

  1. 1. 18 UNIDAD ITEMA 3ORGANIZACIÓN Y DESCRIPCIÓN GRÁFICA DE UNCONJUNTO DE DATOS1.10. Organización de un conjunto de datos. Tablas de frecuenciaEs muy común que ante un conjunto de datos obtenidos directamente de la fuente de información,éstos no puedan ser visualizados por presentarse en forma desordenada y demasiado extensa. En elejemplo seis del tema anterior es dificil decir a simple vista en la tabla 1.1 cuántos obreros tienentres hijos; hay que hacer un conteo entre los 200 datos para saber cuántas veces ocurrió el númerotres. Un modo de organizar los datos para visuarlos más fácil y rápidamente es agrupando losque tengan el mismo valor e indicando cuántas veces se repite cada uno de ellos, es decir, indi-cando la FRECUENCIA de su repetición. Eso puede hacerse mediante una TABLA DE FRE-CUENCIAS, donde la información se pone por columnas o por renglones. La tabla 1.3 correspondea los 200 datos de la población del ejemplo seis: TABLA 1.3 Dato CONTEO Frecuencia O //111 111JI JI 111 I 16 1 //111 11111 11111 11111 11 22 2 11111 //111 11111 1/111 1111/ 1/1// 1/1 33 3 111/1 111/1 1/111 11111 1/1/1 1/1/1 1/11/ 1/1/1 1111/ 45 4 1/11/ 111/1 1/11/ 1/1/1 1/1/1 11/1/ I 31 5 11111 //1/1 11111 11111 20 6 1/1/1 111/1 11 12 7 1/1/1111/ 9 8 1111/ // 7 9 //11/ 5 Cuando el número de datos recabados no es demasiado pequefio es conveniente hacer elconteo como se expone en la segunda columna de la tabla de frecuencias 1.3.
  2. 2. ESTADfsTICA DESCRIPTIVA 191.11. Gráficas de variables numéricas discretas y tablas de frecuencias relativasOtro modo de presentar la misma información, pero en forma visualmente más resumida, es pormedio de una gráfica denominada HISTOGRAMA o de otra llamada POLÍGONO DE FRE-CUENCIAS. Para ello se traza un sistema de ejes coordenados; en el eje horizontal localizamos losdistintos valores que toma la variable y en el eje vertical localizamos las frecuencias. El histogramase construye uniendo los datos con barras cuya altura corresponde a la frecuencia de cada dato (VERGRÁFICA 1.2) Y el polígono de frecuencias se forma uniendo con segmentos los puntos que tienencomo abcisa a cada dato y como ordenada su correlativa frecuencia (VER GRÁFICA 1.3): 45 45 40 40 35 35 30 30 25 25 20 20 15 15 10 10 5 5 o o 2 3 4 5 6 7 8 9 o o 1 2 3 4 5 6 7 8 9 GRÁFICA ].2 GRÁFICA 1.3 La tabla de frecuencias, el histograma y el polígono de frecuencias para los datos de lamuestra aleatoria seleccionada de la población en el ejemplo seis son (VER TABLA 1.4 y GRÁFICAS 1.4 y1.5): TABLA 1.4 Dato CONTEO Frecuencia O I 1 1 11 2 2 1111 4 3 11111 I 6 4 11111 I 8 5 1111 4 6 I 1 7 I 1 8 I 1 9 11 2
  3. 3. 20 UNIDAD I o 23456 7 8 9 o 1 2 3 4 5 6 7 8 9 GRÁFICA 1.4 GRÁFICA J.S Teniendo la información organizada en una tabla de frecuencias o en un histograma, po-demos responder fácil y rápidamente a preguntas como: ¿qué porcentaje de obreros en la poblaciónno tienen hijos?, o ¿qué porcentaje de obreros en la muestra no tienen hijos? En la tabla de frecuencias para la población vemos que hay 16 obreros sin hijos de untotal de 200, luego el porcentaje es 16 -x 100%=(0.08xI00%)=8% 200y para la muestra tenemos que hay un obrero sin hijos de un total de 30, el porcentaje es 1 - x 100 % = ( 0.03 x 100 % ) = 3 % 30 Las fracciones ~ para calcular el porcentaje en la población y ...!.. para el porcentaje en 200 30la muestra expresan cada una el cociente formado por lafrecuencia del dato dividida entre el totalde elementos. Dicña fraccián se llama FRECUENCIA RELATWA o PROPORCIÓN Si a la tabla de frecuencias le agregamos otra columna con las frecuencias relativas,tendremos una TABLA DE FRECUENCIAS RELATWAS, la cual consitituye una síntesis delos datos que forman una poblacián -o, en su caso, una muestra- estadística. Este concepto seráesencial para las aplicaciones probabilísticas con variables que veremos en la Unidad m (VER INFRA,3.3).Las tablas de frecuencias relativas para la población (VER TABLA 1.5) Y para la muestra del ejem-plo seis (VER TABLA 1.6) son:
  4. 4. ESTADíSTICA DESCRIPTIVA 21 TABLA I.S TABLA 1.6 Dato Frecuencia Frecuencia relativa Dato Frecuencia Frecuencia relativa O 16 16/200 = 0.080 O 1 1/30 = 0.033 1 22 22/200 = 0.110 1 2 2/30 = 0.066 2 33 33/200 = 0.165 2 4 4/30 = 0.133 3 45 45/200 = 0.225 3 6 6/30 = 0.200 4 31 31/200 = 0.155 4 8 8/30 = 0.266 5 20 20/200 = 0.100 5 4 4/30 = 0.133 6 12 12/200 = 0.060 6 1 1/30 = 0.033 7 9 9/200 = 0.045 7 1 1/30 = 0.033 8 7 7/200 = 0.035 8 1 1/30 = 0.033 9 5 5/200 = 0.025 9 2 2/30 = 0.066 En las tablas 1.5 y 1.6 se percibe cierta similitud entre las frecuencias relativas de losdatos de la población con los correspondientes de la muestra; lo mismo ocurre con los histogramas(VER GRÁFICAS 1.6 y 1.7). Además, veamos que estas gráficas están hechas con las frecuencias relativasen el eje de las ordenadas, y no con las frecuencias: en general, dos gráficas -sean histogramas opolígonos- resultan ser idénticas cuando se hacen con frecuencias o con frecuencias relativas, loque pasa es que se cambia la escala en el eje de las ordenadas. Para el estudio estadístico y probabilístico de una población o muestra es más útil trabajar confrecuencias relativas, por lo cual de aquí en adelante se empleará en las gráficas la frecuencia relativa. 0,3 0,25 0,2 0,15 0,1 0,05 o+--+__~~~~~-+ __~~~~ 234 567 8 9 o ° 234 567 8 9 GRÁFICA 1.6 GRÁFICA 1.7 Cuanto más grande se hace la muestra, mayor es la aproximación entre sus porcentajes ylos de la población. Este resultado nos llevará en la siguiente unidad al concepto de "regularidadestadística" del cual se desprenderá la definición frecuencial de probabilidad. Suponiendo que necesitamos conocer cuántos obreros de la población del ejemplo seistienen A LO MÁs o COMO MÁXIMO tres hijos. Correlacionamos en la tabla 1.5 la columna de
  5. 5. 22 UNIDAD I"Dats" con la de "Frecuencias" para sumar las frecuencias que hay entre cero y tres hijos. Elresultado es: 16 + 22 + + 33 + + 45 = 116 obreros. Este procedimiento indica el grado de acumu-lación ordenada de los datos en un nivel determinado, es decir la FRECUENCIA ACUMULADAde los datos hasta dicho nivel. Pero debemos saber también qué porcentaje o proporción del total de datos representala frecuencia acumulada en un nivel dado: FRECUENCIA RELA TIVA ACUMULADA. Divi-dimos entonces la frecuencia acumulada entre el total de datos. Resulta: 116/200 = 0.580. En sín-tesis, el 58% de los obreros -116 de ellos- tienen entre cero y tres hijos. La frecuencia relativa acumulada y su generalización como porcentaje o proporciónson ampliamente utilizados en el estudio teórico de la estadística y en la aplicación de esta teoría(VÉASE INFRA, ESTADíSTICA INFERENCIAL: UNIDADES V A VIlJ). PORCENTlLES es la denominación que se daa este concepto: que el dato "3" tenga acumulado el 58% del total de los datos significa este dato esel 0.58 porcentil del conjunto de datos, de igual manera el dato 5 es el 0.835 porcentil y el dato 7 esel 0.975 porcentil. Se ve que es imprescindible construir tablas que contengan, además de la columna dedatos, las columnas referentes a la frecuencia, la frecuencia acumulada, la frecuencia relativa y lafrecuencia relativa acumulada, como ocurre en la tabla 1.7 que es la ampliación de la tabla 1.5 yen la tabla 1.8 (VER INFRA) referente a los datos de la muestra de la población "número de hijos por /obrero", organizados anteriormente en la tabla 1.6. TABLA 1.7 Dato Frecuencia Frecuencia Frecuencia Frecuencia relativa. acumulada relativa acumulada O 16 0.080 16 0.080 1 22 0.110 38 0.190 2 33 0.165 71 0.355 3 45 0.225 116 0.580 4 31 0.155 147 0.735 5 20 0.100 167 0.835 6 12 0.060 179 0.895 7 9 0.045 188 0.940 8 7 0.035 195 0.975 9 5 0.025 200 1.000 En el caso de la muestra del ejemplo seis, los obreros con un máximo de tres hijos son 13(frecuencia acumulada), que representa el 43.3% del total de datos, es decir, el dato "3" es el 0.433porcentil (frecuencia relativa acumulada). Cualquier observador podrá Uegar a este resultado consólo ver la última columna de la tabla 1.8.
  6. 6. ESTADfsTICA DESCRIPTIVA 23 TABLA 1.8 Dato Frecuencia Frecuencia Frecuencia Frecuencia relativa acumulada relativa acumulada O 1 0.033 1 0.033 1 2 0.066 3 0.099 2 4 0.133 7 0.233 .. 3 6 0.200 13 0.433 4 8 0.266 21 0.700 5 4 ~ 0.133 25 0.833 6 1 0.033 26 0.866 7 1 0.033 27 0.900 8 1 0.033 28 0.933 9 2 0.06$ 30 1.00 Además, una tabla de frecuencias relativas acumuladas nos ayuda a contestar preguntascomo ¿qué porcentaje de obreros de la muestra tiene POR LO MENOS cuatro hijos? En la tablavemos que el dato "3" posee una frecuencia relativa acumulada de 0.433; como el total de porcen-tajes de todos los datos suma exactamente 1, restamos 0.433 al, y tenemos que los obreros concuatro hijos COMO MÍNlMO son el 0.567 del total. Toda esta información será esencial para elcálculo de probabilidades de la muestra -o de la población- (VER INFRA, 2.16.) También es importante cotejar las gráficas -tanto histogramas como polígonos- de lasfrecuencias acumuladas y de las frecuencias relativas acumuladas tanto de población como demuestra para percibir similitudes y contrastes entre ambos. Por ejemplo, puedes contrastar el histo-grama acumulativo de la población (VER GRÁFICA 1.8) con el de la muestra (GRÁFICA 1.9.) 0,9 0,9 0,8 0,8 0,7 0,7 0,6 0,6 0,5 0,5 0,4 0,4 0,3 0,3 0,2 0,2 0,1 0,1 OT=~--~~~~~~~~~~~ ° 2 3 4 5 6 7 8 9 ° 1 234 5 6 789 ° GRAFICA 1.8 GRÁFICA 1.91.12. Gráficas de variables categóricasSea nominal u ordinal la variable categórica, se sigue el mismo procedimiento que el visto en elinciso 1.ll. Ilustramos esto con dos ejemplos:
  7. 7. 24 UNIDAD I Ejemplo 7. Los siguientes datos corresponden a una muestra aleatoria de 50 estudiantesde tercer afio de un colegio de nivel medio superior que han solicitado su pase a una facultad. (VERTABLA 1.9.) TABLA 1.9 Dato Dato Dato Dato Dato 1 O 11 Ad 21 C 31 O 41 I 2 Q 12 O 22 O 32 M 42 D 3 O 13 O 23 I 33 Q 43 E 4 M 14 C 24 F 34 Ad 44 E 5 F 15 I 25 Q 35 E 45 O 6 M 16 D 26 M 36 O 46 Ad 7 O 17 M 27 Ar 37 O 47 M 8 Ar 18 O 28 C 38 O 48 I 9 E 19 M 29 Ar 39 Q 49 E 10 F 20 I 30 O 40 F 50 M Las letras utilizadas en las columnas de datos de esta tabla son abreviaturas de las facul-tades universitarias que constituyen los valores que ha tomado la variable, y significan lo siguiente:Ad - - Administración Ar - - Arquitectura e -- Ciencias 0/-- DerechoE - - Economía F - - Filosofía 1- - Ingeniería M - - MedicinaO - - Odontología Q - - Química Una tabla de frecuencias relativas y una gráfica para estos datos son como las siguientes: TABLA J.IO Dato Conteo Frecuencia Frecuencia relativa Ad 111 3 3/50 = 0.06 Ar 111 3 3/50 = 0.06 C 111 3 3/50 = 0.06 D 2 2/50 = 0.04 E F " ,," 5 4 5/50 = 0.10 4/50 = 0.08 I "" /" 4 4/50 = 0.08 M O ,," 11/ 11111 11/1/ 11 8 12 8/50 = 0.16 12/50 = 0.24 Q 1111 4 4/50 = 0.08 Hemos ordenado alfabéticamente los valores de la variable "Facultad a la que solicitaningresar los estudiantes de tercer afio del colegio X". Establecer un orden entre los valores adopta-dos por una variable categórica nominal, ya lo hemos visto, no tiene ninguna interpretación prácti-ca (VER SUPRA 1.5). Por eso mismo, tampoco tiene sentido agregar a la tabla 1.1O las columnas defrecuencia acumulada y de frecuencia relativa acumulada.
  8. 8. ESTADíSTICA DESCRIPTIVA 25 Ad Ar e o E F M o Q GRÁFICA 1.10 En estadística el tipo de gráficas como la 1.10 recibe diversos nombres: llamaremosGRAFICA DE BARRAS a la gráfica relativa a una variable categórica e HISTOGRAMA a lagráfica correspondiente a una variable numérica. Notarás que en la gráfica de barras éstas apare-cen separadas (VER TAMBIÉN GRÁFICA 1.11) mientras que en el histograma aparecen juntas (VER GRÁFICAS1.2 y 1.4). Ejemplo 8. El departamento de servicios escolares de un colegio de nivel medio superiorha elaborado una tabla de frecuencias relativas para las calificaciones finales de la materia de Esta-dística de los 20 grupos en los que se impartió esta asignatura (VER TABLA 1.11). Se añade la gráficade barras respectiva. TABLA 1.11 Dato Frecuencia Frecuencia relativa Frecuencia Frecuencia relativa acumulada acumulada NA 296 296/985 = 0.3005 296 296/985 - 0.3005 S 198 198/985 = 0.2010 494 494/985 =0.5015 B 307 307/985 = 0.3116 801 = 801/985 0.8131 MB 184 184/985 = 0.1868 985 985/985 =1.0000 Total 985 1 1 0,35 0,3 0,25 0,2 0,15 0,1 0,05 O+-_-L-+_ __~~~~~~~~ NA s B MB GRÁFICA 1.11
  9. 9. 26 UNIDAD I En suma, una tabla de frecuencias relativas y una gráfica de barras, un histograma oun polígono sirven, entre otras cosas, para organizar y resumir en poco espacio la informacióncontenida en los datos y nos dan a simple vista una idea de cómo se distribuyen los posibles valo-res de la variable.1.13. Gráficas de una variable numérica continua Con una variable continua pocos datos tienen el mismo valor porque la variable puede tomar unainfinidad de valores. Ejemplo 9. En un día determinado se midió el tiempo que tardan 50 estudiantes del cole-gio X en trasladarse de su casa al plantel escolar. Los resultados, medidos en minutos y décimas deminuto, son: TABLA 1.12 Dato Dato Dato Dato Dato 1 12.5 11 19.3 21 28.1 31 34.1 41 35.7 2 33.2 12 15.0 22 32.5 32 27.6 42 41.0 3 7.0 13 35.7 23 18.1 33 24.3 43 11.3 4 20.8 14 11.2 24 13.8 34 33.8 44 20.8 5 45.2 15 18.7 25 29.4 35 19.9 45 27.6 6 4.6 16 29.1 26 21.3 36 18.7 46 30.1 7 18.1 17 43.7 27 42.8 37 28.6 47 18.7 8 25.4 18 29.4 28 25.0 38 19.1 48 22.5 9 28.6 19 38.7 29 30.4 39 28.2 49 38.0 10 18.3 20 23.1 30 28.4 40 22.4 50 17.5 Una tabla de frecuencias relativas contendría 42 datos diferentes, casi todos con frecuen-cia uno; de hecho esta tabla no resumiría la información -sólo la ordenaría- y un histograma co-rrespondiente a ella contendría 42 barras, lo que haría muy dificil graficarlas porque varios datosdiferirían muy poco entre sí. Lo mismo ocurriría en el polígono de frecuencias (VER GRÁFICA 1.12). 3 3.5 2.5 3 2 2.5 1.5 2 1.5 1 ~tXJ:Ó 0.5 0.5 0~~~~~~~~~~~~~N4~ O-ttt-++tti+tt+t+t1I+H+H-++tti+tt+t++Il+Hf+f+f 4. 1 1 1 1 2 2 2 2 2 3 3 3 4 6 1. 5 8. 9. 1. 3. 5. 8. 9. O. 3. 8 2. 3 333142148 8 GRÁFICA 1.12
  10. 10. ESTADfsTICA DESCRIPTIVA 27 La gráfica 1.12 no permite visualizar cómo se distribuyen todos los valores de la varia-ble. Por ello es conveniente agrupar los datos en una forma más compacta y sintética, un modode hacerlo es por INTERVALOS. No hay una regla general para agrupar por intervalo los datosreferentes a una variable continua. Nos limitaremos a sugerir una forma sencilla de hacerlo y que,además, se adecúa al posterior desarrollo de los temas de este libro. Consta de tres fases:• Antes que nada, se selecciona el número de intervalos. El número dependerá de la cantidad de datos obtenidos y de que dicho número permita alcanzar los objetivos del estudio, reflejando adecuadamente la distribución de los datos. La experiencia demuestra que si se tienen 30 datos lo más adecuado es distribuirlos en cinco O seis intervalos; si son 50 datos, en ocho, nueve o diez intervalos; para alrededor de 100 datos, usar entre 15 y 20 intervalos; para más de 100 da- tos, manejar entre 20 y 30 intervalos.• Por lo común, los intervalos deberán tener igual longitud. Para calcular ésta se obtiene el RAN- GO, que consiste en restar el dato de menor valor al de mayor valor, luego la longitud se ob- tiene al dividir el rango entre el número de intervalos. Obtenido este resultado se construyen los intervalos según se enuncia a continuación.• (PARA ENTENDER MEJOR ESTE PASO, VE COMPARANDO CADA lNSTRUCC¡ÓN CON LAS PARTES ALUDIDAS EN ELLA DE LA TABLA 1.13). El extremo izquierdo del primer intervalo puede ser el dato de menor valor o un número más pequeño. El extremo izquierdo del segundo intervalo debe coincidir con el extre- mo derecho del intervalo anterior, repiténdose el mismo número en ambos extremos. Para sa- ber a qué intervalo pertenece tal número consideramos a los intervalos cerrados por la izquierda y abiertos por la derecha ( o sea que el número de la izquierda ,tipertenece al inter- valo y el de la derecha no-l J. Repitiendo la misma operación en los demás intervalos éstos se ajustarán al rango de los datos -siempre que la división para obtener la longitud de los interva- los sea exacta- porque el dato mayor coincidirá con el extremo derecho del último intervalo; en este caso habrá que cerrar dicho intervalo por la derecha para incluir en él al dato mayor (SI LA DIVISIÓN NO ES EXACTA SE HARÁN LOS AJUSTES QUE VEREMOS EN LOS SI- GUIENTES EJEMPLOS). Una vez obtenidos los extremos de los intervalos, procedemos a elaborar la tabla de frecuencias relativas. Apliquemos esta sugerencia a los datos del ejemplo nueve. Allí tenemos 50 datos y lorecomendable es que se agrupen en ocho, nueve o diez intervalos. Elijamos el ocho. El dato mayor es 45.2 y el menor es 4.6; por lo tanto, el rango es R = 45.2 - 4.6 = 40.6.La longitud de los intervalos es aproximadamente 40.6 / 8 = 5.0. (Resultado inexacto, sobran 0.6como residuo.)4 Los símbolos" [ ", "]" significan respectivamente "intervalo cerrado por la izquierda" e "intervalo cerrado por la derecha". El símbolo" ) " denota "intervalo abierto por la derecha".
  11. 11. 28 UNIDAD I Si empezamos el primer intervalo con el dato menor 4.6, los intervalos son: TABLA 1.13 Intervalo [4.6,9.6) [9.6 , 14.6) [14.6,19.6) [19.6,24.6) [24.6 , 29.6) [29.6 , 34.6) [34.6 , 39.6) [39.6 , 44.6] Los intervalos contienen sólo 49 datos (con la longitud de 5.0 apenas cubrimos el rangodesde 4.6 hasta 44.6); el último dato 45.2 queda afuera: hay que ajustar la longitud de 5.0. Paracubrir hasta el dato mayor faltan las seis décimas del residuo en la división. Aumentamos a 5.1 lalongitud de los intervalos (ocho décimas más, en total). Como teníamos 0.6 de residuo, ahora nossobran 0.8 - - 0.6 = 0.2. Las compensamos, repartiendo estas dos décimas, una antes del inicio delprimer intervalo y la otra después del final del último. Empezaremos en 4.5 y acabaremos en 45.3(VER TABLA 1. 15.) Ya obtenidos los extremos de los intervalos hacemos la tabla de frecuencias relativas enla que agregamos la columna de la MARCA DE CLASE que se considera como un punto (núme-ro) represenuuivo de su respectivo intervalo (clase). Algunos autores proponen que sea el puntomedio del intervalo, otros sugieren que alguno de sus extremos lo sea (VER TABLA 1.14.) Los extremos de los intervalos se conocen como Límites reales de clase. Las frecuen-cias correspondientes a cada intervalo son Frecuellcias de clase. Las frecuencias relativas decada intervalo son Frecuencias relativas de clase. TABLA 1.14 Intervalo Marca de clase Conteo Frecuencia Frecuencia relativa [ 4.5, 9.6) 7.0 1/ 2 = 2/50 0.04 [ 9.6,14.7) 12.1 /111 4 = 4/50 0.08 [14.7,19.8) 17.2 /111/ /111/ 10 = 10/50 0.20 [19.8.24.9) 22.3 //11/ /11 8 = 8/50 0.16 [24.9 • 30.0) 27.4 1111/ 1//11 1/ 12 = 12/50 0.24 [30.0 , 35.1) 32.5 //111 / 6 = 6/50 0.12 [35.1 .40.2) 37.6 1111 4 = 4/50 0.08 [40.2 , 45.3) 42.7 1/11 4 = 4/50 0.08 El histograma y el polígono acumulativo de frecuencias correspondientes a esta tablaestán en las gráficas 1.13 y 1.14.
  12. 12. ESTADfsTICA DESCRIPTIVA 290.25 .--- 0.9 0.2 - 0.8 0.70.15 r-- 0.6 0.5 0.1 - 0.4 .--- 0.3 0.05 0.2 1-- 0.1 O O 7 12.1 17.2 22.3 27.4 32.5 37.6 42.7 7 12.1 17.2 22.3 27.4 32.5 37.6 42.7 GRÁFICA 1.13 GRÁFICA 1.14 Algunos llaman histograma únicamente a la gráfica de barras para una variable continua.Nosotros también hemos denominado como histograma a la gráfica de barras para una variablenumérica discreta porque en la práctica también se hace necesario en algunos casos agrupar porintervalos los datos relativos a esta variable, según ahora veremos: Ejemplo 10. Para medir el nivel de conocimientos en matemáticas de los alumnos querecién han ingresado al colegio X, se aplicó un examen de diagnóstico a una muestra de tamaño 60,representativa de la población. El examen contiene 80 reactivos de opción múltiple y la calificaciónes el número de reactivos contestados correctamente. Estos son los resultados: TABLA 1.15 Dato Dato Dato Dato Dato Dato 1 63 11 50 21 76 31 49 41 67 51 26 2 40 12 61 22 52 32 58 42 24 52 43 3 73 13 48 23 32 33 50 43 55 53 26 4 61 14 49 24 37 34 46 44 51 54 60 5 68 15 39 25 49 35 20 45 34 55 75 6 54 16 70 26 62 36 67 46 55 56 31 7 25 17 37 27 43 37 45 47 55 57 SO 8 67 18 61 28 57 38 38 48 58 58 31 9 37 19 43 29 52 39 27 49 60 59 48 10 59 20 33 30 50 40 60 50 38 60 44 Si hiciéramos el histograma directamente con estos datos, obtendríamos 37 barras porquehay 37 valores distintos entre los 60 datos. Mejor agrupemos los datos en diez intervalos: el rango es R = 76 - 20 = 56, distribuyendo56/ 10 = 5.6 nos da una división que no es exacta; al subir cuatro décimas la longitud de cada in-tervalo quedarán éstas en 6 y el total rebasará el valor del rango en cuatro unidades, las que reparti-remos así: dos unidades antes del dato menor "20" y dos después del dato mayor "76" quedandocomo se muestra en la tabla 1.16.
  13. 13. 30 UNIDAD I TABLA 1.16Intervalo Marca Frecuencia Frecuencia rela- Frecuencia Frecuencia Acum. de clase tiva acumulada relativa[18 ,24) 21 1 0.016 1 0.016[24,30) 27 5 0.083 6 0.100[30,36) 33 5 0.083 11 0.183[36,42) 39 7 0.116 18 0.300[42 ,48) 45 6 0.100 24 0.400[48,52) 51 11 0.183 35 0.583[52,60) 57 8 0.133 43 0.716[60 ,66) 63 9 0.150 52 0.866[66 72) I 69 5 0.083 57 0.950[72 78] I 75 3 0.050 60 1.000 Un polígono de frecuencias relativas y un histograma de frecuencias relativas acumuladasson los siguientes. 0.2 1 0.18 0.9 0.16 0.8 0.14 0.7 0.12 0.6 0.1 0.5 0.08 0.4 0.06 0.3 0.04 0.2 0.02 0.1 o o~-+ +--+ +--+~+--+ __+--+~ 22.4 28 33.6 39.2 44.8 50.4 56 61.6 67.2 72.8 22.4 28 33.6 39.2 44.8 50.4 56 61.6 67.2 72.8 GRÁFICA I.JS GRÁFICA 1.16 Existen otras formas de representar gráficamente la información recabada; por ejemplo,las "gráficas de pastel" son muy empleadas en publicaciones como periodicos, revistas, etc., por sucapacidad representación visual atractiva y concreta. Para el desarrollo conceptual y práctico de este libro es suficiente con dominar la grafica-ción a través de histogramas y polígonos.EJERCICIOS16. Agrupando a los datos del ejercicio 13 del tema anterior en cinco intervalos construye una tablade frecuencias relativas y frecuencias relativas acumuladas para la población.
  14. 14. ESTADrSTICA DESCRIPTIVA 3117. Dibuja dos gráficas referentes al mismo ejercicio: histograma de frecuencias relativas y polígo-no de frecuencias relativas acumuladas.18. Elabora con los siguientes datos la tabla de frecuencias relativas acumuladas y la gráfica debarras que les correspondan: Médico (frecuencia = 9); Profesor (frecuencia = 15); Licenciado (frecuencia = 46) Ingeniero (frecuencia = 17); Arquitecto (frecuencia = 14); Enfermera (frecuencia = 5)19. En una compañía los totales de facturas cobradas por semana para las 50 semanas laborables en1997 han sido los siguientes: 238, 215, 188, 182, 235, 188, 248, 261, 248, 200, 169, 222, 232, 207, 237, 274, 225, 220, 217, 241, 205, 199, 231, 177, 207, 245, 241, 253, 223, 230, 189, 204, 201, 224, 199, 216, 230, 264, 240, 22] , 198, 179, 176, 210, 191, 193, 215, 249, 219, 228, Haz con los siguientes datos:a. Una tabla de frecuencias relativas y relativas acumuladas, agrupando los datos en siete intervalosde clase.b. El histograma y el polígono de las frecuencias relativas de clase.20. ¿Cuáles son los límites reales y la marca de clase de cada intervalo en el ejercicio anterior?21. a. Completa esta tabla con los datos faltantes: TABLA E 1.1 Dato frecuencia frecuencia frecuencia Frec. Rel. relativa acumulada acumulada O 5 1 0.12 2 0.50 3 4 10 Total 50 b. ¿Cuál es el 0.5 porcentil de este conjunto de datos? c. El dato "3" ¿qué porcentil es?22. Construye un polígono de frecuencias relativas y un histograma acumulativo para los datos delproblema anterior.23. Tienes cinco intervalos de clase (marcas de clase: 6, 8.6, 11.2, 13.8 Y 16.4). Sabes de n = 20. Elintervalo de clase 8.6 tiene una frecuencia relativa acumulada de 0.30 y contiene la mitad de datos
  15. 15. 32 UNIDAD Ique los incluidos en el primer intervalo de clase. El dato con mayor frecuencia -de 8- tiene unafrecuencia acumulada igual a 14. Los dos últimos intervalos de clase tienen, cada uno, el mismonúmero de frecuencias de clase. Escribe lo que sabes en una tabla de frecuencias relativas acumu-ladas y complétala.24. Dibuja el histograma y el polígono de frecuencias relativas de clase de la tabla del ejercicioanterior.25. Usando la Tabla 1de dígitos aleatorios del apéndice, selecciona una muestra aleatoria simple detamaño n = 50 de la población del ejemplo 6 del tema anterior y con los resultados construye unatabla de frecuencias relativas y relativas acumuladas, además construye los histogramas de fre-cuencias relativas y de frecuencias relativas acumuladas.26. Asocia a los siguientes conceptos con sus respectivas características:a. Tabla Síntesis geométrica de la distribución frecuencial de los datos ( )b. Límites reales de clase Histograma con las barras separadas por graficarc. Gráfica de barras variables categóricas ( )d. Gráfica Puntos extremos de un intervalo de clase ( )e. Polígono Gráfica obtenida al unir los puntos cuya abcisa es cada dato y cuya ordenada es su respectiva frecuenciaf. Histograma ()g. Rango Descripción aritmética de la distribución frecuencial de los datos ( )h. Frecuencia relativa Razón entre el número de veces que se repite cada datoentre el total de los datos obtenidos ( ) Diferencia entre el dato mayor y el menor del intervaloocupado por los datos ( ) Gráfica de barras unidas, referente a variables numéricas discretas y continuas ( )27. La frecuencia es una propiedad de los datos, ¿en qué consiste?28. a. ¿Cuál es la diferencia entre la frecuencia y la frecuencia de clase? b. ¿Cuál es la diferencia entre frecuencia relativa acumulada y porcentil? J

×