Graficas o diagramas

413
-1

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
413
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Graficas o diagramas

  1. 1. Corporación Universitaria Minuto de Dios Módulo Estadística Descriptiva GRÁFICAS O DIAGRAMAS Las gráficas permiten describir brevemente las características de un colectivo. Existen varios tipos de gráficas que pueden utilizarse para representar el comportamiento de una variable, tales como histogramas, polígonos de frecuencia, ojivas, diagramas circulares y barras. Histogramas Un histograma de frecuencias consiste en una serie de rectángulos que se construyen sobre un plano cartesiano. Este tipo de gráfica se aplica a la variable cuantitativa continua. Sobre el plano cartesiano, en el eje horizontal, se ubican los intervalos de cada clase, y en el eje vertical las frecuencias. Luego, para cada intervalo se dibuja un rectángulo cuya base es la amplitud del intervalo de cada clase, y la altura es la frecuencia de cada clase. Si sobre el eje vertical se ubican las frecuencias absolutas, se obtiene el histograma de frecuencias absolutas, y si se ubican las frecuencias relativas, se obtiene el histograma de frecuencias relativas, como se ilustra en las gráficas 1 y 2 para un grupo de expertos que auditan un proceso. Gráfica 1. Histograma de frecuencias absolutas para un grupo de expertos que auditan un proceso. Tiempo que tarda (en minutos) un grupo de expertos en auditar un proceso
  2. 2. Gráfica 2. Histograma de frecuencias relativas (porcentajes) para un grupo de expertos que auditan un proceso Polígono de frecuencias El polígono de frecuencias se construye de forma similar al histograma; la diferencia radica en la forma y estructura de la gráfica, la cual se obtiene ubicando las marcas de clase sobre el eje horizontal; y sobre el eje vertical, las frecuencias, según el tipo de polígono; si se ubican las frecuencias absolutas, se denomina polígono de frecuencias absolutas; y si se ubican las frecuencias relativas, se denomina polígono de frecuencias relativas, como se ilustra en las gráficas 3 y 4 para un grupo de expertos que auditan un proceso.
  3. 3. Gráfica 3. Polígono de frecuencias absolutas para un grupo de expertos que auditan un proceso Gráfica 4. Polígono de frecuencias relativas para un grupo de expertos que auditan un proceso Se acostumbra prolongar el polígono hasta las marcas de clase inferior y superior inmediatas, que corresponderían a las clases de frecuencia cero. Los polígonos de frecuencia pueden tomar muchas formas, sin embargo, en la mayoría de los casos toman una forma acampanada que se identifica con la curva normal.
  4. 4. Ojivas o polígonos de frecuencias acumuladas La construcción de estos polígonos es similar a los polígonos de frecuencias absolutas y relativas; la diferencia radica en que aquí se toman las frecuencias acumuladas, como se puede observar en las gráficas 5 y 6, donde se presentan los polígonos de frecuencias absolutas y relativas acumuladas para el grupo de expertos que auditan un proceso. Gráfica 5. Polígono de frecuencias absolutas acumuladas para un grupo de expertos que auditan un proceso Gráfica 6. Polígono de frecuencias relativas acumuladas para un grupo de expertos que auditan un proceso
  5. 5. Diagramas de barras Los diagramas de barras son muy utilizados por la facilidad y sencillez que ofrecen para presentar características de una población, especialmente de variables cualitativas o cuantitativas discretas. Los diagramas de barras consisten en rectángulos de anchura arbitraria en la cual se ubican los valores de la variable, y de longitud proporcional al número de observaciones o frecuencias. Las barras se pueden construir de forma horizontal o vertical, como se muestra en la gráfica 7, correspondiente a los datos de la tabla. Gráfica 7. Diagrama de barras. Diagramas circulares Estas gráficas consisten en un círculo dividido en partes proporcionales a los porcentajes de cada una de las características o valores de la variable. Se utilizan principalmente en la representación de variables cualitativas. 0 2 4 6 8 10 12 Ateltismo Fútbol Baloncesto Voleibol Balonmano No. de Personas Deporte Favorito DEPORTE F. ABSOL. Atletismo 5 Fútbol 10 Baloncesto 8 Voleibol 4 Balonmano 3
  6. 6. Para su construcción, se dividen los 360° de la circunferencia proporcionalmente a los porcentajes o a las frecuencias absolutas de cada característica. En la gráfica 8 se ilustra el nivel de escolaridad de los asociados de la Cooperativa de Trabajo Asociado Epsilón. En ella, 360° corresponde al 100% de los asociados; con nivel profesional corresponde 36°; nivel técnico corresponde 108°; nivel de bachillerato, 144°; y con básica primaria, 72°. Gráfica 8. Nivel de escolaridad de los asociados de la Cooperativa de Trabajo Asociado Epsilon Diagrama de tallo y hojas El diagrama de tallo y hoja es una herramienta valiosa y versátil para organizar un conjunto de datos y entender la distribución y agrupación de los valores dentro del intervalo de observaciones en el conjunto. Un diagrama de tallo y hoja separa los datos en dígitos guía, o tallos, y dígitos que le siguen, u hojas. Para construir el diagrama, primero se ordenan los dígitos principales de cada dato a la izquierda de una línea vertical. A la derecha de ésta se registra el último dígito para cada dato conforme al orden de aparición de las
  7. 7. observaciones. El último dígito de cada dato se coloca en la fila que corresponde a su primer dígito. Para ilustrar el uso del diagrama de tallo y hojas se consideran los siguientes datos de la tabla 13. La información es resultado de un examen de aptitudes de 150 preguntas, aplicado a 50 personas durante un proceso de selección de personal en Manufacturas Alfa. Tabla : Número de preguntas contestadas en forma correcta en una prueba de aptitud 112 84 108 76 115 102 124 119 7 115 73 68 76 118 94 80 83 95 95 85 126 100 141 132 97 98 92 104 134 107 82 72 119 96 86 106 81 69 128 100 92 92 98 91 127 106 106 113 81 75 Fuente: Datos hipotéticos Inicialmente, se deben ubicar los datos en tallo y hojas, así: 6 9 8 7 2 3 6 3 6 5 8 6 2 3 1 1 0 4 5 9 7 2 2 6 2 1 5 8 8 5 4 10 7 4 8 0 2 6 6 0 6 11 2 8 5 9 3 5 9 12 6 8 7 4 13 2 4 14 1 Posteriormente, se ordena cada línea en forma ascendente, y una vez ordenado, queda el diagrama de tallo y hojas como sigue:
  8. 8. 6 8 9 7 2 3 3 5 6 6 8 0 1 1 2 3 4 5 6 9 1 2 2 2 4 5 5 6 7 8 8 10 0 0 2 4 6 6 6 7 8 11 2 3 5 5 8 9 9 12 4 6 7 8 13 2 4 14 1 Los números de la izquierda de la línea (6, 7, 8, 9, 10, 11, 12, 13, 14) forman el tallo, y cada dígito de la derecha de la fila es una hoja. Por ejemplo, se considera la primera fila con un valor de tallo igual a 6, y hojas de 8 y 9, lo cual significa que hay dos valores que tienen un primer dígito de 6; las hojas muestran que los valores son 68 y 69. De manera similar, la segunda fila indica que hay seis valores cuyo primer dígito es siete: 72, 73, 73, 75, 76 y 76. Si se gira el diagrama de tallo y hojas 90° en sentido contrario a las manecillas del reloj, se obtiene una imagen similar al histograma de frecuencias. Aunque el diagrama de tallo y hojas parece ofrecer la misma información que un histograma, tiene dos ventajas principales: 1. Es más fácil de construir. 2. Dentro de un intervalo de clase, el diagrama de tallo y hojas da más información que un histograma, porque muestra los valores reales. Diagrama de Pareto El diagrama de Pareto es un recurso gráfico que permite representar datos categóricos (variables cualitativas) y que a menudo proporciona más información visual que los diagramas de barras o circulares. El diagrama de Pareto es un tipo especial de diagrama de barras verticales, donde las respuestas categorizadas se grafican en orden descendente de frecuencias y se combinan con un polígono acumulado en la misma escala. El
  9. 9. principio fundamental de la gráfica es separar los “pocos vitales“ de los “muchos triviales”, lo que permite dirigir la atención a las respuestas importantes. Así, el diagrama alcanza su utilidad máxima cuando la variable categórica de interés contiene muchas categorías. Este diagrama se utiliza ampliamente en el control estadístico de procesos y el control estadístico de calidad del producto. En la construcción de un diagrama de Pareto, el eje vertical de la izquierda contiene las frecuencias o porcentajes, el eje vertical de la derecha contiene los porcentajes acumulados, y el eje horizontal contiene las categorías de interés. Las barras con separación uniforme tienen el mismo ancho. El punto en el polígono de porcentajes acumulados para cada categoría se centra en el punto medio de cada barra. Entonces, al estudiar el diagrama de Pareto se buscan dos cosas: las magnitudes de las diferencias en las longitudes de las barras que corresponden a las categorías adyacentes decrecientes, y los porcentajes acumulados de estas categorías adyacentes. Para ilustrar el diagrama de Pareto, se utiliza el ejemplo tomado del texto Estadística para administración, de Berenson y otros, página 60. El gerente de operaciones de una planta empacadora de cereales indicó que, según su experiencia, casi siempre hay nueve razones que dan como resultado la producción de cajas de cartón no conformes al final del proceso de empaque: cartón roto, cartón abultado, cartón agrietado, cartón sucio, agujeros en el cartón, peso de empaque inadecuado, error de impresión, etiqueta ilegible y tapa superior sin sello. Se tomó una muestra de 50 cajas de cartón no conformes de la producción de una semana, con los siguientes datos:
  10. 10. Porcentajes razones de no conformidad de la producción de cajas de cartón RAZÓN DE NO CONFORMIDAD NÚM % % ACUMULADO Tapa superior sin sello 16 32.0 32.0 Etiqueta ilegible 12 24.0 56.0 Cartón sucio 9 18.0 74.0 Cartón abultado 4 8.0 82.0 Cartón roto 3 6.0 88.0 Cartón agrietado 2 4.0 92.0 Peso de empaque inadecuado 2 4.0 96.0 Agujeros en el cartón 1 2.0 98.0 Error de impresión 1 2.0 100.0 Total 50 100.00 Fuente: Berenson y otros. Estadística para administración, Pág. 60. Gráfica 9. Diagrama de Pareto para las razones de no conformidad de la producción de cajas de cartón A pesar de los “pocos vitales” de los “muchos triviales”, se determina que las tapas sin sello (32.0%), las etiquetas ilegibles (24.0%) y los cartones sucios (18.0%) representan el 74% de las razones de no conformidad. Las otras razones representan el 26%. La gráfica de Pareto es muy útil al permitir identificar visualmente en una sola revisión tales minorías de características vitales a las que es importante prestar atención y de esta manera utilizar todos los recursos necesarios para llevar
  11. 11. acabo una acción correctiva sin malgastar esfuerzos. Algunos ejemplos de tales minorías vitales serían: · La minoría de clientes que representen la mayoría de las ventas. · La minoría de productos, procesos, o características de la calidad causantes del grueso de desperdicio o de los costos de reelaboración. · La minoría de rechazos que representa la mayoría de quejas de la clientela. · La minoría de vendedores que esta vinculada a la mayoría de partes rechazadas. · La minoría de problemas causantes del grueso del retraso de un proceso. · La minoría de productos que representan la mayoría de las ganancias obtenidas. · La minoría de elementos que representan al grueso del costo de un inventarios. TABULACIÓN DE DATOS BINARIOS O CRUZADOS Con frecuencia se requiere analizar al mismo tiempo las respuestas de dos variables, por lo cual es necesario cruzar variables para describir exitosamente el comportamiento de las mismas. En este caso, se utiliza la tabulación cruzada o tablas de contingencia. La tabulación cruzada o tablas de contingencia se emplea para resumir de manera simultánea los datos para dos variables. Se describirá el procedimiento mediante la adaptación del ejemplo planteado por Anderson y otros en el texto Estadística para administración y economía, Pág. 44. Un informe mundial sobre restaurantes muestra muchas variables, entre ellas, la evaluación de la calidad del restaurante y los precios característicos. La calificación de la calidad es una variable cualitativa, con categorías de bueno, muy bueno y excelente. El precio de la comida es una variable cuantitativa continua que, por lo general, varía de 10 a 49 dólares. Se tomó una muestra
  12. 12. de 300 restaurantes para un Estado determinado. En la tabla se muestran sólo los datos para los primeros 10 restaurantes. Tabla 1. : Evaluación de calidad y precio de la comida para restaurantes de un Estado RESTAURANTE EVALUACIÓN DE LA CALIDAD PRECIO DE LA COMIDA (dólares) 1 Bueno 18 2 Muy bueno 22 3 Bueno 28 4 Excelente 38 5 Muy bueno 33 6 Bueno 28 7 Muy bueno 19 8 Muy bueno 11 9 Muy bueno 23 10 Bueno 13 . . . . . . Fuente: Anderson y otros. Estadística para administración y economía, Pág. 44. El formato general de la tabulación cruzada para este ejemplo se muestra en la tabla 2, la cual ha recogido toda la información para el Estado objeto de análisis. Los encabezados de las márgenes izquierda y superior definen las clases de las dos variables. En la margen izquierda se encuentran las categorías de la variable Evaluación de la calidad, y en la parte superior los valores correspondientes a la variable Precio de la comida. Cada restaurante tiene una evaluación de la calidad y un precio de la comida. Así, cada restaurante de la muestra se asocia con una celda que aparece en uno de los renglones y en una de las columnas de la tabulación cruzada. Por ejemplo, el restaurante 5 se identifica por tener una evaluación de la calidad muy buena y un precio de la comida de 33 dólares. Este restaurante pertenece a la celda de la fila 2 y la columna 3 de la tabla 1. Para elaborar una tabulación
  13. 13. cruzada simplemente se cuenta la cantidad de restaurantes que pertenecen a cada una de las celdas de la tabla. En la tabla 2 se observa que la mayor cantidad de restaurantes (64) en la muestra tienen calificación de “muy bueno“, y que el precio de la comida está entre los límites de 20 a 29 dólares. Sólo hay dos restaurantes con calificación de “excelente” y precio de la comida de 10 a 19 dólares. De las demás frecuencias se puede llegar a interpretaciones análogas. Además, las márgenes derecha e inferior de la tabla cruzada indican por separado las distribuciones de frecuencias de evaluación de la calidad y del precio de la comida. En la margen derecha se ve que los datos sobre evaluación de la calidad indican que hay 84 restaurantes buenos, 150 muy buenos y 66 excelentes. De igual forma, la margen inferior indica la distribución de frecuencias de la variable “costo de la comida”. Tabla 2. Tabulación cruzada o tabla de contingencia de calificaciones y precio de la comida para restaurantes de un Estado EVALUACION DE LA CALIDAD PRECIO DE LA COMIDA (dólares) TOTAL 10 - 19 20 - 29 30 - 39 40 - 49 Bueno 42 40 2 0 84 Muy bueno 34 64 46 6 150 Excelente 2 14 28 22 66 TOTAL 78 118 76 28 300 Fuente: Anderson y otros. Estadística para administración y economía, Pág. 44. El valor de una tabulación cruzada consiste en que proporciona una idea de la relación entre las variables. A partir de los resultados de la tabla 2 los precios más altos por comida parecen estar asociados con una calidad mayor del restaurante y el precio más bajo por comida a una calidad menor. Si se convierten los elementos de la tabla 2 a porcentajes de fila o porcentajes de columna, se puede tener una mejor idea acerca de la relación entre las variables. Para los porcentajes de fila, los resultados de dividir cada
  14. 14. frecuencia de la tabla 2 entre su total de fila correspondiente se muestran en la tabla 3. Por ejemplo, el porcentaje en la primera fila y la primera columna (50%) se calcula al dividir 42 entre 84 y multiplicar por 100. Para los porcentajes de columna, los resultados de dividir cada frecuencia de la tabla 2 entre su total de columna correspondiente se muestran en la tabla 4. Por ejemplo, el porcentaje en la primera fila y la primera columna (53.8%) se calcula al dividir 42 entre 78 y multiplicar por 100. Tabla 3. Tabulación cruzada o tabla de contingencia de porcentaje de fila para las calificaciones de calidad y los precios de la comida EVALUACIÓN DE LA CALIDAD PRECIO DE LA COMIDA (dólares) TOTAL 10 - 19 20 - 29 30 - 39 40 - 49 Bueno 50.0 47.6 2.4 0.0 100 Muy bueno 22.7 42.7 30.6 4.0 100 Excelente 3.0 21.2 42.4 33.4 100 Fuente: Anderson y otros. Estadística para administración y economía, Pág. 44. Tabla 4. Tabulación cruzada o tabla de contingencia de porcentaje de columna para las calificaciones de calidad y los precios de la comida EVALUACIÓN DE LA CALIDAD PRECIO DE LA COMIDA (dólares) 10 - 19 20 - 29 30 - 39 40 - 49 Bueno 53.8 33.9 2.6 0.0 Muy bueno 43.5 54.2 60.6 21.4 Excelente 2.7 11.9 36.8 78.6 TOTAL 100 100 100 100 Fuente: Anderson y otros. Estadística para administración y economía, Pág. 44.

×