Formulas estadisticas

797 views
558 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
797
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
19
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Formulas estadisticas

  1. 1. Desviación respecto a la media La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media aritmética. Di = |x - x| Desviación media La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por Ejemplo: Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Desviación media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
  2. 2. Ejemplo: Calcular la desviación media de la distribución: xi fi xi · fi |x -x| |x - x| · fi [10, 15) 12.5 3 37.5 9.286 27.858 [15, 20) 17.5 5 87.5 4.286 21.43 [20, 25) 22.5 7 157.5 0.714 4.998 [25, 30) 27.5 4 110 5.714 22.856 [30, 35) 32.5 2 65 10.714 21.428 21 457.5 98.57
  3. 3. En Excel: 5.1 DESVIACIÓN MEDIA Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentración, debemos como primera medida, calcular la distancia de cada dato respecto a una medida de tendencia central. Por ejemplo: 4 5 3 5 3 2 2 2 2 3 5 1 4 1 4 Tenemos que la media aritmética es de aproximadamente 3,0667 (indicador de tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333 hacia la derecha. Gráficamente tendríamos: Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmética: Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la media. Para indicar las distancias de estos puntos, agregaremos el signo negativo, por tanto, la distancia del tercer dato sería –0,0667. La representación gráfica de todos los puntos quedaría: El total de las distancias de los puntos que están a la izquierda respecto a la media es de -8,6 (empleando todos los decimales), que es igual a la sumatoria de las distancias de los puntos que están a la derecha respecto a la media 8,6. Concluimos que la sumatoria de todas las distancias de cada punto respecto a la media aritmética es igual a cero (las distancias se anulan): Para responder a la pregunta de ¿qué tan disperso están los datos respecto a la media aritmética?, recurriremos nuevamente al promedio simple. Para llegar a una fórmula básica de dispersión, en que las distancias positivas y negativas no se eliminen, modificaremos la fórmula anterior para trabajar solo con distancias positivas mediante el valor absoluto: La distancia promedio sería de aproximadamente 1,15 (resultado de la división entre la distancia total absoluta y el total de datos). A esta distancia promedio se le conoce con el nombre de desviación media y significa que en promedio, los datos se separan de la media en 1,15. Desviación media (Dm): Equivale a la división de la sumatoria del valor absoluto de las distancias existentes entre cada dato y su media
  4. 4. aritmética y el número total de datos. Se debe hacer la distinción que para datos poblacionales (no agrupados), la fórmula quedaría: La variación para los datos agrupados en tablas tipo B radica en cambiar el valor de X i por la marca de clase correspondiente, multiplicando esa distancia por su frecuencia: Para las tablas tipo A solo cambiaremos la marca de clase por su respectivo valor de clase (representada por Xi): 5.1.1 Ejemplo: Desviación media para datos no agrupados Tres alumnos son sometidos a una competencia para probar sus conocimientos en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del concurso es encontrar al alumno más idóneo para representar al colegio en un torneo a nivel nacional. El número de preguntas buenas por materia se muestra a continuación: Materia Carlos Pedro Juan 1 2 7 5 2 9 2 6 3 10 2 5 4 2 6 5 5 3 6 5 6 1 3 5 7 9 6 4 8 9 7 5 9 1 6 6 10 4 5 4
  5. 5. SOLUCIÓN Lo primero que analizaremos es la media de los puntajes para cada uno de los alumnos, con el fin de determinar el alumno con mayor promedio de preguntas buenas. Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el indicador diferenciador entre los alumnos?. Complementemos el análisis anterior calculando la desviación media: Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9), siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba como por debajo de la media aritmética. Se recomienda al colegio elegir como ganador en este caso a Juan, presenta resultados más constantes que los otros dos alumnos, Juan en promedio acierta 5 preguntas buenas con una variación muy baja (rondando entre 4 y 6). 5.1.2 Ejemplo: Desviación media para datos agrupados Una maquina dispensadora de gaseosas esta programada para llenar un envase con 350 c.c. de un refresco popular. A partir de una muestra de prueba realizada sobre 30 envases se realizó la siguiente tabla de frecuencia: Ni 1 2 3 4 5 6 Lm 130.0 140.1 150.1 160.1 170.1 180.1 Ls 140.1 150.1 160.1 170.1 180.1 190.0 Total F 2 5 14 4 4 1 Mc 135.1 145.1 155.1 165.1 175.1 185.1 30 Calcular e interpretar la desviación media. SOLUCIÓN PASO 1: Calcular la media aritmética. PASO 2: Calcular la desviación media. La desviación media es de aproximadamente 8,8 c.c. Concluimos que con datos suministrados de una muestra, el dispensador llenó los 30 envases con un promedio de 157,095 c.c. con una desviación media de 8,8 c.c.
  6. 6. La desviación media describe un rango de dispersión promedio de llenado del dispensador, ubicándolo entre 148,295 c.c. (equivale a restar la media a la desviación media) y 165,895 c.c. (sumar una desviación media a la media aritmética). 5.1.3 Cálculos de la desviación media en Excel Presentaremos el cálculo de la desviación media en Excel tanto para datos sin agrupar, como para los datos agrupados en tablas de frecuencias. Copiemos los siguientes datos a partir de la celda B2. Excel cuenta con la función DESVPROM para el cálculo de la desviación media para datos sin agrupar. DESVPROM: Calcula la desviación media de un conjunto de datos numéricos. Formato: DESVPROM(número1;número2;…) Categoría: Estadísticas Activemos esta función en la celda B9, señalando el rango de celdas B2:F7 en el campo número1. Al pulsar en el botón Aceptar, se mostrará la desviación media. Para el cálculo de la desviación media en tablas de frecuencia debemos calcular de antemano la media aritmética y el valor absoluto de las distancias. Copiemos la siguiente tabla de frecuencia en una hoja nueva en Excel (es la misma utilizada en el ejemplo 5.1.2). El primer paso es calcular la media aritmética para datos agrupados con ayuda de la función SUMAPRODUCTO (ver el ejemplo dado en el punto 4.1.7), aplicado sobre las frecuencias y marcas de clases. Luego hallaremos las distancias de cada marca de clase respecto a la media, convirtiéndolas a su valor absoluto con la función ABS.
  7. 7. ABS: Devuelve el valor absoluto de un número. Formato: ABS (número) Categoría: Matemáticas y trigonométricas Esta función posee un único campo (número) el cual contendrá, la distancia entre la marca de clase y la media. Para el primer intervalo de clase tendríamos: Donde F3 representa la primera marca de clase y B11 la media aritmética. Para completar el cálculo, multiplicaremos esta función por la frecuencia respectiva: Para poder arrastrar la fórmula, debemos recordar que la celda B11 no varía (la media aritmética es una sola), ubicándonos sobre las letras B11 en modo de edición y luego pulsando la tecla F4. El resultado final, después de haber arrastrado la fórmula, debería verse como sigue: El total de las distancias se muestra en la celda G9. La desviación (que ubicaremos en la celda B12), es el resulta de la división de la distancia total sobre el número de datos empleados en el ejercic Moda La moda , M o , es el valo r que tiene mayor frecuencia absoluta . 1º Todos los intervalos tienen la misma amplitud. L i - 1 es el límite inferior de la clase modal. f i es la frecuencia absoluta de la clase modal.
  8. 8. f i - - 1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. f i - + 1 es la frecuencia a bsoluta inmediatamente posterior a la clase modal. a i es la amplitud de la clase. También se utiliza otra fó rmula de la moda que da un valo r aproximado de ésta: 2º Los intervalos tienen amplitudes distintas. En primer luga r tenemos que ha llar las alturas. La clase modal es la que tiene mayor altura. La fórmula de la moda apro ximada cuando existen distintas amplitudes es: Mediana Es el valor que ocupa el lugar central de todos los datos cuando éstos están orden ados de menor a mayor .
  9. 9. 1 Si la serie tiene un número impar de medidas la mediana es la puntuación cen tral de la misma. 2 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos p untuaciones cen trales . Mediana para datos agrupados es la semisuma de las frecuencias absolutas. L i - 1 es el límite inferior de la clase donde se encuentra . F i - 1 es la frecuencia ac umulada anterior a la clase mediana. a i es la amplitud de la clase. Media aritmética La media aritmética es el valor obtenido a l sumar todos los d atos y dividir el resultado entre el número tota l de datos. Cuartiles Los cuartiles son los tres valo res de la un conjunto de dato s ordenados en cuatro p artes iguales. variable dividen a
  10. 10. Cálculo de los cuartiles 1 Orden amos los d ato s de menor a mayor. 2 Buscamos el lugar expresión que ocupa ca da cuartil mediante la . Cálculo de los cuartiles para datos agrupados En primer lugar buscamos la clase donde se encuentra , en la tab la de las frec uencias acumuladas . Deciles Los deciles son los nu eve valores que d ivid en la serie de datos en diez partes iguales. Cálculo de deciles Ordenamo s los datos de meno r a mayo r. Buscamos la puntuación, en la serie, o frecuencias acumuladas, donde se encuentra la clase, en la tabla , . de las
  11. 11. Percentiles Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Cálculo de percentiles Ordenamo s los datos de meno r a mayo r. Buscamos la puntuación, en la serie, o la clase, en frecuencias acumuladas, donde se encuentra la tabla de las ,. Desviación media La desviac ión media es la media aritmética de los valo res abso lutos de las desviaciones respecto a la media . Desviación media para datos agrupados
  12. 12. Varianza La varianza es la med ia aritmética del cuad rado de las desviac io nes respec to a la media de una distribución estadística. Varianza para datos agrupados Para simplificar el c álc ulo de la varianza va mos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Varianza para datos agrupados Desviación típica La desviac ión típica es la raíz cuad rad a de la varianza .
  13. 13. Desviación típica para datos agrupados Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equiva lentes a las a nteriores. Desviación típica para datos agrupados Coeficiente de variación El coeficien te de variación es la relación entre la desviación típic a de una muestra y su m edia. Coeficiente de variación en tanto por ciento Puntuaciones diferenciales Las puntuaciones diferenc iales resultan las puntuaciones direc tas la media aritmétic a . xi = Xi − X de restarles a
  14. 14. Puntuaciones típicas Las puntuaciones típicas son el resulta do de dividir las puntuac io nes diferenc iales entre la desviación típic a. Este proceso se llama tip ificación . Distribuciones bidimensionales Covarianza Coeficiente de correlación lineal Recta de regresión de Y sobre X
  15. 15. Recta de regresión de X sobre Y Correlación estadística La correlación estad ística determina la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional . Es decir, determina r si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlaciona das o que hay correlac ión entre ellas. Coeficiente de correlación El coeficiente de correlación lineal se expresa mediante la letra r. Propiedades 1. El co efic iente de correlación no varía al hacerlo la escala de medición. Es decir, si expresamos la a ltura en metros o en centímetros el coeficiente de correlación no va ría. 2. El signo del coefic iente de correlación es el mismo que el de la covarianza.
  16. 16. Si la covarianza es positiva, la correlación es directa . Si la covarianza es negativa, la correlación es inversa. Si la covarianza es nula, no existe correlación. 3. El co efic iente de c orrelac ión lineal es un número real comprendido entre menos −1 y 1. −1 ≤ r ≤ 1 4. Si el coeficiente d e correlac ión lineal toma valores cercanos a −1 la correlación es fuerte e inversa, y será tanto más fuerte cuanto más se aproxime r a −1. 5. Si el coeficiente d e correlación lineal toma valores cercanos a 1 la correlación es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1. 6. Si el coeficiente de correlación lineal toma valores cercanos a 0, la correlación es déb il. 7. Si r = 1 ó −1, los puntos de la nube está n sobre la recta creciente o decreciente. Entre amba s varia bles hay depend encia funcional . Ejercicios Las estaturas y pesos de 10 juga dores de ba loncesto de un equipo son: Estatura (X) 186 189 190 192 193 193 198 201 203 205 Pesos ( Y) 85 85 86 90 87 91 93 103 100 101
  17. 17. Calcular el coeficien te de correlación . xi yi 186 85 189 85 190 86 192 90 193 87 193 91 198 93 201 103 203 100 xi2 yi2 x i ·y i 34 7 15 596 225 810 35 7 16 721 225 065 36 7 16 100 396 340 36 8 17 864 100 280 37 7 16 249 569 791 37 8 249 281 39 8 18 204 649 414 40 10 20 401 609 703 41 10 20 209 000 300 17563
  18. 18. 205 1 950 101 921 42 10 20 025 201 705 380 85 179 618 255 971 Correlación positiva muy fuerte . Los valores de dos va ria bles X e Y se distribuyen según la ta bla siguiente: Y/X 100 50 25 14 1 1 0 18 2 3 0 22 0 1 2 Obtener e interpretar el coeficiente de correlación lineal .
  19. 19. Convertimos la tabla de doble entra da en una tabla simple. xi · xi2 · yi · yi2 · xi · fi fi fi fi yi · fi 14 196 1 400 36 648 3 600 14 196 700 54 972 2 700 22 484 1 100 44 968 1 100 3 10 464 600 xi yi fi 100 14 1 100 100 18 2 200 50 14 1 50 50 18 3 150 50 22 1 50 25 22 2 50 10 600 10 000 20 000 2 500 7 500 2 500 1 250 43 750 184
  20. 20. Es una correlación neg ativa débil . CAPÍTULO 6.- MANUAL DE CONTROL ESTADÍSTICO DE PROCESOS Introducción. Definición de Proceso Control Estadístico de Procesos (C.E.P) El CEP es una herramienta estadística que se utiliza en el puesto de trabajo para conseguir el productoadecuado y a la primera. Los gráficos de control constituyen el procedimiento básico del C.E.P. Con dicho procedimiento se pretende cubrir 3 objetivos - Seguimiento Reducción y vigilancia de del la proceso variación - Menos costo por unidad En cualquier proceso productivo, por muy bien que se diseñe y por muy cuidadosamente que se controle, siempre existirá una cierta variabilidad inherente, natural, que no se puede evitar. Esta variabilidad natural, este “ruido de fondo”, es el efecto acumulado de muchas pequeñas causas de carácter, esencialmente, incontrolable. Cuando el “ruido de fondo” sea relativamente pequeño consideraremos aceptable el nivel de funcionamiento del proceso y diremos que la variabilidad natural es originada por un „sistema estable de causas de azar”. Un proceso sobre el que solo actúan causas de azar se dice que está bajo control estadístico. Por el contrario, existen otras causas de variabilidad que pueden estar, ocasionalmente, presentes y que actuarán sobre el proceso. Estas causas se derivan, fundamentalmente, de tres fuentes: Ajuste inadecuado de las máquinas Errores de las personas que manejan las máquinas Materia prima defectuosa.
  21. 21. La variabilidad producida por estas causas suele ser grande en comparación con el “ruido de fondo” y habitualmente sitúa al proceso en un nivel inaceptable de funcionamiento. Denominaremos a estas causas “ causas asignables‟‟ y diremos que un proceso funcionando bajo “causas asignables” está fuera de control. Un objetivo fundamental del C.E.P. es detectar rápidamente la presencia de “causas asignables” para emprender acciones correctoras que eviten la fabricación de productos defectuosos. Alcanzar un estado de control estadístico de proceso puede requerir un gran esfuerzo pero es sólo el primer paso. Una vez alcanzado, podremos utilizar la información de dicho control como base para estudiar el efecto de cambios planificados en el proceso de producción con el objetivo de mejorar la calidad del mismo. La Operación Evolutiva es un tipo de Diseño de Experimentos en línea (aplicado al proceso productivo) que sirve como herramienta para acercarnos a las condiciones óptimas de funcionamiento del proceso. Gráficos CEP. Generalidades Los gráficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Básicamente, una Carta de Control es un gráfico en el cual se representan los valores de algún tipo de medición realizada durante el funcionamiento de un proceso continuo, y que sirve para controlar dicho proceso. Vamos a tratar de entenderlo con un ejemplo. Supongamos que tenemos una máquina de inyección que produce piezas de plástico, por ejemplo de PVC. Una característica de calidad importante es el peso de la pieza de plástico, porque indica la cantidad de PVC que la máquina inyectó en la matriz. Si la cantidad de PVC es poca la pieza de plástico será deficiente; si la cantidad es excesiva, la producción se encarece porque se consume más materia prima. En el lugar de salida de las piezas, hay un operario que cada 30 minutos toma una, la pesa en una balanza y registra la observación. Supongamos que estos datos se registran en un gráfico de líneas en función del tiempo:
  22. 22. Observamos una línea quebrada irregular, que nos muestra las fluctuaciones del peso de las piezas a lo largo del tiempo. Esta es la fluctuación esperable y natural del proceso. Los valores se mueven alrededor de un valor central (El promedio de los datos), la mayor parte del tiempo cerca del mismo. Pero en algún momento puede ocurrir que aparezca uno o más valores demasiado alejados del promedio. ¿Cómo podemos distinguir si esto se produce por la fluctuación natural del proceso o porque el mismo ya no está funcionando bien? El control estadístico de procesos provee la respuesta a la anterior pregunta y a continuación veremos como lo hace. Todo proceso de fabricación funciona bajo ciertas condiciones o variables que son establecidas por las personas que lo manejan para lograr una producción satisfactoria. Cada uno de estos factores está sujeto a variaciones que realizan aportes más o menos significativos a la fluctuación de las características del producto, durante el proceso de fabricación. Los responsables del funcionamiento del proceso de fabricación fijan los valores de algunas de estas variables, que se denominan variables controlables. Por ejemplo, en el caso de la inyectora se fija la
  23. 23. temperatura de fusión del plástico, la velocidad de trabajo, la presión del pistón, la materia prima que se utiliza (Proveedor del plástico), etc.

×