Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Estadistica Descriptiva

  • Login to see the comments

  • Be the first to like this

Estadistica Descriptiva

  1. 1. EstadísticaSubdivisión de la Estadística: Estadística Descriptiva Inferencial
  2. 2. ESTADÍSTICA DESCRIPTIVAConjunto de métodos estadísticos para resumir y describirdatos recolectados, es decir, se ocupa de clasificar lainformación, del resumen de tabulaciones y de su presentaciónmediante cuadros y gráficos que describan en forma apropiadael comportamiento de la información captada, para luegorealizar los cálculos de las medidas estadísticas y realizar elanálisis estadístico inicial.Por ejemplo, cuando se realiza una encuesta opinión públicasobre calidad del servicio de una empresa de servicios, lo quese va a obtener con esta encuesta es una ida general acerca dela opinión del público y en base a ella tomar algunas medidasde mejora si fuera el caso.
  3. 3. ESTADÍSTICA INFERENCIALConjunto de procesos de estimación de parámetros y pruebashipótesis. Tiene por finalidad de llegara conclusiones quebrinden un adecuado sustento científico para la toma dedecisiones sobre la base de la información muestral captada..Estas conclusiones no tienen porque ser validas al 100%, porlo que normalmente se deben dar con una medida deconfiabilidad (Intervalos de Confianza).Ejemplo: Estimación del tiempo de proceso requerido para laelaboración de un producto.
  4. 4. DEFINICIONES BASICASPoblación: (Todo)Conjunto de todas las unidades elementales que poseencaracterísticas o factores que son de interés para un estudio.Por ejemplo, tiempo proceso de un producto, calidad deservicio, etc. es decir tiene una realidad que es desconociday sobre la cual se desea conocer cómo se comportan loselementos que la conforman.Muestra: (Parte)Es el subconjunto de unidades elementales, elegidas de unapoblación.
  5. 5. PARAMETRO Y ESTADISTICOPoblación: ParámetroMedida descriptiva que resume una característica de lapoblación a partir de la observación de los datos de total de lapoblación.Muestra: Estadístico o estadígrafoMedida descriptiva que resume una característica de lamuestra con el fin de estimar un parámetro.Las medidas descriptivas para ambos son las mismas.Ejemplo: La media, varianza, desviación estándar, etc.
  6. 6. VARIABLESVariable es una característica que se define en la población, que puede tomar dos o más valores o modalidades.Ejemplos:• Tiempo de respuesta de una Pentium 300 Mhz• Calidad de servicio: Muy buena, Buena, Mala, regular.• Nro. de productos producidos por hora• Tiempo de proceso de producción de productos en línea.• Productividad del área de operaciones.
  7. 7. CLASIFICACIÓN DE VARIABLESCualitativas:Son aquellas cuyos resultados posibles no pueden serexpresados en forma numérica.. Cualitativas Nominales: Son aquellas cuyas categorías posiblesno tienen por que ser representadas en un orden definido. Porejemplo. Color de preferencia de las personas.. Cualitativas Ordinales: Son aquellas en cuyas categorías debenser representadas en un orden. Por ejemplo. Calidad deartículos producidosCuantitativas:Son aquellas cuyos resultados posibles pueden ser expresadosen forma numérica.
  8. 8. CLASIFICACIÓN DE LAS VARIABLES CUANTITATIVASDiscretas:Son aquellas que tiene un número finito o infinito numerable devalores posibles, usualmente se las asocia a procesos de conteo,donde el valor es un número entero.Ejemplo: Número de artículos defectuosos en un lote, número declientes satisfechos, número de alumnos aprobados, etc.Continuas:Este tipo de variable puede asumir cualquier valor, entero y/odecimal.Ejemplo: Volumen de producción, tiempo de proceso de unproducto, etc.
  9. 9. EJERCICIOS DE APLICACIÓN.1.- El gerente de una sucursal de un banco local desea estudiarlos tiempos de espera de los clientes para ser atendidos por elcajero en el periodo de 12:00 a 13:00, se selecciona una muestrade 30 clientes. Que tipo de variable es?2.- Un administrador de una empresa de servicios desea estimarel número de clientes atendidos entre viernes y sábado, para locual toma una muestra de 200 clientes. Que tipo de variable es?3.-Una empresa de producción desea determinar si su productoestrella mantiene la aceptación, para lo cual se toma unamuestra y se pregunta al público por la aceptación del producto.Qué tipo de variable es?.
  10. 10. ORGANIZACIÓN DE DATOS REPRESENTACIÓN DE DATOSLuego de recolectar datos, es necesario resumirlos y presentarlos detal forma que se puedan COMPRENDER, ANALIZAR y UTILIZAR.Por eso se ordenan en cuadros numéricos y luego se representan engráficos. ORGANIZACIÓN DE DATOS CUALITATIVOSAntes de iniciar la organización de datos se deberá determinar si losdatos son variables cualitativas nominales u ordinales. Si sonnominales se pueden representar en cualquier orden indistintamente,si son ordinales, entonces se deberán asociar al algún ordenjerárquico. Luego se procede a realizar un proceso de conteo lasfrecuencias absolutas (número de veces que se repite cada respuesta).
  11. 11. Distribución de las razones por las que se realiza compras los días festivos en la Tienda “G&G” de un Centro ComercialRazones Frecuencias Frecuencias En absoluta relativas %- Variedad productos (V) 10 0.33 33- Ubicación (U) 8 0.27 27- Gasto Envío Gratis (G) 12 0.40 40Total 30 1.00 100
  12. 12. Para representar gráficamente la distribución de frecuencias deuna variable cualitativa nominal lo mas conveniente essectores circulares. V G 33% 40% U 27% excel
  13. 13. ORGANIZACIÓN DE DATOS CUANTITATIVOSVariable Cuantitativa discretaConstruir la distribución de frecuencias del número detrabajadores eventuales de una empresa de producción. 4,4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 9,9, 9, 9, 9, 9, 10, 10, 10, 10Definición de la variable: X = Número de trabajadores eventuales Rx = {4, 5, 6, 7, 8, 9, 10} Conjunto de valores posibles, es un conjunto finito.
  14. 14. Variable Cuantitativa contínua DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS• Se usa cuando la variable estadística es continua o cuando el rango de la variable discreta es infinito o tiende a infinito.• La distribución se obtiene dividiendo el rango en intervalos o clases y determinando el número de datos que contiene cada intervalo.• El número de intervalos debe estar de preferencia entre 5 y 20.
  15. 15. HISTOGRAMA, es la representación por medio de barrasrectangulares, siendo la base de cada barra proporcional a la amplitud,su centro la marca de clase y la altura su frecuencia absoluta o relativa.En el eje horizontal va la escala de la variable y en el vertical la escalade la frecuencia. 30 24 25 Número de colegios 20 15 13 9 8 10 5 5 1 0 0 a 2,0 2,0 a 4,0 a 6,0 a 8,0 a 10,0 a 12,0 a 14,0 a 4,0 6,0 8,0 10,0 12,0 14,0 16,0 Pensiones anuales en miles de soles
  16. 16. POLIGONOS DE FRECUENCIA, es la representación por medio deuna figura polígona cerrada, que se obtiene uniendo con segmentos derecta los puntos de intersección de las marcas de clase con lasfrecuencias. 30 Número de colegios 24 25 20 13 15 9 8 10 5 5 1 0 0 a 2,0 2,0 a 4,0 a 6,0 a 8,0 a 10,0 a 12,0 a 14,0 a 4,0 6,0 8,0 10,0 12,0 14,0 16,0 Pensiones anuales en miles de soles
  17. 17. CURVAS DE FRECUENCIA, se puede obtener del polígono defrecuencia suavizando los puntos angulosos del polígono. Esta gráficanos describe algunas características de la distribución de la poblacióncomo: Simetría, Asimetría, Normalidad, Uniformidad, Bimodalidad,etc. 30 24 Número de colegios 25 20 13 15 9 8 10 5 5 1 0 0 a 2,0 2,0 a 4,0 a 6,0 a 8,0 a 10,0 a 12,0 a 14,0 a 4,0 6,0 8,0 10,0 12,0 14,0 16,0 Pensiones anuales en miles de soles
  18. 18. LA OJIVA, o polígono de frecuencias acumuladas, se obtieneuniendo segmentos de recta de intersecciones entre el límite superiorde cada intervalo y la frecuencia acumulada respectiva. Con la ojiva sepuede calcular fácilmente el número o porcentajes de observacionesque corresponden a un intervalo determinado. Número de colegios 70 59 60 60 54 50 46 40 37 30 20 13 10 0 0 0 a 2,0 2,0 a 4,0 a 6,0 a 8,0 a 10,0 a 12,0 a 14,0 a 4,0 6,0 8,0 10,0 12,0 14,0 16,0 Pensiones anuales en miles de soles
  19. 19. Diagrama de ParetoEs una representación gráfica que usualmente se utiliza para controlesde calidad y que permite tomar acciones correctivas necesarias.Ejemplo: Las principales causas de mala atención se han clasificado en7. El 80% causas es explicado por C y A , e n menor grado G. Plan demejora debe atacar en primer lugar a C y A.
  20. 20. MEDIDAS DESCRIPTIVAS1.Medidas de Posición: Son aquellas medidas que tienen una posición específica dentrode una distribución o un grupo de datos, entre ellas tenemos a las detendencia central Tendencia Central o Promedios: media aritmética, media geométrica, media armónica, mediana.2. Medidas de dispersión: Desviación estándar, rango, coeficiente de variación.
  21. 21. MEDIA ARITMÉTICAEs la medida de localización más importante, llamada tambiénpromedio de la variable. Es una de las medidas de tendenciacentral, conocida como el punto de equilibrio de los datos ó centrode gravedad.FORMULAS:Para calcular la media aritmética se observa como se tiene lainformación: si los datos están ó no organizados en tablas defrecuencias. n  Datos no agrupados: Con información muestral ∑x X i i= = 1 n Xi : valores que toma la variable X n : número de observaciones
  22. 22. Ejemplo: Los siguientes datos corresponden a volúmenes de ventasoles) de un producto en 9 días.900, 800, 900, 12100, 800, 700, 1300, 800, 1200a) calcular la venta promedio. 900 + 800 + 900 + 12100 + 800 + 700 + 1300 + 800 + 1200 9 = 2166Es decir venta promedio por día del productos es 2166 soles.
  23. 23. CARACTERISTICAS DE LA MEDIA Para un grupo de datos es única. Para su cálculo se usan todas las observaciones disponibles. Su valor se ve afectado por la presencia de valores extremos;por ello pierde representatividad cuando hay presencia de ellosentre los datos. La suma de los valores observados desviados respecto de sumedia es cero.
  24. 24. RELACIONES ENTRE LA MEDIA, LA MEDIANA Y LA MODA Si en una distribución unimodal simetrica se cumpleque: X = me = mo Si en una distribución unimodal se cumple que: X < me < mo Entonces la distribución será ASIMETRICA NEGATIVA (es decir tiene un sesgo o cola a la izquierda: por la presencia de valores extremos bajos) Si en una distribución unimodal se cumple que: X > me > mo Entonces la distribución será ASIMETRICA POSITIVA (es decir tiene un sesgo o cola a la derecha: por valor. altos).
  25. 25. MEDIDAS DE DISPERSIÓN O VARIACIÓN• Es la medida de las diferencias que presentan los datos entre si.• Para medirla se aprovecha el hecho, de que si los datos son semejantes entre si, están más cerca a la media aritmética, entonces se dice que tienen poca variabilidad ó que son homogéneos.• Por el contrario si son muy diferentes entre si, estarán muy dispersos respecto a la media aritmética y se dice de ellos que son muy variables o que son heterogéneos.• ES PREFERIBLE SIEMPRE QUE LOS DATOS SEAN HOMOGÉNEOS
  26. 26. MEDIDAS DE DISPERSIÓN O VARIACIÓNLas medidas de variabilidad o de dispersión son aquellas quemiden el grado de separación de los datos con respecto a unvalor central.las principales medidas de dispersión son: EL RANGO (R) EL RANGO INTERCUARTILICO (RIQ) LA VARIANZA [ V(X) ó S2(X) ] LA DESVIACION ESTANDAR [S(X)] COEFICIENTE DE VARIACION [ CV(X) ]
  27. 27. EL RANGO (R)El Rango de variación o recorrido de una serie de datos, estarepresentado por la diferencia entre sus valores máximo ymínimo, resultando ser la medida de variabilidad más sencillay menos confiable, ya que sólo usa dos datos para su cálculo. R = Xmáx – Xmíndonde: Xmáx : valor máximo Xmín : valor mínimo
  28. 28. VARIANZA La varianza ó variancia es una medida de variabilidad absoluta,que se expresa en unidades al cuadrado y que utiliza todos losdatos para su cálculo (el cual se basa en las diferencias entre elvalor de las observaciones y su media).Se defina como el promedio de las desviaciones, elevadas alcuadrado, de cada uno de los datos con respecto del promedio(media aritmética) ∑( ) n 2 nCalculo: Xi − X ∑ X i2 2 S = 2 i =1 = i =1 −X n n Xi : i-ésima observación n : Número de datos : media aritmética
  29. 29. DESVIACION ESTANDAR (S)Como la varianza se mide en unidades al cuadrado, por ejemplosi los datos están expresados en metros, la varianza se mediráen metros al cuadrado.Esto trae dificultades para su interpretación real. Es por ello queen ocasiones se prefiere el uso de la Desviación Estándar,definida como la raíz cuadrada (positiva) de la varianza: Desviación Estándar : s= s 2 InterpretacionEl valor numérico de la varianza y la desviación estándar cuantifican el gradode dispersión absoluta de los datos de la variable en estudio, con respecto a sumedia aritmétia, la primera en unidades al cuadrado y la segunda en unidadesreales. Por lo que a mayor variabilidad mayor varianza.
  30. 30. COEFICIENTE DE VARIACON (CV)Esta medida de dispersión es muy útil cuando se quiere comparar el grado de dispersión (homogeneidad o variabilidad) en dos conjuntos de datos que tienen un promedio diferente y/o que tienen diferentes unidades de medida En general se considera lo siguiente: Si CV < 25% implica baja dispersión Si CV > 50% implica Alta dispersión En otro caso se tiene Dispersión moderadaCálculo: S S CV ( X ) = CV ( X )% = (100) X X
  31. 31. EJEMPLO1:Un administrador debe decidir la compra de una de dos máquinas, tienelasiguiente información con respecto al tiempo diario que requiere cadamáquina para su mantenimiento. Promedio Varianza Máquina A 27 min 4.5 min2 Máquina B 35 min 5 min2 Utilizando la medida de variabilidad adecuada.¿Cuál de las dos máquinas tiene menos variabilidad en cuanto al tiempo de mantenimiento? Dado que la unidad de medida es la misma para ambos Solución: grupos, pero las medias no son iguales, entonces utilizamos el coeficiente de variación para comparar: S A 4.5 SB 5 CVA = = = 0.07856 CVB = = = 0.06388 X A 27 XB 35 Entonces la máquina B tiene una distribución de tiempos menos variable.
  32. 32. TIPIFICACION DE VARIABLESTipificar una variable es cambiarla por otra que tenga de media cero ydesviación típica 1. Se utiliza para comparar distribuciones .Cada valor se tipifica restando la media y dividiendo por la desviacióntípica. − x− x z = SxEn otras palabras: “Z” es la distancia de cualquier valor de la variableen estudio a su media expresado en desviaciones estándar

×