Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

procesar informacion de ventas de gasolina durante un mesTrabajo gasolinera.

1,010 views

Published on

trabajo de introduccion a la estadistica con una practica real

Published in: Education
  • Be the first to comment

  • Be the first to like this

procesar informacion de ventas de gasolina durante un mesTrabajo gasolinera.

  1. 1. UNIVERSIDAD TÉCNICA DE MACHALA FACULTAD DE CIENCIAS EMPRESARIALES ESCUELA DE CONTABILIDAD Y AUDITORIA PROYECTO FINAL CALCULOS ESTADISTICOS INTEGRANTES: AUS PEREIRA DIANA MICHELLE AZANZA AGUILAR CORAIMA NICOLE JARAMILLO MOLINA CRISTHY MABEL TORO PROAÑO DANIELA DEL ROSARIO ASIGNATURA: ESTADISTICA PROFESORA: ING. RAFAEL SALCEDO CURSO: PRIMERO “B” MACHALA EL ORO ECUADOR 2012
  2. 2. Estadística ¿Qué es Estadística? La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. Distribución normal Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. La estadística se divide en dos grandes áreas: La estadística descriptiva, se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros. La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión
  3. 3. teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos. GRAFICOS ESTADISTICOS IMPORTANCIA, UTILIDAD Y CARACTERÍSTICAS DESEABLES DE LOS GRÁFICOS Importancia: Permite a las personas no especializadas, interpretar mejor determinada información, haciéndola más entendible e interesante. Aun cuando presentan una cantidad limitada de datos y cifras aproximadas, permite reforzar los argumentos o conclusiones que una investigación presente. Proporciona una idea generalizada de los resultados. Utilidad general de un gráfico: El gráfico hace más atractiva la información; presentando en forma generalizada los números y proporciones que se obtienen como resultado de un estudio. El uso del gráfico varía según la cantidad de datos que muestre. A menor cantidad de datos, mayor será la utilidad del gráfico empleado, mejora la presentación de un grupo en un informe. Características generales deseables en un gráfico:
  4. 4. La proporción debe ser adecuada: no debe ser ni muy ancho, ni muy alto. Para un gráfico de diez centímetros de ancho, la altura aproximada debe ser de cinco centímetros. Debe ser diseñado para una reproducción fácil y económica; estar centrado en la página o en el espacio que ocupe, para llamar la atención del observador. Debe explicarse a sí mismo, por lo que necesita la tabla de datos, el título, la escala, la leyenda y los símbolos, el gráfico debe ser conciso en la información que proporciona. Debe incluir pocas series de datos, para hacerlo fácil de interpretar, es decir debe ser simple. Debe ser cómodo de leer, es decir poder leerse sin necesidad de mover o girar la hoja, y adecuado al tipo de información que presenta, debe tener comunicabilidad, en otras palabras, ser sencillo de utilizar e identificar. Debe usar un vocabulario común a todas las personas y evitar las palabras inusuales o demasiado especializadas. Los colores son vivos, y deben tomar en cuenta las personas daltónicas. Las tramas, sombras y tonos no deben ser muy elaborados El tipo de letra usada es clara, precisa y modesta. Los textos son cortos; están escritos tanto en mayúscula como en minúscula
  5. 5. Características específicas deseables según el tipo de gráfico: Gráfico de Barras: Es el más simple y utilizado, ya que las comparaciones se basan en el tamaño de las barras Se ordenan de mayor a menor para facilitar su lectura El espacio entre las barras le da mayor claridad. Gráfico Circular y de Barra de 100%: Presentan proporciones en porcentajes Permiten presentar la importancia relativa de un dato. El gráfico circular no posee ejes
  6. 6. Gráficos Lineales Aritméticos y Logarítmicos: se usan especialmente para presentar series de tiempo y crecimiento siempre tienen dos escalas, una horizontal y otra vertical, que al formar parejas representan puntos específicos de un gráfico. Permiten presentar mayor cantidad de datos dentro del mismo gráfico Pictogramas: es un gráfico construido con figuras o dibujos no usa escalas. todos los dibujos son iguales y se presentan horizontalmente todos los dibujos tiene el mismo tamaño para expresar mejor su valor numérico las magnitudes se representan con la cantidad de dibujos empleados.
  7. 7. cada símbolo representa un valor específico Mapas Estadísticos: muestran la información sobre un mapa. muestran datos de áreas geográficas en un país. Al igual que el anterior las magnitudes se representan en la cantidad de marcas usadas. Variable estadística Una variable es una característica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores. Existen diferentes tipos de variables: Según la medición: Variables cualitativas: Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave. Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden como por ejemplo los colores.
  8. 8. Variables cuantitativas: Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas además pueden ser: Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables. Según la influencia: Según la influencia que asignemos a unas variables sobre otras, podrán ser: Variables independientes: Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. Es aquella característica o propiedad que se supone ser la causa del fenómeno estudiado. En investigación experimental se llama así a la variable que el investigador manipula.
  9. 9. Variables dependientes: Son las variables de respuesta que se observan en el estudio y que podrían estar influenciadas por los valores de las variables independientes. Hayman (1974: 69) la define como propiedad o característica que se trata de cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente. Otras Variables intervinientes: Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que se espera y están vinculadas con las variables independientes y dependientes. Variables moderadoras: Según Tuckman: representan un tipo especial de variable independiente, que es secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente primaria y las variables dependientes. Son las variables que expresan distintas cualidades, características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más valores. Distribución de frecuencias En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que
  10. 10. indican el número de observaciones en cada categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Características Una distribución de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los [datos] y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada. La tabla de frecuencias puede representarse gráficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
  11. 11. Tipos de frecuencias Frecuencia absoluta: La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por ni. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria. Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por fi. La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada: La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fa. Frecuencia relativa acumulada: La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
  12. 12. Este tipo de tablas de frecuencias se utiliza con variables discretas. Distribución de frecuencias agrupadas: La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. El diagrama de tallos y hojas Dado un conjunto de datos formado por observaciones, las cuales pueden ser representadas mediante y donde cada tiene por lo menos dos dígitos. Una forma rápida de obtener una representación visual del conjunto de datos es construir un diagrama de tallos y hojas. Este diagrama es usado cuando hay un número no muy pequeño de datos. Los siguientes son los pasos para construir un diagrama de tallos y hojas: Seleccionar uno o más dígitos iniciales para los valores de tallo. El dígito(s) final(es) se convierte (n) en hojas. Para facilitar la determinación de la forma de la distribución de los datos se necesitan al menos 5 tallos. Hacer una lista de valores de tallo en una columna vertical. Registrar las hojas por cada observación junto al valor correspondiente del tallo.
  13. 13. Indicar las unidades para tallos y hojas en algún lugar del diagrama. Muchos de los procedimientos estadísticos que se desarrollarán en las siguientes unidades suponen que la variable aleatoria estudiada tiene al menos una distribución aproximadamente normal, para la cual el diagrama de tallos y hojas tiene forma de campana. Los diagramas de tallos y hojas nos dan una idea de la localización de los datos y de la forma de la distribución. Esta técnica funciona bien para los conjuntos de datos que no tienen una dispersión muy grande. Ejemplo: La siguiente tabla representa el porcentaje de algodón en un material utilizado para la fabricación de camisas para caballeros. Tabla 1. Datos del porcentaje de algodón 33.1 35.3 34.2 33.6 33.6 33.1 37.6 33.6 34.5 34.7 33.4 32.5 35.4 34.6 37.3 34.1 35.6 35.0 34.7 34.1 34.6 35.9 34.6 34.7 36.3 35.4 34.6 35.1 33.8 34.7 35.5 35.7 35.1 36.2 35.2 36.8 37.1 33.6 32.8 36.8 34.7 36.8 35.0 37.9 34.0 32.9 32.1 34.3 33.6 35.1 34.9 36.4 34.1 33.5 34.5 32.7 32.6 33.6 33.8 34.2 34.6 34.7 35.8 37.8 El diagrama de tallos y hojas para los anteriores datos aparece a continuación. Stem-and-leaf of PORCENTAJE DE ALGODON N = 64 Leaf Unit = 0.10 (el número 1 después del punto significa que se usa una sola cifra decimal). Tallo Hojas
  14. 14. 6 32 156789 18 33 114566666688 (21) 34 011122355666667777779 25 35 00111234456789 11 36 234888 5 37 13689 Algunas veces, la utilización del primero o de los dos primeros dígitos de los datos puntuales como tallos no proporcionan suficientes tallos como para permitirnos detectar la forma de su distribución. Una manera de solucionar esto es utilizar tallos dobles. Es decir, utilizar cada tallos dos veces: una vez para trazar las hojas inferiores 0, 1, 2, 3, 4, y a continuación nuevamente para trazar las hojas superiores 5, 6, 7, 8, 9. El siguiente gráfico ilustra lo anterior Histograma En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de
  15. 15. clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso. Tipos de histograma Diagramas de barras simples Representa la frecuencia simple (absoluta o relativa) mediante la altura de la barra la cual es proporcional a la frecuencia simple de la categoría que representa. Diagramas de barras compuesta Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, las cuales se representan así; la altura de la barra representa la frecuencia
  16. 16. simple de las modalidades o categorías de la variable y esta altura es proporcional a la frecuencia simple de cada modalidad. Diagramas de barras agrupadas Se usa para representar la información de una tabla de doble entrada o sea a partir de dos variables, el cual es representado mediante un conjunto de barras como se clasifican respecto a las diferentes modalidades. Polígono de frecuencias Es un gráfico de líneas que de las frecuencias absolutas de los valores de una distribución en el cual la altura del punto asociado a un valor de las variables es proporcional a la frecuencia de dicho valor. Ojiva porcentual Es un gráfico acumulativo, el cual es muy útil cuando se quiere representar el rango porcentual de cada valor en una distribución de frecuencias.
  17. 17. En los gráficos las barras se encuentran juntas y en la tabla los números poseen en el primer miembro un corchete y en el segundo un paréntesis, por ejemplo: [10-20) Construcción de un histograma: Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor. Paso 2: Obtener los números de clases, existen varios criterios para determinar el número de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cómo estén los datos y cuántos sean. Un criterio usado frecuentemente es que el número de clases debe ser aproximadamente a la raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de artículos) es mayor que cinco, por lo que se seleccionan seis clases. Paso 3: Establecer la longitud de clase: es igual al rango dividido por el número de clases. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en relación al resultado del PASO 2 en intervalos iguales. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se hace un gráfico de barras, las bases de las barras son los intervalos de clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias. El histograma de una imagen representa la frecuencia relativa de los niveles de gris de la imagen. Las técnicas de modificación del histograma de una imagen son útiles para aumentar el contraste de imágenes con histogramas muy concentrados. Sea u una imagen de tamaño NxN, la función de distribución del histograma es:
  18. 18. Ejemplos de otros tipos de representaciones gráficas: Hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase). Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical). A veces es más útil representar las frecuencias acumuladas. O representar simultáneamente los histogramas de una variable en dos situaciones distintas. Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas. En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.
  19. 19. MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas. Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está observando, en este caso se observan variables cuantitativas. MEDIA ARITMETICA La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos Propiedades: La media aritmética es una medida de tendencia central. Todas las observaciones están incluidas en el calculo La media aritmética es afectada por medios extremos. Cada conjunto de datos con variable observada de intervalo o razón tienen una única media. La suma de las desviaciones de cada observación respecto de ella es cero.
  20. 20. MEDIA ARITMETICA PARA DATOS NO AGRUPADOS 𝑥̅ = Σx 𝑛 MEDIA ARITMETICA PARA DATOS AGRUPADOS 𝑥̅ = Σfx 𝑛 MEDIA POBLACIONAL 𝓊 = Σx 𝑁 MEDIA PONDERADA 𝑋𝑤 = (Σwx) Σ𝑛 MEDIA GEOMETRICA La media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para datos de progresión geométrica, para promediar razones, interés compuesto y números índices. Propiedades: El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los valores de la variable. La media geométrica de un conjunto de números positivos es siempre menor o igual que la media aritmética.
  21. 21. MEDIA GEOMETRICA PARA DATOS NO AGRUPADOS 𝑀𝐺 = √ 𝑥1. 𝑥2 . 𝑥3 … 𝑥 𝑛 𝑛 AUMENTO PORCENTUAL PROMEDIO DE UN PERIODO DETERMINADO 𝑴𝑮 = √ 𝒗𝒂𝒍𝒐𝒓 𝒂𝒍 𝒇𝒊𝒏𝒂𝒍 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐 𝒗𝒂𝒍𝒐𝒓 𝒂𝒍 𝒊𝒏𝒊𝒄𝒊𝒐 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐 𝒏 − 𝟏 MEDIANA La mediana, representa el valor de la variable de posición central en un conjunto de datos ordenados. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil. Su cálculo no se ve afectado por valores extremos. MEDIANA PARA DATOS AGRUPADOS 𝑴𝒆 = 𝑳 + 𝒏 𝟐 − 𝑭𝑨 𝒇 . 𝒊 L: límite inferior de la clase donde está ubicada la mediana n: número de términos FA: frecuencia absoluta acumulada del intervalo anterior a la clase de donde está la mediana. f: frecuencia absoluta del intervalo donde se ubica la mediana i: amplitud del intervalo
  22. 22. MODA La moda es el valor con una mayor frecuencia en una distribución de datos. Hablaremos de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal. MEDIDAS DE DISPERSION VARIANZAS La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. Propiedades de la varianza: La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. Si a todos los valores de la variable se les suma un número la varianza no varía. Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
  23. 23. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. AMPLITUD DE LA VARIANZA PARA DATOS AGRUPADOS 𝑨𝒗 = 𝑉𝑀 − 𝑉𝑚 AMPLITUD DE LA VARIANZA PARA DATOS AGRUPADOS 𝑨𝒗 = 𝐿𝑠 − 𝐿𝑖 DESVIACION MEDIA La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. 𝐷𝑚 = Σ|x − x̅| n VARIANZA POBLACIONAL 𝝈 𝟐 = 𝛴( 𝑥 − 𝑢)2 𝑁 VARIANZA MUESTRAL 𝑺 𝟐 = Σ( 𝑥 − 𝑥̅)2 𝑛 − 1
  24. 24. DESVIACION ESTANDAR La desviación estándar o desviación típica (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. DESVIACION ESTANDAR POBLACIONAL 𝝈 = √ Σ(x− u)2 𝑵 DESVIACION ESTANDAR MUESTRAL 𝑺 = √Σ𝑓𝑥2 − (Σ𝑓𝑥)2 𝑛 𝑛 − 1
  25. 25. PRACTICA
  26. 26. DIA N° SUPER LADO A DIFERENCIA LADO B DIARIA GALONES DIARIOS.LADO A LADO B 1 101632 109363 - - - 2 102428 109984 796 621 1417 3 102789 110740 361 756 1117 4 103436 111783 647 1043 1690 5 104099 112407 663 624 1287 6 104578 112839 479 432 911 7 101534 113291 556 452 1008 8 105720 113870 586 579 1165 9 106714 114297 994 427 1421 10 107252 114754 538 457 995 11 108123 115689 871 935 1806 12 108885 116441 762 752 1514 13 109431 117033 546 592 1138 14 110075 117581 644 548 1192 15 110733 117931 658 350 1008 16 111648 118467 915 836 1751 17 11912 119708 264 941 1205 18 112645 120323 733 615 1348 19 113334 120933 689 610 1299 20 113995 121420 661 487 1148 21 114565 121902 570 482 1052 22 115349 122514 784 612 1396 23 1115943 123432 594 918 1512 24 116759 124222 816 790 1606 25 117197 125037 438 438 1253 26 117881 125266 684 229 913 27 118428 125895 547 629 1176 28 118910 126526 482 628 1110 29 119656 127079 746 556 1302 30 120216 127877 560 798 1358 31 120800 128528 584 651 1235 INICIO: 17-12-2012 FINALIZAMOS: 16-07-2013
  27. 27. Se ha observado durante 31 días los datos de la cantidad de galones vendidos en la Gasolinera “____”de El Guabo. Obteniendo los siguientes datos. 0 1417 111 1690 1287 911 1008 1165 1421 995 1806 1514 1138 1192 1008 1751 1205 1348 1299 1148 1052 1396 1512 1606 1253 913 1176 1110 1302 1358 1235 a) Elabore un cuadro de frecuencias donde exista la Frecuencia Absoluta y Relativa en forma decimaly porcentual. DATOS f F f% F% fr Fr Xm 0 362 1 1 3.22 3.22 0.03 0.03 181 362 724 0 1 0 3.22 0 0.03 543 724 1086 6 7 19.35 22.57 0.2 0.23 905 1086 1448 19 26 61.3 83.87 0.61 0.84 1267 1448 1810 5 31 16.13 100 0.16 1 1629 b) ¿Cuál es el mayor número de ventas diarias? El mayor número de ventas diarias es de: 1806 2k  #Datos. 2k  31 25  32 K = 5 i = H-L/k i = 1806-0/5 i = 361.2 i = 362
  28. 28. C ) GRAFICAS. 0 2 4 6 8 10 12 14 16 18 20 362 724 1086 1448 1810 HISTOGRAMA 0 2 4 6 8 10 12 14 16 18 20 181 543 905 1267 1629 Pto.Medio FRECUENCIA. POLIGONODE FRECUENCIA..
  29. 29. Ventas de Gasolina. 3.22% 0% 19.35% 61.30% 16.30% 0 5 10 15 20 25 30 35 181 543 905 1267 1629 F. AbsolutaAcumulada. Pto.Medio. OJIVA.
  30. 30. d) Halle la media, la mediana y la moda de los datos de la gasolinera. U 38333 U = = = 1236.548 N 31 0 911 913 995 1008 1008 1058 1110 1117 1138 1148 1165 1176 1192 1205 1253 1287 1299 1302 1348 1358 1396 1417 1421 1512 1514 1606 1690 1751 1806 Mediana= 1235 Moda= 1008
  31. 31. n e) Hallar la Media Geométricade las frecuencias de las ventas de la Gasolinera. MG= X1.X2.X3…Xn MG=3.22*0*19.35*61.3*16.13 MG=0 = 0 f% 3.22% 0% 19.35% 61.3% 16.13%
  32. 32. DATOS AGRUPADOS. GALONES f F Xm fXm 0 362 1 1 181 181 362 724 0 1 543 0 724 1086 6 7 905 5430 1086 1448 19 26 1267 24073 1448 1810 5 31 1629 8145 37829 f) Hallar la Media Aritmética. fx 37829 x = = = 1220.290 N 31 g) Halle la Mediana. N/2 - FA Me= L+ . i f 15.5-7 Me=1086+ . 362 19
  33. 33. Me=1247.94 h) Calcule la Moda. Moda= 1267 i) Una muestra de la venta de los galones de gasolina vendidas en 31 días, se organizó una distribuciónde frecuencias para su estudio. Calcule la Amplitud de la Varianza. Evalué la Desviación EstándarMuestral. Determine la Varianza de la Muestra. DATOS f Xm fXm X2 Fx2 0 362 1 181 181 32761 32761 362 724 0 543 0 294849 0 724 1086 6 905 5430 819025 4914150 1086 1448 19 1267 24073 1605289 30500491 1448 1810 5 1629 8145 26539641 13268205 31 37829 5405565 48715607 AV= Ls-Li AV= 1810-0 AV=1810.
  34. 34. fx2 - (fx)2 /n = n-1 48715607 - (37829)2 /31 = 30 = 162479.557 = 403.087
  35. 35. DIA N° SUPER LADO A DIFERENCIA LADO B DIARIA GALONES DIARIOS.LADO A LADO B 1 101632 109363 - - - 2 102428 109984 796 621 1417 3 102789 110740 361 756 1117 4 103436 111783 647 1043 1690 5 104099 112407 663 624 1287 6 104578 112839 479 432 911 7 101534 113291 556 452 1008 8 105720 113870 586 579 1165 9 106714 114297 994 427 1421 10 107252 114754 538 457 995 11 108123 115689 871 935 1806 12 108885 116441 762 752 1514 13 109431 117033 546 592 1138 14 110075 117581 644 548 1192 15 110733 117931 658 350 1008 16 111648 118467 915 836 1751 17 11912 119708 264 941 1205 18 112645 120323 733 615 1348 19 113334 120933 689 610 1299 20 113995 121420 661 487 1148 21 114565 121902 570 482 1052 22 115349 122514 784 612 1396 23 1115943 123432 594 918 1512 24 116759 124222 816 790 1606 25 117197 125037 438 438 1253 26 117881 125266 684 229 913 27 118428 125895 547 629 1176 28 118910 126526 482 628 1110 29 119656 127079 746 556 1302 30 120216 127877 560 798 1358 31 120800 128528 584 651 1235 INICIO: 17-12-2012
  36. 36. FINALIZAMOS: 16-07-2013

×