Estadistica descriptiva

12,304 views

Published on

La estadística es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. Se considera como su fundador a Godofredo Achenwall, profesor alemán (1719-1772), él y sus seguidores estructuraron métodos estadísticos para estudiar las riquezas de las naciones. La estadística es una de las ramas de la matemática con más aplicaciones, ya que casi en cualquier rama del conocimiento humano tiene aplicación. Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc.

Published in: Education
0 Comments
10 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
12,304
On SlideShare
0
From Embeds
0
Number of Embeds
74
Actions
Shares
0
Downloads
571
Comments
0
Likes
10
Embeds 0
No embeds

No notes for slide

Estadistica descriptiva

  1. 1. CURSO VIRTUAL: ESTADÍSTICA DESCRIPTIVA INEC - 2011
  2. 2. Capítulo 1 ¿Qué es la Estadística? <ul><li>Objetivos: Al terminar este capítulo podrá: </li></ul><ul><li>Comprender qué es y por qué se estudia la estadística. </li></ul><ul><li>Explicar lo que significan estadística descriptiva y estadística inferencial. </li></ul><ul><li>Diferenciar entre una variable cualitativa y una variable cuantitativa. </li></ul><ul><li>Distinguir entre una variable discreta y una variable continua. </li></ul><ul><li>Diferenciar entre los niveles de medición nominal, ordinal, de intervalo y de razón. </li></ul><ul><li>Definir los términos mutuamente excluyente y exhaustivo. </li></ul>
  3. 3. ¿Qué se entiende por Estadística? <ul><li>Estadística: Es la ciencia que se ocupa de recolectar, organizar, presentar, analizar e interpretar datos para ayudar a una toma de decisiones más efectiva. </li></ul>
  4. 4. ¿Quién usa la Estadística? <ul><li>Los métodos estadísticos son utilizados por mercadólogos, contadores, analistas de control de calidad, clientes, profesionales del deporte, administradores de hospitales, educadores, políticos, físicos, etc… </li></ul>
  5. 5. Tipos de Estadística <ul><li>Estadística Descriptiva: Conjunto de métodos para organizar, resumir y presentar los datos de manera informativa. </li></ul><ul><li>Ejemplo 1: La agencia Gallup encontró que el 49% de las personas entrevistadas en una encuesta supo el nombre del primer libro de la Biblia. El estadístico 49 describe el número de personas que de cada 100 conoce el nombre del primer libro de la Biblia. </li></ul><ul><li>Ejemplo 2: De acuerdo al reporte de consumidores, los dueños de lavadoras General Electric reportaron 9 problemas de cada 100 lavadoras durante 2005. </li></ul><ul><li>El estadístico 9 describe el número de problemas de cada 100 lavadoras. </li></ul>
  6. 6. Tipos de Estadística <ul><li>Estadística Inferencial: Conjunto de métodos utilizados para saber algo acerca de una población , basándose en una muestra . </li></ul><ul><li>Población: Conjunto de todos los posibles individuos, objetos, o medidas de interés. </li></ul><ul><li>Muestra: Una porción, o parte, de la población de interés. </li></ul>
  7. 7. Tipos de Estadística (Ejemplos de Estadística Inferencial) <ul><li>Ejemplo 1: Las empresas de televisión constantemente monitorean la popularidad de sus programas contratando a la empresa Nielsen y a otras organizaciones para conocer las preferencias de los telespectadores. </li></ul><ul><li>Ejemplo 2: Un despacho de contadores selecciona una muestra aleatoria de 100 facturas y verifica que sean correctas . En 5 de las mismas se encontraron errores, por tanto el despacho estima que el 5% de toda la población de facturas contiene algún error. </li></ul><ul><li>Ejemplo 3: Los catadores de vino toman unas copas de vino como muestra para tomar una decisión con respecto a todo el vino almacenado para su venta. </li></ul>
  8. 8. Tipos de variables <ul><li>Cuando la característica o variable en estudio es no numérica, se le denomina variable cualitativa o de atributo . </li></ul><ul><li>Ejemplos: Género sexual, religión, tipo de automóvil, lugar de nacimiento, color de los ojos de la persona, etc… </li></ul>
  9. 9. Tipos de variables <ul><li>En una variable cuantitativa la información es reportada numéricamente. </li></ul><ul><li>Ejemplos: El saldo en tu cuenta de cheques, los minutos que le restan a la clase, o el número de niños de una familia. </li></ul>
  10. 10. Tipos de variables <ul><li>Las variables cuantitativas pueden ser discretas o continuas . </li></ul><ul><li>Las variables discretas pueden asumir sólo ciertos valores, y generalmente existen “brechas” o “huecos” entre ellos. </li></ul><ul><li>Ejemplo: el número de recámaras en una casa, el número de estudiantes en el curso de estadística (1,2,3,…). </li></ul>
  11. 11. Tipos de variables <ul><li>Las observaciones de una variable continua pueden tomar cualquier valor dentro de un intervalo determinado. </li></ul><ul><li>La presión del aire en un neumático de automóvil, el peso de un cargamento de granos (15.0,15.01, 15.013,…toneladas). </li></ul>
  12. 12. Resumen de tipos de variables Variables Cualitativa Numérica Discreta Continua
  13. 13. Niveles de medición <ul><li>Existen cuatro niveles de medición: </li></ul><ul><li>Nivel nominal: Las observaciones solamente se pueden clasificar o contar. No existe algún orden específico entre las clases. </li></ul><ul><li>Ejemplos: color de ojos, género, religión. </li></ul>
  14. 14. Niveles de medición <ul><li>Mutuamente excluyente . Propiedad de un conjunto de categorías que implica que una persona, objeto o medición se ha de incluir en sólo una categoría. </li></ul><ul><li>Exhaustivo . Propiedad de un conjunto de categorías que implica que cada individuo, objeto o medición debe aparecer en sólo una categoría. </li></ul>
  15. 15. Niveles de medición <ul><li>Nivel ordinal: involucra datos arreglados con algún orden, pero las diferencias entre los valores de los mismos no pueden ser determinadas o bien no tienen algún significado. </li></ul><ul><li>Ejemplo: en la evaluación de profesores, se asigna el 4 a excelente, 3 a bueno, 2 a regular y 1 a malo. </li></ul>
  16. 16. Niveles de medición <ul><li>Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que la diferencia entre los valores de los datos sí pueden ser determinados. Es importante señalar que 0 es solamente un punto de la escala, y no representa la ausencia de la condición. </li></ul><ul><li>Ejemplo: temperatura en grados Fahrenheit. </li></ul>
  17. 17. Niveles de medición <ul><li>Nivel de razón: esta medida tiene todas las características del nivel de intervalo, pero además el punto 0 sí tiene significado, y la razón (cociente) entre dos números también es significativa. </li></ul><ul><li>Ejemplo: unidades de producción, salarios, distancia entre un conjunto de oficinas, la estatura. </li></ul>
  18. 18. Capítulo 2 Descripción de los datos, distribuciones de frecuencias y representaciones gráficas <ul><li>Objetivos: Al terminar este capítulo podrá: </li></ul><ul><li>Organizar los datos en una distribución de frecuencias. </li></ul><ul><li>Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias y un polígono de frecuencias acumuladas. </li></ul><ul><li>Elaborar e interpretar una representación de tallo y hoja. </li></ul><ul><li>Presentar datos utilizando técnicas de graficación como gráficas de líneas, gráficas de barras y gráficas circulares. </li></ul>
  19. 19. Distribución de frecuencias <ul><li>Distribución de frecuencias: Agrupamiento de datos en categorías mutuamente excluyentes, que indican el número de observaciones en cada categoría. </li></ul>
  20. 20. Construcción de una distribución de frecuencias Determinar la información que interesa Recolectar datos Organizar datos Sacar conclusiones Presentar datos (gráfica) Distribución de frecuencias
  21. 21. Distribución de frecuencias <ul><li>Punto medio de clase: Un punto que divide el intervalo en dos partes iguales. Es el promedio entre el límite inferior y superior del intervalo de clase. </li></ul><ul><li>Frecuencia de clase: El número de observaciones en cada clase. </li></ul><ul><li>Intervalo de clase: El intervalo de clase es obtenido restando el límite inferior de una clase del límite inferior de la siguiente clase. </li></ul>
  22. 22. Ejemplo 1 <ul><li>El Dr. Yáñez es director de una Escuela de Negocios en la Universidad de Calvillo. Él desea preparar un resumen mostrando el número de horas por semana que los estudiantes emplean en el estudio. Selecciona una muestra de 30 estudiantes y determina el número de horas que cada alumno estudió en la última semana. </li></ul><ul><li>15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6 </li></ul><ul><li>Organice los datos en una distribución de frecuencias. </li></ul>
  23. 23. Ejemplo 1 (Continuación) <ul><li>Hay 30 observaciones. </li></ul><ul><li>Dos elevado a la quinta potencia es 32. </li></ul><ul><li>Sin embargo, debemos tener al menos 5 clases. Eventualmente utilizaríamos 6. </li></ul><ul><li>El rango es 23.5 horas, restando 10.3 de 33.8 horas. </li></ul><ul><li>Escogemos un intervalo de 5 horas. </li></ul><ul><li>El límite inferior de la primera clase es 7.5 horas. </li></ul>
  24. 24. Ejemplo 1 (Continuación) <ul><li>Horas en estudio </li></ul><ul><li>Frecuencia, f </li></ul><ul><li>De 7.5 a menos de 12.5 </li></ul><ul><li>1 </li></ul><ul><li>De 12.5 a menos de 17.5 </li></ul><ul><li>12 </li></ul><ul><li>De 17.5 a menos de 22.5 </li></ul><ul><li>10 </li></ul><ul><li>De 22.5 a menos de 27.5 </li></ul><ul><li>5 </li></ul><ul><li>De 27.5 a menos de 32.5 </li></ul><ul><li>1 </li></ul><ul><li>De 32.5 a menos de 37.5 </li></ul><ul><li>1 </li></ul>
  25. 25. Sugerencias en la construcción de la distribución de frecuencias <ul><li>El intervalo o amplitud de las clases debe ser el mismo para todas ellas. </li></ul><ul><li>Determine el intervalo o amplitud usando la siguiente fórmula: </li></ul>
  26. 26. Sugerencias en la construcción de la distribución de frecuencias <ul><li>Use el cálculo obtenido como sugerencia del ancho del intervalo en la construcción de la distribución de frecuencias. </li></ul><ul><li>Nota: Esto es un ancho del intervalo de clase sugerido; si el cálculo obtenido es 97, puede ser mejor usar 100. </li></ul><ul><li>Cuente el número de valores en cada clase. </li></ul>
  27. 27. Ejemplo 1 (Continuación) <ul><li>Una distribución de frecuencias relativas muestra el porcentaje de observaciones en cada clase. </li></ul>
  28. 28. Distribución de frecuencias relativas Horas en estudio Frecuencia, f Frecuencia relativa <ul><li>De 7.5 a menos de 12.5 </li></ul><ul><li>1 </li></ul><ul><li>1/30 = .0333 </li></ul><ul><li>De 12.5 a menos de 17.5 </li></ul><ul><li>12 </li></ul><ul><li>12/30 = .4000 </li></ul><ul><li>De 17.5 a menos de 22.5 </li></ul><ul><li>10 </li></ul><ul><li>10/30 = .3333 </li></ul><ul><li>De 22.5 a menos de 27.5 </li></ul><ul><li>5 </li></ul><ul><li>5/30 = .1667 </li></ul><ul><li>De 27.5 a menos de 32.5 </li></ul><ul><li>1 </li></ul><ul><li>1/30 = .0333 </li></ul><ul><li>De 32.0 a menos de 37.5 </li></ul><ul><li>1 </li></ul><ul><li>1/30 = .0333 </li></ul>Total 30 30/30 = 1.0000
  29. 29. Representación de tallo y hoja <ul><li>Representación de tallo y hoja: Es una técnica estadística que muestra un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales se toman como el tallo, y el dígito siguiente es la hoja. Los tallos se ubican a lo largo del eje vertical principal, y las hojas de cada observación, a lo largo del eje horizontal. </li></ul><ul><li>Nota: Una ventaja de esta representación sobre la distribución de frecuencias es que no se pierde la identidad de cada observación. </li></ul>
  30. 30. Ejemplo 2 <ul><li>86, 79, 92, 84, 69, 88, 91, 83, 96, 78, </li></ul><ul><li>82, 85. </li></ul><ul><li>Construya un diagrama de árbol y hojas. </li></ul><ul><li>Colín obtuvo las siguientes calificaciones en doce pruebas de este semestre: </li></ul>
  31. 31. Ejemplo 2 (Continuación) Árbol Hojas 6 9 7 8 9 8 2 3 4 5 6 8 9 1 2 6
  32. 32. Presentación de una distribución de frecuencias en gráficas <ul><li>Las tres gráficas más comunes son: histograma, polígono de frecuencias y distribución de frecuencias acumuladas. </li></ul><ul><li>Un histograma es una gráfica en la cual los intervalos de clase se señalan en el eje horizontal, y las frecuencias de clase en el eje vertical. </li></ul><ul><li>Las frecuencias de clase son representadas por barras de diferente altura y éstas se colocan una junto a otra. </li></ul>
  33. 33. Presentación de una distribución de frecuencias en gráficas <ul><li>Un polígono de frecuencias consiste en segmentos de línea conectados a través de los puntos medios (marcas de clase) de clase en cada intervalo de clase. </li></ul><ul><li>Una distribución de frecuencias acumulada (ojiva) es utilizada para determinar cuántos o qué proporción de los datos están por arriba o por debajo de cierto valor. </li></ul>
  34. 34. Histograma para horas empleadas en estudiar
  35. 35. Polígono de frecuencias para horas empleadas en estudiar
  36. 36. Distribución de frecuencias acumuladas (ojiva) para horas en estudio
  37. 37. Gráfica de barras <ul><li>Una gráfica de barras es especialmente útil para mostrar cualquiera de los niveles de medición: nominal, ordinal, de intervalo o de razón. </li></ul>
  38. 38. Ejemplo 3 <ul><li>Construya un diagrama de barras para el número de desempleados de una población de 100,000 para ciudades seleccionadas durante 2001. </li></ul>Ciudad Número de desempleados por cada 100,000 Atlanta 7300 Boston 5400 Chicago 6700 Los Ángeles 8900 Nueva York 8200 Washington 8900
  39. 39. Diagrama de barras para desempleados
  40. 40. Diagrama tipo pastel <ul><li>Un diagrama tipo pastel es útil para mostrar la distribución de frecuencias relativas. Un círculo es dividido proporcionalmente a las frecuencias relativas y las porciones del círculo están ubicadas para los diferentes grupos. </li></ul>
  41. 41. Ejemplo 4 <ul><li>A una muestra de 200 corredores se le preguntó su tipo de zapato tenis favorito. </li></ul><ul><li>Elabore un diagrama tipo pastel en base a la siguiente información. </li></ul>Tipo de zapato No. de corredores Nike Adidas Reebok Asics Otros 92 49 37 13 9
  42. 42. Diagrama tipo pastel para zapato tenis
  43. 43. Capítulo 3 Descripción de datos, medidas de tendencia central <ul><li>Objetivos: Al terminar este capítulo podrá: </li></ul><ul><li>Calcular la media aritmética, la media ponderada, la mediana, la moda y la media geométrica. </li></ul><ul><li>Explicar las características, uso, ventajas y desventajas de cada medida de tendencia central. </li></ul><ul><li>Identificar la posición de la media aritmética, la mediana y la moda, tanto en distribuciones simétricas como asimétricas. </li></ul>
  44. 44. Características de la media <ul><li>La media aritmética es, con mucho, la medida de localización más usada. </li></ul><ul><li>Es calculada sumando los valores y dividiendo entre el número de valores. </li></ul><ul><li>Las principales características de la media son: </li></ul><ul><li>- Requiere de una escala de intervalo. </li></ul><ul><li>- Todos los valores son utilizados. </li></ul><ul><li>- Es única. </li></ul><ul><li>- La suma de las desviaciones con respecto a la media </li></ul><ul><li> es cero. </li></ul>
  45. 45. Media poblacional <ul><li>Para datos no agrupados, la media poblacional es la suma de todos los valores de la población divididos entre el número total de valores de la población: donde µ es la media poblacional, N es el total de observaciones de la población y X un valor particular. </li></ul>
  46. 46. Ejemplo 1 <ul><li>Un parámetro es una medida característica de la población. </li></ul><ul><li>Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos corresponden al kilometraje de cada uno de ellos: </li></ul><ul><li>56,000 23,000 42,000 73,000 </li></ul><ul><li>Encuentre la media aritmética del kilometraje de los autos: </li></ul><ul><li>µ = (56,000 + … + 73,000)/4 = 48,500 </li></ul>
  47. 47. Media muestral <ul><li>Para datos no agrupados, la media muestral es la suma de todos los valores de la muestra dividida por el número de valores de la muestra. Donde n es el número total de valores en la muestra. </li></ul>
  48. 48. Ejemplo 2 <ul><li>Un estadístico es una medida característica de una muestra. </li></ul><ul><li>Ejemplo 2: Una muestra de cinco ejecutivos recibió los siguientes bonos el último año ($000): </li></ul><ul><li>14.0, 15.0, 17.0, 16.0, 15.0 </li></ul>
  49. 49. Propiedades de la media aritmética <ul><li>Todos los datos de nivel de intervalo y de nivel de razón tienen una media. </li></ul><ul><li>Para evaluar la media se consideran todos los valores. </li></ul><ul><li>Un conjunto de datos sólo tiene una media la cual es un valor único. </li></ul><ul><li>La media es afectada por valores inusualmente grandes o pequeños. </li></ul><ul><li>La media aritmética es la única medida de tendencia central donde la suma de las desviaciones de cada valor, respecto de la media, siempre es igual a cero. </li></ul>
  50. 50. Ejemplo 3 <ul><li>Considere el siguiente conjunto de valores: 3, 8, y 4. La media es 5. Ilustrando la quinta propiedad: </li></ul>
  51. 51. Media ponderada <ul><li>La media ponderada de un conjunto de números X 1 , X 2 , …, X n con pesos correspondientes w 1 , w 2 , …, w n es calculada con la siguiente fórmula: </li></ul>
  52. 52. Ejemplo 6 <ul><li>Durante el periodo de una hora, en una tarde calurosa de sábado, Cristina sirvió 50 refrescos. Ella vendió 5 bebidas de $0.50, 15 de $0.75, 15 de $0.90, y 15 de $1.15. Calcule la media ponderada para el precio de estas bebidas. </li></ul>
  53. 53. La mediana <ul><li>La mediana es el valor que corresponde al punto medio de los valores después de ordenarlos de menor a mayor. </li></ul><ul><li>Cincuenta por ciento de las observaciones son mayores que la mediana, y 50% son menores que ella. </li></ul><ul><li>Para un conjunto par de valores, la mediana será el promedio aritmético de los dos valores centrales. </li></ul>
  54. 54. Ejemplo 4 <ul><li>Las edades de una muestra de 5 estudiantes del colegio son: </li></ul><ul><li>21, 25, 19, 20, 22 </li></ul><ul><li>Ordenando los datos en forma ascendente, tenemos: </li></ul><ul><li>19, 20, 21, 22, 25. Entonces la mediana es 21. </li></ul><ul><li>Las estaturas de 4 jugadores de basquetbol, en pulgadas, son: </li></ul><ul><li>76, 73, 80, 75 </li></ul><ul><li>Entonces la mediana es 75.5 </li></ul>
  55. 55. Propiedades de la mediana <ul><li>Es única; esto es, a semejanza de la media, sólo existe una mediana para un conjunto de datos. </li></ul><ul><li>No se ve afectada por valores extremadamente grandes o muy pequeños, y por tanto es una medida valiosa de tendencia central cuando se presenta esta clase de valores. </li></ul><ul><li>Puede calcularse para datos de nivel de razón, de intervalo y ordinal. </li></ul><ul><li>Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en tal clase. </li></ul>
  56. 56. La moda <ul><li>La moda es el valor de la observación que aparece con más frecuencia. </li></ul><ul><li>Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75, 81, 87 </li></ul><ul><li>Dado que 81 es el dato que aparece con más frecuencia, éste es la moda. </li></ul>
  57. 57. La media geométrica <ul><li>La media geométrica ( GM ) de un conjunto de n números se define como la raíz enésima del producto de n números. </li></ul><ul><li>La media geométrica es útil para encontrar el promedio de porcentajes, razones, índices o tasas de crecimiento. </li></ul><ul><li>La fórmula es: </li></ul>
  58. 58. Ejemplo 7 <ul><li>La tasa de interés de tres bonos son: 5, 21 y 4 por ciento. </li></ul><ul><li>La media aritmética es (5+21+4)/3 =10.0 </li></ul><ul><li>La GM da una utilidad más conservadora porque no está demasiado influenciada por la tasa del 21 por ciento. </li></ul><ul><li>La media geométrica es: </li></ul>
  59. 59. Media geométrica (Continuación) <ul><li>Otro uso de la media geométrica es determinar el aumento porcentual en ventas, producción o series económicas de un periodo de tiempo a otro. </li></ul>
  60. 60. Ejemplo 8 <ul><li>El número total de mujeres contratadas en Colegios Americanos se incrementó de 755,000 en 1992 a 835,000 en 2000. Esto es, la media geométrica o tasa de incremento es 1.27%. </li></ul>
  61. 61. La media para datos agrupados <ul><li>La media de una muestra de datos organizados en una distribución de frecuencias es calculada por la siguiente fórmula: </li></ul>
  62. 62. Ejemplo 9 <ul><li>Una muestra de 10 cines en una gran área metropolitana contó el número total de películas en exhibición la última semana. Calcule el número medio de películas en exhibición. </li></ul>
  63. 63. Ejemplo 9 (Continuación) Películas en cartelera Frecuencia f Punto medio de clase ( X ) ( f )( X ) 1 hasta 3 1 2 2 3 hasta 5 2 4 8 5 hasta 7 3 6 18 7 hasta 9 1 8 8 9 hasta 11 3 10 30 Total 10 66
  64. 64. La mediana para datos agrupados <ul><li>La mediana de una muestra de datos agrupados en una distribución de frecuencias se calcula con: </li></ul><ul><li>donde L es el límite inferior de la clase que contiene a la mediana, n es el número total de frecuencias, CF es la frecuencia acumulada precedente a la clase mediana, f es la frecuencia de la clase que contiene a la mediana, e i es la amplitud de la clase en que se encuentra la mediana. </li></ul>
  65. 65. Encontrar la clase que contiene a la mediana <ul><li>Para determinar la clase que contiene a la mediana para datos agrupados: </li></ul><ul><li>Construya una distribución de frecuencias acumuladas. </li></ul><ul><li>Divida el número total de datos entre 2. </li></ul><ul><li>Determine cuál clase contiene este valor. </li></ul><ul><li>Por ejemplo, si n = 50, 50/2 =25, entonces determine cuál clase contiene el valor en la posición 25. </li></ul>
  66. 66. Ejemplo 10 Películas en cartelera Frecuencia Frecuencia acumulada 1 hasta 3 1 1 3 hasta 5 2 3 5 hasta 7 3 6 7 hasta 9 1 7 9 hasta 11 3 10
  67. 67. Ejemplo 10 (Continuación) <ul><li>De la tabla, tenemos: L = 5, n = 10, f = 3, i = 2, CF = 3 </li></ul>
  68. 68. La moda en datos agrupados <ul><li>Para datos agrupados en una distribución de frecuencias, es posible aproximar la moda usando el punto medio de la clase que contiene el mayor número de frecuencias de clase. </li></ul><ul><li>Las modas en el ejemplo 10 son 8 y 10. Cuando dos valores ocurren un gran número de veces, la distribución es llamada bimodal , como en el ejemplo 10. </li></ul>
  69. 69. Distribución simétrica <ul><li>Cero asimetría moda = mediana = media </li></ul>
  70. 70. Distribución con sesgo positivo <ul><li>Asimetría positiva: media y mediana están a la derecha de la moda. </li></ul><ul><li>Moda<Mediana<Media </li></ul>
  71. 71. Distribución con sesgo negativo <ul><li>Asimetría negativa: media y mediana están a la izquierda de la moda. </li></ul><ul><li>Media<Mediana<Moda </li></ul>
  72. 72. Capítulo 4 Otras medidas descriptivas <ul><li>Objetivos: Al terminar este capítulo podrá: </li></ul><ul><li>Calcular e interpretar la amplitud, la desviación media, la varianza y la desviación estándar de datos no agrupados. </li></ul><ul><li>Calcular e interpretar la amplitud de variación, la varianza y la desviación estándar de datos agrupados. </li></ul><ul><li>Explicar las características, usos, ventajas y desventajas de cada medida. </li></ul>
  73. 73. Capítulo 4 (Continuación) <ul><li>Entender el teorema de Chebyshev y la regla normal o empírica, con relación a un conjunto de observaciones. </li></ul><ul><li>Calcular e interpretar los cuartiles y la amplitud cuartílica o intercuartílica. </li></ul><ul><li>Elaborar e interpretar los diagramas de caja. </li></ul><ul><li>Calcular y entender el coeficiente de asimetría y el coeficiente de variación. </li></ul>
  74. 74. Amplitud de variación <ul><li>La amplitud de variación es la diferencia entre el valor más grande y el valor más pequeño. </li></ul><ul><li>Sólo dos valores son utilizados en su cálculo. </li></ul><ul><li>Está influido por un valor extremo. </li></ul><ul><li>Es fácil calcularlo y entenderlo. </li></ul>
  75. 75. Desviación media <ul><li>La desviación media ( MD ) es el promedio aritmético de los valores absolutos de las desviaciones con respecto a la media aritmética. </li></ul><ul><li>Todos los valores son utilizados en el cálculo. </li></ul><ul><li>No está influido excesivamente por valores muy grandes o valores muy pequeños. </li></ul><ul><li>Los valores absolutos son difíciles de manipular. </li></ul>
  76. 76. Desviación media <ul><li>La fórmula para la desviación media es: </li></ul>
  77. 77. Ejemplo 1 <ul><li>Los pesos de una muestra de canastas conteniendo libros para una librería (en libras) son: </li></ul><ul><li>103, 97, 101, 106, 103 </li></ul><ul><li>Encuentre la amplitud y la desviación media. </li></ul><ul><li>Amplitud = 106 – 97 = 9 </li></ul>
  78. 78. Ejemplo 1 (Continuación) <ul><li>El primer paso es encontrar la media: </li></ul><ul><li>La desviación media es: </li></ul>
  79. 79. Varianza de la población <ul><li>La varianza de la población es la media aritmética de las desviaciones al cuadrado de la media poblacional. </li></ul><ul><li>Todos los valores son utilizados en el cálculo. </li></ul><ul><li>No está influido por valores extremos. </li></ul><ul><li>Las unidades están desproporcionadas, son los cuadrados de la unidad original. </li></ul>
  80. 80. Varianza <ul><li>La fórmula para la varianza poblacional es: </li></ul><ul><li>La fórmula para la varianza muestral es: </li></ul>
  81. 81. Ejemplo 2 <ul><li>Las edades de la familia González son: </li></ul><ul><li>2, 18, 34, 42 </li></ul><ul><li>¿Cuál es la varianza poblacional? </li></ul>
  82. 82. La desviación estándar poblacional <ul><li>La desviación estándar poblacional ( ) es la raíz cuadrada de la varianza poblacional. </li></ul><ul><li>Para el Ejemplo 2, la desviación estándar es 15.36, calculada así: </li></ul>
  83. 83. Ejemplo 3 <ul><li>Los ingresos ganados por hora en una muestra de cinco estudiantes son: </li></ul><ul><li>$7, $5, $11, $8, $6. </li></ul><ul><li>Encuentre la varianza. </li></ul>
  84. 84. Desviación estándar muestral <ul><li>La desviación estándar muestral es la raíz cuadrada de la varianza muestral. </li></ul><ul><li>En el Ejemplo 3, la desviación estándar muestral es 2.30 </li></ul>
  85. 85. Varianza muestral para datos agrupados <ul><li>La fórmula para la varianza muestral para datos agrupados es: </li></ul><ul><li>donde f es la frecuencia de clase y X es la marca de clase. </li></ul>
  86. 86. Interpretación y usos de la desviación estándar <ul><li>Teorema de Chebyshev: Para un conjunto cualquiera de observaciones, la proporción mínima de los valores que se encuentran dentro de k desviaciones estándar desde la media es por lo menos. </li></ul>donde k 2 es una constante mayor que 1.
  87. 87. Interpretación y usos de la desviación estándar <ul><li>Regla empírica: En una distribución de frecuencias simétrica, con forma de campana: </li></ul><ul><li>Aproximadamente 68% de las observaciones estarán entre más una y menos una s desde la media; </li></ul><ul><li>Aproximadamente 95% de las observaciones se encontrarán entre más dos y menos dos s desde la media; </li></ul><ul><li>Prácticamente todas las observaciones se hallarán entre más tres y menos tres s a partir del valor medio. </li></ul>
  88. 88. µ µ +1s µ+2s µ+3s µ-1s µ-2s µ-3s
  89. 89. Dispersión relativa <ul><li>El coeficiente de variación es la razón (cociente) de la desviación estándar y la media aritmética, expresada como un porcentaje. </li></ul>
  90. 90. Coeficiente de asimetría <ul><li>La asimetría es la medida de la carencia de simetría en una distribución. </li></ul><ul><li>El coeficiente de asimetría puede variar desde </li></ul><ul><li>-3 hasta 3. </li></ul><ul><li>Un valor cero indica una distribución simétrica. </li></ul><ul><li>Es calculado como sigue: </li></ul><ul><li>CA = 3(Media – Mediana)/ s </li></ul>
  91. 91. Rango intercuartílico <ul><li>El rango intercuartílico es la distancia entre el tercer cuartil Q 3 y el primer cuartil Q 1 . </li></ul><ul><li>Esta distancia incluirá la mitad de las observaciones. </li></ul><ul><li>Rango intercuartílico = Q 3 – Q 1 </li></ul>
  92. 92. Ejemplo 5 <ul><li>Para un conjunto de observaciones el tercer cuartil es 24 y el primer cuartil es 10. </li></ul><ul><li>¿Cuál es la desviación intercuartílica? </li></ul><ul><li>El rango intercuartílico es 24 – 10 = 14. 50% de las observaciones ocurrirán entre 10 y 24. </li></ul>
  93. 93. Diagrama de caja y bigotes <ul><li>Una gráfica de caja y bigotes es una gráfica basada en cuartiles, que ayudan a retratar un conjunto de datos. </li></ul><ul><li>Cinco tipos de datos son necesarios para construir una gráfica de caja y bigotes: el valor mínimo, el primer cuartil, la mediana, el tercer cuartil, y el valor máximo. </li></ul>
  94. 94. Ejemplo 6 <ul><li>Basado en una muestra de 20 pedidos entregados, Pizza Hot registró la siguiente información. El tiempo mínimo de entrega fue 13 minutos, y el máximo, 30 minutos. El primer cuartil fue 15 minutos, la mediana 18 minutos, y el tercer cuartil 22 minutos. Elabore un diagrama de caja y bigotes para los tiempos de entrega. </li></ul>
  95. 95. Ejemplo 6 (Continuación) mín Q 1 Q 2 Q 3 máx 12 14 16 18 30 20 22 24 26 28

×