Estadística i usam

5,349 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,349
On SlideShare
0
From Embeds
0
Number of Embeds
3,624
Actions
Shares
0
Downloads
36
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • 4
  • 1
  • 5
  • 4
  • 6
  • 2
  • 3
  • 7
  • 9
  • 8
  • Estadística i usam

    1. 1. ESTADÍSTICA IProf. Edwin Gerardo Acuña Acuña 1 San José. Costa Rica. Mayo 2012
    2. 2. • ¿Qué es estadística? 2
    3. 3. • La estadística es una rama de las matemáticas, que a través de un conjunto de técnicas, métodos, normas, reglas y procedimientos que se ocupan en observar, reunir, agrupar, cuantificar y organizar los datos de una muestra, permita no solo describir un hecho o comportamiento de un fenómeno, también analizar y evaluar conclusiones acerca de una población. 3
    4. 4. • Cualquier persona recibe información en forma de datos a través de los periódicos, la televisión u otros medios; y a menudo es necesario obtener alguna conclusión a partir de la información contenida en los datos. 4
    5. 5. Ejemplos de aplicación de la Estadística. 5
    6. 6. Ejercicio 1• Se desea investigar durante el mes de enero de este año, la opinión de los costarricenses mayores de 18 años sobre los distintos casos de corrupción que involucra a expresidentes. 6
    7. 7. Ejercicio 2• Se desea conocer el porcentaje de personas que observó el último encuentro de fútbol de la selección nacional, para ello se realizará un estudio telefónico en el Gran Área Metropolitana, entre personas mayores de 12 años. 7
    8. 8. Ejercicio 3• Ingreso salarial neto de los empleados del ICE.• El número de citas que atiende una clínica.• El grado académico de un profesor universitario.• El distrito de residencia de los costarricenses.• El número de personas que mueren a causa del SIDA cada año.• Si una persona ha visitado el parque Simón Bolívar.• Nivel de rating de una emisora radial• Número de placa de un vehículo 8
    9. 9. • Proporcionar las técnicas, métodos y procedimientos requeridos para describir y analizar un conjuntos de datos y así simplificar sus resultados.• Permite describir sus características y analizar el estudio de los fenómenos, de los datos destacados (HOLGUIN, 1993, Pág. 14)• Obtener conclusiones de una población, a partir de la descripción y análisis realizados a una muestra. (SANDOVAL, 2001, P. 15) 9
    10. 10. Las técnicas estadísticas utilizadas para interpretar los datos de una investigación pueden ser clasificadas en dos grandes grupos en función de que su objetivo sea describir las característicasobservadas de una muestra o inferir conclusionessobre la población de la que dicha muestra ha sido extraída. SE CLASIFICA EN DOS RAMAS DESCRIPTIVA INFERENCIAL 10
    11. 11. La estadística descriptiva es una rama de la estadística, que se encarga en representar a un fenómeno refiriendo variables que caracterizan los datos de la muestra de una población. El proceso que sigue la estadística descriptiva para el PROCESO estudio de una cierta población consta de los siguientes pasos: 11
    12. 12. Selección de variables e indicadores (es unamanifestación, observable y medible de loscomponentes de una variable) (Quivy, 2000)Mediante la recolección de datos se obtiene elvalor de cada individuo en los caracteresseleccionados de la muestra.Elaboración de tablas de frecuencias, mediantela adecuada ordenación, clasificación ydistribución de los datos del fenómenoestudiado.Representación gráfica de los resultados. 12
    13. 13. La estadística inferencial, extrae y analiza las características de los datos obtenidos de una muestras formados por individuos de unapoblación. A partir del estudio de la muestra se pretende conducir a un resultado de losaspectos relevantes de toda la población. Paracuyo estudio se requiere de conocimientos de estadística, probabilidad y matemáticas.(Esta rama de la estadística se estudia en la asignatura Estadística Aplicada a la Investigación Social II) 13
    14. 14. Concepto de estadísticadescriptiva e Inferencial. 14
    15. 15. POBLACION Es un conjunto de valores posibles o el recuentode todos los elementos que presentan unacaracterística común que toma de un colectivo ouniverso de objetos, ideas, acontecimientos oindividuos, al cual se refiere el estudio que sepretende realizar. El termino población, se usa para denotar elconjunto de elementos del cual extrae unamuestra. 15
    16. 16. MUESTRA Es un subconjunto de una población lacual nos puede servir para generalizaracerca de la población de estudio.Muestra aleatoria:Esta se obtiene cuando seleccionamos unamuestra de una población en la que todos loselementos son INDEPENDIENTES Ytienen IGUAL oportunidad de serseleccionados 16
    17. 17. MUESTRA• La muestra nos sirve para poder representar el comportamiento de la población con alto grado de confianza.• El éxito del proyecto depende de la forma en que se seleccione al elemento que participará en el estudio. 17
    18. 18. • Por qué emplear muestras? – La población es infinita – Población finita pero muy grande, sería imposible o muy costoso estudiarla. – La unidad estadística se transforma o destruye al ser analizada – Los resultados que se obtendrían al realizar una encuesta por muestreo serían suficientes y precisos. 18
    19. 19. Es un proceso que determina cómo serán seleccionados loselementos de una parte de la población, para que se puedan obtener conclusiones fiables a partir de la muestra, es importante tanto su tamaño como el modo en que han sidoextraídos los objetos, ideas, acontecimientos o individuos que componen el estudio. Existen diferentes tipos de diseño de muestreo,cada uno de ellos tienen características que sepueden ocupar según el tipo de población y elobjetivo la investigación. 19
    20. 20. Tipos de muestras• Aleatorias: – Muestreo simple al azar – Muestreo sistemático – Muestreo estratificado – Muestreo por conglomeradoss No aleatorias: – Muestreo por cuotas – Muestreo por criterio – Muestreo por conveniencia 20
    21. 21. Error de muestreo• Se presenta sólo en muestras aleatorias.• Es la diferencia entre el resultado dado por la muestra y el resultado que se hubiera obtenido si se hubiera hecho un censo.• Ventaja: se puede medir haciendo uso de la teoría de la probabilidad. 21
    22. 22. Sesgo• Error sistemático (se da en todas las observaciones) en un sólo sentido.• No es medible.• Tipos – Sesgo de selección. – Sesgo de medición. 22
    23. 23. DATO• Se le conoce como dato u observación, a cada resultado que se obtiene al realizar un experimento. 23
    24. 24. INFORMACION• A menudo se tiene que organizar los hechos para que te digan algo. Es en ese momento en que habrás convertido los datos en información. 24
    25. 25. Un instrumento es un mecanismo por el cual se recopilan datos con las variables que pretende medir a través de: la observación encuesta entrevista o cuestionario basados en los objetivos de la investigación.EL INSTRUMENTO TIENE QUE TENER LAS PROPIEDADES DE: VALIDEZ CONFIABILIDAD 25
    26. 26. El termino “validez” denota la utilidad científica de un instrumento de medida en el que puede establecerampliamente qué tan bien mide lo que pretende medir. A la validez se le ha dado tres significados principales: Validez de contenido Validez de criterio Validez de constructo 26
    27. 27. •VALIDEZ DE CONTENIDO Se refiere al grado en que la medición abarca la gama de significados que comprende el concepto (marco teórico) VALIDEZ DE CRÍTERIO Se basa en algún juicio externo (expertos) •VALIDEZ DE CONSTRUCTO Se refiere al grado en que una medición se relacionaconsistentemente con otras mediciones. En la medida en que la variable es abstracta y observable se le denomina de constructo. 27
    28. 28. El termino “confiabilidad” es una medida práctica de que tan consistente y estable podría ser un instrumento de medición o prueba. Existen diversos procedimientos para calcular la confiabilidad de un instrumento de medición entre los más utilizados son: Medidas de estabilidad (Test-retest) Método de formas alternativas o paralelas Método de mitades partidas (Split-Halves) Coeficiente alfa de Cronbach Coeficiente KR-20 Kuder y Richardson 28
    29. 29. Fuentes de información• Fuentes primarias: Publican o suministran datos recogidos por ellas mismas.• Fuentes secundarias: Toman datos recogidos o publicados anteriormente por otras. 29
    30. 30. Técnicas de Recolección de la información ENTREVISTA Requieren Cuestionario estructu – Personal – Telefónica CUESTIONARIO AUTOADMINISTRADO OBSERVACION Y MEDICION REGISTRO 30
    31. 31. ENTREVISTA PERSONAL• Motiva al entrevistado • Alto costo• Permite aclarar preguntas • Desconfianza del y/o verificar respuestas. entrevistado• Alto porcentaje de • Longitud limitada (en respuesta ocasiones)• Permite accesar a todos • Influencia del los elementos de la entrevistador puede ser población un elemento distorsionador 31
    32. 32. ENTREVISTA TELEFONICA• Bajo costo • Longitud limitada• Alto porcentaje de • No permite accesar a todos respuesta los elementos de la• Permite verificar las población (no todos respuestas tienen teléfono)• Más flexible con respecto a la hora de la entrevista 32
    33. 33. CUESTIONARIO AUTOADMINSTRADO • Porcentaje de respuesta bajo• Bajo costo • Dificulta la aclaración de• Longitud ilimitada dudas• Libertad de respuesta • Requiere informantes con• Mayor tiempo para nivel educativo alto responder • Requiere un sistema de• Permite tratar temas correo eficiente delicados o embarazosos 33
    34. 34. OBSERVACION Y MEDICION• Neutralidad u objetividad • Errores en la observación • Instrumento mal calibrado • Instrumento mal utilizado • Alto costo en algunos casos • No se pueden verificar los datos 34
    35. 35. REGISTRO• Bajo costo • Puede tener información• Información real y objetiva desactualizada o incompleta • La información disponible no siempre coincide con los fines estadísticos. 35
    36. 36. El Cuestionario• Identificación• Párrafo introductorio• Tamaño• Numeración• Caracteres tipográficos (Tipo de letra, Negrita)• Símbolos de ayuda (-->, * ) 36
    37. 37. El Cuestionario• Clasificación de las preguntas – Cerradas • De escogencia única • De escogencia múltiple • De rangos • De notas – Abiertas – Abiertas con alguna clasificación 37
    38. 38. El Cuestionario• Precodificación• Prueba del cuestionario• Revisión y Crítica• Codificación• Tabulación 38
    39. 39. El Cuestionario• Longitud del cuestionario• Orden o secuencia de las preguntas – Iniciales – Flujo de los temas – Delicadas• Estilo de redacción de las preguntas – Clara, comprensible, precisa y lo más específica posible. – No debe incomodar al entrevistado – Debe referirse a un solo aspecto – No debe inducir las respuestas 39
    40. 40. Fases de una investigación estadística• Planteamiento del problema.• Diseño del instrumento de recolección• Obtención de la información.• Preparación de la información• Análisis e Interpretación.• Presentación de resultados. 40
    41. 41. Presentación de la Información• Presentación Textual “En comparación con 1998, la economía experimentó en 1999 una reducción en la tasa de crecimiento, pues alcanzó apenas el 2.5%, mientras que el promedio anual entre 1985 y 1998 había sido de 4.9%” 41
    42. 42. Presentación de la Información• Presentación semitabular“En el último mes, la mayoría de los bancos ha disminuido los intereses para vivienda, como se puede apreciar a continuación: Se espera que esta reducción de intereses incentive el sector de la producción.” 42
    43. 43. Presentación tabular: Cuadros• Muestran la información de forma ordenada por filas y por columnas, de manera visualmente agradable.• Permiten presentar y divulgar la información de una manera fácil de interpretar y útil para el usuario. 43
    44. 44. Componentes de un cuadro Número de cuadro Título Columna matriz Encabezados Cuerpo o contenido Nota introductoria o preliminar Nota al pie Fuente 44
    45. 45. Cuadro # TITULO (nota introductoria) Columna Encabezados Encabezados Matriz CUERPONota al pieFUENTE 45
    46. 46. CUADRO 2 CONSUMO DE DROGAS SEGÚN CANTÓN DE RESIDENCIA POR TIPO DE DROGA, COSTA RICA, 2,000 (Valores Porcentuales) **Datos preliminares FUENTE: Consumo de alcohol, tabaco y otras drogas. Distribución geográfica 2001. I.A.F.A. 46
    47. 47. EXPERIMENTO• Actividad planeada cuyos resultados producen un conjunto de datos. 47
    48. 48. PARÁMETRO• Valor numérico que resume toda la información de una población completa.• Promedio, moda, mediana, desviación estándar, rango, etc. 48
    49. 49. Una variable es susceptible de medir cualquier característica de un objeto que pueda tomar diferentes valores de un conjunto de datos (Un dato es una medida que se realiza sobre los sujetos de un experimento).Existen diferentes tipos de variables, entre las más utilizadas son: VARIABLES CUALITATIVAS CUANTITATIVAS 49
    50. 50. Una variable cualitativa, también llamada nonumérica, se denomina por sus atributos porqueexpresa distintas cualidades, características omodalidades, que son susceptibles dedescribirse mediante palabras, cuya mediciónsolo puede ser por una escala nominal u ordinal.EJEMPLO: Sexo, estado civil, o la profesión de una persona. 50
    51. 51. • TIPOS DE VARIABLES CUALITATIVAS• Dicotómicas: Sólo hay dos categoría, que son excluyentes una de la otra• Ejemplo: enfermo-sano, muerto-vivo, mujer- hombre• Nominal: tiene mas de dos categorías y no hay orden entre ellas.• Ejemplo: color de los ojos, grupo sanguíneo• Ordinal: tiene varias categorías y hay orden entre ellas.• Ejemplo: grado tumoral, calificación del riesgo en anestesia. 51
    52. 52. Una variable cuantitativa, también llamada numérica, es aquella susceptible de ser expresada numéricamente, cuya medición puede ser utilizada con una escala de intervalo o de razón según el objetivo de la investigación.EJEMPLO: A los pacientes atendidos en la Institución Musas de Metal se les pregunta el ingreso mensual de sus familias. $0 a $5,999 b) $6,000 a $11,999 c)$12,000 a $17,999 d)$18,000 a $23,999 52
    53. 53. • TIPOS DE VARIABLES CUANTITATIVAS• Continuas: números infinito no numerables de elementos. Tiene asociado el concepto de medida• Ejemplo: Presión arterial, Edad, peso.• Discretas: números finitos o infinitos numerables de elementos. Se asocia con el concepto de conteo.• Ejemplo: N° de hijos, N° de casos de tuberculosis por estado. 53
    54. 54. • Hay ocasiones en las que las medidas cuantitativas continuas son transformadas en ordinales mediante la utilización de uno o varios puntos de corte.• Ejemplo: La variable peso es codificada en varias categorías y se utiliza en términos como: Bajo-peso, peso-normal, Sobrepeso, Obesidad 54
    55. 55. • Las descripciones numéricas de datos suelen ser importantes. Dado un conjunto de n observaciones x1 , x2 ,....., xn• La estadística descriptiva nos puede ayudar mediante resúmenes numéricos, que son medidas de tendencia central, o también llamadas de posición y medidas de dispersión 55
    56. 56. RECOPILACION DE DATOS• Es el proceso mediante el cual obtenemos los datos u observaciones de una muestra.• Posteriormente los datos se organizarán de acuerdo al uso que se les de.• Experimento, encuesta, censo. 56
    57. 57. ORGANIZAR Si se tiene una serie de datos, primero hayque organizarlos en forma ordenada y ensubconjuntos que presenten característicassimilares. Los datos agrupados se pueden resumirgráficamente o en tablas y mediantemedidas numéricas (parámetros) queobtendremos posteriormente como lamedia, la mediana, la desviación estándar,etc. 57
    58. 58. • Los datos ordenados en grupos o categorías reciben el nombre de: distribución de frecuencias.• Para obtener el rango de una distribución de frecuencias, se realiza la diferencia entre el mayor y el menor valor de los datos.• Cuando se tiene un gran número de datos, habrá que distribuirlos en : clases, categorías. 58
    59. 59. La distribución de datos ó de frecuencias la cual es la presentación de cuadros o tablas estadísticas. El objetivo principal de una distribución de frecuencias consiste enpresentar los datos de un modo que facilite su comprensión e interpretación. Algunos tipos de distribución Frecuencia Absoluta. Frecuencia Relativa. Frecuencia Porcentual. Frecuencia Acumulada. Marca de Clase 59
    60. 60. VARIABLE FRECUENCIA ABSOLUTA La frecuencia absoluta, es el número de AHORRO F veces que se repite un determinado valor 09-12 18 o una determinado atributo de la variable. 13-15 26 Está influida por el tamaño de la muestra, 16-18 7 al aumentar el tamaño de la muestra 19-21 4 aumentará también el tamaño de la 22-24 1 frecuencia absoluta y la suma de las frecuencias absolutas debe ser igual al 25-27 4 . número total de los datos en estudio. Total 60 Tabla No 1.3 Datos de laencuesta del ahorro mensual deacuerdo al salario que perciben los trabajadores. (pesos mexicanos) 60
    61. 61. La frecuencia relativa consiste en la proporción del número total de datos que aparece en cada intervalo, la suma de la frecuencia es siempre la unidad (1). Se obtiene al dividir la frecuencia absoluta de cada intervalo entre el número total de datos o elementos del conjunto. La frecuencia relativa también se expresa, en ocasiones, en tanto por ciento F Frecuencia del intervaloSE OBTIENE FR = N Suma de frecuencias 61
    62. 62. La frecuencia porcentual, consiste encalcular el porcentaje de la relación que La palabra porcentajese establece entre una de las partes con significa por cien.respecto al todo multiplicándolas por 100,que pertenece a cada intervalo ocategoría. La frecuencia porcentual también se expresa, en ocasiones en frecuencia relativa. PORCENTAJE = ( F / N ) X 100 Ó PORCENTAJE = FR X 100 62
    63. 63. VARIABLE FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADA La frecuencia acumulada, indica cómo AHORRO F FA se van concentrando los datos de un 09-10 18 18 valor de cada intervalo o una 13-15 26 44 determinada modalidad del atributo. 16-18 7 51 Puede incluir a cualquiera de las 19-21 4 55 frecuencias: absoluta, relativa o 22-24 1 56 porcentual; sugiriendo se calcule sólo 25-27 4 60 la que sea necesaria para los fines de la investigación. Total 60 Tabla No. 1.6 Datos de laencuesta del ahorro mensual deacuerdo al salario que perciben los trabajadores. (pesos mexicanos) 63
    64. 64. La marca de clase, solo es aplicable a datos agrupados y es: Es el punto medio de cada intervalo de clase. Es el valor que representa a todos los datos que puedan estar integrados en éste.Marca de clase = ( Límite inferior + Límite superior ) / 2 9 - 12 10.5 Marca Intervalos de clase de Clase Con clasificación continua X 64
    65. 65. FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA MARCA DE VARIABLE ABSOLUTA RELATIVA PORCENTUAL ACUMULADA CLASE AHORRO F FR % FA MC 9-12 18 0,3 30 18 10,5 13-15 26 0,43 42 44 14 16-18 7 0,12 12 51 17 19-21 4 0,07 7 55 20 22-24 1 0,02 2 56 23 25-27 4 0,07 7 60 26 Total 60 1 100Tabla No. 1.7 Se ha realizado una encuesta a 60 personas alas que se les ha preguntado cuanto dinero ahorranmensualmente de acuerdo al salario que perciben,obteniéndose los siguientes resultados (pesos mexicanos) 65
    66. 66. Las gráficas se basa por completo en una tabla de datos y sirve para visualizar la forma de distribución de los datos, porque permite mostrar, explicar, interpretar y describir de manerasencilla, clara y efectiva, los datos estadísticos mediante formas geométricas tales como líneas, áreas, volúmenes. Para la descripción gráfica, podrá disponer de una amplia galería de gráficas entre las más utilizadas son: POLIGONOS HISTOGRAMA DE FRECUENCIA DIAGRAMA DE OJIVA BARRAS SECTORIAL 66
    67. 67. Se considera uno de las más sencillas y útiles de representar los datos cuantitativos (numéricas)• Representa a los niveles de medición ordinal, de intervalo o de razón• Se puede graficar con la frecuencia: absoluta, porcentual ó relativa, según los objetivos de la investigación F Fig. No. 1 Histograma Ahorro (colones) r e 30 c 20 u 10 Cuantitativa e 0 n 1 c 9-12 13-15 16-18 19-21 22-24 25-27 i a Intervalo 67
    68. 68. HISTOGRAMA TRABAJADORES DEL TALLER ELÉCTRICO 50TRABAJADORES 42 NUMERO E 40 27 30 18 edad 20 5 8 10 0 61 64 67 70 73 EDAD DE LOS TRABAJADORES 68
    69. 69. • Es una gráfica más utilizada por su sencillez, para representar las características cuantitativas (numérica) y cualitativas (no numérica) Representa a los niveles de medición nominal u ordinal Se puede graficar con la frecuencia: absoluta, porcentual o relativa 30 25 20 Fig. No. 2 Diagrama de 15 Barras Percepción del ahorro 10 (colones) 5 0 Baja Muy Regular Alta Muy alta baja Cualitativa Categor ia 69
    70. 70. Se utilizada para representar principalmente variablescualitativas (no numéricas)Representa al nivel de medición nominalSe puede graficar con la frecuencia: porcentual o relativaResultan adecuado cuando hay pocos valores Para ello se utiliza la siguiente expresión aritmética: Total de grados = ( porcentaje ) ( 360 ) MUY BAJO Fig. No. 3 Gráfica sectorial BAJO REGULAR Ahorro (dólares) ALTO MUY ALTO Cualitativas Porcentajes 70
    71. 71. Se utiliza para representar principalmente variablescuantitativas (numéricas) Representa al nivel de medición de intervalo o de razón Se puede graficar con la frecuencia: marca de clase F r 0,50 e 0,40 c Fig. No. 4 Polígono de 0,30 u Frecuencia 0,20 e 0,10 Ahorro (euros) n 0,00 c 9-12 13-15 16-18 19-21 ia 22-24 25-27 71
    72. 72. POLIGONO DE FRECUENCUA TRABAJADORES DEL TALLER ELÉCTRICO TRABAJADORES 50NUMERO E 40 42 30 27 edad 20 18 10 8 5 0 61 64 67 70 73 EDAD DE LOS TRABAJADORES 72
    73. 73. Los polígonos de frecuencia pueden emplearse asimismo para representar frecuencia acumulada que en tal caso resulta designar como ojiva.• Es aplicable a variables ordinales.• Representa a la distribución de frecuencias acumuladas, sean absolutas, porcentuales o relativas.• Es una gráfica ascendente.706050 Fig. No. 5 Ojiva4030 Ahorro (colones)2010 0 9 * 12 13 * 15 16 * 18 19 * 21 22 * 24 25 - 27 73
    74. 74. CLASE Ó CATEGORIA• La utilidad de lo anterior, es que se puede analizar con mayor facilidad un conjunto de números sin que se tenga que considerar cada número.• Una categoría o clase recibe el nombre de : intervalo de clase. 74
    75. 75. INTERVALO DE CLASE• Los valores extremos de un intervalo de clase reciben el nombre de: limites de clase. (inferior y superior)• Existen otros limites de gran importancia llamados limites reales de clase.• Para hallar el limite real inferior se suma el limite inferior mas el número anterior y esto se divide entre dos. 75
    76. 76. • Para hallar el limite real superior se suma el limite superior mas el número que le sigue y esto se divide entre dos.• Tamaño o anchura de clase: basta con realizar la diferencia entre los limites reales considerando primero el superior.• Marca de clase: se obtiene sumando los limites superior e inferior y dividiendo entre dos. 76
    77. 77. Con la información anterior podemosformar las distribuciones de frecuencia conmayor facilidad si consideramos primero elrango. Después de calcularlo, lo dividimosen un número conveniente de intervalos declase del mismo tamaño y considerando almismo tiempo que las marcas de clasecoincidan en lo posible con los datos quefueron observados. Por último indicamosla frecuencia de clase. 77
    78. 78. • Al construir una distribución de frecuencias podemos representarla gráficamente, ya sea por medio de un histograma (rectángulo sobre el eje X) o por un polígono de frecuencias (gráfico de línea trazado sobre las marcas de clase) 78
    79. 79. II semana 79
    80. 80. DIA 24 EJEMPLO 1• Se tiene el número de accidentes que ocurren día a día durante un periodo de 50 días en la autopista Veracruz-Xalapa. 2 9 6 7 0 8 2 5 4 2 4 4 5 4 4 2 5 6 7 3 8 3 8 4 4 7 4 7 5 6 4 7 3 5 1 7 3 8 0 6 1 5 2 3 0 6 5 6 3 6 80
    81. 81. Observar que los datos constan de enteros.Puesto que el mayor número de accidenteses 9 y el menor es 0, por lo tanto el :rango: 9 – 0 = 9Considerando 5 intervalos de clase:(Rango + 1)/5 = (9+1)/5=10/5=2 Podemos considerar que cada intervalo declase constará de : 2 elementos. 81
    82. 82. 1ºDIA 15 2ºDIA 22 Formando los intervalos de clase y contabilizando la cantidad de elementos en cada intervalo de clase obtenemos la siguiente distribución de frecuencia:INTERVALOS DE CLASE FRECUENCIA 0-1 5 2-3 11 4-5 16 6-7 13 8-9 5 Total ( N) = 50 82
    83. 83. Identificando las partes de la distribución de frecuencia:• Primer intervalo de clase: 0-1• Frecuencia de la tercera de clase: 16• Limite inferior del primer intervalo de clase: 0• Limite superior del tercer intervalo de clase: 5• Tamaño de tercera la clase: 5.5-3.5= 2• Marca de la primer clase : (0+1)/2=.5• Marca de la quinta clase : (8+9)/2=8.5 …etc. 83
    84. 84. FRECUENCIA RELATIVA• Es la frecuencia de clase dividida por el total de frecuencias de todas las clases. El resultado se expresa generalmente como porcentajes. F.R.= f/ N o bien: F.R.%=(f/N) * 100• Esto nos servirá para la representación gráfica circular o de pastel. 84
    85. 85. FRECUENCIA ACUMULADAS• Este tipo de frecuencia está diseñada para mostrar el número o porcentajes de elementos que son menores que cierto valor específico o iguales a este. 85
    86. 86. DISTRIBUCION DE FRECUENCIA RELATIVAF.R. (0-1)= 5/50 = 0.10 o bien 10%F.R. (2-3)= 11/50= 0.22 o bien 22%F.R. (4-5)= 16/50= 0.32 o bien 32%F.R. (6-7)= 13/50= 0.26 o bien 26%F.R. (8-9)= 5/50 = 0.10 o bien 10% 1.00 100% 86
    87. 87. DISTRIBUCION DE FRECUENCIA ACUMULADAF.A. (0-1) 0.10F.A. (2-3) 0.22+0.10=0.32F.A. (4-5) 0.32+0.32=0.64F.A. (6-7) 0.26+0.64=0.90F.A. (8-9) 0.10+0.90=1.00 Se puede observar que el 64% de los días no excedió de 5 accidentes y que el 90% de los días no excedió de 7 accidentes. 87
    88. 88. HISTOGRAMA DEFRECUENCIAS RELATIVAS NUMERO DE ACCIDENTES EN LA AUTOPISTA VERACRUZ-XALAPA EN UN PERIODO DE 50 DIAS FRECUENCIA 0.4 0.32 RELATIVA 0.3 0.22 0.26 0.2 Frecuencia 0.1 0.1 Relativa 0.1 0 0-1 2-3 4-5 6-7 8-9 RANGO (NUMERO DE ACCIDENTES) 88
    89. 89. POLIGONO DE FRECUENCIAS ACUMULADAS NUMERO DE ACCIDENTES EN LA AUTOPISTA VERACRUZ-XALAPA EN 1.2 UN PERIODO DE 50 DIASDIAS 1 1 FRECUENCIA ACUMULADA 0.9 Frecuencia 0.8 Acumulada 0.6 0.64 0.4 0.32 0.2 0.1 0 0-1 2-3 4-5 6-7 8-9 RANGO (NUMERO DE ACCIDENTES) 89
    90. 90. EJEMPLO 2CONSIDEREMOS LA EDAD DE CIEN ADULTOS MAYORES QUE VARIAN ENTRE 60 Y 74 AÑOS 62 72 72 69 69 69 61 68 71 71 64 67 64 67 60 64 67 62 64 67 65 64 74 64 73 65 63 74 64 63 73 64 67 73 71 71 67 65 67 67 67 63 63 63 64 71 64 74 71 71 70 67 70 66 70 67 70 66 70 66 66 68 66 66 69 67 67 68 68 68 68 66 68 70 70 66 67 66 66 70 68 68 68 70 67 67 68 68 67 69 67 67 67 70 70 70 70 61 70 70 90
    91. 91. RESOLUCION DE EJEMPLO 2• Rango 74-60= 14 años• Dividiremos todo en cinco intervalos de clase. intervalos de clase (AÑOS) 60-62 63-65 66-68 69-71 72-74 91
    92. 92. RESOLUCION DE EJEMPLO 260 Limite inferior del primer intervalo de clase.62 Limite superior de primer intervalo de clase.(59+60)/2 = 59.5 Limite real inferior.(62+63)/2 = 62.5 Limite real superior.Tamaño C = 62.5 - 59.5 = 3 C = 65.5 - 62.5 = 3, …….., etc. 92
    93. 93. DISTRIBUCION DE FRECUENCIAS (AÑOS) ( ADULTOS MAYORES)INTERVALOS DE CLASE FRECUENCIAS 60-62 5 63-65 18 66-68 42 69-71 27 72-74 8 100 93
    94. 94. RESOLUCION DE EJEMPLO 2• Marca de Clase (60+62)/2 = 61 (63+65)/2 = 64, ……., etc 94
    95. 95. DISTRIBUCION DE FRECUENCIAS AÑOS ADULTOS MAYORESMARCAS DE CLASE FRECUENCIA 61 5 64 18 67 42 70 27 73 8 N= 100 95
    96. 96. DISTRIBUCIÓN DE FRECUENCIA RELATIVA.• Distribución de frecuencia relativa. F. R. (60-62) = 5/100 = 0.05 F. R. (63-65) = 18/100 = 0.18 “ “ 0.42 “ “ 0.27 “ “ 0.08 1.00 96
    97. 97. DISTRIBUCIÓN DE FRECUENCIAS ACUMULADASF.A. (60-62) 0.05F.A. (63-65) 0.18+0.05=0.23F.A. (66-68) 0.42+0.23=0.65F.A. (69-71) 0.27+0.65=0.92F.A. (72-74) 0.08+0.92=1.00 97
    98. 98. MEDIDAS DE TENDENCIA CENTRAL• Estas medidas se emplean para indicar un valor que tiende a ser el más representativo de un conjunto de números. Las tres medidas de mayor importancia son:• Media• Mediana• Moda 98
    99. 99. MEDIA• De las 3 medidas está es la más importante. La media se determina al sumar los valores de un conjunto y dividir el resultado de esta suma entre el número de valores del mismo. X = x1+ x2+…+xn = ∑nj=1xj = ∑xj N N N 99
    100. 100. MEDIA Esta medida de tendencia central posee varias propiedades:• Se puede calcular para un conjunto de números• La media es única, es decir, existe una y solo una para un conjunto de datos.• Si cambia algún valor del conjunto de números, entonces también cambia la media.• La suma de desviaciones de los números a partir de la media es 0. ∑(xj-X) = 0 100
    101. 101. MEDIA• Cuando se tiene una tabla de una distribución de frecuencias en donde hemos clasificado nuestros datos y deseamos calcular la media tenemos que considerar únicamente las marcas de clase de cada intervalo. Estas marcas de clase multiplicadas por las frecuencias y divididas entre la frecuencia total, nos da como resultado la media. X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj N N N 101
    102. 102. EJEMPLO 3• En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9 102
    103. 103. HALLANDO LA MEDIA X = f1x1+ f2x2+…+fkxk = ∑kj=1fjxj = ∑fxj N N NX = 1(1)+2(2)+3(3)+0(4)+4(5)+6(6)+9(7)= 133= 25 25 X= 5.32 min. 103
    104. 104. MEDIANA• La característica de mayor importancia es que divide un conjunto ordenado en dos grupos iguales, es decir, la mediana de un conjunto de datos ordenados en orden de magnitud, es el valor medio o la media de los valores medios.• Una regla para obtener la mediana es:• Clasificación u ordenamiento de los datos. 104
    105. 105. MEDIANA• Contar para conocer si existen un numero par o impar de datos.• Si se tiene un numero impar de valores, la mediana es el valor intermedio. Para un numero par de valores, la mediana es la media de los valores intermedios. 105
    106. 106. MEDIANA• Considerando una distribución de frecuencias para datos agrupados, la mediana se obtiene mediante: Mediana = L1 + N/2 – (∑F )1 C Fmediana• Donde:• L1 = Limite real inferior de la clase mediana (esto es, la clase que contiene la mediana).• N = Frecuencia Total (Numero total de Datos)• (∑f)1=Suma dde las frecuencias de todas las clases que se encuentran debajo de la clase mediana.• Fmediana = Frecuencia de la clase mediana• C= Tamaño del intervalo de la clase mediana. 106
    107. 107. EJEMPLO 4• En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9 107
    108. 108. HALLANDO LA MEDIANA Mediana = L1 + N/2 – (∑F )1 c FmedianaRecuerde que gráficamente la mediana es el valor quecorresponde a la mitad de la frecuencia total.25/2= 12.5 = N/2La ∑ de la “f” hasta la quinta clase es 10 : (∑F )1La ∑ de la “f” hasta la sexta clase es 16En esta clase se localiza la mediana.Clase mediana : sexta clase 108
    109. 109. HALLANDO LA MEDIANALimite real inferior de la sexta clase:L1 = (5+6)/2= 5.5(∑F )1= 10 Mediana: 5.5 + 12.5-10 (1)Fmediana = 6 6C= 1 Mediana=5.5 +0.416 = 5.916N/2= 12.5 min. 109
    110. 110. MODA• La moda es el valor que mayor número de veces se presenta en un conjunto de números. Existen algunos casos en los cuales no existe la moda y otros en los cuales existen mas de una moda. Una distribución que cuenta con una moda se le conoce como unímodal. 110
    111. 111. MODA• Para una distribución de frecuencias, la moda es el valor o los valores máximos de la curva y se puede calcular por medio de Moda = L1 + Δ1 C Δ1 + Δ2• Donde:• L1 = Limite real inferior de clase de la clase modal. La clase modal es aquella donde se localiza la moda.• Δ1 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia anterior o premodal• Δ2 = Es la diferencia entre la frecuencia de la clase modal y la frecuencia siguiente o posmodal• C = Tamaño del intervalo de clase modal 111
    112. 112. EJEMPLO 5• En un examen de habilidad matemática aplicado a 25 alumnos se les pidió completar en forma individual un “cuadro mágico”. El tiempo que necesitó cada estudiante para completar el trabajo fue registrado en minutos . Los resultados fueron los siguientes:Minutos x 1 2 3 4 5 6 7Alumnos f 1 2 3 0 4 6 9 Moda: 7 min. 112
    113. 113. EJEMPLO MEDIDAS DE TENDENCIA CENTRAL• En una compañía automotriz hay 100 trabajadores los cuales producen refacciones. Algunos por sus capacidades y experiencias construyen mas que otros al termino de cada mes. La distribución de frecuencias es la siguiente: 113
    114. 114. Intervalo de Clase Frecuencia(f) x 45-47 2 46 48-50 4 49 51-53 15 52 54-56 21 55 57-59 39 58 60-62 5 61 63-65 14 64 114
    115. 115. MEDIA, MEDIANA Y MODAMEDIA X =56.86 refacciones producidasMEDIANA =57.11 refacciones producidasMODA= 57.53 refacciones producidas 115
    116. 116. MEDIAPromedio aritmético del conjunto de datos.Un dato extremo disperso afecta alresultado de la media. 116
    117. 117. MEDIANAEs el número del medio del conjunto dedatos, establece un punto que divide alconjunto de datos en dos grupos de lamisma cantidad. 117
    118. 118. MODA Es el número más popular en el conjunto de datos.“Es importante saber la marca de cereales que se vende más de manera que se pueda estar seguro de tener suficiente en el almacén. 118
    119. 119. MEDIA Y MEDIANAPara un conjunto de datos con dos o másmodas, será mejor usar la media o lamediana como característica del grupo,recordando que al haber un extremodisperso, es mejor el uso de la mediana. 119
    120. 120. EJEMPLO 6 Una persona que sirve mesas en el restaurante del hotel “PLAZA VERACRUZ” de Veracruz, Veracruz, registra las propinas que percibió durante 7 días.Día 1 2 3 4 5 6 7$ 24 15 22 80 16 21 19 120
    121. 121. ANALISIS¿Cuánto te haces de propina en un día?X = $ 28.14Moda : no hayMediana: 15,16,19,21,22,24,80 = $ 21 ¿Cuál seria el valor más característico o representativo de este conjunto de datos? 121
    122. 122. EJEMPLO 7 Datos de producción de tres operarios. Número de artículos producidos por día Día de trabajoOperario día 1 día 2 día 3 día 4 día 5 día 6 día 7 día 8 día 9 día 10 A 1 2 2 3 3 4 5 4 5 5 B 6 1 2 5 3 2 2 2 7 1 C 7 6 5 4 2 3 2 3 2 2 122
    123. 123. MODA MEDIA MEDIANAOPERARIO A 5 3.5 3.4OPERARIO B 2 2.5 3.2OPERARIO C 2 3 3.6¿Qué operario elegirías para quecontinuara en el puesto?¿Te ayudaría el rango a reafirmar tudecisión? ¿Qué mas observas? 123
    124. 124. MEDIDAS DE DISPERSION• Este tipo de medidas también reciben el nombre de Medidas De Variación.• Las Medidas de Dispersión o Variación se emplean para saber si los valores están relativamente cercanos uno al otro o si se encuentran dispersos. Todas las medidas de dispersión exceptuando la de Amplitud o Rango toman a la media como punto de referencia. 124
    125. 125. MEDIDAS DE DISPERSIONLas medidas de dispersión son: 125
    126. 126. RANGO O AMPLITUD DE VARIACION• Es la diferencia entre el mayor valor y el menor de todos ellos.• El rango es una medida limitada puesto que considera a los valores extremos de un conjunto y no proporciona mayor información respecto a los demás valores del mismo. 126
    127. 127. DESVIACION MEDIA O PROMEDIO DE DESVIACION• Se emplea para medir el promedio de los alejamientos de los datos observados en la muestra respecto a la media de estos datos.• Para un conjunto de valores se obtiene al restar la media de cada valor del grupo, eliminando el signo negativo (esto se logra por medio del valor absoluto) dividida entre el número total de observaciones. 127
    128. 128. DESVIACION MEDIA O PROMEDIO DE DESVIACION• Sus formulas son: Para una distribución de frecuencias: DM = ∑ x-X DM = ∑f x-X N N• N = numero total de datos.• x = Marcas de clase• X = Media• f = frecuencias de clase 128
    129. 129. VARIANZA• La varianza de una muestra se determina en forma similar que la desviación media pero con las siguiente diferencia: Las desviaciones se elevan al cuadrado antes de ser sumadas. 129
    130. 130. VARIANZA• Sus formulas son: Para una distribución de frecuencias S2 = ∑(x-X)2 S2 = ∑f (x-X)2 N N• Donde:• N = numero total de datos.• x = Marcas de clase o datos• X = Media• f = frecuencias de clase 130
    131. 131. DESVIACION ESTANDAR• La desviación estándar es la raíz cuadrada positiva de la varianza. Para obtener la desviación estándar se debe calcular la varianza y hallar su raíz cuadrada positiva.• La desviación estándar queda representada por la letra mayúscula S.• La desviación estándar es una de las medidas mas importantes dentro de la Estadística. 131
    132. 132. DESVIACION ESTANDAR• Sus formulas son: Para una distribución de frecuencias S=Donde: √ ∑(x-X)2 N S= √ ∑f (x-X)2 N• N = numero total de datos.• x = Marcas de clase o datos• X = Media• f = frecuencias de clase 132
    133. 133. DESVIACION ESTANDAR• El 68% de los valores cae dentro del rango de una vez la desviación estándar con respecto de la media.• En cualquier conjunto de valores graficados que se ajusten a una curva normal, el 95% de los valores quedan dentro de dos desviaciones típicas respecto del valor de la media del conjunto.• Generalmente en un rango de 3 desviaciones típicas con respecto a la media queda contenido el 100% de los valores del conjunto. Esta información tiene uso inmediato en la aplicación de tolerancia o medidas de control de calidad de artículos manufacturados. 133
    134. 134. REPRESENTACION DE LA DESVIACION ESTANDAR LA MEDIA, LA MODA Y LA MEDIANA SON IGUALES PUNTOS DE INFLEXIONPUNTOS DE 68 %INFLEXION UNA DESVIACION TÍPICA O ESTANDAR DOS DESVIACIONES TÍPICAS O ESTANDAR 134
    135. 135. EJEMPLO DE MEDIDAS DE DISPERSION• En un experimento aleatorio se obtuvo la muestra de elementos: 17, 15, 25, 23, 18, 18, 20, 19, 20, 20, 20, 21, 20, 20Determinar• Desviación Media• Varianza• Desviación estándar. 135
    136. 136. OBTENIENDO LA DISTRIBUCION DE FRECUENCIAS x f f.x 15 1 15 17 1 17 18 2 36 19 1 19 20 6 120 21 1 21 23 1 23 25 1 25 N = 14 ∑fx= 276 136
    137. 137. MEDIAMedia = ∑fx / N = 276/14 = 19.714 137
    138. 138. x media Desv│x-X│ F F.│x-X│ 15 19.7142857 4.7142857 1 4.7142857 17 19.7142857 2.7142857 1 2.7142857 18 19.7142857 1.7142857 2 3.4285714 19 19.7142857 0.7142857 1 0.7142857 20 19.7142857 0.2857143 6 1.7142858 21 19.7142857 1.2857143 1 1.2857143 23 19.7142857 3.2857143 1 3.2857143 25 19.7142857 5.2857143 1 5.2857143 N= ∑ F.│x-X │= 14 23.1428572 138
    139. 139. DESVIACION MEDIADESV. MEDIA 1.65306123 139
    140. 140. CALCULO DE LA DESV. ESTANDAR Y LA VARIANZADesviación │x-X│ (x-X)2 f f(x-X)2 4.7142857 22.2244897 1 22.2244897 2.7142857 7.36734686 1 7.36734686 1.7142857 2.93877546 2 5.87755092 0.7142857 0.51020406 1 0.51020406 0.2857143 0.08163266 6 0.48979597 1.2857143 1.65306126 1 1.65306126 3.2857143 10.7959185 1 10.7959185 5.2857143 27.9387757 1 27.9387757 ∑ f(x-X)2 = N = 14 76.8571429 140
    141. 141. DESVIACION ESTANDAR Y VARIANZAvarianza 5.48979592Desv. Estandar 2.340309 141
    142. 142. CUARTILES, DECILES Y PERCENTILES.• Los cuartiles, deciles y percentiles se asemejen mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas y ordenadas.• Mientras la mediana divide una distribución en dos mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en 10 décimos y los puntos percentiles la dividen en 100 partes. 142
    143. 143. • Considerando que el lugar de la mediana se puede encontrar por:Lugar de la mediana: n/2 + ½• Para el primer cuartil será: n/4 + ½• Para el tercer decil será: 3n/10 + ½• Para el septuagésimo percentil será: 70n/100 + ½ 143
    144. 144. EJEMPLO• Si ocho empresas vendieron las siguientes cantidades de unidades de aire acondicionado, 5, 8, 8, 11, 11, 11, 14, 16.Busque la posición del tercer cuartel para esta distribución; C3 = 3n/4 + ½ C3 = 3(8)/4 + ½= 6.5• Lo cual nos indica que el tercer cuartel se encuentra ubicado entre el sexto y séptimo valor del grupo ordenado. O sea: (11 + 14)/ 2 = 12.5 144
    145. 145. DESVIACION CUARTIL• Es la medida de dispersión más usada en relación con la mediana; también es llamada rango semiintercuartil. Se simboliza por Q y se le define por la fórmula:• en la cual Q1 y Q3 son los puntos bajo los cuales se halla el 25% y el 75% de los datos, respectivamente, como ya se había visto anteriormente. 145
    146. 146. 146

    ×