Estadística Unidades Desarrolladas

63,862 views

Published on

Published in: Travel, Entertainment & Humor
3 Comments
9 Likes
Statistics
Notes
No Downloads
Views
Total views
63,862
On SlideShare
0
From Embeds
0
Number of Embeds
55
Actions
Shares
0
Downloads
621
Comments
3
Likes
9
Embeds 0
No embeds

No notes for slide

Estadística Unidades Desarrolladas

  1. 1. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 1 UNIDAD I EL PAPEL DE LA ESTADÍSTICA 1.1 INTRODUCCIÓN A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más difícil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales decisiones deben tomarse con mucho menos que un conocimiento adecuado y experimentando una gran incertidumbre. Sin embargo, las soluciones a estos problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia final. Continuamente estamos recibiendo presiones debido a problemas económicos angustiosos como una inflación galopante, el sistema tributario engorroso y oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido económico y social está amenazado por la contaminación ambiental, la deuda publica, la tasa de criminalidad que siempre va en aumento y las impredecibles tasas de interés. Si estas condiciones parecen ser características del estilo de vida actual, no debe olvidarse que problemas de esta naturaleza contribuyeron a la caída de la antigua Roma más que la invasión de las hordas de bárbaros provenientes del norte. Un periodo de éxito en este planeta, relativamente corto, no es garantía de una supervivencia futura. A menos que puedan encontrarse soluciones viables a estos apremiantes problemas, podríamos acompañar en el olvido al dinosaurio y al ave dodo. Como ya lo hicieron los antiguos romanos. Este capítulo aportará una visión general sobre lo que es la estadística y cómo puede utilizarse. Esta visión general sobre la naturaleza de la estadística y los beneficios que puede proporcionarnos se efectuara revisando:
  2. 2. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 2 • Las definiciones básicas de las herramientas estadísticas. • Cómo llevar a cabo el muestreo para realizar análisis estadísticos. • Las funciones que cumple la estadística. • Cómo puede ayudar la estadística en la profesión. 1.2 LA IMPORTANCIA DE LA ESTADÍSTICA Virtualmente cada área de la investigación científica seria puede beneficiarse del análisis estadístico. Para quien formula las políticas económicas y para quien asesora al presidente y a otros funcionarios públicos sobre procedimientos económicos apropiados, la estadística ha demostrado ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los programas sociales, el gasto de defensa y muchos otros asuntos pueden hacerse de manera inteligente tan sólo con la ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su eterna búsqueda de la rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones. Los esfuerzos en control de calidad, minimización de costos, combinación de productos e inventarios, y una gran cantidad de otros asuntos empresariales, pueden manejarse efectivamente a través del uso de procedimientos estadísticos comprobados. Para quienes están en el área de la investigación de mercados, la estadística es de gran ayuda en el momento de determinar qué tan probable es que un producto nuevo sea exitoso. La estadística también es muy útil para evaluar las oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal, y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis estadístico. Incluso un investigador en el campo de la medicina, interesado en la efectividad de un nuevo medicamento, considera la estadística una aliada imprescindible.
  3. 3. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 3 Tales aplicaciones y muchas otras se ilustran a lo largo de esta unidad. Se mostrará cómo utilizar la estadística en el mejoramiento del desempeño laboral y en muchos otros aspectos de la vida diaria. 1.3 LAS FUNCIONES DE LA ESTADÍSTICA En repetidas ocasiones se ha enfatizado la utilidad de la estadística y la amplia variedad de problemas que puede resolver. Para ilustrar de manera más completa esta amplia aplicabilidad, es necesario analizar las diversas funciones de la estadística. La estadística es la ciencia que tiene que ver con la (1) recolección, (2) organización. (3) presentación.. (4) análisis, e (5) interpretación de datos. Aunque en todo estudio estadístico el primer paso es la recolección de datos, es usual en un curso básico de estadística asumir que los datos ya han sido recolectados y que ahora están disponibles. Por consiguiente, el trabajo comienza con el esfuerzo por organizar y presentar estos datos de manera significativa y descriptiva. Los datos deben colocarse en un orden lógico que revele rápida y fácilmente el mensaje que contienen. Este procedimiento constituye el proceso de la estadística descriptiva, tal como se define y se discute en los capítulos siguientes. Luego de que los datos se han organizado y se han presentado para su revisión, el estadístico debe analizarlos e interpretarlos. Estos procedimientos se basan en la estadística inferencial y constituyen un importante beneficio para el análisis estadístico, mediante la ayuda en el proceso de toma de decisiones y solución de problemas. Se descubrirá que a través de la aplicación de procedimientos estadísticos precisos, es posible predecir el futuro con cierto grado de exactitud. Toda empresa que se enfrenta a las presiones competitivas puede beneficiarse considerablemente de la capacidad para anticipar las condiciones del negocio, antes que éstas ocurran. Si una empresa sabe cómo van a estar sus ventas en cierto momento en el futuro cercano, la gerencia puede hacer planes más exactos y efectivos respecto a las operaciones actuales. Si se calcula las ventas futuras con un grado de exactitud confiable, la gerencia puede tomar fácilmente decisiones importantes
  4. 4. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 4 respecto a los niveles de inventario, pedidos de materia prima, contrataciones de empleados y, virtualmente, sobre cada aspecto de las operaciones del negocio en si. 1.4.- BENEFICIOS DE LA ESTADÍSTICA Es factible que en pocos años abandone la relativa seguridad del ambiente académico y esté metido de cabeza en el mundo competitivo. Desde el punto de vista practico, usted debe conocer la manera de utilizar los conocimientos en estadística después de graduarse. No existe duda alguna acerca de que una experiencia académica. adecuadamente relacionada con unos firmes cimientos ampliara significativamente las oportunidades de encontrar empleo y, posteriormente, le permitirá demostrar la competividad laboral. Cuando encuentre ese trabajo anhelado que le ponga en la rápida ruta del éxito profesional, su jefe espera que usted haga dos cosas: 1. Tomar decisiones. 2. Solucionar problemas. Estos dos cometidos pueden lograrse a través de la aplicación de procedimientos estadísticos. 1.4.1 LA APLICACIÓN UNIVERSAL DE LA ESTADÍSTICA Al ser capaz de solucionar problemas y tomar decisiones, se obtendrá una excelente posición en la demanda del mercado laboral. Si logra tomar decisiones incisivas cuando se está solucionando los problemas de alguien, dicha persona estará dispuesta a proporcionarle una recompensa generosa. El mundo laboral paga más a las personas que son capaces de plantear las preguntas correctas para alcanzar los objetivos fundamentales, que a quienes tienen la responsabilidad de resolverlas. Con frecuencia, las respuestas son bastante evidentes una vez que se han planteado las preguntas. El análisis estadístico probará ser de gran utilidad en la acertada formulación de estas preguntas esenciales.
  5. 5. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 5 Los empresarios reconocen que los problemas complejos que enfrenta el mundo actual requieren soluciones cuantitativas. Si usted no está en capacidad de aplicar la estadística y otros métodos cuantitativos a muchos de los problemas comunes que sin duda se le presentarán, estará en gran desventaja en el mercado laboral. Casi todas las áreas del saber requieren del pensamiento estadístico. Las disciplinas de estudio que dependen ampliamente del análisis estadístico, incluyen - pero no se limitan a- markting, finanzas, economía e investigación de operaciones. Los principios aprendidos en contabilidad y gerencia administrativa también se basan en la preparación estadística. Los analistas financieros y económicos con frecuencia se basan en sus habilidades cuantitativas para proporcionar soluciones a problemas difíciles. La comprensión de los principios financieros y económicos permitirá aplicar las técnicas estadísticas para hallar soluciones viables y tomar decisiones. Quienes aspiran a cargos en el área contable o administrativa, a ser independientes, o a desempeñar otra profesión en el sector industrial. Descubrirán que comprender la estadística no sólo mejora las oportunidades de obtener un empleo, sino que también aumenta la probabilidad de promoción mediante el enriquecimiento en el desempeño laboral. Las personas empleadas en tareas cuantitativas que trabajan con procedimientos estadísticos, con frecuencia gozan de salarios más altos y están más protegidos de los trabajos sin futuro. Además, muy al inicio de sus carreras, generalmente se encuentran en contacto cercano con personas en cargos de alto nivel. La proximidad a la élite ejecutiva es inevitable porque la alta gerencia necesita de la información y asistencia que la gente con entrenamiento en estadística puede proporcionarle. En el mercado laboral actual, los empresarios sencillamente no desean contratar o conservar a quienes no saben estadística. Bien sea que las aspiraciones profesionales tiendan hacia la industria privada, el servicio publico, el gobierno, o hacia alguna otra fuente de retribución remunerada, la experiencia
  6. 6. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 6 académica será más completa si se adquiere una sólida formación en fundamentos de análisis estadístico. 1.4.2 GERENCIA DE CALIDAD TOTAL A medida que la competencia mundial se Intensifica, surge, de parte de los negocios, un esfuerzo por promover la calidad de sus productos. Este esfuerzo, conocido ampliamente como Gerencia de Calidad Total (Total Quality Managemem, TQM), tiene como propósito central la promoción de las cualidades del producto que el consumidor considera importantes. Tales atributos van desde la ausencia de defectos hasta el servicio eficiente y la respuesta rápida a las posibles quejas del consumidor. Hoy día. la mayoría de los grandes negocios (así como también muchos negocios pequeños) tienen departamentos de Control de Calidad {Quality Control. QC) cuya función es recolectar datos sobre el desempeño y solucionar problemas de calidad. Así, la TQM representa un área creciente de oportunidades para quienes tienen conocimientos en estadística. La TQM involucra el uso de equipos administrativos integrados conformados por ingenieros, expertos en marketing, especialistas en diseño, estadísticos, y otros profesionales que pueden contribuir a la satisfacción del cliente. La formación de estos equipos, denominada Despliegue de la Función de Calidad (Quality Function Deployment, QFD), está diseñada para reconocer y agenciar las inquietudes de los consumidores. Los especialistas actúan conjuntamente para promover la calidad del producto y para que supla de manera efectiva las necesidades y preferencias del consumidor. Otro método común para mejorar la calidad de un producto es el uso de los círculos de Control de Calidad (Quality Control, QC). Los círculos de control de calidad constan de un grupo pequeño de empleados (generalmente entre 5 y 12) que se reúnen regularmente para solucionar problemas relacionados con el trabajo. Con frecuencia se conforman tanto con trabajadores en línea como con representantes de la gerencia, los miembros de estos círculos QC son todos de la misma área de trabajo y reciben capacitación formal en control
  7. 7. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 7 estadístico de calidad y en planeación de grupos. A través de discusiones abiertas y del análisis estadístico, los círculos QC pueden lograr mejoras significativas en diversas áreas que van desde el mejoramiento de la calidad- el diseño del producto. la productividad y los métodos de producción, hasta la reducción de costos y seguridad. Se estima que más del 90% de las 500 mejores compañías que aparecen en la revista Fortune utilizan de manera efectiva los círculos de control de calidad. Uno de los elementos más importantes del TQM es un conjunto de herramientas y métodos estadísticos utilizados para promover el Control Estadístico de Calidad (Statistical Quality Control, SQC). Tales herramientas ayudan a organizar y analizar datos para efectos de solucionar problemas. Una de estas herramientas es el diagrama de Párelo, denominado así en honor al economista italiano Vilfredo Pareto. Este diagrama identifica los problemas de calidad que se presentan con mayor frecuencia o que han demostrado ser los más costosos. La figura 1.1 muestra un diagrama de Pareto de los defectos que afectan la producción de hornos microondas. comercializados por JC Penney. Figura 1. Diagrama de Pareto 38 35 10 8 5 0 5 10 15 20 25 30 35 40 Dispositivo de descogelación automática Dispositivo de conservación de la temperatura Arranque automático Pulsadores Cocción por fases Defecto PorcentajedeDefectos Fuente: QC, JC Penney,
  8. 8. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 8 Los diagramas de Párelo con frecuencia expresan la regla 80/20: el 80% de lodos lo» problemas se debe al 20% de las causas. Como lo demuestra la figura 1.1. aproximadamente el 75% de todos los problemas es causado por el dispositivo de descongelación automático y por el de conservación de la temperatura del horno. Hablando en términos generales, el SQC esta diseñado para asegurar que los productos cumplan con unas normas y especificaciones mínimas de producción. Este objetivo con frecuencia se promueve a través del uso del muestreo de aceptación, el cual es parte integral del SQC. El muestreo de aceptación implica probar una muestra aleatoria de productos existentes para determinar si se debe aceptar o rechazar todo el envío, o el lote. Esta decisión se basa en parte en un nivel de calidad aceptable (Acceptable Quality Level, AQL), o número máximo de defectos que una empresa está dispuesta a tolerar. En las organizaciones se es cada vez más consciente de la necesidad de mantener la calidad del producto. Si una firma va a competir de manera exitosa, debe tomar todas las precauciones para garantizar que sus productos cumplan con ciertos estándares básicos. Por tanto, no es ninguna exageración insistir en la importancia de la TQM. Los principios inherentes al TQM están aumentando en popularidad; representan la dirección futura del análisis estadístico, aplicada al mundo de los negocios. 1.4.3 NECESIDAD DE LA FORMACIÓN EN ESTADÍSTICA Se podría pensar que el tipo de trabajo a que se aspira no necesitará del análisis estadístico. O quizás podría argumentarse que el personal de estadísticos de la compañía realizará el trabajo estadístico pertinente y que no existe la necesidad de manejar los detalles del análisis estadístico. Este no es el caso. Incluso si los estadísticos profesionales de la organización realizan el trabajo estadístico pertinente, es esencial poseer un cierto nivel de formación en este campo. Para determinar cómo puede ayudar el staff de estadística al desempeño del trabajo
  9. 9. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 9 de los otros, se debe conocer qué es la estadística, qué hacen los estadísticos y cómo lo hacen. Cuando los problemas surgen se debe determinar cómo puede ayudar la estadística. Para lograrlo, es necesario comprender los procedimientos estadísticos, y poder comunicarse con los estadísticos, en un esfuerzo conjunto para diseñar soluciones adecuadas y tomar decisiones óptimas. Una vez se ha adquirido esta familiaridad con el análisis estadístico, se sorprenderá de las infinitas formas en que la estadística puede ayudar en la solución de problemas que surgen con frecuencia en un escenario empresarial. 1.5 ALGUNAS DEFINICIONES BÁSICAS Toda rama de la investigación científica tiene su vocabulario propio y la estadística no es la excepción. Esta sección revisa algunos de los términos comunes utilizados en el análisis estadístico. Las definiciones y expresiones que siguen son esenciales para la comprensión de cómo se realizan las pruebas estadísticas. 1.5.1 ESTADÍSTICA .-Se refiere a las técnicas o métodos de recolección, representación, procesamiento y análisis de un conjunto de datos los cuales ha sido recolectados luego de realizar algunos experimentos, o simplemente considerar algunos aspectos de la vida diaria. 1.5.2 RAMAS DE LA ESTADÍSTICA.- 1.5.2.1 ESTADÍSTICA DESCRIPTIVA.- Consiste en organizar, resumir y simplificar en términos generales información que a menudo resulta bastante compleja. Ej. Promedio de calificaciones, rendimiento medio de un automóvil, etc. 1.5.2.2 TEORÍA DE LA PROBABILIDAD.- Sirve para analizar situaciones en las que intervienen el azar. Ej., lanzamiento de una dado, resultado de un partido de fútbol, elecciones presidenciales, etc.
  10. 10. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 10 1.5.2.3 INFERENCIA ESTADÍSTICA.- Se refiere al análisis e interpretación de una muestra de datos para poder así dar conjeturas sobre un grupo mayor denominado población. 1.5.3 POBLACIONES Y PARÁMETROS.- En todo estudio estadístico, el investigador está interesado en una determinada colección o conjunto de observaciones denominadas población, (o universo). Si los ingresos de los 121 millones de asalariados de los Estados Unidos son de interés para un economista que asesore al Congreso en la formulación del plan nacional tributario, entonces los 121 millones de ingresos constituyen la población. Si se está considerando un plan tributario para los perceptores de ingresos superiores a US $100.000. entonces tales ingresos superiores a US $100,000 constituyen la población. Si el director ejecutivo (ChiefExecutive Officer, CEO) de una gran empresa manufacturera desea estudiar la producción de todas las plantas de propiedad de la firma, entonces la producción de todas estas plantas es la población. Se puede decir también que población es un conjunto de medidas, o el recuento de todos los elementos o individuos que presentan una característica común. Pudiendo ser estos por ejemplo un estudiante, un animal (entidad simple) o un curso, una familia (entidad compleja). La población es la colección completa de todas las observaciones de interés. Un parámetro es toda medida descriptiva de una población. Algunos ejemplos son: el ingreso promedio de todos los asalariados de Estados Unidos, o la producción total de todas las plantas manufactureras. El punto clave para recordar es que un parámetro describe una población.
  11. 11. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 11 Parámetro es una medida descriptiva de la población total de todas las observaciones de interés para el investigador. 1.5.4 MUESTRAS Y ESTADÍSTICOS.- Aunque generalmente los estadísticos se interesan en algún aspecto de toda la población, generalmente descubren que las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Calcular el ingreso promedio de cada uno de los 121 millones de asalariados seria una tarea abrumadora. Por consiguiente. generalmente debe ser suficiente estudiar tan sólo una pequeña porción de dicha población. A esta porción más pequeña y más manejable se le denomina muestra. Una muestra es un subconjunto de la población seleccionado científicamente o ser seleccionados al azar, es decir todos los elementos de la población tienen la misma posibilidad de ser seleccionados ya sea por sorteo, por las tablas de números aleatorios, o cualquier método al azar. Muestra es una parte representativa de la población que se selecciona para ser estudiada ya que la población es demasiado grande como para analizarla en su totalidad. Cada mes el Ministerio de Trabajo de Estados Unidos (U.S. Department of Labor) calcula el ingreso promedio de una muestra de varios miles de asalariados seleccionados entre la población total de 121 millones de trabajadores. El promedio de esta muestra se utiliza luego como una estimación del ingreso promedio para toda la población. Las muestras son necesarias porque estudiar las poblaciones completas resulta muy costoso y consume demasiado tiempo. Un estadístico es una medida descriptiva de una muestra. El ingreso promedio de esos varios miles de trabajadores, calculado por el Ministerio de Trabajo, es un estadístico. El estadístico es a la muestra lo que el parámetro es a la población. El estadístico sirve como
  12. 12. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 12 una estimación del parámetro. Aunque en realidad el interés se fija en el valor del parámetro de la población, con frecuencia debe haber conformidad con sólo calcularlo con un estadístico de la muestra que se ha seleccionado. Estadístico Elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente. 1.5.5 CARACTERÍSTICAS DE UNA POBLACIÓN.- Corresponde a ciertos rasgos, cualidades, propiedades que poseen los individuos de una muestra. Estos pueden ser: Cuantitativos los cuales son mesurables (medibles) se describen numéricamente estos pueden ser continuos o discretos; o Cualitativos (o por Atributos) no medibles se expresan mediante palabras, símbolos (números). 1.5.6 VARIABLE.- Las variables son las características de la muestra o de la población que se esta observando. 1.5.6.1 VARIABLE ALEATORIA- Si una característica es observada sobre una muestra o población y los individuos observados son elegidos al azar entonces este carácter se denomina variable aleatoria.(v.a) Una v.a puede ser cuantitativa ( da como referente cantidades) o cualitativa (da como referentes atributos). También las variables aleatorias cuantitativas se pueden dividir en continuas y discretas. Una variable continua es aquella que puede tomar cualquier valor dentro de un rango dado. No importa que tan cerca puedan estar dos observaciones, si el instrumento de medida es lo suficientemente preciso, puede hallarse una tercera observación que se encuentre entre las dos primeras. Una variable continua generalmente resulta de la medición.
  13. 13. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 13 Los datos que se obtienen acerca de estas variables reciben el nombre de datos continuos. Ejemplo altura, peso, velocidad, espesor, etc. Las variable discretas pueden asumir solo ciertos valores, por lo general enteros. Nunca serán fraccionarios. Los datos que se obtienen se denominan datos discretos. Estos surgen al contar el número de conceptos y objetos que poseen ciertas características. Ejemplo Cantidad de alumnos en un salón de clase, número de accidentes de trabajo , las casa de un barrio, etc. Las variables cualitativas (atributos) son de dos clases la nominales y de orden (jerarquía) Las v.a nominales comprenden categorías Ejemplo sexo (femenino, masculino), color de ojos (negro, café, azul). No son numéricos pero pueden asignarse valores para cada categoría. Los datos nominales se obtienen cuando se definen las categorías y se cuentan el número de observaciones que queda en cada una. Las v.a de orden son cuando los conceptos se jerarquizan según la preferencia o logro. Los datos de orden o jerarquizados constan de valores relativos asignados para denotar orden. Ejemplo: primero, segundo; mayor, menor, aceptable no aceptable, más caro, mas feo, muy alto, muy bajo, etc.                                    automovil. undevalorDAS.JERARQUIZAOORDEN ojosdepiel,decolorsexo,NOMINALES. ASCUALITATIV colegiounde cursoshijos,de#DISCRETAS. estaturapeso,CONTINUAS. VASCUANTITATI STICAS)(CARACTERIVARIABLESPOBLACION (1) En una misma población se pueden obtener varios tipos de datos esto depende del objetivo del estudio que se realice. Daremos entonces una tabla en la cual se pueden ver los diferentes tipos de datos desde una misma población
  14. 14. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 14 TIPO DE DATOS CONTINUOS DISCRETOS NOMINALES JERARQUIZADOS Clase de tercer grado Edad, peso Nº en el grupo Niños / Niñas 3º grado Automóviles Kph. Kpg Nº de defectos/auto colores Más sucio Ventas de bienes raíces Valores en USD. Nº de ofertas sobrevaluado Más caro 1.6 LA IMPORTANCIA DEL MUESTREO Gran parte del trabajo de un estadístico se realiza con muestras. Las muestras son necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser estudiadas en su totalidad. Es muy costoso y demanda mucho tiempo examinar la población total por tanto, debe seleccionarse una muestra de la población, calcular el estadístico de la muestra, y utilizarlo para estimar el parámetro correspondiente de la población. Este análisis sobre las muestras implica una distinción entre las dos principales ramas del análisis estadístico: (1) la estadística descriptiva y (2) la estadística inferencial, como ya se dijo la estadística descriptiva es el proceso de recolectar, agrupar y presentar datos de una manera tal que describa fácil y rápidamente dichos datos mientras que la estadística inferencial involucra la utilización de una muestra para sacar alguna inferencia o conclusión sobre la población de la cual hace parte la muestra. Cuando el Ministerio de Trabajo utiliza el ingreso promedio de una muestra de varios miles de trabajadores para calcular el ingreso promedio de los 121 millones de trabajadores, está utilizando una forma simple de estadística inferencial. La exactitud de toda estimación es de enorme importancia. Esta exactitud depende en gran parte de la forma como se tomó la muestra, y del cuidado que se tenga para garantizar que la muestra proporcione una imagen confiable de la población. Sin embargo, con mucha frecuencia se comprueba que la muestra no es del todo representativa de la población y resultará un error de muestreo. El error de muestreo es la diferencia entre el estadístico de
  15. 15. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 15 la muestra utilizada para calcular el parámetro de la población y el valor real pero desconocido del parámetro. Error de muestreo Es la diferencia entre el parámetro desconocido de la población y el estadístico de la muestra utilizado para calcular el parámetro. Existen dos causas posibles del error de muestreo. La primera fuente del error de muestreo es el azar en el proceso de muestreo. Debido al factor azar en la selección de elementos de la muestra, es posible seleccionar sin darse cuenta, elementos atípicos que no representan la población. Por ejemplo, en el esfuerzo por estimar la media poblacional es factible que se seleccionen elementos en la muestra que sean anormalmente grandes, produciendo así una sobreestimación de la media poblacional. Por otro lado, el azar puede producir un gran número de elementos de muestra que sean inusualmente pequeños, produciendo una subestimación del parámetro. En cualquiera de los dos casos, ha ocurrido un error de muestreo. Una forma más, seria de error de muestreo es el sesgo muestral. El sesgo muestral ocurre cuando hay alguna tendencia a seleccionar determinados elementos de muestra en lugar de otros. Si el proceso de muestreo se diseña de manera incorrecta y tiende a promover la selección de demasiadas unidades con una característica en especial, a expensas de las unidades que no tienen dicha característica, se dice que la muestra está sesgada. Por ejemplo, el proceso de muestreo puede favorecer de manera inherente la selección de hombres excluyendo a las mujeres, o de personas casadas excluyendo a las solteras. Sesgo muestral Es la tendencia a favorecer la selección de ciertos elementos de muestra en lugar de otros.
  16. 16. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 16 ACTIVIDADES RECOMENDADAS 1.- Describa en sus propias palabras cómo puede utilizarse la estadística para solucionar problemas en varias disciplinas y ocupaciones. 2.- ¿De qué forma utilizará los servicios del estadístico profesional en su organización una vez que usted encuentre empleo? ¿Por qué es poco probable escaparse de la necesidad de tener un conocimiento básico en estadística? 3.- Describa en sus propios términos la diferencia entre una población y una muestra; entre un parámetro y un estadístico. 4.- ¿Cuál es la diferencia entre una variable cuantitativa y una variable cualitativa? Dé ejemplos. 5.- Diferencie entre una variable continua y una variable discreta. Dé ejemplos de cada una. 6.- Un informe reciente en la revista Fortune reveló que los japoneses pronto controlarán hasta un 35% de las ventas de autos en los Estados Unidos; comparado con el 28% de finales de los años 80 está apenas un 8% por encima de lo ocurrido en 1970. ¿Esta información contiene estadística descriptiva, inferencial, o ambas? Explique. 7.- Cuál es la diferencia entre la estadística descriptiva y la estadística inferencial? ¿Cuál cree usted que constituye una forma más elevada de análisis estadístico y por qué? AUTOEVALUACION 1.- ¿En qué usos o funciones se puede aplicar la estadística? ¿Cómo cree usted que pueda utilizarse para solucionar problemas comerciales y administrativos en el mundo real? Dé ejemplos de problemas específicos que puedan surgir y explique cómo podría utilizarse la estadística para desarrollar soluciones y respuestas. 2.- Si los estadísticos están interesados realmente en poblaciones, ¿por qué generalmente trabajan con muestras? 3.- Indique lo siguiente en términos de datos:
  17. 17. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 17 a) 17 gramos b) 3 correctas, 7 incorrectas c) más lento d) 25 segundos e) 3 casas f) kilómetros por hora g) tallas de camisas h) el mas encantador i) helados de vainilla 4.- Analice si las siguientes variables son discretas o continuas: a. Número de carreras que oferta su facultad. b. Número de pases atrapados por el beisbolista Tim Brown, receptor de los LA Raiders. c. Peso de los integrantes del equipo de fútbol nacional d. Peso del contenido de las cajas de cereal que se producen en una determinada empresa e. Número de libros que usted leyó el año pasado. 5.- Seleccione una población cualquiera que sea de su interés. Identifique variables cuantitativas (discretas – continuas) y cualitativas (nominales – de orden) de esa población que puedan seleccionarse para ser estudiadas. 6.- Defina el error de muestreo y explique qué lo causa.
  18. 18. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 18 UNIDAD II DESCRIPCIÓN DE LOS CONJUNTOS DE DATOS 2.1 INTRODUCCIÓN Casi todos los trabajos que se hacen en estadística comienzan con el proceso de recolección de datos necesarios para formar con ellos un conjunto que se utilizara en el estudio. Para propósitos generales, se adoptará la suposición conveniente de que esta labor, con frecuencia tediosa, ya ha sido realizada y que los datos están disponibles. Esta recolección de datos originales revela muy poco por si sola. Es extremadamente difícil determinar el verdadero significado de un grupo de números que simplemente se han registrado en un papel. Nuestra labor es organizar y describir tales datos de manera concisa y significativa. Para determinar su significancia, los datos se organizan de manera que, con un simple vistazo, se pueda tener una idea de lo que pueden decirnos. Entre las herramientas estadísticas que resultan de particular utilidad para organizar los datos se incluyen; • Tablas de frecuencia que colocan todos los datos en clases específicas. • Diversos gráficos que pueden proporcionar una representación visual de los datos. • Tablas de contingencia y diagramas de "tallo y hoja", los cuales también permiten la presentación de un conjunto grande de datos de manera concisa y discernible. 2.2 MÉTODOS DE AGRUPACIÓN DE DATOS Los métodos principales para organizar datos estadísticos comprenden el ordenamiento de elementos en subconjuntos que presenten cualidades semejantes (por ejemplo, misma edad,
  19. 19. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 19 misma finalidad, misma escuela, misma ciudad, etc.) Los datos agrupados se pueden resumir gráficamente, o en tablas, y mediante el uso de medidas numéricas, como la media, la amplitud o rango , la desviación estándar, y otras más. El nombre que reciben los datos ordenados en grupos o categorías es el de distribución de frecuencia. 22..33 DISTRIBUCIÓN DE FRECUENCIAS Como estadístico residente de Pigs and People (P&P) Airlines, el director de la división de análisis estadístico le pide recolectar y agrupar los datos sobre el número de pasajeros que han decidido viajar con P&P. Tales datos correspondientes a los últimos 50 días aparecen en la tabla 2.1. Sin embargo, con estos datos en bruto, es improbable que el director pueda obtener información útil y significativa respecto a las operaciones de vuelo. Los datos no están organizados y es difícil llegar a una conclusión significativa simplemente revisando una serie de números anotados en un papel. Es preciso agrupar y presentar los datos de manera concisa y reveladora para facilitar el acceso a la información que contienen. Primero se analizará cómo puede utilizarse una distribución de frecuencia para organizar el conjunto de datos. Tabla 2.1 Datos brutos sobre el numero de pasajeros de P&P Airlines 68 71 77 83 79 72 74 57 67 69 50 60 70 66 76 70 84 59 75 94 65 72 85 79 71 83 84 74 82 97 77 73 78 93 95 80 81 79 90 83 80 84 91 101 86 93 92 102 80 69 Una distribución de frecuencia es un método de clasificación de datos en clases o intervalos, de manera tal que se pueda establecer con facilidad el números o porcentaje (es decir la frecuencia) de cada clase. Esto proporciona una forma de observar un conjunto de
  20. 20. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 20 números sin que se tenga que considerar cada número, y pueda ser extremadamente útil al manejar grandes cantidades de datos. El número o porcentaje en una clase se denomina frecuencia de clase. Una distribución de frecuencia es un agrupamiento de datos en clases, que muestra el número o porcentaje de observaciones de cada una de ellas. Una distribución de frecuencia se puede presentar en forma tabular y gráfica. También se las conoce como Serie estadística de frecuencias o de intervalos El procedimiento para elaborar realmente una distribución de frecuencias para un conjunto de datos dado, depende del tipo de datos particulares (esto es, continuos, discretos, nominales, de orden o jerarquizados). Consideraremos primeramente el caso de que los datos de estudio sean de tipo continuo. 2.4 ORDENACIÓN DE DATOS EN TABLAS DE FRECUENCIA 2.4.1 ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CUANTITATIVOS (CONTINUOS – DISCRETOS) Una vez que se han recolectado los datos de una determinada variable, el paso siguiente para la ordenación de los mismos es la elaboración de una distribución de frecuencia conocida también como SSEERRIIEE EESSTTAADDÍÍSSTTIICCAA DDEE IINNTTEERRVVAALLOOSS oo SSEERRIIEE EESSTTAADDÍÍSSTTIICCAA DDEE FFRREECCUUEENNCCIIAASS,, ddeeppeennddiieennddoo ddeell ttiippoo ddee ddaattooss qquuee ssee hhaann oobbtteenniiddoo.. Los pasos principales en la elaboración de una distribución de frecuencias para datos muéstrales cuantitativos se enumeran a continuación: 1.- Obtener el rango de los datos (amplitud de variación a) a = X mayor – X menor Siendo: a = Amplitud
  21. 21. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 21 X mayor = valor mayor X menor = valor menor La amplitud de variación, recorrido o rango se define entonces como la diferencia que se establece entre el valor mayor y el valor menor de la variable. 2.- Hallar el número de clases o intervalos , k ( se sugiere usar la regla de que le número de clases se puede tomar como la raíz cuadrada del número de observaciones de estudio (n) es decir, nk  . NOTA: Es conveniente utilizar un número de intervalos no menor a 5 ni mayor a 15. Si el número de intervalos es menor a 5 , las frecuencias estarían muy concentradas, con lo cual no se permite un análisis mas real de los datos. Así mismos, si es mayor a 15 las frecuencias estarían muy dispersas, dificultando la elaboración de la tabla, su representación gráfica y sus cálculos matemáticos. 3.- Calcular la amplitud de clase (diámetro del intervalo, o tamaño del intervalo, ancho de intervalo); se obtiene dividiendo el rango para el número de clases (a/k) redondeado a un número conveniente. Una alternativa para conseguir el numero de clases o intervalos es dividiendo el rango o amplitud para el ancho del intervalo y sumando 1 (a/k+1). Y por ultimo también se puede tomar este valor de acuerdo al criterio personal. 4.- Determinar los límites de clase preliminares. Revisarlos de manera que los datos se toquen pero que no se superpongan. 5.- Enumerar los intervalos y efectuar un conteo por marcas de datos según sus clase. (se debe comprobar que el total de marcas sea igual a n) 6.- Elaborar una tabla o un grafico de frecuencias (histograma)
  22. 22. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 22 Nota.- En algunas tablas de distribución de frecuencias se suele hallar la marca de clase que es el promedio de los valores de los limites inferir y superior de cada clase. EJEMPLO: ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS CON LOS DATOS DE LA TABLA 2.1 1.- RANGO O AMPLITUD DE VARIACIÓN DE LA VARIABLE Desde los datos de la tabla 2.1 se puede apreciar que el numero más alto es 102 y el mas bajo 50. La diferencia entre estos dos valores es 52 (a = 102 - 50 = 52). Este valor representa la amplitud de variación o rango de la variable. 2.- NÚMEROS DE CLASE O INTERVALOS DE CLASE ( DEPENDE DEL TIPO DE DATOS) Como 707750k50n  , entonces el total de los datos se ordenaran en 7 clases. 3.-AMPLITUD DE CLASES Se divide la amplitud de variación para el numero de clases así: a.c = 7427752  ,/ o a.c = 814271 7 52  , 4.- LIMITES DE CLASE primera clase: limite inferior: 50 limite superior: 50 + 7 = 57 (lim inf+a.c)(50 a <57) segunda clase: limite inferior: 57 limite superior 57 + 7 = 64 (57 a < 64) tercera clase: limite inferior: 64 limite superior 64 + 7 = 71 (64 a < 71) cuarta clase : limite inferior: 71 limite superior 71 + 7 = 78 (71 a < 78 ) quinta clase: limite inferior: 78 limite superior 78 + 7 = 85 (78 a < 85) sexta clase: limite inferior: 85 limite superior 85 + 7 = 92 (85 a < 92) séptima clase: limite inferior: 92 limite superior 92 + 7 = 99 (92 a < 99) octava clase: limite inferior: 99 limite superior 99 + 7 = 106 (99 a < 106)
  23. 23. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 23 Una vez que se han establecido las clases, a cada dato se colocará en la clase adecuada mediante un conteo por marcas de la siguiente manera Tabla 2.2.- DISTRIBUCIÓN DE FRECUENCIA EN FORMA TABULAR DE LA VARIABLE: Número de pasajeros que viajan en P&P durante 50 días ÍNDICE CLASES MARCAS CONTEO ( FRECUENCIA) 1 50 a <57 [50 – 57) I 1 2 57 a < 64 III 3 3 64 a < 71 IIIII III 8 4 71 a < 78 IIIII IIIII I 11 5 78 a < 85 IIIII IIIII IIIII 15 6 85 a < 92 IIII 4 7 92 a < 99 IIIII I 6 8 99 a < 106 I1 2 total 50 Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa y la frecuencia porcentual (Porcentaje). Tabla 2.3.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS, RELATIVAS) DE LA VARIABLE: Número de pasajeros que viajan en P&P durante 50 días CLASES (pasajeros) f (Días) fr (f/n) f % (f*100) Fa Fra Fa% 50 a <57 1 0,02 2 % 1 0,02 2% 57 a < 64 3 0,06 6% 1+3 = 4 0,02 + 0,06 = 0,08 8% 64 a < 71 8 0,16 16% 4+8 = 12 0,08 + 0,16 = 0,24 24% 71 a < 78 11 0,22 22% 12+11 = 23 0,24 + 0,22 = 0,46 46% 78 a < 85 15 0,30 30% 23+15 = 38 0,46 + 0,30 = 0,76 76% 85 a < 92 4 0,08 8% 38+4 = 42 0,76 + 0,08 = 0,84 84% 92 a < 99 6 0,12 12% 42+6 = 48 0,84 + 0,12 = 0,96 86% 99 a < 106 2 0,04 4% 48+2 = 50 0,96 + 0,04 = 1 100%  N = 50 1 100%
  24. 24. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 24 Donde: Frecuencia absoluta: f (conteo de datos) Frecuencia Relativa: fr (Frecuencia / # total de casos) Es decir: n f fr  Frecuencia Porcentual: f% Es el porcentaje de la frecuencia absoluta. Es decir 100 n f 100frf **%  De igual manera se pueden obtener las diferentes frecuencias acumuladas. Frecuencia acumulada: Fa (F) ( conteo y suma de datos) Frecuencia Acumulada Relativa : Far (Frecuencia acumulada / # total de casos) Es decir: n Fa Far  Frecuencia Acumulada Porcentual: Fa% Es el porcentaje de la frecuencia acumulada Es decir 100 n Fa 100FarFa **%  Luego de construir la tabla es importante la interpretación que se la de . Por ejemplo para la frecuencia absoluta se puede decir que: Un día han viajado entre 50 y 56 pasajeros que corresponde al 2 por ciento, también que 15 de los 50 días han viajado entre 78 y 84 (78 a < 85) que corresponde al 30 % del tiempo en observación . Mientras que para la frecuencia acumulada: Hubo 23 días en los cuales menos de 78 pasajeros volaron en la mencionada compañía. Con un equivalente del 46% del tiempo estimado para la investigación. EJEMPLO.- FORMA ALTERNATIVA PARA CONSTRUIR LA DISTRIBUCIÓN DE FRECUENCIA Se realizo una encuesta a ciertos estudiantes y al ser preguntados por su estatura, dieron los siguientes datos en cm.
  25. 25. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 25 Tabla 2.4 .- Estatura de los estudiantes de primer semestre de la escuela de Ingenieria de la ESPOCH. 149 147 165 160 161 164 168 169 170 159 158 164 162 170 160 157 149 162 165 171 168 167 151 152 154 149 153 153 154 162 169 168 167 164 168 167 168 161 150 163 167 167 165 166 169 1.- AMPLITUD DE VARIACIÓN: a = 171 – 147 = 24 2.- NÚMERO DE INTERVALOS: a diferencia del ejemplo anterior aquí no se calcula la amplitud de la clase si no que se asigna una cantidad usando el criterio del estadístico en este caso he ha tomado como a.c = 3 y luego se saca el numero de clases o intervalos dividiendo la amplitud de variación o rango para el ancho del intervalo que se eligió arbitrariamente. Así: 9181 3 24 k  3.- LIMITES DE CLASE primera clase: limite inferior: 145 limite superior: 145 + 3 = 148 o 145 a < 148 ( 147) segunda clase: limite inferior: 148 limite superior 151 (o 150) tercera clase: limite inferior: 151 limite superior 154 (o 153) cuarta clase : limite inferior: 154 limite superior 157 (o 156) quinta clase: limite inferior: 157 limite superior 160 (o 159) sexta clase: limite inferior: 160 limite superior 163 (o 162) séptima clase: limite inferior: 163 limite superior 166 (o 165) octava clase: limite inferior: 166 limite superior 169 (o 168) novena clase: limite inferior: 169 limite superior 172 (o 171)
  26. 26. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 26 4.- MARCA DE CLASE La marca de clase se calcula para cada una de las clases o intervalos así sacando la suma de los límites de clases y dividiendo para dos . 2 supliminf XmMc   lim Para completar la tabla anterior se debe sacar la frecuencia acumulada , frecuencia relativa, la frecuencia porcentual (Porcentaje)y la marca de clase . Tabla 2.5.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, ACUMULADAS, RELATIVAS) DE LA VARIABLE: Estatura de los estudiantes de primer semestre de la escuela de Ingenieria de la ESPOCH. CLASES X Mc Xm f (Días) fr (f/n) f % (f*100) Fa Fra Fa% 145 – 147 146 1 0.02 2 1 0.022 2.22 148 – 150 149 4 0.09 9 5 0,114 11.11 151 -153 152 4 0.09 9 9 0,20 20.00 154 -156 155 2 0.04 4 11 0,244 24.44 157 -159 158 3 0.07 7 14 0,31 31.11 160 - 162 161 7 0.16 16 21 0,4667 46.67 163 - 165 164 7 0.16 16 28 0,6222 62.22 166 - 168 167 11 0.24 24 39 0,8667 86.67 169 - 171 170 6 0.13 13 45 1 100.00 45 1 100
  27. 27. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 27 2.4.2 ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CUALITATIVOS (NOMINALES Y DE ORDEN O JERARQUIZADOS) Quizá las distribuciones de frecuencias más fáciles sean las que se utilizan para datos nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen de manifiesto con más facilidad, de modo que los cálculos son mínimos. Por ejemplo, considerar los datos nominales de la tabla 2.3, que representan las ventas de gaseosas, ordenados en una tabla de frecuencia. Las categorías son los diversos sabores de las gaseosas. Obsérvese la última categoría. Varios. Puede haber algunos sabores que se vendan poco, como: fresa, tamarindo y toronja, los cuales se agruparán en una sola categoría para simplificar la comprensión de los datos. Tabla 2.6 DATOS DE LA VENTA DE GASEOSAS EN UN DÍA SABOR VENTAS Cola (negra) 600 Limón 200 Naranja 100 Uva 50 Fresa 40 Otros 10 Total 1000 Con la información de la tabla 2.6 se puede determinar la frecuencia absoluta como las ventas reales que se tuvo durante ese día, para luego proceder a determinar las frecuencias acumulada, relativa y porcentual de la misma manera que para los datos cuantitativos
  28. 28. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 28 Tabla 2.7.- DISTRIBUCIÓN DE FRECUENCIAS (ABSOLUTAS, RELATIVAS Y PORCENTUALES) DE LA VARIABLE : Venta de gaseosas en un día CLASES Categorías X F (ventas reales) fr (f/n) f % (f*100) Cola negra 600 0.6 60 % Limón 200 0.2 20% Naranja 100 0.1 10% Uva 50 0..5 5% Fresa 40 0.04 4% Otros 10 0.01 1% Total 1000 1 100% La presentación de datos jerarquizados es bastante semejante. Considérense los datos del promedio de calificaciones que se presentan a continuación en un formato un tanto diferente al de las tablas de frecuencias anteriores, sólo para demostrar otra forma de elaborarlas Tabla 2.8- DISTRIBUCIÓN DE FRECUENCIAS ABSOLUTAS Y PORCENTUALES DE LA VARIABLE: Calificaciones de un curso en la asignatura de Matemática. CALIFICACIONES DEL CURSO MALA REGULAR BUENA MUY BUENA EXCELENTE TOTALES NUMERO 2 4 20 10 4 40 PORCENTAJE 5% 10% 50% 25% 10% 100% 2.5 GRÁFICOS ESTADÍSTICOS 2.5.1.- GRÁFICOS PARA DATOS CUANTITATIVOS CONTINUOS. A menudo se dice que “una imagen vale más que mil palabras.” De hecho, los estadísticos han empleado las técnicas gráficas para describir de manera mas vivida series de datos. En particular, los histogramas y los polígonos se usan para describir datos numéricos que han sido agrupados en distribuciones de frecuencia, de frecuencia relativa o de porcentaje.
  29. 29. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 29 2.5.1.1.- HISTOGRAMAS DE FRECUENCIAS.- Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los límites de cada clase. Al graficar histogramas, la variable aleatoria o fenómeno de interés se despliega a lo largo del eje horizontal; el eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase, dependiendo de ,si el histograma particular es, respectivamente, un histograma de frecuencia, un histograma de frecuencia relativa o un histograma de porcentaje. Un histograma de frecuencia se describe a continuación con los datos de la tabla 2.5 que reflejan las estaturas de los estudiantes de primer semestre de la escuela de Ingeniería de la ESPOCH. En el eje horizontal están las marcas de clase y en el vertical las frecuencias absolutas. Figura 2.1 . Histograma de Frecuencia Absoluta ESTATURA 171168165162159156153150147 FRECUENCIAABSOLUTA 12 10 8 6 4 2 0 6 11 77 3 2 44 1 Fuente: Datos tomados de la tabla 2.5 Se puede también graficar histogramas de frecuencias tanto para la frecuencia relativa como para la frecuencia porcentual.
  30. 30. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 30 2.5.1.2.- POLÍGONOS DE FRECUENCIAS ABSOLUTAS Al igual que con los histogramas, al graficar polígonos el fenómeno de interés se despliega a lo largo del eje horizontal y el eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase. El polígono de porcentaje se forma permitiendo que el punto medio o marca de clase represente los datos de esa clase en el eje horizontal y luego conectando la sucesión de puntos medios con sus respectivos valores ya sea de las frecuencias o de los porcentajes de clase en el eje vertical. Debido a que los puntos medios consecutivos son conectados por una serie de líneas rectas, el polígono algunas veces está dentado en apariencia. Sin embargo, al tratar con una serie de datos muy grande, si tuviéramos que crear los límites de las clases en su distribución de frecuencia más juntos (incrementando así el numero clases en esa distribución), las líneas dentadas del polígono se "suavizarían". Figura 2.2. Polígono de Frecuencia Absoluta. 0 2 4 6 8 10 12 146 149 152 155 158 161 164 167 170 ESTATURAS ( MEDIAS) FRECUENCIASABSOLUTAS Fuente: Datos tomados de la tabla 2.5
  31. 31. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 31 2.5.1.3.- POLÍGONOS DE FRECUENCIAS ACUMULADAS La variación de este polígono con relación al de las frecuencias absolutas es que en el eje vertical se ubican las frecuencias acumuladas ya sean absolutas, relativas o porcentual generando un grafico estadístico conocido con el nombre de OJIVA o POLÍGONO DE FRECUENCIA ACUMULADA . Figura 2.3 . Polígono de frecuencia acumulada.( datos tabla 2.5) 0 5 10 15 20 25 30 35 40 45 50 146 149 152 155 158 161 164 167 170 ESTATURA FRECUENCIAACUMULADA Fuente: Datos tomados de la tabla 2.5 Al igual que los histogramas los polígonos se pueden construir con las frecuencias absolutas y acumuladas tanto relativas como porcentuales. 2.5.2.- GRÁFICOS PARA DATOS CUANTITATIVOS DISCRETOS Y CUALITATIVOS NOMINALES Y DE ORDEN. 2.5.2.1 DIAGRAMAS DE BARRAS.- Un diagrama de barras es parecido a un histograma, este puede mostrar cantidades o porcentajes para una , dos o mas valores sobre el eje vertical. En los diagramas de barras, cada clase o categoría se describe mediante una barra cuya longitud representa la frecuencia o porcentaje de observaciones que caen en una categoría.
  32. 32. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 32 Para construir un diagrama de barras se hacen las siguientes sugerencias: a) Todas las barras deben tener el mismo ancho, solo el largo diferirá dependiendo de la frecuencia que presente cada categoría o clase b) Las barras pueden ser horizontales o verticales. c) Los espacios entre las barras deben variar entre la mitad del ancho de una barra hasta el ancho de una barra d) Las escalas y guías son auxiliares útiles en la lectura de una gráfica y deben incluirse. El punto cero debe indicarse e) Los ejes de la grafica deben etiquetarse claramente EJEMPLO.- Mediante una encuesta se logro recabar los siguientes datos sobre el tipo de colegio en el que obtuvieron su título de bachiller 272 estudiantes de la Universidad, y con ellos se elaboro una distribución de frecuencia tabular la cual se detalla a continuación. Tabla 2.9.- TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA LA VARIABLE Tipo de colegio en el que obtuvieron su título de bachiller 272 estudiantes de la Universidad. TIPO DE COLEGIO f fr fr% Particular 44 0,162 16,2 Fiscal 206 0,757 75,7 Fiscomisional 22 0,081 8,1 Total 272 100,0 100,0 Figura 2.4. Diagrama de barras de los datos de la tabla 2.9
  33. 33. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 33 TIPO DE COLEGIO fiscomisionalfiscalparticular FRECUENCIAABSOLUTA 300 200 100 0 22 206 44 Fuente: Datos tomados de la tabla 2.9 2.5.2.2 DIAGRAMA DE BARRAS COMPUESTAS Mediante este diagrama se puede representar dos series de datos y así efectuar comparaciones. EJEMPLO.- Representar en un diagrama de barras compuestas los resultados definitivos de la segunda vuelta electoral realizada el 6 de mayo de 1984. Correspondiente a la Costa, para el Ing. León Fébres Cordero y para el Dr. Rodrigo Borja. Tabla 2.10.- RESULTADOS DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL REALIZADA EL 6 DE MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING. LEÓN FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA. provincias Ing. León Fébres Cordero Dr. Rodrigo Borja Guayas Manabí Los Ríos El Oro Esmeraldas 493581 129622 68309 48771 28180 232410 104730 56321 70963 39262
  34. 34. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 34 Para obtener el diagrama de barras compuestas utilizamos el siguiente procedimiento: Primero sumamos las votaciones de los dos candidatos para cada una de las provincias. Tabla 2.11 DISTRIBUCIÓN DE FRECUENCIA PARA RESULTADOS DEFINITIVOS DE LA SEGUNDA VUELTA ELECTORAL REALIZADA EL 6 DE MAYO DE 1984. CORRESPONDIENTE A LA COSTA, PARA EL ING. LEÓN FEBRES CORDERO Y PARA EL DR. RODRIGO BORJA. Provincias Ing. León Febres Cordero Dr. Rodrigo Borja TOTAL Guayas Manabí Los Ríos El Oro Esmeraldas 493581 129622 68309 48771 28180 232410 104730 56321 70963 39262 725991 234352 124630 119734 67442 Luego utilizamos el primer cuadrante del sistema de coordenadas, para representar las provincias en el eje horizontal y las frecuencias en el eje vertical. Representamos en cada una de las barras el total de la votación de los dos candidatos para cada provincia. Ubicamos en cada una de las barras la frecuencia de cada candidato identificándolo con la leyenda correspondiente. Entonces el grafico queda así: Figura 2.5 . Diagrama de Barras compuestas para los datos de la tabla 2.11. 0 200000 400000 600000 800000 Guayas Manabí Los Rios El Oro Esmeraldas Ing. León Febres Cordero Dr. Rodrigo Borja
  35. 35. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 35 Fuente: Tribunal Supremo Electoral Boletín oficial de los escrutinios de las votaciones del 6 Mayo de 1984. 2.5.2.3 DIAGRAMA PASTEL O DE SECTORES Para construir una gráfica de pastel o diagrama pastel cuando no se dispone de software apropiado se usa compás y transportador ( graduador) el primero para dibujar el círculo y el segundo para la medir los sectores del pastel apropiados. Puesto que el circulo tiene 360º el transportador puede usarse para dividir el pastel basándose en “rebanadas” de porcentaje deseadas. Los grados que le corresponde a cada clase o “rebanada” se los obtiene realizando una regla de tres simple y se la ubica en la tabla de distribución de frecuencia que se elaborara para el efecto de la misma manera que para los diagramas de barras. Tabla 2.12 TABLA DE DISTRIBUCIÓN DE FRECUENCIA PARA LA VARIABLE: Tipo de colegio en el que obtuvieron su título de bachiller 272 estudiantes de la Politécnica. TIPO DE COLEGIO F fr % º Particular 44 0,162 16 59º Fiscal 206 0,757 76 272º Fiscomisional 22 0,081 8 29º Total 272 100,0 100,0 360º Figura 2.6. Diagrama Pastel de los datos de la tabla 2.10
  36. 36. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 36 TIPO DE COLEGIO 22 / 8% 206 / 76% 44 / 16% fiscomisional fiscal particular Fuente: Datos tomados de la tabla 2.12. 2.5.2.4 DIAGRAMA DE PARETO El diagrama de Pareto es un tipo especial de gráfica de barras verticales en la que las respuestas categorizadas se grafican en el orden de rango descendiente de sus frecuencias y se combinan con un polígono acumulativo en la misma escala. El principio básico detrás de este dispositivo gráfico es su capacidad de distinguir los “pocos vitales” de los “muchos triviales”, permitiéndonos enfocar las respuestas importantes. Así pues, el diagrama logra su mayor utilidad cuando la variable categórica de interés contiene muchas categorías. El diagrama de Pareto se usa ampliamente en el control estadístico de procesos y calidad de productos Al construir el diagrama de Pareto, el eje vertical contiene los porcentajes (de 100 en el extremo superior a 0 en el extremo inferior) y el eje horizontal contiene las categorías de interés. Las barras igualmente espaciadas también deben ser de igual ancho y, para un impacto visual, sugerimos que las barras sean del mismo color. El punto del polígono de porcentaje acumulativo para cada categoría se centra en el punto medio de cada barra respectiva. Por tanto, al estudiar un Diagrama Pareto, debemos concentrarnos en dos cosas,
  37. 37. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 37 las magnitudes de las diferencias en las longitudes de las barras correspondientes a las categorías descendientes adyacentes y los porcentajes acumulativos de estas categorías. Figura 2.7. Diagrama Pareto de los datos de la tabla 2.10 TIPO DE COLEGIO fiscomisionalparticularfiscal FRECUENCIAS 300 200 100 0 PORCENTAJES 100 75 50 25 022 44 206 Fuente: Datos tomados de la tabla 2.12 2.5.2.5 CARTOGRAMA Consiste en un mapa sobre el cual se destacan diferentes motivo, sea rayando coloreando o utilizando diversas figuras o signos convencionales que estén en relación con el hecho o fenómeno que se quiere resaltar. Por ejemplo El cartograma de América de Sur en el cual se hallan localizados los diferentes países que lo forman.
  38. 38. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 38 2.5.2.6 PICTOGRAMA Es un recurso que se utiliza para efectuar la representación de los fenómenos investigados mediante signos o figuras que atraigan la atención; por lo cual es el gráfico que se utiliza con gran ventaja en situaciones publicitarias, antes que en representaciones estadísticas, en las que también existe inconveniente de no poder representar la fracción. EJEMPLO.- Vamos a representar la población de seis provincias del Ecuador según datos estimados por el INEC. Tabla 13.- Datos del número de habitantes de seis provincias del Ecuador según los datos proporcionados por el INEC. PROVINCIAS MAS DENSAMENTE POBLADAS DEL ECUADOR GUAYAS PICHINCHA MANABÍ LOS RÍOS AZUAY LOJA 2038703 1330076 1025858 516840 438760 410509 Gráficamente de los puede representar de la siguiente manera:
  39. 39. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 39 Figura 2.8. Pictograma de los datos de la tabla 2.13 Guayas Pichincha Manabí Los Ríos Azuay Loja Donde: = 100 000 habitantes = 25 000 a 38 000 habitantes. Fuente: INEC 2000. ACTIVIDADES RECOMENDADAS 1.- Un conjunto tiene 100 observaciones; la más grande es 315 y la más pequeña es 56. a) ¿Cuántas clases debería tener la tabla de frecuencia?. ¿Por qué? b) ¿ Cual es la amplitud del intervalo ? c) ¿Qué valores deberán ir en cada clase como limites superior e inferior? d) ¿Cuáles son las marcas de clase para estos intervalos ¿ 2.- En un estudio reciente sobre 500 graduados en administración de negocios, el salario inicial más alto que se reportó fue de $27.500 al año y el más bajo fue de $19.900. Usted
  40. 40. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 40 desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de trabajo que Ud. ha recibido a) ¿Cuántas clases pondría en su tabla de frecuencias . Porqué? b) ¿ Cuál es la amplitud del intervalo ? c) c) ¿Cuáles son los limites y puntos medios de cada clase? 3.- Elabore una distribución de frecuencia en forma tabular y gráfica. Los datos obtenidos son del número de accidentes ocurridos durante 60 días tomados al azar en la ciudad de Riobamba los cuales han sido proporcionados por la Policía Nacional . comente los resultados. 9 7 4 3 6 5 8 2 3 6 2 3 0 3 0 2 1 3 1 5 11 7 4 2 3 2 4 7 3 2 1 3 2 1 0 1 2 2 2 3 3 2 5 4 3 6 2 8 2 3 4 1 2 1 6 1 3 2 1 1 4.- Los siguientes datos pertenecen a las precipitaciones pluviales (anuales) de los últimos 50 años, registradas en la zona del estado de Ohio. Elabore una tabla de distribución de frecuencias y un histograma de frecuencias relativas tanto absolutas como acumuladas. Interprete los datos que se obtienen en la tabla como en los gráficos estadísticos. 15.2 14.6 27.9 24.9 20.0 43.5 30.7 30.0 35.7 40.9 23.4 17.8 26.9 30.8 19.9 36.8 33.4 19.8 29.6 38.2 25.1 42.0 35.2 15.6 25.5 29.7 27.8 14.6 22.1 24.3 30.1 30.1 22.1 24.4 28.7 35.0 26.1 28.2 19.4 28.7 28.0 25.3 31.8 31.0 28.3 13.5 32.1 25.4 26.7 36.8 5.- Los siguientes datos son los ingresos de 60 ejecutivos de marketing para una empresa “X” ( ponga Ud. el nombre a la empresa). Los datos están expresados en miles de dólares 58 76 89 45 67 34 64 76 34 65 45 39 79 74 56 71 85 87 74 38 69 79 61 71 69 62 56 38 69 79 71 54 31 69 62 39 65 79 47 46 77 66 55 75 62 57 77 36
  41. 41. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 41 73 72 64 69 51 50 40 50 74 61 69 73 a) Construya una tabla y grafico de frecuencia absoluta para los datos. Interprete los resultados tanto de la tabla como del gráfico b) Construya una tabla y grafico de frecuencia acumulada para los datos. Interprete los resultados tanto de la tabla como del gráfico 6.-La junta de directores de una gran cooperativa de vivienda desea investigar la posibilidad de contratar a un supervisor para un campo de juegos al aire libre. Se sondearon las 616 casas de la cooperativa, cada una con un voto, sin importar su tamaño. Se recolectaron los siguientes datos: ¿Debería la cooperativa contratar un Supervisor? Si 146 No 91 No está seguro 58 Sin respuesta 321 Total 616 a) Convierta los datos en porcentaje y construya 1.- Un diagrama de barras 2.- Un diagrama pastel b) Eliminando el gripo “sin respuesta”, convierta las 295 respuestas a porcentajes y construya 1.- Un diagrama de barras 2.- Un diagrama pastel c) ¿Cuál de estos gráficos prefiere y porqué? d) Basándose en los resultados de a) y c) ¿ Que recomendaría hacer a la junta de directores?. 7.- Los siguientes datos representan acciones de mercado ( en porcentaje ) propiedad de fabricantes de teléfonos celulares portátiles vendidos durante 1999.
  42. 42. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 42 Fabricante Acciones del mercado (%) Motorota 22 Nokia 14 Mitsubishi 10 Toshiba 9 Samsung 8 Todos los demás 37 Total 100 Fuente: The New York Times, 31 de Octubre de 1993, Pág. 1 Construya: a) Un diagrama de barras b) Un diagrama pastel c) Describa estos resultados en un breve informe y sugiera algunos planteamientos para que Samsung pueda mejorar su posición en el mercado. 8.- Las importaciones a los Estados Unidos provenientes de países en desarrollo constituyeron el 41,4% de un total estimado de 575.9 miles de millones de dólares en el año 1993. Por otra parte, las exportaciones de los Estados Unidos hacia países en desarrollo constituyeron 40.7% de un total estimado de 459.600 de millones de dólares en ese mismo año. La siguiente tabla presenta un desglose por país o región ( en porcentaje ) de importaciones y exportaciones de Estados Unidos para el año 1993: País o Región Acciones del mercado de importaciones a los EE.UU % Acciones del mercado de las exportaciones de los EE.UU (%) África 2.3 1.6 Asia ( excluyendo Japón) 23.5 17.2 Canadá 19.2 21.7 Comunidad Europea 16.6 20.8 Japón 18.4 10.4 Latinoamérica 12.9 16.8 Medio Oriente 2.7 4.7 Otro 4.4 6.8 Total 100 100 Fuente: The New York Times, 19 de Diciembre de 1993, Pág. F7.
  43. 43. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 43 Construya: a) Diagramas de barras separadas para importaciones y exportaciones b) Diagramas pastel separados para importaciones y exportaciones c) Diagramas de barras unidas para importaciones y exportaciones d) ¿Cuál de estas graficas prefiere y por que? e) Realice un resumen interpretativo de una de las graficas construidas. 9.- Recoja datos de su empresa o lugar de trabajo y elabore un cartograma 10.- Recoja datos de su empresa o lugar de trabajo y elabore un pictograma. AUTOEVALUACION 1.- Un conjunto de datos concreto tiene 130 observaciones. ¿Alrededor de cuantas clases deberá contener la distribución de frecuencias? 2.- ¿Porque es necesario organizar los datos de un modo sistemático después de recogerlos?. ¿Por qué no dejarlos en su forma bruta para preservar su integridad y no traicionar su verdadero significado? 3.- Definir y poner ejemplos de los métodos de organización de datos que se han explicado. ¿Cuáles son las ventajas de cada uno de ellos?  Distribución de frecuencias  Distribución de frecuencias acumuladas  Distribución de frecuencias relativas  Gráfico circular  Histograma 4.- ¿Cuál es la relación entre un polígono de frecuencias y una ojiva?
  44. 44. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 44 5.- ¿En qué forma resultarán afectados los limites de clase de una distribución de frecuencias si trabajamos con datos continuos en lugar de discretos? 6.- Exponer con brevedad las reglas que se han de observar para establecer intervalos y límites de clase en una distribución de frecuencias. ¿Qué consideraciones habremos de tener en cuenta si trabajamos con datos continuos?
  45. 45. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 45 UNIDAD III MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS NO AGRUPADOS 3.1 INTRODUCCIÓN El análisis de datos suele realizarse de diversas maneras, dependiendo de si existe una cantidad pequeña o grande de datos que se deba analizar. Cuando existen, digamos, 30 o menos puntos de datos, se utilizan los métodos que presentaremos a continuación; para mayores cantidades de datos, son más prácticas las computadoras o técnicas en las que es necesario llevar a cabo, en primer lugar, el agrupamiento de los datos antes del análisis. Tales técnicas se explicarán con mayor detalle más adelante. Con frecuencia un conjunto de números se puede reducir a una o unas cuantas medidas numéricas sencillas que resumen el conjunto total. Tales medidas son mas fáciles de comprender que los datos originales, no procesados. Más aún, son esenciales para técnicas de cálculo. Dos importantes características de los datos que las medidas numéricas pueden poner de manifiesto son: 1) el valor central o típico del conjunto y 2) la dispersión de los números. El objetivo de esta parte es presentar los métodos más útiles para resumir datos. Mientras no exista una medida mejor para este objeto, diferentes situaciones suelen inclinarse más por una técnica que por otra. La siguiente exposición presenta una gran variedad de técnicas y sugiere algunas consideraciones generales que se pueden utilizar para seleccionar entre diversas medidas.
  46. 46. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 46 3.2 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central se utilizan para indicar un valor que tiende a tipificar o a ser el más representativo de un conjunto de números. Las tres medidas que más comúnmente se emplean son la media, la mediana y la moda. 3.2.1 MEDIA ARITMÉTICA La media aritmética es lo que viene a la mente de la mayoría de las personas cuando se menciona la palabra "promedio". Como este término tiene ciertas propiedades matemáticas deseables, es la más importante de las tres medidas que estudiaremos. La media aritmética se calcula al sumar los valores de un conjunto y al dividir el producto de esta suma entre el número de valores del mismo. De este modo, la media de los valores 70, 80 y 120 es 90 3 270 3 1208070   Si un alumno presentó cuatro exámenes y obtuvo calificaciones de 83, 94, 95 y 86, la calificación promedio del alumno es 89,5: 5,89 4 86959483   La media de una muestra se representa por el símbolo x (que se lee "x con raya"), y su cálculo se puede expresar en notación sigma como se observa a continuación. n x x n 1i i  o, en forma más simple como n x x 
  47. 47. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 47 El procedimiento para calcular la media aritmética es el mismo, independientemente de si un conjunto de valores representa las observaciones de la muestra o todos los valores obtenidos de una población. Sin embargo, se utiliza el símbolo  para la media de una población y N para el número de elementos de la misma: n x La media presenta ciertas propiedades útiles e interesantes, que explican por qué es la medida central que se utiliza más ampliamente: 1. La media siempre se puede calcular para un conjunto de números. 2. Existe una media única para un conjunto dado de números. 3. La media es sensible a (o afectada por) cada valor del conjunto. De este modo, si cambia algún valor, la media también cambiará. 4. Si se suma una constante a cada valor del conjunto, la media aumentará por la misma cantidad. De manera que si se suma una constante de 4.5 a cada valor, la media aumentará en 4.5. En forma similar, el restar de cada valor una constante, o bien, multiplicarlo o dividirlo por la misma, hará que la media disminuya en la misma cantidad, o resulte multiplicada o dividida por dicha constante. 5.- La suma de las desviaciones de los números de un conjunto a partir de la media, es cero:    0xxi Por ejemplo, la media de los números 2, 4 y 6 es 4: 4 3 642 x   
  48. 48. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 48 Si restamos 4 de cada número, tenemos, 2 – 4 = -2 4 – 4 = 0 6 – 4 = +2 0 3.2.2 MEDIA PONDERADA La fórmula anterior para calcular la media aritmética supone que cada observación es de igual importancia. En términos generales, esto suele suceder así, no obstante, hay algunas excepciones. Tomemos, por ejemplo, la situación en la que un profesor informa a su clase que les hará dos exámenes de una hora, cada uno de los cuales equivaldrá al 30% de la calificación de todo el curso, y un examen final que corresponderá al 40%. El cálculo de la media deberá considerar las diferentes ponderaciones de los exámenes. Se aplica la siguiente fórmula:      n 1i i n 1i ii w xw ponderadamedia donde w¡ es el valor de la observación i-ésima. Así, un alumno que obtenga 80 en el primer examen, 90 en el segundo y 96 en el final, obtendrá un promedio de 89,4:
  49. 49. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 49 Examen Calificación Ponderación no. 1 80 0,30 no. 2 90 0,30 final 96 0,40 media ponderada = 0.30(80) + 0.30(90) + 0.40(96) = 89.4 0.30 + 0.30 + 0.40 Supóngase que en otra asignatura hay un examen de medio curso y otro final, y que este último va a valer el doble que el primero. Un alumno que obtenga 95 en el primer examen y 89 en el segundo, tendría un promedio de 91.0. Examen Calificación Ponderación Intermedio 95 1 Final 89 2 0.91 21 )89(2)95(1 ponderadamedia     3.2.3 MEDIANA La segunda medida de tendencia central de un conjunto de números es la mediana. Su característica principal es que divide un conjunto ordenado en dos grupos iguales; la mitad de los números tendrá valores que son menores que la mediana, y la otra mitad alcanzará valores mayores que está. Para encontrar la mediana, primeramente es necesario ordenar los valores (generalmente) de menor a mayor. Posteriormente se deberá separar la mitad de los valores para obtener la mediana. Por ejemplo, la mediana del grupo 5, 6 y 8 es 6, en el cual el 6 está en medio. En términos generales, la mediana ocupa la posición (n + 1)/2. Por tanto, para tres números, la posición es (3 + 1)/2 = 2 o sea, la segunda posición.
  50. 50. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 50 Considérese un segundo ejemplo: Obtener la mediana de estos valores: 7, 8, 9 y 10. Según la fórmula, la posición de la mediana es (4 + 1)/2 = 2.5 que se encuentra a la mitad de los dos valores intermedios, o sea 8.5 en este caso. Esto deja dos valores menores y dos mayores. El procedimiento para obtener la mediana es como sigue: 1. Ordenar o clasificar los valores. 2. Contar para saber si existe un número de valores par o impar. 3. En caso de que se tenga un número impar de valores, la mediana es el valor intermedio. En cambio, para un número par de valores, la mediana es el promedio de los dos valores intermedios. A continuación presentamos algunos ejemplos. Par Mediana Impar Mediana a.- 2.3. 3.4 3 a.- 1. 2. 3. 3,3.4. 7 3 b.-1,18, 19,20 18.5 b.- 9, 40, 80, 81,100, 80 La mediana de un conjunto de números es mayor que la mitad de los valores y menor que la otra mitad de los mismos. 3.2.4 COMPARACIÓN ENTRE LA MEDIA Y MEDIANA Elegir el uso de la media o la mediana como medidas de tendencia central de un conjunto de números depende de varios factores. La media se ve afectada o es influida por todo valor
  51. 51. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 51 del conjunto, incluyendo los extremos. La mediana, por otra parte, es relativamente insensible a valores extremos. En términos generales, la media posee ciertas propiedades matemáticas que la hacen más atractiva. Además, ordenar los datos para encontrar la mediana puede resultar aburrido, y para determinarla no es posible utilizar una calculadora como sucede al obtener la media. 3.2.5 MODA La moda es el valor que con más frecuencia se presenta en un conjunto. Por ejemplo, en el conjunto 10, 10, 8, 6 y 10, el 10 se presenta tres veces, en tanto que cada uno de los otros valores, sólo una vez. El valor más frecuente, la moda, es 10. El valor moda es descriptivo cuando se trabaja con canteo de datos. En comparación con la media y mediana, la moda es la menos útil para la mayoría de los problemas estadísticos, ya que no se inclina por un análisis matemático en el mismo sentido que lo hacen las otras dos(media y mediana) Sin embargo, desde un punto de vista puramente descriptivo, la moda es indicativa del valor "típico" en términos del valor que se presenta con mayor frecuencia. La moda es más útil cuando uno o dos valores, o un grupo de éstos, ocurren con mayor frecuencia que otros. Por el contrario, cuando la mayoría o todos los valores se presentan casi con la misma frecuencia, la moda no sirve para describir datos. La moda es el valor que ocurre con mayor frecuencia. Esta es una medida que sirve para datos continuos, discretos, nominales y jerarquizados. Es decir es la única medida de tendencia central que sirve para todo tipo de datos.
  52. 52. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 52 3.2.6 COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA Definición Ventajas Limitaciones Media n x x n 1i i  1.- refleja cada valor 2.- propiedades matemáticas atractivas 1.- puede ser excesivamente influida por los extremos Mediana La mitad de los valores son mayores, la otra mitad es menor 1.- es menos sensible que la media 1.- difícil de determinar si hay gran cantidad de datos Moda Valor con la frecuencia más alta 1.- valor “típico”; más valores en este punto que en cualquier otro 1.-no se presta para análisis matemático. 2.- puede o no haber un valor modal para algunos conjuntos de datos. 3.3 MEDIDAS DE DISPERSIÓN Para describir en forma adecuada un conjunto de datos, es necesario dos tipos de medidas de resumen. Además, para obtener información respecto a la parte media de un conjunto de números, es conveniente también tener un método para expresar la cantidad de dispersión o difusión que hay entre los números. Por ejemplo, las medidas de dispersión indican si los valores están relativamente cercanos uno del otro o si se encuentran dispersos. En una forma esquemática, esto se ilustra en la figura 1 en las partes (a) y (b). Las observaciones en la figura 1 (a) tienen valores que están relativamente cercanos entre si, en comparación con los de la figura 1 (b).
  53. 53. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 53 . . ........... . (a) Baja dispersión . . . . . . . . . . . (b) Alta dispersión Figura 3.1 la dispersión mide cuan próximos están los valores del grupo entre si. Es conveniente considerar cuatro variables de dispersión: la amplitud de variación (rango), la desviación media, la varianza y la desviación estándar. Todas estas medidas excepto el rango toman a la media como punto de referencia. En cada caso, un valor cero indica que no hay dispersión, en tanto que la dispersión aumenta a medida que se incrementa el valor de la medida del rango , varianza, etc. 3.3.1 RANGO El rango o amplitud de variación de un grupo de datos es generalmente la medida mas sencilla de calcular y comprender, Se concentra en el número mayor y el número menor del grupo (es decir, los puntos extremos). Dicha medida se puede expresar en dos formas: 1. La diferencia entre los valores extremos (mayor – menor) 2. Los valores mayor y menor del grupo (del menor al mayor) El uso de una u otra manera de expresar el rango depende de la naturaleza del conjunto de datos y de la magnitud de los mismos. Por ejemplo saber solo que el rango de un conjunto de datos es 44, no dice nada más respecto a los números; sin embargo, si se establece que el rango es de 300 a 344, se proporciona más información acerca de la magnitud de los números.
  54. 54. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 54 El rango se puede expresar, estableciendo la diferencia entre los números mayor y menor de un grupo, o bien, identificando ambos números EJEMPLOS: RANGO O AMPLITUD DE VARIACIÓN NÚMEROS DIFERENCIA DEL MAS BAJO AL MAS ALTO 1,5,7,13 13 – 1 = 12 1 al 13 14,3,17,4,8,73,36,48 73 – 3 = 70 3 al 73 3,2;4,7;5,6;2,1;1,9;10,3 10,3 – 1,9 = 8,4 1,9 al 10,3 La ventaja de utilizar esta medida como medida de dispersión, se base en el hecho de que su obtención es relativamente sencilla, aún cuando se trate de un conjunto bastante grande de números. La principal limitación que tiene en cambio es que se considera solamente los valores extremos del conjunto, y no proporciona mayor información respecto a los demás valores del mismo. . ... . .. ... .. (1) . ... ............ . (2) . . . . . . . . . . . . . (3) Figura 3.2 Tres grupos de datos, todos con el mismo rango.
  55. 55. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 55 En la figura 3.2 se presentan tres conjuntos de datos bastante diferentes, que poseen el mismo rango, pero no así la misma dispersión. En el primero, los valores se distribuyen en forma uniforme, y esta medida cumple con su objetivo. En el segundo conjunto, los números se encuentran más agrupados, aunque el rango aún proporciona una “cruda” medida de dispersión. No obstante, el tercer conjunto demuestra cómo se puede influir fácilmente en el rango mediante unos cuantos valores extremos, y representar información bastante engañosa respecto a la dispersión de una serie de números. Debido a estos problemas el rango no es suficiente para medir la dispersión de datos entonces citaremos algunas medidas de este tipo pero que utilizan a la media como punto de referencia. 3.3.2 MEDIDAS DE DISPERSIÓN QUE UTILIZAN LA MEDIA COMO PUNTO DE REFERENCIA Dadas sus propiedades matemáticas, la media de un conjunto de datos casi siempre se calcula. En consecuencia, se ha encontrado determinado número de medidas de dispersión que utilizan esta medida como punto de referencia. Todas estas incluyen la obtención de la desviación o diferencia entre cada valor del y la media  xxi  . Se consideran tres de estas medidas, la primera trata sobre la desviación absoluta respecto de la media, mientras que las otras dos se concentran en desviaciones cuadradas a partir de la media. El análisis se llevara a cabo principalmente con cálculos que comprendan datos muestrales, en oposición a datos obtenidos a partir de poblaciones enteras, con la idea de que la estadística muestral se utilizará para aproximar los parámetros de la población.
  56. 56. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 56 3.3.3 DESVIACIÓN ABSOLUTA MEDIA (DAM) La desviación absoluta media (DAM) mide la desviación promedio de valores con respecto a la media del grupo, sin tomar en cuenta el signo de la desviación. Se obtiene al restar la media de cada valor del grupo, eliminando el signo (+ 0 - ) de la desviación (es decir tomando el valor absoluto de esta resta), hallando después el promedio (dividir para el número de las observaciones n). Por definición se debe tener en cuenta que la suma de las desviaciones positiva y negativas de la media siempre será igual a cero. La DAM se calcula mediante la siguiente fórmula: n xx DAM n 1i i   donde n es el número de observaciones. Ejemplo.- Obtenga la DAM para el siguiente conjunto de valores 1, 2, 3, 4, 5 Solución.- Primero calculamos la media 3 5 54321 5 x x 5 1i i     para facilitar los cálculos se sugiere realizar la siguiente tabla: xi x xxi  xxi  1 2 3 4 5 3 3 3 3 3 -2 -1 0 1 2 2 1 0 1 2  0 6
  57. 57. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 57 Luego sacamos el promedio: 2.1 5 6  y esta será la DAM es decir : DAM = 1.2 La desviación absoluta media de un conjunto de datos es la desviación promedio de los valores del conjunto con respecto a la media sin tomar en cuenta el signo de la diferencia. Es relativamente sencillo comprender la desviación media, no obstante, no se la emplea tan ampliamente como medida de dispersión, ya que otras medidas presentan propiedades matemáticas mas atractivas, a la DAM se le utiliza de diferentes manera en control de inventarios. 3.3.4 VARIANZA La varianza de una muestra se calcula casi en la misma forma que la desviación media, con dos pequeñas diferencias: 1.- Las desviaciones se elevan al cuadrado antes de sumarlas y 2.- Se obtienen el promedio, utilizando n-1 en lugar de n, ya que esta pretende proporcionar un mejor cálculo de la varianza de la población del obtenido mediante el uso de n. La varianza muestral se puede calcular mediante la siguiente formula:   1n xx ss n 1i 2 i 2 x 2    
  58. 58. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 58 Si un conjunto de datos constituye una población, o bien, si el objeto de resumir los datos es únicamente para describir un conjunto de datos en lugar de sacar inferencias respecto a una población, entonces se deberá sustituir en el denominador (n-1) por n. Ejemplo: Calcular la varianza de la siguiente muestra: 1,2,3,4,5 Solución.- Para facilitar los cálculos se sugiere realizar la siguiente tabla: xi x  xxi   2 i xx  1 2 3 4 5 3 3 3 3 3 -2 -1 0 1 2 4 1 0 1 4  0 10 Luego aplicamos la fórmula de la varianza:   5,2 4 10 15 xx s 5 1i 2 i 2      Nota.- si tales valores hubieran sido todos los valores de una población, su varianza sería 10/5 = 2. A la varianza la podemos definir como: La desviación promedio de los valores obtenidos a partir de la media, elevada al cuadrado y calculada mediante n-1 en lugar de n. En resumen los pasos necesarios para calcular la varianza son los siguientes:
  59. 59. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 59 1.- Calcular la media 2.- Restar la media de cada valor del conjunto 3.- Elevar al cuadrado cada una de estas desviaciones 4.- Sumar los cuadrados de las desviaciones 5.- Dividir entre (n-1) en el caso de datos muestrales; dividir entre n simplemente para resumir el conjunto o si los datos equivales a todos los valores de una población. Una fórmula alternativa que suele emplearse para calcular la varianza muestral es 1n nxx ss 2 n 1i i n 1i 2 i 2 x 2            una vez más se sustituye n-1 por n en el denominador , para obtener la varianza de la población. Esta fórmula algunas veces es más fácil de utilizar que la anterior ya que no se requiere calcular la media y no es necesario obtener cada una de las desviaciones. Y en el caso de que una media se por ejemplo 3,333333333, el método anterior da lugar a errores, debido al redondeo de números. Mediante los datos anteriores podemos ver que la varianza calculada con esta fórmula es igual a la que resulto anteriormente. xi 2 ix 1 2 3 4 5 1 4 9 16 25  15 55
  60. 60. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 60 La varianza será: 5,2 4 10 4 4555 15 )5/15(55 1n nxx s 2 2 n 1i i n 1i 2 i 2                  3.3.5 DESVIACIÓN ESTÁNDAR La desviación estándar es simplemente la raíz cuadrada positiva de la varianza. De este modo si la varianza es 81 la desviación estándar será 9; si la varianza es 10 la desviación estándar es 10 = 3,16. Para obtener la desviación estándar se debe calcular la varianza y hallar su raíz cuadrada. Las fórmulas para la desviación estándar son:   1n nxx 1n xx s 2n 1i i n 1i 2 i n 1i 2 i                        Al igual que para la varianza si se desea calcular la desviación estándar de la población basta sustituir en el denominador n -1 por n. La desviación estándar es una de las medidas de resumen que más se suele utilizar para distribuciones, y desempeña un papel importante en la estadística. Es importante observar que las unidades de la desviación estándar son las mismas que las de la media. Por ejemplo, si la media esta en unidades monetarias, la desviación estándar también lo estará, Si la media esta en metros lo mismo ocurrirá con la desviación estándar. Por otro lado, la varianza se expresa en unidades al cuadrado ( es decir, unidades monetarias2 , metros2 ).
  61. 61. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 61 EJEMPLO: Estime la desviación estándar de la muestra dada anteriormente. Como la varianza era 5,2s2  entonces  5,2s 1,58. En si la Desviación estándar de un conjunto de datos se define como la raíz cuadrada positiva de la varianza. 3.3.6 COEFICIENTE DE VARIACIÓN La desviación estándar es un término absoluto del que se pueden sacar conclusiones erróneas sobre la dispersión de la muestra. Así para una muestra de x = 30 y s = 4 y otra de x = 60 y s = 6 parece que en principio la segunda es más dispersa. Sin embargo reduciendo los datos a una misma escala sucede lo contrario. Para evitar lo anterior utilizamos el coeficiente de variación, que es el cociente que resulta de dividir la desviación estándar entre la media aritmética. )(100 x s CV  Será más dispersa la muestra que tenga mayor coeficiente de variación. En el caso anterior Cp= 4/30 = 0.13 para la primera muestra y Cp =6/60 = 0.1 para la segunda. La primera tiene más dispersión que la segunda teniendo en cuenta la media de cada una. Este coeficiente no es conveniente usarlo cuando la media se halla muy próxima a 0. En los demás casos es la medida de dispersión más representativa
  62. 62. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 62 3.3.7 OTRAS MEDIDAS Las medidas presentadas anteriormente se utilizan cuando los datos son de tipo cuantitativo, con excepción de la moda, que sirve también con datos cualitativos (nominales). Otra medida que se emplea con datos de este tipo es la proporción que es la fracción o porcentaje de elementos de un grupo o clase particular. La proporción se calcula mediante la fórmula n x proporción  en la cual x es el número de elementos que tienen determinada característica y n es el número total de observaciones. Por ejemplo si observamos que 10 personas de una muestra de 40 tienen color de ojos negros, decimos que la proporción es 10/40 = 0,25 o 25%. ACTIVIDADES RECOMENDADAS 1.- a) ¿Puede la desviación tener valor de cero?.¿Puede ser negativa? Explique. b) ¿Puede ser negativa la desviación absoluta media? Explique 2.- Calcule la media y la desviación estándar de las ventas diarias si se obtuvieron ingresos de: $8100, $9000, $5600, $7680, $4800, $10640. 3.- Obtenga la media y la mediana para cada uno de los siguientes conjuntos de datos. a. 7, 9, 2, 1, 5, 4, 5, 7, 6, 2 b. 30, 2, 79, 50, 38, 17, 9 c. 90, 87, 92, 81, 78, 85, 95, 80 d. 1, 2, 10, 7, 7, 9, 8, 5, 2, 11
  63. 63. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 63 e. 0.0011, 0.032, 0.027, 0.035, 0.042 f. 42, 30, 27, 40, 35, 32, 33. 4.- Calcule las medidas de tendencia central y de dispersión para el siguiente conjunto de datos : 83, 92, 100, 57, 85, 88, 84, 82, 94, 93, 91, 95, 87; suponiendo que son: a) muestrales b) de la población. Realice un comentario sobre las respuestas y justifíquelo. 5.- Determine la desviación estándar para los valores del ejercicio 4 en términos muestrales y de población. 6.- Calcule la mediana, la media y la moda para el número de clientes que están formados en colas de 12 cajas en la oficina matriz de un importante banco. Si los datos son: 1, 3, 4, 3, 4, 2, 4, 1, 2, 2, 1, 0 7.- Calcule la media y la desviación estándar para los tiempos de reacción para los siguientes datos muestrales: 2.2, 2.5, 2.7, 2.3, 2.4, 2.0, 2.7, 2.3, 2.4, 2.4, 2.8 8.- Considere los siguientes datos obtenidos sobre una muestra de precios de oferta: 26.5, 27.5, 25.5, 26, 27, 23.4, 25.1, 26.2, 26.8 a) Determine el rango b) Obtenga la DAM c) Encuentre la varianza d) Calcule la desviación estándar. 9.Convierta cada uno de los siguientes enunciados en una proporción: a) 5 niños de 25 b) 7 de nueve pacientes c) 3 rojos, 4 azules y 5 verdes de 12 canicas.
  64. 64. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 64 10.- Calcule cada una de las siguientes proporciones por medio de la tabla que se muestra a en la figura 3.3: a) Días soleados del mes de junio b) Días parcialmente nublados del mes de junio c) Domingos soleados d) Fines de semanas lluviosos (viernes, sábado, domingo) e) Días con nieve. f) Jueves nublados Figura 3.3.- Tiempo del mes de Junio D L M M J V S 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Soleado Parcialmente nublado: Nublado; lluvioso; nevado
  65. 65. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 65 AUTOEVALUACION 1.- Definir y poner ejemplos de una medida de tendencia central y una medida de dispersión. 2.- ¿En qué condiciones preferiría usted la mediana a la madia aritmética como medida de tendencia central? Explíquelo. 3.- Como propietario de una agencia de publicidad próspera de Chicago, George Kay gana 110000 dólares al año. Sus siete empleados más recientes ganan 15000, 21000, 18500, 17900, 21200, 15900 y 22500 dólares. ¿Qué medida de tendencia central piensa usted que es la mejor indicación del promedio de estos ocho sueldos? Calcule el promedio. 4.- Helen es directora de los servicios de personal de un gran banco de la ciudad. Tiene que contratar a una secretaria por su eficiencia en mecanografía. Una candidata al trabajo mecanografío seis veces un manuscrito con el siguiente número de errores: 5, 6, 2, 1, 2, 0. Otra candidata mecanografío el mimo manuscrito seis veces con: 3, 4, 5, 3, 4 y 5 faltas. ¿Qué candidata debe contratar Helen?
  66. 66. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 66 UNIDAD IV MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN PARA DATOS AGRUPADOS. 4.1 INTRODUCCIÓN En la unidad anterior se dieron las nociones básicas de estas medidas, aplicadas a casos en los cuales las observaciones eran pocas, en esta unidad se ampliaran estos conceptos para series estadísticas, ya sean de intervalos o de frecuencias. 4.2 MEDIDAS DE TENDENCIA CENTRAL 4.2.1 LA MEDIA ARITMÉTICA 4.2.1.1 LA MEDIA ARITMÉTICA DE UNA SERIE ESTADÍSTICA DE FRECUENCIAS. Para obtenerla se multiplica la variable por la frecuencia correspondiente, luego se halla la suma de todos estos productos y dividimos por el número de casos. Esta descripción se puede sintetizar con la fórmula: n fX X n 1i ii  En donde: X = Media Aritmética Xi . fi = Sumatoria del producto de la variable por la frecuencia de cada clase n = número de casos u observaciones.
  67. 67. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 67 Media Aritmética = casosdenúmero frecuencialaporvariableladeproductodelatoriaSum EJEMPLO: Los datos de una encuesta aplicada a estudiantes, en relación al número de hermanos, una vez tabulados quedan así: X f 1 2 3 4 5 6 7 8 9 10 11 12 3 10 10 16 14 7 8 7 1 0 2 1 79 Determinar la Media Aritmética: Para ello construimos la siguiente tabla x f X.f 1 2 3 4 5 6 7 8 9 10 11 12 3 10 10 16 14 7 8 7 1 0 2 1. 3 20 30 64 70 42 56 56 9 0 22 12 79 384
  68. 68. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 68 Aplicando la fórmula n fX X n 1i ii  tendremos 5864 79 384 X  . Como conclusión tenemos que los 79 alumnos encuestados tiene un promedio de 5 hermanos. 4.2.1.2 LA MEDIA ARITMÉTICA DE UNA SERIE ESTADÍSTICA DE INTERVALOS A este procedimiento lo podemos sintetizar de la siguiente manera: 1. Encontramos los puntos medios de la serie. 2. Multiplicamos las frecuencias por los puntos medios correspondientes. 3. Sumamos todos los productos de las frecuencias por los puntos medios. 4. Dividimos la suma anterior por el número de elementos de la serie. Todo este procedimiento lo podemos sintetizar con la fórmula: n fXm X n 1i ii  Siendo: X = Media Aritmética f . Xm = Sumatoria de los productos de las frecuencias por los puntos medios n = número de elementos
  69. 69. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 69 Media Aritmética = elementosdeNúmero mediospuntoslosporsfrecuencialasdeproductoslosdeaSum EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba, Provincia de Chimborazo en el año 2002 fue: X f 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65 83 191 99 67 41 27 16 7 4 Calcular la Media Aritmética: X F Xm f.Xm 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65 83 191 99 67 41 27 16 7 4 23 28 33 38 43 48 53 58 63 1.909 5.348 2.267 2.546 1.763 1.296 848 406 252
  70. 70. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 70 De donde: f . Xm = 17.635 n = 535 Si: n fXm X n 1i ii  Entonces: 96.32 535 635.17 X La edad promedio de los 535 profesores ha sido de 32.96 años es decir 33 años. 4.2.1.3 PROPIEDADES Y APLICACIONES 4.2.1.3.1 PROPIEDADES 1 A la formula de la media aritmética se le puede despejar cualquiera de sus elementos es decir puede ser tratada matemáticamente. 2 La media aritmética es un promedio que depende de todos los valores de la serie, es afectada por los valores extremos. 3 La suma de las desviaciones con respecto a la media aritmética es igual a cero. 4 Se puede establecer la media aritmética de un conjunto de promedios o lo que es lo mismo, determinar la media de las medias aritméticas. 5 Se puede establecer la media aritmética de un conjunto de promedio o lo que es lo mismo, determinar la media de las medias aritméticas.
  71. 71. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 71 4.2.1.3.2 APLICACIONES Se utiliza: 1 Obtener un promedio representativo en la serie. 2 Comparar dos o más series. 3 Calcular otro tipo de medidas. Como medidas de dispersión, medidas de correlación, etc. 4.2.2 LA MEDIANA 4.2.2.1. MEDIANA DE UNA SERIE ESTADÍSTICA DE FRECUENCIA. Para determinar el valor de la mediana, hemos utilizado el siguiente procedimiento: 1. Calculamos la columna de la frecuencia acumulada 2. La mediana la encontramos en la variable que corresponde a la frecuencia acumulada inmediata a aquella que sobrepasa la mitad del número total de casos EJEMPLO: Los datos de una encuesta, sobre el número de hermanos de cada uno de encuestados, una vez tabulados quedan así: X f 1 2 3 4 5 6 7 8 9 10 11 12 3 10 10 16 14 8 7 7 1 0 2 1 79
  72. 72. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 72 Determinar la mediana X f fa 1 2 3 4 3 10 10 16 3 13 23 39 5 14 53 6 7 8 9 10 11 12 7 8 7 1 0 2 1 61 68 75 76 76 78 79 Puesto que: n/2 = 79/2 = 39.5 entonces: Mdm = 5 4.2.2.2 MEDIANA DE UNA SERIE ESTADÍSTICA DE INTERVALOS Para este cálculo se sigue el siguiente proceso: 1. Determinar la columna de la frecuencia acumulada. 2. Dividimos (n/2), nos permite determinar la posición de la mediana. 3. Encontramos el límite real inferior del intervalo. 4. Obtenemos la frecuencia acumulada menor, que es la ubicación de la mediana. 5. Encontramos el valor de la frecuencia. 6. Hallamos el ancho del intervalo. Todo este proceso la sintetiza la fórmula:
  73. 73. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 73 i f mfa2n LiMdm . .)/(   Siendo: Mdm = mediana Li = límite real inferior n/2 = número total de casos divido para dos fa.m = frecuencia acumulada menor i = ancho del intervalo f = frecuencia EJEMPLO: Si la edad de los profesores del Nivel Medio de la Ciudad de Riobamba, Provincia de Chimborazo en el año 2002 fue: X f 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65 83 191 99 67 41 27 16 7 4  535 Calcular la mediana X f f.a 21 – 25 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 56 – 60 61 - 65 83 191 99 67 41 27 16 7 4 83 274 373 440 481 508 524 531 535  535
  74. 74. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 74 n/2 = 535/2 = 267.5 Li = 25 + 26 / 2 = 25.5 fa.m = 83 f = 191 i = 5 i f mfe2n LiMdm . .)/(   Reemplazando: 33.305. 191 )835.267( 5.25   Mdm Se puede decir entonces que 30.33 es el valor central de la serie. 4.2.2.3 PROPIEDADES Y APLICACIONES 4.2.2.3.1 PROPIEDADES 1 La mediana no es como la media, un número que señale precisión en el cálculo, sino que es un promedio que ocupa el valor central de la serie, haciendo que la mitad de la población se ubique a su izquierda y, la otra mitad, a su derecha. 2 La mediana es un valor central y para su determinación no es necesario conocer todos los elementos de la serie 3 Los elementos de la variable demasiado grandes o demasiados pequeños, no influyen en la determinación de la mediana. 4 La fórmula que hemos propuesto para el cálculo de la mediana, en una serie de intervalos, recoge un proceso que se utiliza para su cálculo aproximado.
  75. 75. Estadística Gerencial Tutor: Dra. Lourdes Zúñiga L. 75 4.2.2.3.2 APLICACIONES Este promedio se utiliza para: 1 Encontrar el valor central de la serie 2 Dividir el área del polígono de frecuencia en dos partes iguales. 3 Establecer la verificación de la hipótesis, en los métodos no paramétricos de la prueba de la mediana. 4 Encontrar un promedio más fiable en cierto tipo de variables como: salarios, estaturas, pesos, etc. ya que no influyen en esta determinación los valores extremos muy grandes o muy pequeños. 4.2.3 LA MODA Para obtener la moda de una serie estadística no es necesario utilizar ninguna fórmula, sino que se lo hace tomando el valor que más veces se repite. 4.2.3.1 LA MODA DE UNA SERIE ESTADÍSTICA DE FRECUENCIA Para determinar la moda en una serie de frecuencias, se encuentra la variable que tiene mayor frecuencia y dicha variable será la moda de la serie. EJEMPLO: La tabulación de una encuesta en relación con el número ideal de hijos que debe tener una familia, nos da los siguientes datos: X f 1 10 2 20 3 8 4 20 5 6 6 4 7 5  73

×