Estadistica general

44,314 views

Published on

Apuntes de estadística general

Published in: Education
1 Comment
13 Likes
Statistics
Notes
No Downloads
Views
Total views
44,314
On SlideShare
0
From Embeds
0
Number of Embeds
31
Actions
Shares
0
Downloads
609
Comments
1
Likes
13
Embeds 0
No embeds

No notes for slide

Estadistica general

  1. 1. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos APUNTES DE ESTADÍSTICA DESCRIPTIVA MC Raúl Adalberto Morelos Centro de Estudios Superiores del Estado de Sonora Unidad Académica de San Luis Río Colorado, Sonora México. Septiembre 2010 1
  2. 2. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ÍndiceTema PáginaUnidad 1Conceptos Básicos ¿Qué es la estadística? ------------------------- 3Datos estadísticos ----------------------------------------------------------- 4Importancia Actual de la estadística ------------------------------------ 4Clases de estadística ------------------------------------------------------- 5Estadística Descriptiva ------------------------------------------------------ 6Estadística Inferencial ------------------------------------------------------- 6Definición del concepto de estadística ---------------------------------- 7Ejercicio 1.1 -------------------------------------------------------------------- 9Ejercicio 1.2 -------------------------------------------------------------------- 9Unidad 2Métodos estadísticos ------------------------------------------------------- 10Recopilación de datos ------------------------------------------------------ 11Organización de datos ----------------------------------------------------- 12Organización de datos usando arreglos ------------------------------- 15Organización de datos usando una distribución defrecuencias -------------------------------------------------------------------- 15Número de clases o intervalos ------------------------------------------- 16Amplitud de clases ---------------------------------------------------------- 17Tabla de frecuencias -------------------------------------------------------- 18Datos fundamentales de una tabla de frecuencia ------------------- 18Otros métodos de presentación de datos ----------------------------- 19Partes principales de una tabla ------------------------------------------ 20Gráficas estadísticas -------------- ---------------------------------------- 21Representación gráfica de una tabla de frecuencia ---------------- 22Ejercicio 2.1 ------------------------------------------------------------------- 24Medidas de tendencia central para datos NO agrupados --------- 26Medidas de tendencia central para datos agrupados -------------- 27Medidas de dispersión para datos No agrupados ------------------ 28Medidas de dispersión para datos agrupados ----------------------- 29Bibliografía --------------------------------------------------------------------- 29 2
  3. 3. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos ESTADÍSTICA GENERAL.CONCEPTOS BÁSICOS¿QUE ES LA ESTADÍSTICA?Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprenderlo que él termino significa en la actualidad así como conocer algo de su origen.Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentespersonas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas decifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen,por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. Adecir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en loque respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación deimpuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados“estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado.En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todorelacionado con los informes basados en hechos y consignados en base a números, lo quecomúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que“en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publicanartículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes.Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia losdesconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, queutiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la“estadística” normalmente se pretende dominar algunas de estas técnicas.Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene unasegunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo:una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es unaestadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra esuna estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestraes asimismo una estadística.La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra"estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma comoa los métodos que tratan con la información. Los estadísticos prefieren llamar a la informacióncuantitativa Datos Estadísticos y a los métodos que tratan con la información los MétodosEstadísticos. Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemosrecolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonosextraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis.Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datossean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificartendencias y llegar a conclusiones lógicas. 3
  4. 4. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosDATOS ESTADÍSTICOSLa información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) denúmeros que muestren relaciones significativas. En otras palabras, los datos Estadísticos son númerosque pueden ser comparados, analizados e interpretados.Un número aislado que no se compara o que no muestra relación significativa con otro número no esdato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que lasedades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados.El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo.Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos simplementepreguntar a cada estudiante su edad: así tenemos un conjunto completo de datos. Sin embargorecopilar tales datos de una población finita pero grande es algunas veces imposible o impráctico. A finde evitar la tarea imposible o impráctica, usualmente se extrae una muestra de elementosrepresentativos de la población. La muestra entonces, utilizada para el estudio estadístico y losresultados de la muestra son usados como las bases para describir, estimar o predecir lascaracterísticas de la población.Podemos resumir los significados del término “Estadística” como sigue: 1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este sentido se usa en plural. 2. La materia propiamente dicha, con su terminología, metodología y conocimientos particulares. Bajo este concepto el término se usa en singular. 3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa en plural.IMPORTANCIA ACTUAL DE LA ESTADÍSTICALa aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la estadística ennuestra vida es tan grande, que difícilmente podemos ponderarla lo bastante.Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la aplicación de laestadística a los planos y a los análisis de los experimentos agrícolas. Este es un campo en el cual latécnica estadística se utilizó relativamente al principio. Algunas de las preguntas que los métodos de laestadística ayudan a contestar son: ¿Qué clase de maíz da los mejores rendimientos? ¿Qué clase demezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? ¿Qué clase de mezclade semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas preguntas ycientos mas nos afectan a todos en forma directa a través del mercado domestico.La metodología de la estadística también se usa constantemente en la investigación médica yfarmacéutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizadosprimero en animales y, posteriormente, en seres humanos. Los adelantos de la investigación médicas ylas nuevas drogas nos afectan casi a todos.La estadística también es empleada por los gobiernos. La información económica es objeto de estudioy afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obraspúblicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística 4
  5. 5. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelosdel desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Losmétodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar,desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades yla estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) seusan como ayuda para tomar decisiones sumamente importantes en los altos niveles.En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectoscomo en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de losproductos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar almercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios,en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en lasestadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se empleaen la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben dehacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, paramedidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, tambiénesta usando la estadística actualmente.Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que lasestadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obrasen disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de lasestadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literariosen los “Federalist Papers”.En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pescade las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; asícomo la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, elveintiuno, el béisbol, etc.No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cadauno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no secomprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios delas primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propiasalud.CLASES DE ESTADÍSTICALa estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y laestadística INFERENCIAL.Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dosclases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo deestadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas quecorresponden a las distribuciones a una población; la representación de los datos por medio de otrasclases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo demedidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviacionesabsolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La laborestadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadísticadescriptiva. 5
  6. 6. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosESTADÍSTICA DESCRIPTIVASignificado de EstadísticaLa palabra “Estadística” ha sido frecuentemente referida a la información cuantitativa o numérica.También ha sido referida ampliamente a los métodos que se tratan con la información. Sin embargoesto debería aclararse y llamar a la información, datos estadísticos y a los métodos, métodosestadísticos.La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para laorganización, representación y descripción de un conjunto de datos con el propósito de resaltar susrasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremosque la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden losdatos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para latoma de alguna decisión.En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variableque miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de lamisma, para la toma de alguna decisión.Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él está usando estadística para describir el comportamiento de esa clase y no para hacer una generalización acerca de varias clases, se puede decir que él está usando estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma que sean más fáciles de entender son ejemplos de estadística descriptiva.ESTADÍSTICA INFERENCIALY su significadoLa segunda parte importante de la estadística se refiere a la Estadística Inferencial. Antes definimos ala estadística como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a lamejor resolución sobre bases de una información incompleta. Con el fin de llegar a una decisión sobreuna población, se toma una muestra (generalmente de unos cuantos de los miembros) de esapoblación. Dicha selección se hace, generalmente, al azar, a pesar de que existen varios medios demuestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho términoimplica, se puede apreciar que se trata de un método de muestreo en los que los elementos que lointegran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocenvarias definiciones de matemáticas del muestreo del azar, pero nosotros lo aceptaremos como unmuestreo en el que cada elemento escogido de la población tiene la misma oportunidad de serseleccionado, y en el que la selección de cualquier elemento no afecta que se pueda seleccionarcualquier otro.Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia quehacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferenciaestadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo parallegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras.De manera general, la Estadística Inferencial es: la Estadística mediante la cual se obtienengeneralizaciones o se toman decisiones en base a una información parcial o incompleta obtenidamediante técnicas descriptivas. Los datos se analizan de una manera más detallada, se interpretan y seinfieren. 6
  7. 7. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosSi una muestra es representativa de una población, se puede deducir importantes conclusiones acercade ésta, a partir del análisis e interpretación de la misma.Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notas promedios en una de la clase de Historia para estimar la nota promedio obtenida en los diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un problema de inferencia estadística. Obviamente, cualquier conclusión que realice el profesor acerca de los diez grupos del curso estará basada en una generalización que va más allá de los datos originalmente obtenidos en el curso de Historia. La generalización del profesor puede no ser completamente válida y él debe establecer cuanto tiene de cierto.Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de laPOBLACIÓN en estudio.Para ello debemos definir los siguientes conceptos:POBLACIÓN: Es una agrupación de todos los elementos que se están estudiando y de los cuales seestá tratando de obtener conclusiones. Se debe definir esta población para precisar si un elemento quepertenece a la población.POBLACIÓN FINITA: Cuando una población consta de un número limitado (finito) de elementos. Porejemplo, si se desea obtener información acerca de la capacidad didáctica de los 40 profesores de unauniversidad, se obtendrán datos de una población finita.POBLACIÓN INFINITA: Cuando una población consta de un número ilimitado de elementos. Porejemplo, la población formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de unamoneda es infinita, puesto que hipotéticamente la moneda puede lanzarse un número infinito de veces.MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero no todos. Lamayoría de las veces no es posible o práctico observar todos los elementos de la población, en todocaso se toma solo una parte de ella.PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población.ESTADÍSTICO: Cuando una medida se calcula a partir de los datos de una muestra. MEDIDA ESTADÍSTICO (MUESTRA) PARAMETR0 (POBLACIÓN )Media aritmética (Promedio) µ xDesviación Estándar S σ Número de datos o elementos n NVARIABLE: Es una característica que toma valores diferentes en personas, lugares y cosas diferentes.VARIABLE ALEATORIA: Son variables cuyos valores son el resultados de factores fortuitos.VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que estapuede obtener (estos valores se asocian a cualquier valor entero).Ejemplos 1.3: • El número de automóviles vendidos en un mes. • El número de clientes esperando servicio en la caja de un supermercado. • El número de tubos electrónicos de T.V. producidos en una hora determinada. 7
  8. 8. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosVARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos loscontenidos en un intervalo de recta.Ejemplo 1.4: • La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día. • El tiempo necesario para completar el ensamblaje de un artículo en una planta. • La cantidad de petróleo bombeado cada hora en un pozo.La estadística está desempeñando un importante papel ascendente en casi todas las facetas delprogreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia seextiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación,electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Estedesarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentacióny análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonablesde acuerdo con tales análisis.No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cadauno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibirnuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestrasatisfacción al consumir diversos productos y en nuestra propia salud. 8
  9. 9. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosEJERCICIOS 1.1: ESTADÍSTICA GENERAL.1) Identifique las variables aleatorias siguientes como discretas o continuas. a) El número de transistores defectuosos en un embarque de 10,000 transistores. b) El número de robos ocurridos en un almacén en un período de tiempo. c) La cantidad de gasolina consumida por un vehículo en una prueba de 100 km. d) Las ventas brutas de un supermercado en un día determinado. e) El número de pólizas vendidas en una determinada semana por un agente de seguros. f) La demanda diaria de energía eléctrica en una determinada ciudad. g) La duración de una bombilla eléctrica observada en un experimento.EJERCICIOS 1.2: ESTADÍSTICA DESCRIPTIVA E INFERENCIALIdentifique, en dónde se está utilizando la estadística descriptiva y dónde la inferencial.1.- En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos y aquellos que se derivan de inferencia estadística.a) La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres trabajadoras es 89.b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores.c) En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones mas bajas que las trabajadoras.2.- Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y 840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de la estadística descriptiva y cuáles de la inferencial?a) La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración promedio de las cuatro bombillas marca B es de 980 hrs.b) La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la marca B.c) La diferencia entre los dos promedio es de 20.d) La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que las bombillas marca A son mejores que la marca B.e) Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio de las bombillas marca B.f) Usted decide comprar bombillas marca A en vez de bombillas marca B. 9
  10. 10. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosUnidad 2:DESCRIPCIÓN DE LOS DATOS.Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtenerinformación del medio digna de confianza y utilizarla para decisiones inteligentesMÉTODOS ESTADÍSTICOSEn un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos. a) Recopilación. d) Análisis. b) Organización. e) Interpretación. c) Presentación.Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunosde los métodos pueden ser usados en más de un paso.a) RECOPILACIÓN DE DATOS De acuerdo a la localización de la información los datos estadísticos pueden se clasificados en datos Internos y datos Externos. DATOS INTERNOS: Es cuando la información cuantitativa es obtenida dentro de la organización que hace el estudio estadístico; Tal como los sueldos de empleados de una lista de pagos, recibos de caja de la oficina de contabilidad de la organización. DATOS EXTERNOS: Es cuando la información es obtenida fuera de la organización. Los datos externos son usualmente obtenidos de dos maneras: - Datos publicados: (revistas, periódicos, instituciones de investigación, universidades, publicaciones editadas por gobierno federal, editores privados, etc...) - Encuestas de datos originales (encuestas, entrevistas, etc..)1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si lasfuentes de datos son conocidas por el lector.En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datospublicados.1.1) FUENTE PRIMARIA Y SECUNDARIALas fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias.Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por elrecopilador original de los datos.La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicadapor una organización distinta del recopilador original.FUENTES DE DATOS PUBLICADOSLos siguientes siete grupos son las fuentes más importantes de datos publicados con relación a lasactividades de los negocios y económicos, aunque de ninguna manera puede considerarse como unalista completa de fuentes. 10
  11. 11. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos a).- Agencias gubernamentales b).- Asociaciones empresariales c).- Revistas y publicaciones periódicas de empresas d).- Periódicos y almanaques e).- Organizaciones privadas de servicio de estadística f).- Organizaciones internacionales g).- Otras organizaciones de negocios y educativasELABORACIÓN DE UNA ENCUESTAEl trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y manode obra disponible para el estudio.En vez de recopilar información completa relacionada con el estudio, una muestra consistente de ungrupo de elementos representativos es ordinariamente sacada de la fuente de información (población)en una encuesta.Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa yFormulación de Preguntas.OBSERVACIÓN DIRECTAEl método de observación directa puede dar información exacta y es usualmente preferida, ya quepuede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos deestudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones.Ejemplos: a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos. b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles ciertas preguntas.FORMULACIÓN DE PREGUNTASHay 3 formas de hacer preguntas a fín, de recopilar datos originales. a).- Entrevistas personales b).- Por teléfono c).- Cuestionario por correoAl diseñar un cuestionario debemos de tener presente los siguientes puntos: 1).- El número de preguntas deberá ser conservado en un mínimo 2).- Las preguntas deberán ser breves y claras 3).- Preguntas ofensivas deberán ser evitadas 4).- Preguntas que induzcan a una respuesta no deberán ser usadas 5).- Las preguntas deberán ser fáciles de contestar 6).- Las preguntas deberán requerir contestaciones simples. 11
  12. 12. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosReglas de Redacción y contenido de las Preguntas:1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; laspreguntas deben limitarse al pasado inmediato (un mes máximo)2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta).3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común.4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas oinsinuantes.Ej. ¿Verdad que la Compañía X es la mejor de su ramo?5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta.Ej. ¿Asiste usted al cine por lo menos una vez a la semana?6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansarrápidamente al entrevistado.Ej. ¿Cuántos Kgrs. de azúcar se consumen en su hogar?7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil decontestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad decontestaciones falsas.Ej. ¿Cada cuántos días se baña usted?8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posiblescontestaciones y la pregunta debe referirse de preferencia a una fecha concreta.Ej. ¿Cuándo fue la última vez que asistió usted al cine?9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, suaroma, su aspecto y otras características similares, es recomendable el uso de respuestaspreformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas.Ej. Excelente 3 Muy Bueno 2 Bueno 1 Regular 0 Malo -1 Muy Malo -2 Pésimo -310.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que sonsusceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta.Ej. El Presidente de la República mencionó en su discurso. ¿Usted qué Opina?En este caso el presidente eclipsa el asunto que se discutía. 12
  13. 13. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en laredacción de un buen cuestionario: • No abrumar con palabras altisonantes. • Construir las preguntas gramaticalmente breves • No usar vulgarismos • No someter a negativas dobles. • Evitar dobles significados. • Evitar preguntas capciosas. • Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusión.Elementos del Cuestionario.Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza ycooperación en el encuestado.Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita aldiseñarse y haber un número máximo e igual de las preguntas.Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven paraintroducirlo.Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de lainvestigación y deben ser lo suficientemente extensas para que cubra los mismos.Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, comocuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferentemanera la misma pregunta.Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos,nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en larespuesta si fueran al principio.ORGANIZACIÓN DE DATOS ESTADÍSTICOSDentro de una organización de datos estadísticos debemos tomar en cuenta: 1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las siguientes cosas que deberían ser corregidas y tratadas. a).- Las respuestas son inconsistentes b).- La escritura no es determinable c).- Las respuestas son incompletas d).- Se necesitan cálculos2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general lasclasificaciones pueden ser determinadas de acuerdo a 4 bases:Tiempo, lugar, cantidad y cualidad. 13
  14. 14. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosCUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo,cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferenciacualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios,administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con suorigen.CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable,conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con élnumero de hijos, las empresas industriales, según él número de obreros empleados y tambiéndesacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas sondistribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisisestadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre basescuantitativas, mediante cambios muy ligeros.CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a unfenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrarla cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarseel coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbóndurante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con lasdistribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año oun mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien losacontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí.Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias.GEOGRÁFICA.- La distribución geográfica es esencialmente un tipo de distribución cualitativa, pero engeneral se considera como una clasificación especial. Por ejemplo, cuando se muestra la población decada unos de los estados, tenemos datos clasificados geográficamente. Aun cuando existe unadiferencia cualitativa entre dos estados cualesquiera, la distinción que se establece no es de clase sinode situación. A veces es posible esperar una distribución geográfica en forma de distribución defrecuencias.3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas odeseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativosen una forma resumida basadas en las clasificaciones.Este proceso se llama tabulación son: 1).- Tarjetas de escritura manual 2).- Hojas de registro 3).- Tarjetas de perforación manual 4).- Tarjetas perforadas 5).- Procesamiento electrónico de datos 14
  15. 15. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosORGANIZACIÓN DE LOS DATOS USANDO EL ARREGLO.El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan delvalor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente). Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto. - Rápidamente se pueden apreciar los valores menor y mayor en los datos. - Fácilmente se puede dividir los datos en secciones. - Se puede ver si algún valor aparece más de una vez en el arreglo. - Se puede observar la distancia entre valores sucesivos de datos.A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando seanecesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la listade todas las observaciones. Para estos casos se necesita condensar la información y estar encapacidad de usarla para tomar decisiones e interpretarla.ORGANIZACIÓN DE LOS DATOS USANDO DISTRIBUCIÓN DE FRECUENCIASUna manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Comose verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de ladistribución de manera más significativa.La organización de los datos generalmente implica el arreglo de las observaciones en CLASES oINTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observacionesen cada una de estas clases se conoce como DISTRIBUCIÓN DE FRECUENCIA.La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramenteson recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un ordenascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Estearreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor estárepetido se le llama FRECUENCIA.Ejemplo 2.1: Calificación final de Estadística de 80 Estudiantes de la carrera de LSCA. = RECOPILACION = 68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75 53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60 96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75 65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8 = ORGANIZACION = 53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67 68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75 75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82 82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97 15
  16. 16. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIAS Valor Marca Frecuencia (f) 53 llll 4 60 llll 5 62 lll 3 63 ll 2 ... ... ...En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada datoposible (fi = al número de veces que ocurre la i-ésima observación posible). La información contenida en la tabla puede ser representada gráficamente en varias formas:gráfica de barras, de líneas, por sectores, etc. El inconveniente de graficar cada dato contenido en lagráfica anterior, es que si el número de datos diferentes es muy grande, se diluye la información.Imagínese un gráfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras técnicasapropiadas para el tratamiento de datos provenientes de una variable continua.En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el datomayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado,procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremossaber o calcular el número de intervalos que tendrá nuestra tabla.NUMERO DE CLASES ó INTERVALOS (k)No hay un criterio establecido para el número de agrupación de datos (intervalo de clase) a utilizar. Elprimer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES oINTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y delrango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el númerode datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Porsupuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, losestadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20clases pueden dispersar la información.Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar elnúmero adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resultaadecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunquepersonal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar máscercano a: k = 1 + 3.3 ⋅ Log( N ) k = Número de clases. N = Número de datos.Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criteriosdeterminantes en algunos casos.La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetríade una distribución de datos.Ejemplo 2.2: Para el problema de los 80 estudiantes de estadística Ejemplo 2.1. 16
  17. 17. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces: k=7AMPLITUD DE CLASES.Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clasesdeterminará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase seutilizan las siguientes ecuaciones: Rango (R) = DM - Dm = Dato mayor - Dato menor R Dato ⋅ Mayor − Dato ⋅ Menor i= = k Numero ⋅ IntervalosPara el ejemplo 2.1 tendremos: R = 97 - 53 = 44 i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos) i = 7 (para datos discretos)Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar concuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho delintervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestrosdatos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos elvalor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lopodemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos queutilizar un intervalo más para poder “meter” los valores más altos.Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedarincluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de losdatos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerseen tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datosquede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayorque él. Los intervalos quedarían así: I1 I2 I3 I4 I5 I6 I7 53.0 59.3 65.6 71.9 78.3 84.6 90.0 97.2 a , bpara introducir los datos en los intervalos tomaremos el criterio siguiente: 17
  18. 18. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos( a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores que b; “b menor que”.( a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”.[ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o igual que”.[ a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”. CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIAS. CLASES MARCA FRECUENCIA FRECUENCIAS FRECUENCIA ACUMULADA DE CLASE RELATIVAS xi fr C Li - Ls f 53.0 - 59.3 56.15 4 4/80 = 0.05 4 59.3 - 65.6 62.45 13 13/80 = 0.1625 17 65.6 - 71.9 68.75 7 7/80 = 0.0875 24 71.9 - 78.2 75.05 30 30/80 = 0.375 54 78.2 - 84.5 81.35 9 9/80 = 0.1125 63 84.5 - 90.8 87.65 10 10/80 = 0.125 73 90.8 - 97.1 93.95 7 7/80 = 0.0875 80 Suma de frecuencias = ∑f = 80 ∑ fr = 1.0000DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA.LÍMITES DE CLASE: Son los valores localizados en los extremos de una clase.LÍMITE INFERIOR ó LÍMITE REAL INFERIOR (Li) = 53.0LÍMITE SUPERIOR ó LÍMITE REAL SUPERIOR (Ls) = 59.3TAMAÑO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la frecuencia de una clase determinada. Se calcula restando los limites reales. i = TAMAÑO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3MARCA DE CLASE (xi) : Es el valor representativo de los elementos de la frecuencia. Se obtiene promediando el límite inferior y superior de una clase. Li + Ls 53 .0 − 59 .3 Marca ⋅ Clase = = = 56 15 . 2 2 18
  19. 19. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosFRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las clases y se expresa generalmente en porcentaje. fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25%FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideración y de los intervalos anteriores.Ejercicios 2.1: Resolver las siguientes cuestiones: 1.- Si la calificación mínima aprobatoria es de 70, ¿Cuántos alumnos acreditaron? 2.- ¿Cuántos alumnos acreditaron con menos de 80 ? 3.- Porcentaje de alumnos reprobados. 4.- Entre que rango de valores encontramos más calificaciones. 5.- Porcentaje de alumnos que obtuvieron 90 o más de calificación. 6.- Número de alumnos que obtuvieron una calificación menos de 90. 7.- ¿Puede determinarse en la distribución de frecuencia el número de calificaciones con 95.c) OTROS MÉTODOS DE PRESENTACIÓN DE DATOS: REPRESENTACIÓN DE DATOS ESTADÍSTICOSEn general hay 3 formas para presentar datos organizados: a).- Presentación con palabras b).- Tablas estadísticas c).- Gráficas estadísticasPRESENTACION CON PALABRAS . La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las comparaciones de importancia.TABLAS ESTADÍSTICAS . Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para los cuales nos sirven: TABLAS PARA PROPÓSITOS GENERALES: Proporcionan información para referencia o uso general. No se construyen para una exposición específica. En otras palabras, las tablas nos sirven como un depósito de información. Por ejemplo se tiene una tabla titulada "Empleo y Población" que muestra el número de empleados 19
  20. 20. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos en manufactura, minería, construcción, transporte, comercio al mayoreo y menudeo, gobierno y otras áreas del país. Esta tabla es de propósitos generales, puesto que solamente dice hechos que no son para una discusión particular. Cuando las tablas de propósitos generales son utilizadas por un investigador, son usualmente colocadas en el apéndice del informe para fácil referencia. TABLAS PARA PROPÓSITOS ESPECIALES. Proporcionan información para una exposición particular. Una tabla para propósitos especiales debería ser diseñada de tal forma que un lector pueda dirigirse fácilmente a la tabla para comparación, análisis o énfasis concerniente a la exposición particular. La tabla debe ser construida de una manera breve y simple. PARTES PRINCIPALES DE UNA TABLATÍTULO: Es una descripción del contenido de la tabla. Debe ser compacto y completo. Un título usualmente indica: ¿Qué son los datos incluidos? ¿Dónde está el área representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo ocurrieron los datos?ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla más simple tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y algunas veces tienen encabezados principales y subencabezados. NOTA DE Son usualmente escritas justamente arriba de los encabezados y abajo del titulo.ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por ejemplo la unidad de los datos es frecuentemente escrita como una nota de encabezado, tal como "En miles" .CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado COLUMNA izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras MATRIZ: incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de la columna. CUERPO: Es el contenido de los datos estadísticos. Los datos presentados en el cuerpo son arreglados de acuerdo con las clasificaciones de los encabezados y conceptos. Por lo tanto la presentación efectiva de los datos en la tabla depende de los arreglos columnas y filas. NOTA DE PIE: Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes. FUENTE: Es el origen de donde se obtuvo la información. Es usualmente escrita abajo de las notas de pie. Si los datos fueron recopilados por la misma persona, es costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron tomados de otras fuentes, las fuentes de los datos deberán ser declaradas en la tabla. La declaración permitirá al lector comprobar o evaluar los datos, u obtener información adicional de la fuente original. 20
  21. 21. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosGRÁFICAS ESTADÍSTICASHay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunesde gráficas son: 1).- Gráfica de línea 2).- Gráfica de barras 3).- Gráficas de partes componentes 4).- Gráfica de dimensiones 5).- Pictogramas 6).- Mapas estadísticos.GRÁFICAS DE LÍNEASLas curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como lasdistribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces sepresentan por medio de líneas; en su lugar se usan gráficas de barras.La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica.La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea.Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque conclaridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesasy delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Estopuede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de masde dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzcaalguna confusión.GRÁFICAS DE BARRASCuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficasde barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala ysi los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdoa la magnitud de dichos intervalos.Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente,arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizancomparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barrashorizontales.Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertasconsideraciones:1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitaddel ancho de una barra, ni mayor que el ancho de la misma.3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad deuna barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales.4.- Las líneas que sirven como guía ayudan a leer la gráfica. 21
  22. 22. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosPara representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas.Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil deconstruir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie;mientras que una gráfica de barras permite comparar determinados años con mayor facilidad.REPRESENTACIÓN GRÁFICA DE UNA TABLA DE FRECUENCIA.Los gráficos de distribuciones de frecuencias son útiles porque enfatizan y clasifican las tendencias queno se perciben fácilmente en las tablas. Los gráficos también ayudan a resolver problemas relacionadoscon las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen unchequeo visual de lo correcto de las soluciones.HISTOGRAMA:Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cadarectángulo tiene de ancho el tamaño de clase.En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su basese señala la marca de clase.Las ventajas de los histogramas son: - El rectángulo muestra claramente cada clase separada en la distribución. - El área de cada rectángulo, referida a todos los otros rectángulos, muestra la proporción del número total de observaciones que ocurren en cada clase. HISTOGRAMA 30 F r 25 e 20 c 15 u e 10 n 5 c 0 i Intervalos de clase a sPOLÍGONO DE FRECUENCIA: Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es lafrecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) dela parte superior de los rectángulos de un histograma mediante segmentos rectos. La ventaja de los polígonos de frecuencia son: - El polígono de frecuencia es mucho más simple que el histograma. - Esboza una idea del comportamiento de los datos más claramente. - El polígono se va aplanando y curveando en la medida en que se aumenta el número de clase y el número de observaciones. 22
  23. 23. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos F POLIGONO DE FRECUENCIAS r 35 e 30 c 25 u e 20 n 15 c 10 i 5 a s 0 Intervalos de claseOJIVA: Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo ycuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antesdel primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total dedatos (N). OJIVA F 90 r A c 80 e c u 70 u m u 60 e n l 50 c a d 40 i a a 30 s s 20 10 0 Intervalos de ClaseEJEMPLOS 2.2: PRESENTACIÓN ESCRITA DE DATOS ESTADÍSTICOS. Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de lacompañía XXX en sus diferentes departamentos: Damas, caballeros y niños. Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento dedamas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en eldepartamento de niños. Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 enel departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145,210, 300, 410 y 625 en el departamento de niños. 23
  24. 24. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosPara lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento deniños fueron de 65, 110, 140, 120 y 195.EJEMPLOS: TABLAS ESTADÍSTICAS. NÚMERO DE AUTOS MANUFACTURADOS Y VENDIDOS PORTítulo G.M., K.W. Y M.S. COMPANY EN 1995 ( MILES DE AUTOS ) Nota de Encabezado Compañía Manufactu- Vendidos Encabezado rados G.M. 10 9.2 Conceptos K.W. 14 12.8 Cuerpo M.S. 5* 5 FUENTE: Revista Journal, Enero de 1996, Pag. 13. * La manufactura fue muy poca debido a que en los meses de Abril-Juniohubo huelga por parte del sindicato de trabajadores.EJERCICIOS 21: DISTRIBUCIÓN DE FRECUENCIA Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Paraprobar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron. 15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6 15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8 15.8 16.0 15.6 16.2 16.4 16.9a) Realizar un arreglo de los datos de menor a mayor.b) Realizar una distribución de frecuencia.c) Cuando la máquina tiene un margen de ± 0.2 oz se dice que trabaja correctamente, no importando las onzas que proporcione después de 16 oz. ¿En qué porcentaje la máquina funciona adecuadamente?d) ¿En qué porcentaje la máquina no trabaja adecuadamente?e) ¿En qué porcentaje la máquina proporciona más de 16 oz de café?f) ¿Cuál es la probabilidad de una persona al usar la máquina le proporcione más de 16 oz de café?GRÁFICAS CIRCULARESSe emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de lossectores del círculo representa una parte de un agregado de un total.Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual alos 360 grados, o bien, cuando se trata de porcentajes, a 100%. 24
  25. 25. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosPara evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tienegraduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemossimplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, bastamultiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que lecorresponde en la circunferencia.Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendrádividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a él.PICTOGRAMASLas gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de losdatos que representan son más atractivas; sin embargo; como ya se señalo presentan mayoresdificultades, tanto para su elaboración como para su adecuada interpretación.Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidadfija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A lagráfica resultante se le llama pictograma.Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, haymayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representenseries cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos(cosas o personas) uno al lado del otro y no uno encima del otro.Las reglas fundamentales para la construcción de pictogramas estadísticos son:1.- Los símbolos deben explicarse por sí mismo2.- Las cantidades mayores se indican por un número mayor de símbolos y no por símbolos más grandes3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos4.- Los pictogramas sólo deben utilizarse para hacer comparaciones y no afirmaciones aisladasMAPAS ESTADÍSTICOSLos mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una basegeográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y losmapas de alfileres. 25
  26. 26. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosMEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas)Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar unanálisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Paraello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valorcentral de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estasinterrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, dedispersión, de sesgo y kurtosis. La medida de tendencia central son los promedios o valores típicos representativos de unconjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendenciacentral más comunes son la media (X), mediana (Md) y moda (Mo).MEDIA ARITMÉTICA ( X ) Es la suma de las observaciones o datos entre el número de observaciones totales. Es una delas medidas digna de confianza porque se determina con mayor certeza que otras medidas. N ∑x I =1 i x = NVENTAJAS:  Es familiar a la mayoría de la gente y muy sencilla de calcular.  En ellas se reflejan todos los valores del conjunto de datos.  Un conjunto de datos solo tiene una sola media.DESVENTAJAS:Puede afectarse por los valores extremos que no son representativos del resto de los valores.MEDIANA ( Md ) La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos.Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Siel conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es lamediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los doselementos de la mitad { N/2 }.VENTAJAS:  Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la media.  Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas como el color o la claridad. 26
  27. 27. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosDESVENTAJAS:  Debido a que la media es un promedio de posición, se deben de organizar los datos antes de realizar cualquier tipo de cálculo. Esto consume tiempo para un conjunto de datos muy grande.MODA ( Mo ) La moda es aquel valor que se repite más en un conjunto de datos.VENTAJAS:  Se puede usar como una medida de localización central tanto para datos cualitativos como cuantitativos.  La moda no esta afectada por los valores extremos.DESVENTAJAS:  Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores que se repiten más de una vez.  Otras veces, cada valor es la moda porque cada valor aparece el mismo número de veces.  Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de interpretar y comparar.MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOSMEDIA ARITMETICA PARA DATOS AGRUPADOS N x i = Marca de clase ∑i x i f ∑f = N = Total de datos x = i=1 f = Frecuencia NMétodo corto para el cálculo de la Media Aritmética: A = Media supuesta N (marca de clase del intervalo central) ∑ f i ⋅ di di = Desviación en unidades de intervalo i = Amplitud del intervalo x= A+ i =1 ⋅i NMEDIANA PARA DATOS AGRUPADOS Linf = Límite inferior N = Total de datos N +1 − C ant i = Amplitud del intervalo Md = L inf + 2 ⋅i fMd = Frec. de la clase mediana 27 f Md C = Frecuencia acumulada hasta antes de la clase mediana.
  28. 28. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosSe divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.MODA PARA DATOS AGRUPADOS: d1 = Frec. de la clase modal menos la  d1  frecuencia de la clase anterior. Mo = L inf +  ⋅i d2 = Frec. de la clase modal menos la  d1 + d2  frecuencia de la clase anterior.MEDIDAS DE DISPERSIÓN: Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas dedispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como basede control de la variación misma. Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son:desviación estándar, varianza y rango.VARIANZA: La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la población entre el número total de elementos de la población.La fórmula para datos no agrupados es: N S2 =Varianza. ∑ ( xi − x) 2 xi = Dato individual o marca de clase. S2 = i =1 x = Media Aritmética. N = Total de datos. NPara la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo,"dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Poresta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida dedesviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa.Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza.DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS 28
  29. 29. Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_MorelosLa desviación estándar permite determinar, con cierto grado de certeza dónde están localizados losvalores de una distribución de frecuencia con relación a la media.Desviación estándar para datos agrupados: S = Desviación Estándar. xi = Dato individual o marca N de clase. ∑ f (x i i − X )2 X = Media Aritmética. S =i i =1 N = Total de datos. f = frecuencia del intervalo. NMétodo corto para el cálculo de la desviación estándar: 2 S = Desviación Estándar. n  n  ∑ f i ⋅ d i2  ∑ f i ⋅ d i  xi = Dato individual. di = Desviación en unidades s=i i =1 −  i =1  de intervalo. N  N  N = Total de datos. f = frecuencia del intervalo.     i = Amplitud de la clase.Bibliografía.Anderson, D. (2007) Estadística para Administración y Economía. México: PearsonBerenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall HispanoamericanaHildebrand, D. (1998). Estadística Aplicada a la Administración. México: PearsonLevin, R. I., (2004). Estadística para Administración y Economía. México: PearsonLevine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece HallWebster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall.Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas 29

×