UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIAESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍAUNIDAD DE CIENCIAS BÁSICASAU...
ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO El presente módulo fue diseñado en el año 2005 por MONICA A. SANTAESCOB...
INTRODUCCIÓNEl presente modulo está dirigido a estudiantes de programas de pregrado queoferta la UNAD, bajo la modalidad d...
Finalmente, el Material pretende servir como guía de aprendizaje autónomo, serecomienda apoyar este proceso por medio de l...
CONTENIDOPág.INTRODUCCIÓN11UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia Central14INTRODUCCIÓN A LA UNID...
1.1. CONCEPTUALIZACIÓN DE TÉRMINOS ESTADÍSTICOS181.1.1. ¿QUÉ ES LA ESTADÍSTICA?181.1.2. CONCEPTOS BÁSICOS19 1.1.2.1 Aleato...
1.1.3.2 variables cuantitativas24 1.1.3.3 escala de medida de variables24 1.1.4 CARACTERIZACIÓN DE UNA VARIABLE CUALITATIV...
1.2.1.3.Clase de investigación33 1.2.1.4 Las fuentes de información33
1.2.2. RECOLECCIÓN341.2.2.1 Según la cobertura341.2.2.2 Según la forma de observación34 1.2.3. ORGANIZACIÓN DE LA INFORMAC...
381.2.4 TABLAS DE DISTRIBUCION DE FRECUENCIAS41 1.2.4.1 Distribuciones de frecuencias41 1.2.5 PRESENTACIÓN DE LA INFORMACI...
521.2.5.5 Ojiva53 1.2.5.6 Gráficos de línea55 1.2.5.7 Diagramas de barras56 1.2.5.8 Diagrama circular59 1.2.5.9 Pictograma...
1.3.4 MODA691.3.5 OTRAS MEDIDAS DE TENDENCIA CENTRAL72ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD 1LABORATORIO EN EXCEL (PR...
114 2.1 MEDIDAS DE DISPERSIÓN Y ASIMETRIA115 2.1.1 RANGO O RECORRIDO115 2.1.2. VARIANZA Y DESVIACIÓN ESTÁNDAR116 2.1.2.1 D...
2.1.4 PUNTAJE TÍPICO O ESTANDARIZADO122 2.1.5 MEDIDAS DE ASIMETRÍA Y APUNTAMIENTO124 2.1.5.1 Asimetría124 2.1.5.2.Apuntami...
2.2.4.CORRELACIÓN138 2.2.5.REGRESIÓN MÚLTIPLE141 2.3 NÚMEROS INDICE144 2.3.1 CONSTRUCCIÓN DE NÚMEROS ÍNDICE145 2.3.2. TIPO...
165BIBLIOGRAFÍA DE LA UNIDAD172ANEXOA174
LISTA DE TABLASPág.UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia CentralTabla 1.1 Tablas de contingencia...
42Tabla 2.6. Número de intervalos de clases sugerido en función deltamaño de la muestra46Tabla 2.7. Distribución de frecue...
UNIDAD 2Medidas De Dispersión Y Estadísticas BivariantesTabla 4.1. Distribución de frecuencias de las calificaciones deest...
Tabla 4.3. Distribución de frecuencias de las calificaciones de primersemestre en Valledupar127Tabla 4.4. Cálculo de Z par...
LISTA DE FIGURASPág.UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia CentralFigura 1.1. Diagrama de Barras ...
53Figura 2.7. Ojiva ascendente de la velocidad de pulsaciones54Figura 2.8. Ojiva descendente de la velocidad de pulsacione...
71Figura 3.2. Ojiva porcentual ascendente78Figura 3.3. Diagrama de flujo para el K-ésimo percentil79Figura 4.1. Curva norm...
Figura 4.3. Curva simétrica platicúrtica. Polígono de frecuencias decalificaciones de Competencias Comunicativas129Figura ...
INTRODUCCIÓNLa Estadística es una disciplina que se aplica en muchos campos de laactividad del ser humano. Es muy frecuent...
desarrollar una capacidad personal para extraer y describir información presenteen un conjunto de datos. Y es precisamente...
Con el presente módulo, se busca que el estudiante se encuentre encapacidad de interpretar, discriminar y relacionar los f...
partir de las cuales se logra presentar, resumir e interpretar datos que puedencorresponder a una muestra o a un grupo tot...
Unidad Didáctica UnoCONCEPTOS PRELIMINARES Y MEDIDASDE TENDENCIA CENTRAL
UNIDAD 1.CONCEPTOS PRELIMINARES YCAPITULO 1.GENERALIDADES Y VARIABLESESTADÍSTICASMEDIDAS DE TENDENCIA CENTRALLección 1Que ...
Lección 10Presentación de lainformación.CAPITULO 2.INVESTIGACIÓN ESTADÍSTICACAPITULO 3.MEDIDAS DE TENDENCIA CENTRAL ODE PO...
INTRODUCCIÓN A LA UNIDADLa investigación estadística es necesaria para cualquier individuo en elmundo de hoy, cualquiera q...
OBJETIVOS ESPECÍFICOS. Conocer el significado de la palabra estadística.. Diferenciar entre los conceptos de Estadística D...
1. UNIDADCONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIACENTRAL1.1. CAPITULO 1. GENERALIDADES Y VARIABLES ESTADÍSTICASEn un ...
Si bien esta definición parece un poco ambigua, se verá más adelante elmarco en que éste método se desarrolla y las .leyes...
inductiva. Este curso se dedica a la Estadística Descriptiva, por lo que se hacenecesario dar a conocer, en términos gener...
La unidad estadística es el elemento de la población que reporta lainformación y sobre el cuál se realiza un determinado a...
agrupados según una característica determinada; originales, información que noha recibido ningún tratamiento estadístico; ...
. Y la variable será el número de estudiantes seleccionados de la muestra,como se puede ver, una variable discreta.. Despu...
La manera en que se realiza la selección depende del número de elementos en lapoblación y el tamaño de la muestra.1.1.2.4 ...
Para esto dicho comité decide realizar una campaña en seis hospitales que estánubicados en tres de las zonas colombianas d...
y que han contraído la malaria. La muestra estará formada por lospacientes seleccionados en los seis hospitales y que adem...
Una variable es estadística, si se puede escribir como una pregunta cuyasrespuestas pueden ser tabuladas o clasificadas en...
1.1.3.1 VARIABLES CUALITATIVASUna variable es cualitativa si en la característica que se va a estudiar sebuscaconocer gust...
Las variables cuantitativas pueden ser consideradas en diferentes escalasteniendo en cuenta las unidades asociadas a la po...
EEJJEEMMPPLLOO 33..11..Los profesores de Educación Física de un colegio medirán la estatura de losniñosde secundaria en ca...
Solución1. La variable es consumo de gas. Es cuantitativa y continua2. La variable es situación de violencia. Es cualitati...
1.1.4. LECCIÓN 4. CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVACaracterizar una variable significa describir su comportamien...
Una tabla de frecuencias contiene:
Clases: que corresponde a opiniones, gustos, preferencias, cualidades ocaracterísticas.Frecuencia: es el número de datos q...
1.1.4.2.1 Diagramas de barras: un diagrama de barras es una representacióngráfica de los datos asociados a una variable cu...
La gráfica se realiza en sistema de coordenadas cartesianas, en el ejehorizontalse representan las clases correspondientes...
FIGURA 1.2 http://127.0.0.1:51235/100105/resources/g-4.jpg1.1.4.3 MODALa moda es el dato que tiene mayor frecuencia, es de...
EEJJEEMMPPLLOO 55..11..Con el fin de determinar que materias opcionales, en deportes, se podríanproponer a los estudiantes...
contingencia de frecuencias relativas , en este caso se debe escribir uncociente entre la información contenida en cada ce...
1.2. CAPITULO 2 .INVESTIGACIÓN ESTADÍSTICALa investigación estadística, por sencilla que sea, es una operación compleja,qu...
1.2.1.1. Definición del objeto de investigaciónDebe responder el qué, el cómo y   establecer el momento correcto parahacer...
1.2.1.2. Unidad de investigaciónSe trata del elemento de la población que origina la información. La unidado elemento de i...
Una fuente de información estadística directa es aquella en donde el hechose produce. Este tipo de fuentes son las mejores...
externa, cuando los datos se recopilan por otra entidad diferente a la que hacelainvestigación.1.2.2. LECCION 7 RECOLECCIÓ...
En este método se tiene en cuenta la forma de medición del dato. Si sehace de manera que la fuente de información se da cu...
con el fin de hacer una consulta referida a las Ciencias Sociales, simplementeseobserva la acción del estudiante al entrar...
o descendente, permite un rápido análisis e interpretación de estos.EEJJEEMMPPLLOO 88..11..Los siguientes datos representa...
6075886474
Es muy poca la información que arroja este conjunto de datos cuando seencuentran sin un tratamiento. A continuación estos ...
8892110A partir de esta lista ordenada se pueden concluir varias cosas:. La más alta evaluación de latidos es 110. La más ...
Tomando la serie de datos del ejemplo 8.1., se puede observar que éstos tienenun rango desde los cincuentas hasta los cien...
la columna de las hojas, se enlistan las unidades (de manera ordenada) de cadauno de los datos registrados y correspondien...
. La forma general del conjunto de mediciones es asimétrico.. Se ve más claramente el .vacío. que existe entre los valores...
Figura 2.2.Diagrama de doble tallo y hojas para los datosde pulsaciones del ejemplo 8.1.TalloHojas55860 2 46870 475 6 680 ...
10110Observe ahora que esta subdivisión más fina entrega más detalles del conjunto dedatos. ¿Qué puede concluir usted?1.2....
Tabla 2.1.Número de egresados de la UNAD en el período 1994-2004AñoNúmero deegresados1994338199542419965561997971199813581...
Total25322Una serie espacial es aquella donde se estudia un fenómeno a través del espacioen un tiempo determinado. Por eje...
Una serie cualitativa es aquella donde se estudia un atributo o característicadela población investigada, independiente de...
Tabla 2.4.Clasificación de la estatura de los estudiantes de un grupo de quinto gradoEstatura(en centímetros)Número deestu...
1.2.5 LECCIÓN 9 TABLAS DE DISTRIBUCION DE FRECUENCIAS1.2.4.1 Distribuciones de frecuenciasUna tabla de frecuencias es otro...
Tabla 2.5.Distribución de frecuencias simple de latidos cardiacos de 30 personasVelocidaddepulsacionesFre-cuenciaVelocidad...
06107909706218019806308109906418231000650830101066
08411020670853103068186010406908711050701882106071089
01070720900108073091210907419221101751930TOTAL30Observe que esta manera de agrupar se vuelve engorrosa cuando se tienenmuc...
inferior y límite superior). La diferencia entre estos límites en cada intervalodeclase se denomina ancho, tamaño o amplit...
En la construcción de la distribución de frecuencias se deben responder aestos interrogantes fundamentales: ¿Cuántos inter...
))((*kAR.. Con este nuevo rango, se tendrá entonces un exceso que deberá distribuirseentre el límite superior y el límite ...
Este valor debe distribuirse lo más equitativo posible, esto no quiere decir quesea repartido en partes iguales a los dato...
claseMenos de 16Datos insuficientes16 – 31532 – 63664 – 1277128 – 2558256 – 5119512 – 1023101024 – 2047112048 – 4095124096...
EEJJEEMMPPLLOO 99..22..Para los datos del ejemplo 8.1. Elabore una tabla de distribución de frecuenciasagrupada. Para esto...
Si en el cálculo del   exceso, este hubiera sido un número impar, la distribuciónentre los límites se   calcularía conside...
. Límites reales. 56.5, 65.5, 74.5,–, 110.5. Que se obtiene de calcular la sumade cada límite y dividirlo entre dos. Así: ...
4101.5 – 110.51Total30Al obtener la tabla de distribución agrupada como en el ejemplo 9.2., sonmuchos los interrogantes qu...
agrupadas de los datos del ejemplo 8.1., se calculan las correspondientesfrecuencias relativas de cada intervalo de clase....
23.3%74.5 – 83.5723.4%1446.7%83.5 – 92.51136.7%2583.4%92.5 – 101.5413.3%2996.7%101.5 – 110.513.3%30100%Total30100%La distr...
absolutas, y así sucesivamente. La última frecuencia absoluta acumuladacorresponderá al número total de frecuencias.De la ...
. De las 30 personas, 25 de ellas no superan registros de 92.5 pulsaciones; estocorresponde al 83.4% del total.Construya l...
Una gráfica siempre debe poseer un título que indique la descripción delcontenido de ella. En muchas ocasiones, es importa...
quién va dirigida ésta, el lugar de exposición y otros factores de logística queintervienen en la decisión del mejor diseñ...
EEJJEEMMPPLLOO 1100..11111100..111100..11Tabla 2.9.Distribución de frecuencias simplede visita al odontólogo de niños entr...
4299029101301103012030Total30Esta tabla de frecuencias indica las veces que un grupo de 30 niños de 6 a 12años de edad vis...
Figura 2.4.Diagrama de frecuencias absolutas acumuladasde visita al odontólogo de niños entre los 6 y 12 años0510152025303...
En la figura 2.4. las dos últimas líneas horizontales son de mayor tamaño quelasdemás, esto se debe a que no hay registro ...
escala horizontal y las frecuencias de clase (absolutas o relativas) en laescalavertical y trazando rectángulos cuyas base...
1.2.5.9 Polígono de frecuenciasDescribe también la información de la distribución de frecuencias absolutaso relativas. Per...
Figura 2.6.Polígono de frecuencias absolutasde la velocidad de pulsaciones012345678910111250556065707580859095100105110115...
Figura 2.7.Ojiva ascendente de la velocidad de pulsaciones036912151821242730545862667074788286909498102106110Velocidad dep...
Si ambas ojivas se dibujan en un mismo gráfico, se obtiene la figura 2.9.Obsérvese que ellas se cortan en un punto M, este...
Figura 2.9.Ojiva ascendente y descendente de la velocidad de pulsaciones03691215182124273054586266707478828690949810210611...
Egresados de la UNAD en el período 2000-2004FACULTAD20002001200220032004Ciencias Administrativas13912192154917732383Cienci...
La tabla 2.10. indica el número de egresados de la UNAD en el período 2000-2004, discriminados por facultad.
En el siguiente gráfico de puntos, se ve claramente el comportamiento yfluctuación en el tiempo de cada facultad respecto ...
facultades, de igual forma en 2002 disminuyó estrepitosamente el número deegresados en las facultades de Ciencias Administ...
Las barras son rectángulos con alturas proporcionales a las frecuencias omagnitudes correspondientes, pueden construirse e...
110290Calzado15090240Electrodomésticos300210510Los siguientes diagramas de barras verticales describen las ventas pordepar...
Figura 2.11.Diagrama de barras agrupadas de las ventaspor departamento al contado y a crédito en marzo de 2005200180150300...
Construya una tabla de frecuencias relativas para los datos de la tabla 2.11. yconella elabore por lo menos dos diagramas ...
1.2.5.8. Diagrama circularEs otro tipo de gráfico que permite observar los componentes de un total,como sectores de un cír...
Donde:  º18010036050...XDe la misma manera, el 25% equivale a 90º en el círculo, 15% a 54º y 10% a 36º.Compruébelo. Así pu...
Este tipo de gráficos es inconveniente cuando se tienen varias partes ycada una representa una pequeña proporción o cuando...
1.2.5.10. Mapas estadísticos o cartogramasEste tipo de gráficos muestra la información cuantitativa o cualitativa sobrebas...
muestra. Todo cuanto tiene que ver con sumatoria y productoria puede serrepasado y consultado en el anexo A, que se encuen...
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Estadistica descriptiva modulo 100105
Upcoming SlideShare
Loading in...5
×

Estadistica descriptiva modulo 100105

12,880

Published on

DESCRIPTIVA ESTADÍSTICA

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
12,880
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
161
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "Estadistica descriptiva modulo 100105"

  1. 1. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIAESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍAUNIDAD DE CIENCIAS BÁSICASAUTORMILTON FERNANDO ORTEGON PAVA100105 – ESTADÍSTICA DESCRIPTIVASegunda versiónMILTON FERNANDO ORTEGON PAVA(Director Nacional)FRANCISCO CABRERA(Acreditador)IBAGUÉJULIO 2010
  2. 2. ASPECTOS DE PROPIEDAD INTELECTUAL Y VERSIONAMIENTO El presente módulo fue diseñado en el año 2005 por MONICA A. SANTAESCOBAR (Primera versión)El documento tiene como antecedentes : Estadística básica aplicada (CiroMartinez Bencardino) Curso de Estadística Elemental para las ciencias aplicadas(Smith A Stanley). Estadística Descriptiva (Hernan Bejarano Barrera).Probabilidady Estadística (Triola Mario F) Estadística y Probabilidad (Juan de Jesus Romero-santillana)Como novedades de este material es la presentación por unidades, capítulos ylecciones, que permite una fácil ubicación de temáticas específicas, según elinteres del estudiante. Además, el componente práctico para los cursos teóricosde Matemáticas a lfinal de cada unidad.Este documento se puede copiar, distribuir y comunicar públicamente bajo lascondiciones siguientes:– Reconocimiento. Debe reconocer los créditos de la obra de la maneraespecificada por el autor o el licenciador (pero no de una manera quesugiera que tiene su apoyo o apoyan el uso que hace de su obra).– No comercial. No puede utilizar esta obra para fines comerciales.– Sin obras derivadas. No se puede alterar, transformar o generar una obraderivada a partir de esta obra.– Al reutilizar o distribuir la obra, tiene que dejar bien claro los términos delalicencia de esta obra.– Alguna de estas condiciones puede no aplicarse si se obtiene el permiso deltitular de los derechos de autor– Nada en esta menoscaba o restringe los derechos morales del autor.
  3. 3. INTRODUCCIÓNEl presente modulo está dirigido a estudiantes de programas de pregrado queoferta la UNAD, bajo la modalidad de educación superior a distancia.El material está estructurado en (Dos unidades) que son las temáticas macro delcurso académico. .El contenido de cada una de las partes fue seleccionado, teniendo en cuenta lossaberes mínimos que se esperaría debe alcanzar un estudiante de la UniversidadNacional Abierta y a Distancia en el campo la (Estadística descriptiva).La propuesta permite que los estudiantes reconozcan los conocimientos mínimosdel curso en mención, que le permita resolver situaciones propias del mismo yademás, abordar posteriores temáticas que requieran de éstos conocimientos.Para el mejor aprovechamiento de este material, se recomienda que el estudianteposea como conocimientos previos: Matemática BásicaEl modulo se caracteriza porque en cada lección se presentar ejemplos modelosdel tema en estudio, al final de cada capítulo se exponen ejercicios; conrespuesta,que permite a los estudiantes contextualizarse en diversas áreas delconocimiento,con el fin de fortalecer las temáticas propias del curso. Al final de cadaunidad sepresenta una Autoevaluación de un nivel medio-alto, las cuales permitenverificarlos alcances de los estudiantes en las temáticas analizadas y detectar lasdebilidades y así centrarse en éstas, con el fin de alcanzar las metaspropuestas.
  4. 4. Finalmente, el Material pretende servir como guía de aprendizaje autónomo, serecomienda apoyar este proceso por medio de lecturas especializadas, ayudasaudiovisuales, visitas a sitios Web y prácticas de laboratorio; entre otros, asílograruna efectiva comprensión, interiorización y aplicación de las temáticasestudiadas.
  5. 5. CONTENIDOPág.INTRODUCCIÓN11UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia Central14INTRODUCCIÓN A LA UNIDAD16OBJETIVOS ESPECÍFICOS171. CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL18
  6. 6. 1.1. CONCEPTUALIZACIÓN DE TÉRMINOS ESTADÍSTICOS181.1.1. ¿QUÉ ES LA ESTADÍSTICA?181.1.2. CONCEPTOS BÁSICOS19 1.1.2.1 Aleatoriedad Y Representatividad de la muestra21 1.1.2.2 Muestra aleatoria simple21 1.1.2.3 Muestra Aleatoria sistemática21 1.1.2.4 Muestra Aleatoria Estratificada22 1.1.2.5 Muestra Aleatoria de conglomerados22 1.1.2.6.Deter. Población, muestra y tipo de muestreo a utilizar22 1.1.3. VARIABLES ESTADÍSTICAS23 1.1.3.1 variables cualitativas24
  7. 7. 1.1.3.2 variables cuantitativas24 1.1.3.3 escala de medida de variables24 1.1.4 CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVA26 1.1.4.1 tablas de frecuencias:26 1.1.4.2 representaciones graficas:27 1.1.4.2.1 diagramas de barras27 1.1.4.2.2 diagrama circular:28 1.1.4.3 moda29 1.1.5. TABLAS DE CONTINGENCIA:3032 1.2 INVESTIGACION ESTADISTICA 1.2.1 PLANEACION32 1.2.1.1 Definición del objeto de investigación32 1.2.1.2.Unidad de investigación33
  8. 8. 1.2.1.3.Clase de investigación33 1.2.1.4 Las fuentes de información33
  9. 9. 1.2.2. RECOLECCIÓN341.2.2.1 Según la cobertura341.2.2.2 Según la forma de observación34 1.2.3. ORGANIZACIÓN DE LA INFORMACIÓN351.2.3.1 Combinación o arreglo ordenado351.2.3.2 Arreglo de tallo y hojas361.2.3.3 Tabulación de la información
  10. 10. 381.2.4 TABLAS DE DISTRIBUCION DE FRECUENCIAS41 1.2.4.1 Distribuciones de frecuencias41 1.2.5 PRESENTACIÓN DE LA INFORMACIÓN481.2.5.1 Componentes de una gráfica481.2.5.2 Diagrama de frecuencias491.2.5.3 Histograma de frecuencias511.2.5.4 Polígono de frecuencias
  11. 11. 521.2.5.5 Ojiva53 1.2.5.6 Gráficos de línea55 1.2.5.7 Diagramas de barras56 1.2.5.8 Diagrama circular59 1.2.5.9 Pictogramas60 1.2.5.10 Mapas estadísticos o cartogramas61 1.3 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION61 1.3.1 ESTADIGRAFOS61 1.3.2 MEDIA ARITMÉTICA621.3.3 MEDIANA65
  12. 12. 1.3.4 MODA691.3.5 OTRAS MEDIDAS DE TENDENCIA CENTRAL72ACTIVIDADES DE AUTOEVALUACIÓN DE LA UNIDAD 1LABORATORIO EN EXCEL (PRÁCTICA: DIAGRAMAS ESTADÍSTICOS)8297BIBLIOGRAFÍA DE LA UNIDAD108UNIDAD DIDACTICA 2MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES110INTRODUCCION A LA UNIDAD111OBJETIVOS ESPECIFICOS1122. MEDIDAS DE DISPERSIÓN Y ESTADÍSTICAS BIVARIANTES
  13. 13. 114 2.1 MEDIDAS DE DISPERSIÓN Y ASIMETRIA115 2.1.1 RANGO O RECORRIDO115 2.1.2. VARIANZA Y DESVIACIÓN ESTÁNDAR116 2.1.2.1 Desviación típica o estándar118 2.1.3 COEFICIENTE DE VARIACIÓN Y DESVIACIÓN MEDIA119 2.1.3.1. Desviación media120
  14. 14. 2.1.4 PUNTAJE TÍPICO O ESTANDARIZADO122 2.1.5 MEDIDAS DE ASIMETRÍA Y APUNTAMIENTO124 2.1.5.1 Asimetría124 2.1.5.2.Apuntamiento o curtosis125 2.1.5.3 Lógica Matemática127 2.1.5.4 Competencias Comunicativas128 2.1.5.5 Cultura Política130 2.1.5.6 Estadística Descriptiva131 2.1.5.7 Herramientas Informáticas132 2.2 MEDIDAS ESTADÍSTICAS BIVARIANTES132 2.2.1 REGRESIÓN Y CORRELACIÓN132 2.2.2 DIAGRAMA DE DISPERSIÓN133 2.2.3 REGRESIÓN LINEAL SIMPLE134
  15. 15. 2.2.4.CORRELACIÓN138 2.2.5.REGRESIÓN MÚLTIPLE141 2.3 NÚMEROS INDICE144 2.3.1 CONSTRUCCIÓN DE NÚMEROS ÍNDICE145 2.3.2. TIPOS DE NÚMEROS ÍNDICES146 2.3.3. ÍNDICES SIMPLES146 2.3.4 ÍNDICES COMPUESTOS147 2.3.5. USOS DE LOS NÚMEROS ÍNDICES151 2.3.5.1. Calculo del salario y del ingreso152 2.3.5.2 Poder de compra o poder adquisitivo o valor del dinero152 2.3.5.3. Porcentaje de desvalorización153 2.3.5.4. porcentaje de variación y de devaluación154ACTIVIDADES DE AUTOEVALUACION UNIDAD 2LABORATORIO EN EXCEL PRÁCTICA: (REGRESIÓN Y CORRELACIÓN)155
  16. 16. 165BIBLIOGRAFÍA DE LA UNIDAD172ANEXOA174
  17. 17. LISTA DE TABLASPág.UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia CentralTabla 1.1 Tablas de contingencia30Tabla 1.2 Tabla de Contingencia de Frecuencia Relativas31Tabla 1.3 Tabla de Contingencia de porcentajes31Tabla 2.1 Número de egresados de la UNAD en el período 1994-200439Tabla 2.2. Clasificación de estudiantes por CEAD en la ZonaOccidente durante el primer semestre de 200539Tabla 2.3. Clasificación de empleados por cargo40Tabla 2.4. Clasificación de la estatura de los estudiantes de un grupode quinto grado40Tabla 2.5. Distribución de frecuencias simple de latidos cardiacos de30 personas
  18. 18. 42Tabla 2.6. Número de intervalos de clases sugerido en función deltamaño de la muestra46Tabla 2.7. Distribución de frecuencias agrupadas de la velocidad depulsaciones47Tabla 2.8. Distribución de frecuencias absolutas, relativas yacumuladas ascendentes de la velocidad de pulsaciones47Tabla 2.9. Distribución de frecuencias simple de visita al odontólogode niños entre los 6 y 12 años50Tabla 2.10. Egresados de la UNAD en el período 2000-200455Tabla 2.11. Ventas por departamento al contado y a crédito en marzode 200557Tabla 3.1. Distribución de frecuencias agrupadas64Tabla 3.2. Distribución de frecuencias agrupadas66Tabla 3.3. Distribución de frecuencias de la asistencia a cine70Tabla 3.4. Distribución de frecuencias agrupadas de la asistencia acine70Tabla 3.5. Comparación de la media, mediana y moda72Tabla 3.6. Distribución de frecuencias agrupadas73Tabla 3.7. Distribución de frecuencias agrupadas77Tabla 3.8. Resumen de cálculos, ejemplo 15.4.78
  19. 19. UNIDAD 2Medidas De Dispersión Y Estadísticas BivariantesTabla 4.1. Distribución de frecuencias de las calificaciones deestudiantes de Estadística118Tabla 4.2. Distribución de frecuencias de las calificaciones deestudiantes de Estadística118
  20. 20. Tabla 4.3. Distribución de frecuencias de las calificaciones de primersemestre en Valledupar127Tabla 4.4. Cálculo de Z para la distribución de frecuencias de lascalificaciones de Competencias Comunicativas129Tabla 4.5. Cálculo de Z para la distribución de frecuencias de lascalificaciones de Estadística Descriptiva131Tabla 5.1. Relación de ventas de un producto y la emisión delcomercial en televisión136Tabla 5.2. Grado de correlación lineal140Tabla 5.3. Gastos indirectos de producción143Tabla 5.4. Precios y cantidades vendidas en una farmacia en 2003 y2004150
  21. 21. LISTA DE FIGURASPág.UNIDAD DIDÁCTICA 1Conceptos Preliminares Y Medidas De Tendencia CentralFigura 1.1. Diagrama de Barras – Medios de Información28Figura 1.2 Diagrama Circular medios Comunicación29Figura 2.1. Diagrama de tallo y hojas para los datos de pulsacionesdel ejemplo 8.1.37Figura 2.2. Diagrama de doble tallo y hojas para los datos depulsaciones del ejemplo 8.1.38Figura 2.3. Diagrama de frecuencias absolutas de visita al odontólogode niños entre los 6 y 12 años50Figura 2.4. Diagrama de frecuencias absolutas acumuladas de visitaal odontólogo de niños entre los 6 y 12 años51Figura 2.5. Histograma de frecuencias absolutas de la velocidad depulsaciones52Figura 2.6. Polígono de frecuencias absolutas de la velocidad depulsaciones
  22. 22. 53Figura 2.7. Ojiva ascendente de la velocidad de pulsaciones54Figura 2.8. Ojiva descendente de la velocidad de pulsaciones54Figura 2.9. Ojiva ascendente y descendente de la velocidad depulsaciones55Figura 2.10. Diagrama de líneas. Egresados de la UNAD en el período2000-200456Figura 2.11. Diagrama de barras agrupadas de las ventas pordepartamento al contado y a crédito en marzo de 200558Figura 2.12. Diagrama de barras segmentadas de las ventas pordepartamento al contado y a crédito en marzo de 200558Figura 2.13. Diagrama circular para el estado civil de 1250 aspirantes aempleo59Figura 2.14. Pictograma para el número de árboles talados enArgentina, Bolivia y Colombia60UNIDAD 2Medidas De Dispersión Y Estadísticas BivariantesFigura 3.1. Distribuciones sesgadas. (a) Sesgada a la derecha; (b)Sesgada a la izquierda; (c) Simétrica
  23. 23. 71Figura 3.2. Ojiva porcentual ascendente78Figura 3.3. Diagrama de flujo para el K-ésimo percentil79Figura 4.1. Curva normal o campana de Gauss122 Figura 4.2. Curva asimétrica positiva. Polígono de frecuencias decalificaciones de Lógica Matemática128
  24. 24. Figura 4.3. Curva simétrica platicúrtica. Polígono de frecuencias decalificaciones de Competencias Comunicativas129Figura 4.4. Curva asimétrica negativa. Polígono de frecuencias decalificaciones de Cultura Política130Figura 4.5. Curva simétrica leptocúrtica. Polígono de frecuencias decalificaciones de Estadística Descriptiva132Figura 5.1. Gráficas de dispersión. (a) lineal; (b) curvilínea; (c) sinrelación134Figura 5.2. Diagrama de dispersión de ventas de un producto y laemisión del comercial en televisión136Figura 5.3. Gráficas de dispersión lineal. (a) positiva; (b) negativa138
  25. 25. INTRODUCCIÓNLa Estadística es una disciplina que se aplica en muchos campos de laactividad del ser humano. Es muy frecuente encontrarse en las diferentesdisciplinas del saber con incertidumbres como el pronosticar el crecimientopoblacional de un país, el crecimiento económico de una empresa o el crecimientode producción y venta de un producto específico, el conocer la efectividad dediferentes abonos en el campo agrario, el determinar la tendencia decontaminación del agua o el aire, la clasificación de personal en una empresaparaefectos de una buena y sana política laboral, etc.Habitualmente, el propósito de la Estadística Aplicada es el de sacarconclusiones de una población en estudio, examinando solamente una parte deella denominada muestra. Este proceso, llamado Inferencia Estadística, suelevenir precedido de otro: la Estadística Descriptiva, en el que los datos sonordenados, resumidos y clasificados con objeto de tener una visión más precisa yconjunta de las observaciones, intentando descubrir de esta manera posiblesrelaciones entre los datos, viendo cuáles toman valores parecidos, cuálesdifierengrandemente del resto, destacando hechos de posible interés, entre otros.En todos los campos de la investigación se requiere a menudo el usoracional de los Métodos Estadísticos. Los procesos de planeación, control y tomade decisiones económicas, administrativas y financieras se basan en resultadosobtenidos mediante el análisis estadístico de los fenómenos en ellosinvolucrados.El acelerado desarrollo de métodos, técnicas y tecnologías para el óptimoanálisisde datos justifica que un profesional disponga de una sólida fundamentaciónconceptual para que realice apropiadamente su evaluación y aportesustentaciones a su decisión. Las interpretaciones que generan los datospudieranser erróneas para aquellas personas que no cuentan con criterios válidos paracaptar la información. Es por ello que con este módulo se pretende que elestudiante se adentre a los conocimientos básicos de la Estadística Descriptiva.Enfrentarse con datos de muy diversa índole es cosa de todos los días encualquier práctica del ser humano. Sin embargo, dado la cantidad innumerable deestos, no siempre se comprende el real alcance de lo que dicen. Como parte deuna base cultural necesaria para desempeñarse en el mundo de hoy, es requisito
  26. 26. desarrollar una capacidad personal para extraer y describir información presenteen un conjunto de datos. Y es precisamente allí donde resalta la importancia delaEstadística Descriptiva como primer paso en la determinación de decisiones einferencias que pueden concluirse de la variada información que nos llega enforma de datos numéricos.
  27. 27. Con el presente módulo, se busca que el estudiante se encuentre encapacidad de interpretar, discriminar y relacionar los fundamentos básicos de laEstadística Descriptiva, a través del análisis de datos tomados de un fenómenopropio de su disciplina y que describa, examine y sintetice adecuadamente lainformación mediante métodos estadísticos sencillos.El curso académico de Estadística Descriptiva hace parte de la formaciónbásica disciplinar de los programas que oferta la Universidad Nacional Abierta yaDistancia –UNAD–. Consta de dos (2) créditos académicos, el sistema adoptadopor la UNAD como estándar curricular en la formación universitaria, y es de tipoteórico, en tanto que busca la identificación y el reconocimiento de lasproblemáticas, perspectivas teóricas, conceptos, categorías, métodos y técnicasindispensables para la formación profesional.Este texto contiene dos unidades didácticas1, correlacionadas directamentecon el número de créditos académicos asignados al curso académico. La primerade ellas, considera los Conceptos Básicos necesarios para el cumplimiento de lospropósitos y objetivos del curso. En esta unidad se identifican algunosconceptosestadísticos como población, muestra, variable, dato, etc.; y se reconocen cadauno de los pasos a seguir para una correcta y acertada investigación estadísticacomo son la planeación, la recolección de la información, su organización y supresentación gráfica. En la segunda unidad didáctica se reconocen algunas de lasmedidas estadísticas más comunes, tanto univariantes como bivariantes. Entre lasprimeras se contemplan las medidas de tendencia central, las medidas dedispersión y las de asimetría y apuntamiento y, como medidas estadísticasbivariantes, se trabaja la regresión lineal (simple, ponderada y múltiple), lacorrelación y los números índice. Como Anexo y complemento a esta segundaunidad, se incluyen algunos elementos básicos de la matemática: la sumatoria yproductoria. Al final de cada tema, encontrará ejercicios de aplicación quebuscanevaluar el grado de conocimiento adquirido, esta evaluación será retroalimentadaen la información de retorno que encontrará al final de cada unidad didáctica.1 Conjunto de conocimientos seleccionados, organizados y desarrollados a partirde palabras clavetomados como conceptos que los tipifican, en articulación con lasintencionalidades formativas,destinadas a potenciar y hacer efectivo el aprendizaje mediante el desarrollo deoperaciones,modificaciones y actualizaciones cognitivas y nuevas actuaciones o competenciaspor parte delestudiante. EL MATERIAL DIDÁCTICO. Roberto J. Salazar Ramos. UNAD, Bogotá D.C.2004.Este texto busca aportar las herramientas teóricas y prácticas a losestudiantes para que logren, mediante análisis cuantitativos, la interpretacióndediferentes fenómenos propios de su disciplina de formación y del entorno social,económico y político. Apunta al manejo estadístico de datos, dar las pautas enlarecolección planeada de los mismos y proporcionar un conjunto de técnicas a
  28. 28. partir de las cuales se logra presentar, resumir e interpretar datos que puedencorresponder a una muestra o a un grupo total.El módulo no pretende reemplazar las diferentes referencias bibliográficasclásicas de la Estadística, busca entregar los conceptos de un modo másdidáctico, enfocado en el autoaprendizaje y en relación directa con la Guía deActividades referenciada en el protocolo del presente curso. Al final de cadaunidad, el estudiante encontrará las referencias bibliográficas básicas, pero noúnicas, para que con ellas refuerce en conceptos y definiciones. Además,encontrará una serie de páginas web recomendadas que amplían los temastratados. Se trata pues de un material didáctico de apoyo para el curso deEstadística Descriptiva de la UNAD, como parte de las diferentes y diversasherramientas didácticas en las que se apoya el aprendizaje autónomo.
  29. 29. Unidad Didáctica UnoCONCEPTOS PRELIMINARES Y MEDIDASDE TENDENCIA CENTRAL
  30. 30. UNIDAD 1.CONCEPTOS PRELIMINARES YCAPITULO 1.GENERALIDADES Y VARIABLESESTADÍSTICASMEDIDAS DE TENDENCIA CENTRALLección 1Que es la estadística?Lección 2Conceptos BásicosLección 3Variables estadísticasLección 4Caracterización de unavariable cualitativaLección 5Tablas de contingenciaLección 6PlaneaciónLección 7Recolección.Lección 8Organización de lainformación.Lección 9Tablas de distribución defrecuencias.
  31. 31. Lección 10Presentación de lainformación.CAPITULO 2.INVESTIGACIÓN ESTADÍSTICACAPITULO 3.MEDIDAS DE TENDENCIA CENTRAL ODE POSICIÓNLección 11Estadígrafos.Lección 12Media AritméticaLección 13Mediana.Lección 14ModaLección 15Otras medidas detendencia central.
  32. 32. INTRODUCCIÓN A LA UNIDADLa investigación estadística es necesaria para cualquier individuo en elmundo de hoy, cualquiera que sean sus actividades siempre hay aplicacionesestadísticas en ellas. Pero cualquier investigación estadística requiere seguirunospasos y procedimientos establecidos para que esta tenga validez. En esta unidadse desarrollarán en forma introductoria y general algunos conceptos preliminarescon el fin de utilizar un mismo lenguaje en cuanto se refiere a esta disciplina.Deigual manera, se presentan los elementos iniciales básicos y necesarios para lacomprensión y aplicación de la estadística en cualquier campo.En el capítulo uno se ampliarán algunas definiciones de términos básicos de laestadística como población, muestra, variable, dato, etc., buscando que elestudiante los identifique en ejemplos sencillos de la vida diaria. En elcapítulo dosse reconocerán cada uno de los pasos a seguir para una correcta y acertadainvestigación estadística como son la planeación, la recolección de lainformación,su organización y su presentación gráfica y en el capitulo III se mencionaranlasmedidas de tendencia central y de posición para lo cual se hace indispensablerecordar algunas nociones aritméticas y algebraicas básicas en estadística, esporesto que se recomienda al lector iniciar el capítulo repasando la sumatoria comopropiedad aritmética fundamental para entender las medidas estadísticas de unapoblación o muestra. Todo cuanto tiene que ver con sumatoria y productoriapuede ser repasado y consultado en el anexo A, que se encuentra al final deltexto.
  33. 33. OBJETIVOS ESPECÍFICOS. Conocer el significado de la palabra estadística.. Diferenciar entre los conceptos de Estadística Descriptiva y EstadísticaInferencial.. Establecer los conceptos de población, muestra, variable, dato y parámetro.. Identificar las etapas que sugiere una investigación estadística.. Manejar los diferentes métodos de recolección de información para lainvestigación estadística.. Advertir la importancia de las distribuciones de frecuencias para ladescripción de datos.. Aplicar los conceptos de frecuencia, marca de clase y distribución defrecuencias a un conjunto de datos estadísticos.. Construir diferentes tipos de distribuciones de frecuencias para conjuntosde datos.. Reconocer algunas características que debe tener una gráfica para querepresente mejor una situación.. Representar gráficamente distribuciones de frecuencias dadas ocalculadas.
  34. 34. 1. UNIDADCONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIACENTRAL1.1. CAPITULO 1. GENERALIDADES Y VARIABLES ESTADÍSTICASEn un principio se consideraba que la función de la estadística era ladescripciónde las características de grupo, actividad que la hacia confundir con el papelquecumple la .historia. de observar y describir el hecho. En su origen lasestadísticasera históricas ; hoy en día, la estadística, además de ser descriptiva, esanalítica,considerándose esta ultima como la función mas importante que realiza, ya quepermite obtener conclusiones para un grupo mayor, denominado población,partiendo de una investigación realizada en un grupo menor, denominado muestracuyos elementos se seleccionan aleatoriamente o al azar.1.1.1. LECCION 1. ¿Qué es la Estadística?Antes de dar a conocer los conceptos de los términos estadísticos quelleven a entablar el lenguaje común que se utilizará en adelante, es necesariosaber qué es la Estadística y en qué consiste la Estadística Descriptiva.Empíricamente se sabe que la Estadística tiene que ver con datos y lamanera en que estos son agrupados. Esto se reconoce en muchos casos de lavida cotidiana que involucran información numérica y el contexto en que estainformación es dada a conocer. Aunque también puede darse en muchos casosque, si bien están relacionados con la estadística, obedecen a otros fenómenosdedisciplinas relacionadas con –pero que no conforman– la Estadísticapropiamente dicha.La Estadística es un método científico de operar con un grupo de datos yde interpretarlos.
  35. 35. Si bien esta definición parece un poco ambigua, se verá más adelante elmarco en que éste método se desarrolla y las .leyes. que lo rigen. Pero, porahora,se deja abierta al cuestionamiento del estudiante la gama de posibilidades queabarca esta definición.La Estadística, o el método de la estadística, se divide en dos ramas: laEstadística Descriptiva o deductiva y la Inferencia Estadística o estadística
  36. 36. inductiva. Este curso se dedica a la Estadística Descriptiva, por lo que se hacenecesario dar a conocer, en términos generales, en qué consiste la InferenciaEstadística.La Inferencia Estadística comprende en un todo articulado el método y lastécnicas necesarias para explicar el comportamiento de un grupo de datos en unnivel superior de lo que estos datos pueden dar a conocer por sí mismos. Esdecir,se puede concluir sobre el grupo de datos sobrepasando los límites delconocimiento inicial que estos suministran, examinando solamente una parte de lapoblación denominada muestra. Es por ello que a la Inferencia Estadísticatambiénse le conoce como Estadística Analítica.Si esto es así, ¿qué le corresponde entonces a la Estadística Descriptiva?Esta tiene por fin elevar los aspectos característicos del grupo de datos perosinintentar obtener más conocimiento del que pueda adquirirse por sí mismos. Es porello que la Estadística Descriptiva es el punto de partida del análisis de ungrupode datos que involucran una cierta complejidad, o bien puede ser el todo de unanálisis básico y limitado del grupo de datos.1.1.2. LECCIÓN 2. CONCEPTOS BÁSICOSPoblación es el conjunto de medidas, individuos u objetos que compartenuna característica en común. La población se basa en cuatro características:contenido, tipo de unidades y elementos, ubicación espacial y ubicacióntemporal.De la población es extraída la muestra..Muestra es un conjunto de elementos extraídos de la población. Losresultados obtenidos en la muestra sirven para estimar los resultados que seobtendrían con el estudio completo de la población. Para que los resultados delamuestra puedan generalizarse a la población, es necesario que la muestra seaseleccionada adecuadamente, es decir, de modo que cualquiera de los elementosde la población tengan la misma posibilidad de ser seleccionados. A este tipo demuestra se le denomina muestra aleatoria.
  37. 37. La unidad estadística es el elemento de la población que reporta lainformación y sobre el cuál se realiza un determinado análisis.Los datos son todas aquellas características o valores susceptibles de serobservados, clasificados y contados. Estos pueden ser experimentales, cuandose le aplica un tratamiento especial a las unidades muestreadas; de encuesta,cuando son tomadas sin ningún tratamiento; clasificados, cuando están
  38. 38. agrupados según una característica determinada; originales, información que noha recibido ningún tratamiento estadístico; primarios, cuando son recogidos,anotados u observados por primera vez; o secundarios, cuando son recopiladospor otra persona o entidad diferente al investigador.Variable es una característica susceptible de tener distintos valores en loselementos de un grupo o conjunto. Si la variable tiene la capacidad de tomarcualquier valor que exista entre dos magnitudes dadas, entonces esta variableserá continua. Si por el contrario, sólo puede tener un valor de entre ciertacantidad de valores dados, entonces será discreta.Parámetro son aquellos valores que caracterizan numéricamente a lapoblación como tal. El parámetro poblacional de interés es único (media,varianza,etc.), pero una población puede tener muchas características –o parámetros– deinterés. Por el contrario, un estadístico es una magnitud correspondiente a unamuestra aleatoria extraída de la población, por lo que cambiando la muestracambiará entonces el estadístico (media muestral, varianza muestral, etc.). Enpocas palabras se puede decir que parámetro es a población como estadístico esa muestra. Es común designar los parámetros con letras minúsculas del alfabetogriego y los estadísticos con letras de nuestro alfabeto. En la Unidad DidácticaDos, se ampliará más estos dos conceptos.EEJJEEMMPPLLOO 22..11..La Universidad Nacional Abierta y a Distancia UNAD desea establecer cuántosestudiantes hacen uso de la biblioteca en el CEAD de San Juan de Pasto. Elcoordinador zonal de biblioteca es designado para este trabajo y decide hacer lainvestigación el día 14 de mayo de 2005.. En esta investigación se considera que el total de estudiantes del CEADque hacen uso de la biblioteca es la población en estudio.. Cada uno de los estudiantes seleccionados para la observación representala unidad estadística de estudio de la población.. El día 14 de mayo de 2005 indica la ubicación temporal.. El CEAD de San Juan de Pasto, identifica la ubicación espacial.. Como el coordinador zonal de biblioteca no puede revisar todo el díaquienes acceden a la biblioteca, decide entonces establecer períodos detiempo para realizar el conteo. En otras palabras, selecciona una muestra.. Identificada la población y la muestra, se ubica la unidad estadística, eneste caso el objeto de medición es cada uno de los estudiantesseleccionados de la muestra.
  39. 39. . Y la variable será el número de estudiantes seleccionados de la muestra,como se puede ver, una variable discreta.. Después de esto el coordinador selecciona los datos necesarios para elestudio, en este caso específico sólo requerirá del número de estudiantesque acceden a la biblioteca. Sin embargo, el coordinador zonal puedeademás, tomar otro tipo de datos como sexo, edad, razón por la cual visitala biblioteca, libros más consultados, etc.1.1.2.1 Aleatoriedad Y Representatividad de la muestraLa muestra asociada a un estudio debe ser representativa y aleatoria.Representativa, pues debe estar formada por un número razonable de elementosy aleatoria porque debe ser escogida al azar, de tal manera que quien realiza elestudio no pueda influir en la elección de los individuos por encuestar.Cada elemento de la población debe tener la misma oportunidad de serseleccionado.El muestre aleatorio puede ser: http://127.0.0.1:51235/100105/resources/f-110.jpg1.1.2.2 Muestra aleatoria simpleSi cada posible muestra de la población, del mismo tamaño, tiene igualprobabilidad de ser seleccionada.1.1.2.3 Muestra Aleatoria sistemáticaCuando los elementos son seleccionados de una manera ordenada. En este caso,la población se encuentra organizada por algún código ya sea por fecha, hora,orden de llegada o algún otro aspecto.
  40. 40. La manera en que se realiza la selección depende del número de elementos en lapoblación y el tamaño de la muestra.1.1.2.4 Muestra Aleatoria EstratificadaCuando la selección tiene en cuenta los diferentes grupos o estratos queconforman la población.Los elementos de la muestra se seleccionan de cada grupo en forma aleatoria opor un método sistemático. Los estudios de la población, basados en muestrasestratificadas usualmente, tienen mayor precisión (o menor error muestral) quecuando se seleccionan por muestreo aleatorio simple.1.1.2.5 Muestra Aleatoria de conglomeradosSi para su selección se tiene en cuenta el siguiente procedimiento:En primer lugar, se divide la población en grupos que sea conveniente para elmuestreo. Luego, se selecciona una parte de los grupos al azar o por un métodosistemático; por último, se toman todos los elementos, o parte de ellos al azaropor un método sistemático, de los grupos seleccionados para conformar lamuestra.Una muestra de conglomerados usualmente, produce un mayor error muestral queuna muestra aleatoria simple del mismo tamaño. Si la población no tiene ningunaorganización interna, entonces se dice que la muestra puede tomarse de formaaleatoria simple y todos los individuos de la población tienen la mismaprobabilidadde ser seleccionados en la muestra.EEJJEEMMPPLLOO 22..22..El comité científico de una reconocida multinacional de medicamentos deseapromover un producto que ha sido efectivo en el tratamiento de la malaria envarios países.
  41. 41. Para esto dicho comité decide realizar una campaña en seis hospitales que estánubicados en tres de las zonas colombianas donde se ha detectado la enfermedad.1.1.2.6. Determinar: población, muestra y tipo de muestreo a utilizar. La población está formada por todas las personas que habitan en Colombia
  42. 42. y que han contraído la malaria. La muestra estará formada por lospacientes seleccionados en los seis hospitales y que además tienen laenfermedad.. Las zonas de mayor registro de contagio en Colombia son la costa pacifica,la costa atlántica y la Amazonía. Dado que la población está dividida en tresgrandes zonas, es posible seleccionar dos hospitales por zona y luego enforma aleatoria, se puede seleccionar la muestra. Por ello, la muestra serátomada de forma estratificada.EEJJEEMMPPLLOO 22..33..Para mejorar el servicio a los usuarios, el director de un hospital realizará unestudio relacionado con el tipo de sangre que ellos tienen Dada la gran cantidadde pacientes a los cuales se les presta el servicio, decide encuestar a 400 delosusuarios que normalmente acuden al hospital en un mes.Determinar: población, muestra y tipo de muestreo a utilizar. La población incluye a todos los usuarios que normalmente acuden al hospitalen un periodo de un mes. La muestra estará formada por los 400 usuariosencuestados.. En este caso, la característica fundamental del estudio (el tipo de sangre)haceque no haya una distinción especial en la población, lo cual indica que no serequiere de una estratificación. Por ello, la muestra será tomada de formaaleatoria simple.1.1.3. LECCIÓN 3. VARIABLES ESTADÍSTICASUna variable es una característica que va a sr estudiada en una población.
  43. 43. Una variable es estadística, si se puede escribir como una pregunta cuyasrespuestas pueden ser tabuladas o clasificadas en determinados rangos, o sipertenecen a una pregunta cuya respuesta tiene un valor correspondiente a unaescala numérica.Las variables estadísticas se clasifican en cualitativas y cuantitativas
  44. 44. 1.1.3.1 VARIABLES CUALITATIVASUna variable es cualitativa si en la característica que se va a estudiar sebuscaconocer gustos, preferencias u opiniones, etc.; por ejemplo: tipo de sangre,gaseosa preferida, color de cabello.Una variable cualitativa es estadística cuando es posible clasificar los datosobtenidos de la muestra en clases bien definidas, en las cuales el individuo quesuministra la información pueda elegir una de ellas.Cuando una variable es cualitativa es necesario determinar las posiblesrespuestas.1.1.3.2 VARIABLES CUANTITATIVASUna variable es cuantitativa si la característica que se va a estudiar se pudemediren una escala numérica.. Si la variable tiene la capacidad de tomar cualquier valor que exista entredos magnitudes dadas, entonces esta variable será continua.. Si por el contrario, sólo puede tener una valor de entre cierta cantidad devalores dados, entonces será discreta.1.1.3.3 ESCALA DE MEDIDA DE VARIABLESUna escala es la relación numérica entre la longitud real y la longitud que seasigna en el plano en el cual se va a representar su gráfica.
  45. 45. Las variables cuantitativas pueden ser consideradas en diferentes escalasteniendo en cuenta las unidades asociadas a la población que se encuentra enestudio.Los datos asociados a un estudio deben estar en las mismas unidades, de talmanera que sea posible asignarles una escala a todos.La notación de una escala es de la forma 1 : n, lo cual indica que n unidades demedida están representadas en el gráfico e una sola.
  46. 46. EEJJEEMMPPLLOO 33..11..Los profesores de Educación Física de un colegio medirán la estatura de losniñosde secundaria en cada uno de los grados.En este caso, la variable estatura es cuantitativa y continua ya que los datosqueresultan son números reales; es posible considerar las mediciones en centímetroso en metros. El profesor de educación física puede usar un escala de 1 : 10 enlacual cada 10 centimetros de ltura están representados en 1 cm del gráfico.Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cmla representación gráfica de la escala 1:10 es la siguiente: http://127.0.0.1:51235/100105/resources/f-111.jpg_EEJJEEMMPPLLOO 33..22..En cada una de las siguientes situaciones, identificar la variable de estudio.Determinar si es cualitativa o cuantitativa.1. En un barrio de la ciudad se aplicó una encuesta para conocer el consumo, encentímetros cúbicos, del servicio de gas natural.2. El alcalde de la ciudad quiere revisar la situación de violenciaintrafamiliar en lasfamilias de estrato 3, 4, 5.3. El número de hermanos de cada jugador del equipo de futboll.4. En un café gourmet, se decidió preguntar por el tipo de variedad que másconsumen sus clientes.
  47. 47. Solución1. La variable es consumo de gas. Es cuantitativa y continua2. La variable es situación de violencia. Es cualitativa3. La variable es número de hermanos. Es cuantitativa y discreta4. La variable es variedad de café. Es cualitativa.
  48. 48. 1.1.4. LECCIÓN 4. CARACTERIZACIÓN DE UNA VARIABLE CUALITATIVACaracterizar una variable significa describir su comportamiento en la población,según algunos parámetros establecidos. De acuerdo con el tipo de variableestadística que se desee estudiar existen distintas técnicas paracaracterizarla.EEJJEEMMPPLLOO 44..11..Una agencia de noticias quiere saber cuál es el medio de comunicación por elcuálse informan las personas, sobe las noticias del país. Para ello, realizó unestudio acuarenta personas a quienes se les preguntó por su medio de información denoticias preferido. Se obtuvo la siguiente lista de datos. http://127.0.0.1:51235/100105/resources/g-1.jpgEl tipo de variable que se registra en este estudio es cualitativa, puesto quepregunta por el medio de información.El estudio de una variable cualitativa requiere de la incorporación de algunoscriterios, de tal manera que al obtener una lista de preferencias, cualidades ogustos, se pueda analizar su comportamiento en la población. Para caracterizaruna variable cualitativa se utilizan tres herramientas:. Tablas de frecuencias. Representaciones gráficas. La moda1.1.4.1 TABLAS DE FRECUENCIAS:Una distribución o tablas de frecuencias es un resumen de los datos en el cual,cada opción de respuesta de la variable se relaciona con el número de datoscorrespondiente.
  49. 49. Una tabla de frecuencias contiene:
  50. 50. Clases: que corresponde a opiniones, gustos, preferencias, cualidades ocaracterísticas.Frecuencia: es el número de datos que pertenece a cada clase. La frecuencia sesimboliza con f . El conteo de la frecuencia de cada clase se puede registrarmediante marcas en grupos.Frecuencia Relativa: es el cociente entre la frecuencia y el número total dedatos,se simboliza fr . La frecuencia relativa representa un porcentaje, que se hayamultiplicando por 100 al cociente indicado de la frecuencia relativa.La siguiente tabla de frecuencias corresponde a los datos de la variable mediodecomunicación del ejemplo 4.1 http://127.0.0.1:51235/100105/resources/g-2.jpgEs necesario interpretar la información contenida en las tablas de frecuencia,paradeducir cuales son las principales características de la variable en estudio.Por ejemplo, en la tabla anterior se puede apreciar que:. La mayoría de personas el 37.5% se informan de las noticias por medio dela televisión y la menor cantidad un 10,8% se informa haciendo uso de lainternet.. Hay un 52,5% de personas que se informan de las noticias haciendo uso dela radio o de la prensa.1.1.4.2 REPRESENTACIONES GRAFICAS:Un gráfico estadístico es un resumen visual de la tabla de frecuencias. Hayvariostipos de representaciones gráficas para las variables cualitativas: losdiagramas debarras, los diagramas circulares, entre otros.
  51. 51. 1.1.4.2.1 Diagramas de barras: un diagrama de barras es una representacióngráfica de los datos asociados a una variable cualitativa.
  52. 52. La gráfica se realiza en sistema de coordenadas cartesianas, en el ejehorizontalse representan las clases correspondientes a la variable y en eje vertical serepresentan las frecuencias correspondientes a cada clase.El diagrama de barras (figura 1.1) correspondiente a la variable medios decomunicación de nuestro ejemplo es el siguiente:FIGURA 1.1 http://127.0.0.1:51235/100105/resources/g-3.jpg1.1.4.2.2 Diagrama Circular: un diagrama circular es la representación gráficadelos datos en un círculo. El diagrama circular presenta los porcentajescorrespondientes a cada clase.En un diagrama circular, la información correspondiente a cada clase serepresenta usando sectores circulares, por lo cual es necesario hallar el ángulocorrespondiente a cada frecuencia, (ver figura 1.2)
  53. 53. FIGURA 1.2 http://127.0.0.1:51235/100105/resources/g-4.jpg1.1.4.3 MODALa moda es el dato que tiene mayor frecuencia, es decir, el dato que mas serepite.Para el ejemplo 4.1, la moda corresponde a informarse de las noticias por mediode la televisión; es decir, si se encuesta a una persona al azar la probabilidadquese informe por las noticas es alta, ya que corresponde al 37.5% del total.Hay estudios en los cuales no existe la moda, ya que todas las clases tiene unamisma frecuencia, y hay casos en los cuales existen varias modas, pues variasclases pueden tener la misma frecuencia.1.1.5. LECCIÓN 5. TABLAS DE CONTINGENCIA:En una tabla de contingencia o tabla cruzada las filas corresponden a las clasesde una variable cualitativa y las columnas corresponden a las clases de la otravariable cualitativa.La tabla de contingencia, también es una tabla de frecuencias, ya que lainformación contenida en cada una de las casillas corresponde a la cantidad depersonas o individuos que poseen ambas características.En general, la tabla de contingencia ofrece una completa distribución de lainformación, ya que tiene en cuenta las diferentes clases que se puedenestablecer para cada una de las variables en estudio.
  54. 54. EEJJEEMMPPLLOO 55..11..Con el fin de determinar que materias opcionales, en deportes, se podríanproponer a los estudiantes de una universidad, se hizo necesario hacer unestudioacerca de la actividad física que ellos realizan en su tiempo libre, para ello,hizouna encuesta entre 156 estudiantes de varias carreras y se les preguntó acercadesu deporte preferido para practicar en tiempo libre. Los resultados se muestranenla siguiente tabla de contingencia. (ver tabla 1.1)TABLA 1.1TABLAS DE CONTINGENCIAEn la tabla de contingencia se observa:http://127.0.0.1:51235/100105/resources/g-5.jpgHay dos variables cualitativas que son género y deporte favorito. Para la variable género hay dos clases hombre y mujer. En la variable deporte preferido hay 5 clases: futbol, baloncesto, voleibol,atletismo y otros.. correspondiente, al cruce de las clases de las dos variables en estudio. Porejemplo el número 38 corresponde al número de mujeres que prefieren elbaloncesto.. Las sumas de filas corresponde a la cantidad de hombres y a la cantidad demujeres que participaron en la encuesta, sin discriminar el deportepreferido. Se puede decir que participaron 72 hombres y 82 mujeres en elestudio.. Las sumas de columnas corresponde a la cantidad de personas queprefieren cada uno de los deportes sin distinguir el género. Por ejemplo: hay38 personas que prefieren futbol, 52 personas prefieren baloncesto, 29personas prefieren el voleibol, 19 el atletismo y 18 personas prefieren otrosdeportes.. El número total de personas que participaron en el estudio debe ser igualtanto en la suma correspondiente a la variable género (vertical), como en lasuma correspondiente a la variable deporte preferido (horizontal). En amboscasos, la suma es 156 personas.. A partir de la información de la tabla anterior se puede construir la tabla de
  55. 55. contingencia de frecuencias relativas , en este caso se debe escribir uncociente entre la información contenida en cada celda y el número total depersonas que participaron en la encuesta.TABLA 1.2TABLA DE CONTINGENCIA DE FRECUENCIA RELATIVAS http://127.0.0.1:51235/100105/resources/g-7.jpgYa que cada uno de los cocientes mostrados tiene su equivalencia en porcentaje,se puede construir la tabla de contingencias de porcentajes como se muestra enlatabla 1.3TABLA 1.3TABLA DE CONTINGENCIA DE PORCENTAJESUn buen análisis incluye la descripción de los porcentajes más altos, los masbajosy aquellos que tiene mayor representación.http://127.0.0.1:51235/100105/resources/g-6.jpg. El 24.36% de la personas que fueron encuestadas fueron mujeres queprefieren practicar el baloncesto. El 3,85% de los hombres se inclinan por el atletismo y el 1,92% de lasmujeres prefieren el futbol, el cual es el porcentaje mas bajo de la muestra. El deporte que mas practican independientemente del género, es elbaloncesto con un 33.33%.
  56. 56. 1.2. CAPITULO 2 .INVESTIGACIÓN ESTADÍSTICALa investigación estadística, por sencilla que sea, es una operación compleja,querequiere atender múltiples aspectos, y que genera muy variadas funciones.El resultado depende en gran parte de la finalidad que se persiga, de lanaturalezade los fenómenos que se desean estudiar y de la facilidad que se tenga paraobservar los elementos.1.2.1. LECCION 6. PLANEACIÓNLa planeación de una investigación estadística debe abarcar el conjunto delineamientos, procedimientos y acciones que conlleven a la resoluciónsatisfactoriapara la cual se estableció la investigación. Es por ello que el plan deinvestigacióndebe fijar concretamente su objeto, el fin que persigue, la fuente o fuentes deinformación, los procedimientos a seguir y resolver los aspectos logísticos,físicosy humanos siguiendo un presupuesto de costos establecido.La investigación estadística puede ser tan sencilla y poco compleja como larecopilación ordenada y coherente de datos que se encuentren en institucionesestatales o privadas que las suministren, o bien pueden ser tan elaboradas ycomplejas como lo son los censos poblacionales, los censos agrícolas oindustriales que tengan importancia estratégica para una región, o inclusiveparaun país. Pero, sea como fuere, la investigación debe seguir una orientación ensuplanteamiento y resolución.A continuación se presentan algunos aspectos básicos que se deben seguirpara desarrollar un trabajo así.
  57. 57. 1.2.1.1. Definición del objeto de investigaciónDebe responder el qué, el cómo y establecer el momento correcto parahacerse, debe también restringir el espacio físico o geográfico donde se llevaráacabo. Es este punto el núcleo de la investigación, es por ello que no puedehaberambigüedad en sus planteamientos y alcances.
  58. 58. 1.2.1.2. Unidad de investigaciónSe trata del elemento de la población que origina la información. La unidado elemento de investigación debe ser clara, adecuada, mesurable y comparable.Debe determinarse la naturaleza cuantitativa o cualitativa de esta unidad, esdecir, definir qué aspectos de la unidad de investigación son cuantitativos(registrados por medio de números) o cualitativos (recogidos medianteanotaciones literarias). También ha de considerarse la posibilidad o viabilidadde lainvestigación y si estos aspectos pueden ser conocidos con precisión. De igualmanera, es necesario delimitar esta unidad en el tiempo y en el espacio, y avecesen el número.1.2.1.3 Clase de investigaciónEn la planeación, debe también tenerse en cuenta el tipo de investigaciónque se va a realizar. Ésta puede ser descriptiva, que consiste en obtenerinformación con respecto a grupos; experimental o controlada, provocada por elinvestigador en condiciones controladas, en la que se busca conocer por quécausa se produce un caso particular; o bien, explicada o analítica, que permiteestablecer comparaciones y verificar hipótesis.1.2.1.4 Las fuentes de informaciónDespués de determinar el qué y el por qué de la investigación estadística,se debe preguntar el dónde conseguir la información requerida. Se trata entoncesde definir las fuentes de información. Estas pueden ser directas o indirectas.
  59. 59. Una fuente de información estadística directa es aquella en donde el hechose produce. Este tipo de fuentes son las mejores, pero no siempre son posibles.Cuando no sea posible, se emplea una fuente de información estadísticaindirecta, aquella donde el hecho se refleja. En muchos casos este tipo defuentes son complementarias de las primeras.Cuando los datos son primarios, ellos pueden provenir de muchas fuentescomo: hechos, información cotidiana y fácil de identificar; opiniones, referidosalo que la gente piensa respecto a algo; motivos, razones que explican por qué seactúa de una manera u otra. Cuando son secundarios ellos provienen de unafuente interna, cuando los datos son recopilados por la misma entidad en losregistros básicos de la misma organización, o bien pueden provenir de una fuente
  60. 60. externa, cuando los datos se recopilan por otra entidad diferente a la que hacelainvestigación.1.2.2. LECCION 7 RECOLECCIÓNDespués de planeada la investigación, comienza la recolección de losdatos. Esta consiste en un conjunto de operaciones de toma de datos que puedeser por observación, por encuesta o tomada de publicaciones y/o fuentesconfiables que han efectuado investigaciones estadísticas. Para esto seselecciona el método de recolección de la información acorde a las necesidadesde la investigación, que se clasifican según su cobertura y según su forma deobservación.1.2.2.3 Según la coberturaSe trata de decidir si se va a estudiar a la población en su totalidad o sólouna parte de ella. Si lo que se desea es atender a una cobertura total, es decircontar con todos los elementos de las fuentes de información, se usa el censo.Si,en cambio, se hace una enumeración parcial de las fuentes de información, se usael muestreo.Por su menor costo, mayor rapidez y menor número de personas queintervienen en la investigación, el muestreo es el método más utilizado. Elmuestreo puede ser de dos tipos: muestreo probabilístico o al azar, cuandocada uno de los elementos tiene la misma probabilidad de ser escogidoobteniendo así una muestra aleatoria; y muestreo no probabilístico, cuando elinvestigador selecciona los datos a su propio criterio, de manera caprichosa,porconveniencia o por cuotas, de manera que las muestras no son seleccionadasaleatoriamente y los resultados no ofrecen confiabilidad alguna.1.2.2.4 Según la forma de observación
  61. 61. En este método se tiene en cuenta la forma de medición del dato. Si sehace de manera que la fuente de información se da cuenta de la medición queefectúa, se dice que se toman los datos por encuesta. Éstas se pueden realizarpor correo, entrega personal de cuestionario, entrevista, motivación, teléfono,etc.El otro método de recolección de información es por observación, endonde la medición se realiza sin que la fuente de información se dé cuenta delhecho. Este método se basa en el registro de los eventos que ocurren, porejemplo cuando se examina el número de estudiantes que entran a la biblioteca
  62. 62. con el fin de hacer una consulta referida a las Ciencias Sociales, simplementeseobserva la acción del estudiante al entrar a la biblioteca: si hace o no laconsultaque se investiga. Este método puede ser también indirecto cuando la recolecciónconsiste en corroborar los datos que otros han observado.1.2.3. LECCION 8 ORGANIZACIÓN DE LA INFORMACIÓNLuego de tomar la información necesaria en la investigación que se sigue,se obtiene una gran cantidad de datos que requieren ser interpretados y sobreloscuales se busca concluir algo específico. Para esto se debe depurar y clasificarlainformación aplicando técnicas adecuadas.La organización y el resumen de la información son dos procesos distintosque se desarrollan por separado. La organización hace referencia al arreglo delosdatos en un formato lógico para su interpretación. En cambio, el resumen implicala condensación de varias mediciones en una forma compacta, ya sea gráfica onuméricamente. De ahí que se tome primero la forma de organizar la informacióntomada en una investigación estadística.La información estadística puede organizarse de diversas maneras:ordenando el conjunto de datos como una combinación ordenada o en un arreglodenominado tallo y hojas, otro de los métodos usados es el uso de tablas y másespecíficamente la tabla de frecuencias. A continuación se hace un acercamientoa las diferentes formas de organizar los datos estadísticos tomados en elprocesode recolección de una investigación estadística.1.2.4.1 Combinación o arreglo ordenadoEl sólo hecho de tener ordenado un conjunto de datos en forma ascendente
  63. 63. o descendente, permite un rápido análisis e interpretación de estos.EEJJEEMMPPLLOO 88..11..Los siguientes datos representan la evaluación de los latidos cardíacos de ungrupo de 30 personas después de cierta actividad física.829592628592829570858495918294768891878068587685110
  64. 64. 6075886474
  65. 65. Es muy poca la información que arroja este conjunto de datos cuando seencuentran sin un tratamiento. A continuación estos datos son presentados comouna combinación ordenada en forma ascendente (de menor a mayor):587080858894607482859195627582859195647682879295687684
  66. 66. 8892110A partir de esta lista ordenada se pueden concluir varias cosas:. La más alta evaluación de latidos es 110. La más baja evaluación de latidos es 58. La mitad de la combinación se encuentra entre 82 y 85. Hay una predominancia en los latidos con una evaluación entre 80 y 95. Hay un .vacío. entre el valor 95 y el valor 110, es decir hay una ciertacontinuidad en los valores entre 58 y 95, pero 110 se encuentra más alejadodel grupo de datos.. Hay una evaluación atípica dentro del grupo de 30 personas, el que registra elvalor 110. Es posible que esta persona tenga perturbaciones cardíacas. Sinembargo, es necesario ampliar la información antes de lanzar un juicioapresurado.1.2.4.2 Arreglo de tallo y hojasEl arreglo de tallo y hojas es una técnica que resume de manera simultánea losdatos en forma numérica y presenta una ilustración gráfica de la distribución.Se trata de organizar los datos numéricos en dos columnas divididas por unalíneavertical. La primera, denominada tallo, corresponderá a las decenas, centenas ounidades que representan el grupo de datos y en la segunda, llamada hojas, iránlas correspondientes decenas, unidades o décimas. Para una mejor ilustración, enel siguiente ejemplo se continuará con los datos del ejemplo 8.1. Para construirelcorrespondiente arreglo de tallo y hojas.EEJJEEMMPPLLOO 88..22..
  67. 67. Tomando la serie de datos del ejemplo 8.1., se puede observar que éstos tienenun rango desde los cincuentas hasta los ciento diez. Ellos se pueden presentarcomo un arreglo de tallo y hojas en una columna de números del 5 al 11 ytrazando una línea vertical a su derecha. Estos números representarán el tallo.En
  68. 68. la columna de las hojas, se enlistan las unidades (de manera ordenada) de cadauno de los datos registrados y correspondientes con su respectiva decena.Figura 2.1.Diagrama de tallo y hojas para los datos de pulsaciones del ejemplo 8.1.TalloHojas5860 2 4 870 4 5 6 680 2 2 2 4 5 5 5 7 8 891 1 2 2 4 5 5 510110Observe que el diagrama de tallo y hojas al mismo tiempo que ordena los datos deforma ascendente, permite una visualización del comportamiento de estos. Coneste se pueden confirmar muchas de las afirmaciones que se hacían en el ejemplo8.1.. La mayoría de los registros de latidos cardiacos del grupo de 30 personas seencuentra entre los ochentas.
  69. 69. . La forma general del conjunto de mediciones es asimétrico.. Se ve más claramente el .vacío. que existe entre los valores 95 y 110, y seresalta cómo el valor de 110 se encuentra aislado del resto de conjunto dedatos.Si se quisiera clasificar más ampliamente los datos, se usa un diagrama de dobletallo. Que consiste en dividir en dos cada posición del tallo, en grupos decincohojas. La primera posición del tallo dispone las hojas 0, 1, 2, 3, 4; y lasegundaposición dispone las hojas 5, 6, 7, 8, 9.
  70. 70. Figura 2.2.Diagrama de doble tallo y hojas para los datosde pulsaciones del ejemplo 8.1.TalloHojas55860 2 46870 475 6 680 2 2 2 485 5 5 7 8 891 1 2 2 495 5 510
  71. 71. 10110Observe ahora que esta subdivisión más fina entrega más detalles del conjunto dedatos. ¿Qué puede concluir usted?1.2.4.3 Tabulación de la informaciónUna de las mejores técnicas usadas en la estadística es la elaboración detablas o cuadros. En ellos se plasman las series estadísticas, una sucesión dedatos referentes a un fenómeno observado a través del tiempo y del espacio.Una serie cronológica es aquella donde se analiza un fenómeno a travésdel tiempo en un espacio determinado. Por ejemplo, el número de egresados de laUNAD en el período 1994-2004 (ver tabla 2.1.)
  72. 72. Tabla 2.1.Número de egresados de la UNAD en el período 1994-2004AñoNúmero deegresados199433819954241996556199797119981358199921192000332820014357200234002003369720044774
  73. 73. Total25322Una serie espacial es aquella donde se estudia un fenómeno a través del espacioen un tiempo determinado. Por ejemplo, el total de estudiantes de la UNAD en laZona Occidente en el primer semestre de 2005.Tabla 2.2.Clasificación de estudiantes por CEAD en la Zona Occidentedurante el primer semestre de 2005CEADNúmero deestudiantesMedellín1507Pereira1850La Dorada350Turbo371Total4078
  74. 74. Una serie cualitativa es aquella donde se estudia un atributo o característicadela población investigada, independiente del tiempo y del espacio. Por ejemplo,losempleados de una empresa clasificados por cargo.Tabla 2.3.Clasificación de empleados por cargoCargoCantidadAdministrador1Jefe de producción1Contador1Secretaria2Supervisor5Operario45Vigilante3Total58Una serie cuantitativa es aquella donde se expresa numéricamente un atributo ocaracterística de la población en estudio, independiente del tiempo y delespacio.Por ejemplo, la estatura en centímetros de un grupo de estudiantes de quintogrado.
  75. 75. Tabla 2.4.Clasificación de la estatura de los estudiantes de un grupo de quinto gradoEstatura(en centímetros)Número deestudiantes125 – 1291129 – 1334133 – 1379137 – 14124141 – 14528145 – 14922149 – 15312Total100
  76. 76. 1.2.5 LECCIÓN 9 TABLAS DE DISTRIBUCION DE FRECUENCIAS1.2.4.1 Distribuciones de frecuenciasUna tabla de frecuencias es otro de los formatos que se usan paraorganizar y resumir los datos. Para comprender la técnica de la distribución defrecuencias y dominar sus aplicaciones, es necesario manejar algunos conceptoscon suficiente claridad. Y para ello se parte del concepto básico en ladistribuciónde frecuencias: el número de veces que un dato se repite de un conjunto de datosse le denomina frecuencia.Un conjunto de datos puede organizarse de diferentes maneras. Una deellas es construir una distribución de frecuencias simple, que indica lasfrecuencias con que aparecen los datos. Es este el tipo de distribución defrecuencias más utilizado en estadística, pues permite conocer el comportamientode un conjunto determinado de datos y no se ocupa de detalles individuales que,en muchos casos, poco puede ayudar en la toma de decisiones.EEJJEEMMPPLLOO 99..11..Continuando con la serie de datos del ejemplo 8.1., organice los datos en unadistribución de frecuencias simple.
  77. 77. Tabla 2.5.Distribución de frecuencias simple de latidos cardiacos de 30 personasVelocidaddepulsacionesFre-cuenciaVelocidaddepulsacionesFre-cuenciaVelocidaddepulsacionesFre-cuencia58176294159077095360178096
  78. 78. 06107909706218019806308109906418231000650830101066
  79. 79. 08411020670853103068186010406908711050701882106071089
  80. 80. 01070720900108073091210907419221101751930TOTAL30Observe que esta manera de agrupar se vuelve engorrosa cuando se tienenmuchísimos datos. Otra forma de organizar un conjunto de datos es construir unadistribución de frecuencias agrupadas, que indica las frecuencias con queaparecen los datos agrupados en lo que se denomina intervalos de clase. Cadaintervalo de clase está limitado por dos valores, llamados límites de clase(límite
  81. 81. inferior y límite superior). La diferencia entre estos límites en cada intervalodeclase se denomina ancho, tamaño o amplitud del intervalo de clase.Clase es, entonces, un grupo que presenta una característica comúncuantificable del conjunto de datos. El valor correspondiente al punto medio deunintervalo de clase es la marca de clase y su valor es igual a la mitad de lasumade los límites de clase del intervalo de clase. Y se interpreta como el valorquecorresponde asignar a cada uno de los elementos del intervalo de clase.El rango o recorrido es la diferencia entre los valores extremos de todo elconjunto de datos; en él se encuentran distribuidos todos los datos.
  82. 82. En la construcción de la distribución de frecuencias se deben responder aestos interrogantes fundamentales: ¿Cuántos intervalos de clase crear?, ¿Cuáldebe ser el tamaño de cada intervalo?, ¿Qué propiedades posee cada intervalo?Las siguientes pautas resuelven estas inquietudes.. Hallar el rango (R) o recorrido del conjunto de datos.. Seleccionar el número de intervalos de clase (k). Este número depende de lacantidad de datos disponibles. Una de las técnicas usadas es la Regla deSturges (desarrollada por H. A. Sturges en 1926). Esta regla afirma que elnúmero de intervalos de clase (k), viene dado por: nklog322.31..donde n es el tamaño de la muestra. Si de este cálculo resulta un númerodecimal, éste de redondearse al entero superior.Esta fórmula ha sido usada para obtener los números de intervalos de claseque aparecen en la tabla 2.6. y que permite sugerir el número de intervalos declase que debe usarse de acuerdo al tamaño de la muestra. De esta manera, elcálculo del número de intervalos de acuerdo al tamaño de la muestra, puededeterminarse bien por la Regla de Sturges o bien por la tabla 2.6.. Hallar el ancho o amplitud del intervalo de clase (A). Los intervalos de clasetienen por lo general el mismo ancho, de modo que al fijarse el número declases se obtiene éste por una operación aritmética simple:kRA.donde R es el rango o recorrido y k es el número de clases. Si este cociente noes un entero, conviene redondear al entero superior. De manera que el rangoes alterado y requiere, por tanto, efectuar un ajuste:
  83. 83. ))((*kAR.. Con este nuevo rango, se tendrá entonces un exceso que deberá distribuirseentre el límite superior y el límite inferior. Este exceso es calculado restandoelrango del nuevo rango. *RRExceso..
  84. 84. Este valor debe distribuirse lo más equitativo posible, esto no quiere decir quesea repartido en partes iguales a los datos extremos, se trata de distribuir elexceso entre el límite inferior y el límite superior de modo que sea consideradola tendencia general de los datos.. Formar los intervalos de clase. Se agrega al límite inferior de cada clase,iniciando por el límite inferior del rango.1.A. Fijar los límites reales de cada intervalo de clase. Dado que los intervalosdeclase son mutuamente excluyentes, es decir, no permiten ambigüedad en loslímites cuando estos se repiten como inferior de un intervalo y como superioren el siguiente intervalo, se determinan los límites reales de clase. Estoscorresponden al punto medio entre el límite superior de una clase y el límiteinferior de la clase siguiente.En muchos casos se permite que se repita el límite superior de una clase y ellímite inferior de la clase siguiente, haciendo la salvedad de cuál clase serátomada por dicho límite. En general, es considerado el límite superior de laclase como valor de esta.. Determinar la frecuencia de clase. Contando el número de observaciones quecae dentro de cada intervalo de clase.. Construir la tabla de distribución de frecuencias agrupadas.Tabla 2.6.Número de intervalos de clases sugerido en función del tamaño de la muestraTamaño muestralNúmero deintervalos de
  85. 85. claseMenos de 16Datos insuficientes16 – 31532 – 63664 – 1277128 – 2558256 – 5119512 – 1023101024 – 2047112048 – 4095124096 – 819013
  86. 86. EEJJEEMMPPLLOO 99..22..Para los datos del ejemplo 8.1. Elabore una tabla de distribución de frecuenciasagrupada. Para esto, se seguirán los pasos propuestos:. Rango = 110 – 58 = 52. Número de clases. Aplicando la Regla de Sturges: 691.530log322.31....kSi se usa la tabla 2.6., esta indica que deben usarse 5 clases. Queda a criteriodel investigador la decisión. En este caso se trabajará con el resultado quearroja la Regla de Sturges.. Amplitud de los intervalos de clase. 967.8652...A. Como se ha redondeado, debe hallarse el nuevo rango: 54)6)(9(*..R. Existe pues un exceso de 2, [54 – 52 = 2]. Este exceso debe distribuirsequitando 1 al límite inferior y agregando 1 al límite superior:111111057158......máxmínXX
  87. 87. Si en el cálculo del exceso, este hubiera sido un número impar, la distribuciónentre los límites se calcularía considerando hacia dónde se agrupan más losdatos. En este caso, los datos tienen una mayor tendencia hacia el límiteinferior de modo que el exceso mayor se repartiría en él.. Intervalos de clase. Se agrega al límite inferior de cada clase,iniciando por el límite inferior del rango. Así:8191....A57 + 8 = 6566 + 8 = 7475 + 8 = 8384 + 8 = 9293 + 8 =101102+8 =110
  88. 88. . Límites reales. 56.5, 65.5, 74.5,–, 110.5. Que se obtiene de calcular la sumade cada límite y dividirlo entre dos. Así: ...5.74275745.65266655.5625756....... Frecuencias de clase en cada intervalo.Tabla 2.7.Distribución de frecuencias agrupadas de la velocidad de pulsacionesIntervalos de clase(Velocidad depulsaciones)Frecuencia(Número depersonas)56.5 – 65.5465.5 – 74.5374.5 – 83.5783.5 – 92.51192.5 – 101.5
  89. 89. 4101.5 – 110.51Total30Al obtener la tabla de distribución agrupada como en el ejemplo 9.2., sonmuchos los interrogantes que continúan sin responderse como: ¿Qué porcentajedel grupo de personas evaluadas presentan pulsaciones entre 74.5 y 83.5? Latabla 2.7. indica que son 7 personas pero ¿Qué porcentaje es ese? Y, más aún¿Qué porcentaje de la muestra presentan, por ejemplo, pulsaciones menores de92.5?Cuando se habla de la frecuencia de una clase, se refiere a la frecuenciaabsoluta, pero si ésta se da en términos del total de frecuencias se tieneentoncesla frecuencia relativa. Esta se obtiene en porcentaje al dividir la frecuenciadeclase entre el número total de frecuencias (o tamaño de la muestra). 100..nffrdonde fr es la frecuencia relativa de clase, f es la frecuencia absoluta declase y nes el tamaño de la muestra. En la tabla 2.8. de distribución de frecuencias
  90. 90. agrupadas de los datos del ejemplo 8.1., se calculan las correspondientesfrecuencias relativas de cada intervalo de clase.Tabla 2.8.Distribución de frecuencias absolutas, relativas yacumuladas ascendentes de la velocidad de pulsacionesIntervalos declase(Velocidad depulsaciones)Frecuencia(Número depersonas)Frecuenciarelativa(%)FrecuenciaabsolutaacumuladaAscendenteFrecuenciarelativaacumuladaAscendente56.5 – 65.5413.3%413.3%65.5 – 74.5310%7
  91. 91. 23.3%74.5 – 83.5723.4%1446.7%83.5 – 92.51136.7%2583.4%92.5 – 101.5413.3%2996.7%101.5 – 110.513.3%30100%Total30100%La distribución de frecuencias acumuladas se construye con el cálculode la frecuencia absoluta acumulada y la frecuencia relativa acumulada. Laprimera es la acumulación sucesiva en forma descendente o ascendente de lasfrecuencias absolutas. Si la frecuencia absoluta acumulada es ascendente, laprimera frecuencia absoluta corresponderá a la primera frecuencia absolutaacumulada. La segunda acumulada se obtiene sumando las dos primeras
  92. 92. absolutas, y así sucesivamente. La última frecuencia absoluta acumuladacorresponderá al número total de frecuencias.De la misma manera, la frecuencia relativa acumulada es una acumulaciónsucesiva en forma ascendente o descendente de frecuencias relativas. Si esascendente, la última frecuencia relativa acumulada tendrá un valor del 100%. Enla tabla 2.8. se expresan estos tipos de frecuencia tomando los datos delejemplo8.1.Esta tabla arroja información tan completa que permite concluir afirmacionestales como:. El 36.7% de las personas evaluadas registran pulsaciones entre el 83.5 y 92.5y sólo el 3.3% registran valores altos, entre 101.5 y 110.5.
  93. 93. . De las 30 personas, 25 de ellas no superan registros de 92.5 pulsaciones; estocorresponde al 83.4% del total.Construya la distribución de frecuencias absoluta acumulada descendente yrelativa acumuladas descendente con los datos de la velocidad de pulsaciones.¿Qué porcentaje de la muestra registra valores superiores a 92.5? ¿A cuántaspersonas corresponde? ¿Qué porcentaje registra valores de más de 75?1.2.5 LECCIÓN 10 PRESENTACIÓN DE LA INFORMACIÓNAnteriormente se mencionó que la organización y el resumen de lainformación son dos procesos distintos que se ejecutan en forma independiente.Ya se ha desarrollado todo cuanto tiene que ver con la organización de lainformación, se verá ahora lo que implica el resumen o presentación de lainformación. Se trata pues de conocer algunas técnicas de construcción degráficas, que es la mejor manera para resumir una investigación estadística.A continuación, se tratarán las partes más fundamentales de una gráfica ylos aspectos a tener en cuenta para su construcción, luego se presentarán losdistintos tipos de gráficas usadas más comúnmente en estadística entre lascualesse encuentran el histograma, el polígono de frecuencias, la ojiva, los gráficosdepuntos, lineales, de barras y circulares y los pictogramas.1.2.5.6 Componentes de una gráficaCuando se diseña una gráfica, sea esta cual fuere, deben tenerse encuenta ciertos aspectos con el fin de mejorar su apariencia y mostrar conclaridadlo que se quiera que ella refleje.
  94. 94. Una gráfica siempre debe poseer un título que indique la descripción delcontenido de ella. En muchas ocasiones, es importante indicar la escala con laque se trabaja. Es decir, identificar los ejes coordenados (X y Y) e indicar susmagnitudes correspondientes. La escala se aplica para saber la dimensión delfenómeno graficado. Otro aspecto importante a tener en cuenta es la fuente deinformación, que indique de dónde han sido tomados los datos incluyendo el tipode publicación, el año del registro y otros indicadores que resulten importantespara la investigación.La forma y el tipo de la gráfica que se seleccione depende en gran parte delinvestigador o de quien la elabora, sin embargo debe tenerse en cuenta para
  95. 95. quién va dirigida ésta, el lugar de exposición y otros factores de logística queintervienen en la decisión del mejor diseño. Existen ciertos principiosgeneralesque se deben tener en cuenta en el logro de una buena gráfica:. Si en la investigación se tienen varias gráficas, estas deben estar enumeradasen forma consecutiva.. Toda gráfica debe tener un título que aclare su contenido.. En los diagramas, las líneas de la ordenada y la abscisa que llevan escala,deben ser más gruesas que las demás.. La mejor gráfica es la más sencilla. Evite saturar la gráfica de datos otextosinnecesarios. Haga uso de sólo lo estrictamente necesario.. La gráfica no sustituye el cuadro o la tabla, debe ser el complemento.. Toda gráfica debe ir acompañada de convenciones para identificar lascaracterísticas que se grafican.. La lectura de la escala del eje horizontal se hace de izquierda a derecha y ladel eje vertical se hace de abajo hacia arriba.. La representación del hecho debe variar sólo en una dimensión.. En toda gráfica se debe explicar la fuente de donde fueron obtenidos losdatos,aclarar las escalas, leyendas, notas, llamadas y convenciones que ayuden aidentificar e interpretar las características presentadas.. Las gráficas nunca preceden al texto.1.2.5.7 Diagrama de frecuenciasLos diagramas de frecuencia se representan por medio de líneasverticales, cuya altura está dada por los valores de las frecuencias, ya seanabsolutas o relativas. Si la representación se refiere a las frecuenciasacumuladas(absolutas o relativas), esta se hará por medio de líneas horizontales, ubicandoenel eje vertical los valores de la frecuencia acumulada. Este último diagrama,denominado diagrama de frecuencias acumuladas, genera una serie de líneashorizontales que dan la sensación de los peldaños de una escalera.
  96. 96. EEJJEEMMPPLLOO 1100..11111100..111100..11Tabla 2.9.Distribución de frecuencias simplede visita al odontólogo de niños entre los 6 y 12 añosEdad del niño(Años)Frecuencia absoluta(Número de visitas)Frecuencia absolutaacumulada233314426539671679258
  97. 97. 4299029101301103012030Total30Esta tabla de frecuencias indica las veces que un grupo de 30 niños de 6 a 12años de edad visitó en los últimos 6 meses al odontólogo. Construya un diagramade frecuencias absolutas y un diagrama de frecuencias absolutas acumuladas.Figura 2.3.Diagrama de frecuencias absolutasde visita al odontólogo de niños entre los 6 y 12 años0123456789100246810121401234567891002468101214EdadFrecuencia
  98. 98. Figura 2.4.Diagrama de frecuencias absolutas acumuladasde visita al odontólogo de niños entre los 6 y 12 años0510152025303501234567891011121305101520253035012345678910111213EdadFrecuenciaEn las figuras 2.3. y 2.4. se reflejan los diagramas de frecuencia absoluta yfrecuencia absoluta acumulada, respectivamente.Obsérvese que a partir de la figura 2.3. rápidamente se puede concluir que losniños de 7 años de edad son los que más han asistido al odontólogo en losúltimosseis meses de la muestra tomada.De igual manera se percibe un agrupamiento a la izquierda de los datos, es decirno es simétrica la gráfica. Este tipo de gráficos suelen llamarse asimétricossesgados a la izquierda.
  99. 99. En la figura 2.4. las dos últimas líneas horizontales son de mayor tamaño quelasdemás, esto se debe a que no hay registro de niños que asisten al odontólogo conedades de 9, 11 y 12 años.Se puede ver también que estas dos últimas líneas están menos separadas quelas otras, pues el .salto. se debe a que existe un niño de la muestra de 10 añosque sí ha asistido al odontólogo. En cambio, existe un gran .salto. a los 7años,¿sabe usted por qué?1.2.5.8 Histograma de frecuenciasEn el caso de las distribuciones de frecuencia agrupada, la forma derepresentación gráfica más común, se conoce con el nombre de histograma defrecuencias. Estos se construyen representando los intervalos de clase en la
  100. 100. escala horizontal y las frecuencias de clase (absolutas o relativas) en laescalavertical y trazando rectángulos cuyas bases equivalen a la amplitud de losintervalos de clase y sus alturas corresponden a las frecuencias de cada clase.En la figura siguiente se registra el diagrama de frecuencias absolutas delgrupo de datos del ejemplo 8.1. Nótese el origen o punto de partida de lavariablees cero y luego aparece un corte o puente, de manera que permite acortar ladistancia entre el origen y el primer valor de la variable. Esta convencióntambiénpuede usarse en el eje vertical u ordenada.Figura 2.5.Histograma de frecuencias absolutas de la velocidad de pulsaciones02468101256.5 –65.565.5 –74.574.5 –83.583.5 –92.592.5 –101.5101.5–110.5Velocidad de pulsacionesFrecuencia(númerode personas)02468101256.5 –65.565.5 –74.574.5 –83.583.5 –92.592.5 –101.5101.5–110.5Velocidad de pulsacionesFrecuencia(númerode personas)
  101. 101. 1.2.5.9 Polígono de frecuenciasDescribe también la información de la distribución de frecuencias absolutaso relativas. Pero se grafican las marcas de clase de cada intervalo, generandounasecuencia de puntos que se unen en segmentos de recta para formar un polígono,de ahí el nombre.El polígono puede dibujarse sobre el histograma de frecuencias o demanera independiente. En el primer caso, se unen los centros de las basessuperiores de los rectángulos; en el segundo caso, se unen los puntos deintersección de la abscisa, que corresponde a la marca de clase, con la ordenadacorrespondiente a la frecuencia relativa o absoluta. La figura 2.6. representaelpolígono de frecuencias de los datos graficados en el histograma de la figura2.5.
  102. 102. Figura 2.6.Polígono de frecuencias absolutasde la velocidad de pulsaciones012345678910111250556065707580859095100105110115120Velocidad depulsacionesFrecuencia(númerode personas)012345678910111250556065707580859095100105110115120Velocidad depulsacionesFrecuencia(númerode personas)1.2.5.10 OjivaContrario al polígono de frecuencias, la ojiva es una curva suavizada2. Lascurvas en estadística tienen diversas formas: estas se clasifican de acuerdo alaforma en simétricas y asimétricas siendo estas últimas sesgadas a la derecha oa la izquierda; y, según los máximos o picos que presenten, en unimodales,bimodales o multimodales.La ojiva es el gráfico de una distribución de frecuencias acumuladas(relativas o absolutas) y puede ser descendente o ascendente. Ella permitepresentar en un mismo gráfico, diferentes curvas lo que no permite el histogramade frecuencias. En el eje horizontal se ubican el límite superior de cadaintervalode clase y en el vertical, las respectivas frecuencias acumuladas, ya seanrelativaso absolutas. Luego se unen estos puntos en una curva suavizada, partiendo desdeel límite inferior del primer intervalo. Observe las siguientes figuras, querepresentan la ojiva ascendente y descendente de los datos tomados de velocidadde pulsaciones de una muestra de 30 personas (ejemplo 8.1.)2 Algunos autores consideran que la ojiva no es una curva suavizada, que estácompuesta desegmentos rectilíneos. No se trata aquí de crear una discusión sobre ello peroqueda al lector ladecisión si elabora la ojiva como curva suavizada o como la unión de segmentosde líneas. En estemódulo se trabajará como curva suavizada.
  103. 103. Figura 2.7.Ojiva ascendente de la velocidad de pulsaciones036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumulada036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumuladaFigura 2.8.Ojiva descendente de la velocidad de pulsaciones036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumulada036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumulada
  104. 104. Si ambas ojivas se dibujan en un mismo gráfico, se obtiene la figura 2.9.Obsérvese que ellas se cortan en un punto M, este punto se denomina mediana,concepto que se discutirá en la siguiente unidad didáctica y que representa elvalor del término de la mitad de la distribución.
  105. 105. Figura 2.9.Ojiva ascendente y descendente de la velocidad de pulsaciones036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumuladaM036912151821242730545862667074788286909498102106110Velocidad depulsacionesFrecuenciaabsolutaacumuladaM1.2.5.6. Gráficos de líneaEstá compuesta de segmentos de líneas que unen los pares ordenados arepresentar. Sirven para describir los cambios o fluctuaciones que sufre unfenómeno, generalmente durante un tiempo. Pueden ser simples, cuando sedibuja una sola serie de datos o compuestos, cuando se comparan dos o másseries de datos, generalmente a través del tiempo (series cronológicas).EEJJEEMMPPLLOO 1100..22111100..111100..11Tabla 2.10.
  106. 106. Egresados de la UNAD en el período 2000-2004FACULTAD20002001200220032004Ciencias Administrativas13912192154917732383Ciencias Básicas e Ingeniería533603708517830Ciencias Agrarias161147130197280C. Soc. Humanas y Educ.12431415101312101281
  107. 107. La tabla 2.10. indica el número de egresados de la UNAD en el período 2000-2004, discriminados por facultad.
  108. 108. En el siguiente gráfico de puntos, se ve claramente el comportamiento yfluctuación en el tiempo de cada facultad respecto a sus egresados.Figura 2.10.Diagrama de líneasEgresados de la UNAD en el período 2000-2004CienciasAdministrativasCiencias Básicase IngenieríaCiencias AgrariasCiencias SocialesHumanas yEducativas0250500750100012501500175020002250250020002001200220032004AñosNúmerodeegresadosUNADCienciasAdministrativasCiencias Básicase IngenieríaCiencias AgrariasCiencias SocialesHumanas yEducativas0250500750100012501500175020002250250020002001200220032004AñosNúmerodeegresadosUNADDe allí se puede ver cómo en 2004 hubo un aumento considerado en todas las
  109. 109. facultades, de igual forma en 2002 disminuyó estrepitosamente el número deegresados en las facultades de Ciencias Administrativas y Ciencias SocialesHumanas y Educativas, mientras que en Ciencias Básicas e Ingeniería se daba unascenso.También se puede leer de este tipo de gráficos que, independiente de lasfluctuaciones en el tiempo, la Facultad de Ciencias Administrativas es la quereporta mayor número de egresados anuales, seguida de Ciencias SocialesHumanas y Educativas, Ciencias Básicas e Ingeniería y por último CienciasAgrarias.1.2.5.7. Diagramas de barrasEs una de las gráficas más usadas para representar tanto característicascuantitativas como cualitativas. Es muy semejante al histograma de frecuencias,pero el diagrama de barras no requiere que la información esté agrupada entablasde frecuencias.
  110. 110. Las barras son rectángulos con alturas proporcionales a las frecuencias omagnitudes correspondientes, pueden construirse en forma vertical u horizontal,sin embargo son más comunes las verticales; en este tipo de gráficos se ubica lavariable o atributo en el eje horizontal y la altura está dada por los valores ocantidades que toma dicha variable.El diagrama de barras se puede trabajar para describir una solacaracterística de la variable, diagrama de barras simple, o bien describir ycomparar dos o más características de ella de forma segmentada o agrupada.Para diferenciar una característica de otra en la misma barra se recurre adiferenciarlas usando colores, sombrándolas o rellenándolas con tramas.EEJJEEMMPPLLOO 1100..33111100..111100..11La siguiente información corresponde a las ventas por departamento, al contado ya crédito, de un almacén de cadena en la ciudad de Bucaramanga en el mes demarzo de 2005. Los valores representan las ventas en millones de pesos.Tabla 2.11.Ventas por departamento al contado y a crédito en marzo de 2005DepartamentoContadoCréditoTotalAlimentos200120320Ropa180
  111. 111. 110290Calzado15090240Electrodomésticos300210510Los siguientes diagramas de barras verticales describen las ventas pordepartamento del almacén. Obsérvese que tanto la figura 2.11. y 2.12., aunquesean visualmente diferentes, ofrecen los mismos resultados. Inténtelo haciendolosdiagramas de forma horizontal, ¿es clara la información? ¿Cuál tipo de diagramade barras elegiría usted para una investigación? ¿Por qué?Obsérvese además, en la figura 2.11., que también se puede graficar una barramás, la correspondiente al total de ventas, la cual permitiría una comparacióneficiente de las ventas del almacén. ¿Cómo sería esta gráfica?
  112. 112. Figura 2.11.Diagrama de barras agrupadas de las ventaspor departamento al contado y a crédito en marzo de 20052001801503001201109021004080120160200240280320AlimentosRopaCalzadoElectro-domésticosMillones depesosContadoCrédito2001801503001201109021004080120160200240280320AlimentosRopaCalzadoElectro-domésticosMillones de pesosContadoCréditoFigura 2.12.Diagrama de barras segmentadas de las ventaspor departamento al contado y a crédito en marzo de 200520018015030012011090210050100150200250300350400450500550AlimentosRopaCalzadoElectrodomésticosMillones depesosContadoCrédito20018015030012011090210050100150200250300350400450500550AlimentosRopaCalzadoElectrodomésticosMillones de pesosContadoCrédito
  113. 113. Construya una tabla de frecuencias relativas para los datos de la tabla 2.11. yconella elabore por lo menos dos diagramas de barra diferentes en los que muestreelporcentaje de ventas de contado y a crédito alcanzadas durante ese mes en elalmacén de cadena para cada uno de los departamentos evaluados. Elabore unapequeña síntesis de los resultados que arrojan las gráficas que ha construido.
  114. 114. 1.2.5.8. Diagrama circularEs otro tipo de gráfico que permite observar los componentes de un total,como sectores de un círculo. Se utiliza para representaciones gráficas dedistribuciones porcentuales. Es una forma efectiva de representar distribucionesde frecuencias en las que la característica es cualitativa.Los ángulos de los sectores son proporcionales a los componentes del total.Se construye subdividiendo los 360º de un círculo, proporcionalmente al número oal porcentaje de cada una de las clases en que se ha dividido la observación.Unamayor apreciación se logra coloreando distintivamente los sectores o dándole unatrama a cada sector.EEJJEEMMPPLLOO 1100..44111100..111100..11En una entrevista masiva de una multinacional, asistieron 1250 personas conexpectativas de emplearse. De ellas el 50% eran casados, 25% solteros, 15%separados y 10% en unión libre. Si se quisiera mostrar en un diagrama circularestas proporciones, se debe tener en cuenta que los 360º del círculo equivalenal100%, debe pues plantearse una regla de tres simple:PorcentajeGrados100%360º50%X
  115. 115. Donde: º18010036050...XDe la misma manera, el 25% equivale a 90º en el círculo, 15% a 54º y 10% a 36º.Compruébelo. Así pues, se grafica el diagrama circular:Figura 2.13.Diagrama circular para el estado civil de 1250 aspirantes a empleo
  116. 116. Este tipo de gráficos es inconveniente cuando se tienen varias partes ycada una representa una pequeña proporción o cuando son muchas las partesque se van a representar. Si se le quiere emplear en secuencias cronológicas, sedibujan círculos de igual radio, tantos como años, meses o días se quieranrepresentar en la secuencia, mostrando en cada uno la correspondientedistribución porcentual.1.2.5.9. PictogramasEs una forma de representar los datos por medio de símbolos o dibujosdonde cada uno representa la misma información con un valor fijo. Lospictogramas son usados comúnmente en el diseño publicitario, ya que seconsideran más expresivos. Así es como se encuentran pictogramas señalando lapoblación de un país, donde una figura humana representaría un millón depersonas, por ejemplo.En la siguiente figura se indica por medio de un pictograma los millones deárboles talados en Argentina, Bolivia y Colombia. Obsérvese que un árbolrepresentará un millón de árboles talados anuales. Si la cantidad no es exacta,sepresenta una fracción de la figura.Figura 2.14.Pictograma para el número de árboles talados en Argentina, Bolivia y ColombiaArgentinaBoliviaColombia35.4 millones26.7 millones37.1 millones= 1–000.000 deárbolesArgentinaBoliviaColombia35.4 millones26.7 millones37.1 millones=1–000.000 de árboles
  117. 117. 1.2.5.10. Mapas estadísticos o cartogramasEste tipo de gráficos muestra la información cuantitativa o cualitativa sobrebases geográficas dentro de las cuales se ubican símbolos o figuras como puntos,barras, círculos, colores, etc. Es muy común en la prensa o boletines deinformación, cuando se indica por ejemplo, el informe del estado del tiempo o,enun mapa de Colombia, se indican con figuras humanas las zonas en conflicto o endisputa con los diversos grupos armados del país.1.3. CAPITULO 3 .MEDIDAS DE TENDENCIA CENTRAL O DE POSICIONAl describir grupos de observaciones, con frecuencia es conveniente resumir lainformación con un solo número. Este número que, para tal fin, suele situarsehacia el centro de la distribución de datos se denomina medida o parámetro detendencia central o de centralización.Cuando se hace referencia únicamente a la posición de estos parámetros dentrode la distribución, independientemente de que esta esté más o menos centrada,se habla de estas medidas como medidas de posición. En este caso se incluyentambién los cuantiles entre estas medidas.Entre las medidas de tendencia central tenemos:. media aritmética. media ponderada. media geométrica. media armónica. mediana. moda.Pero antes de iniciar con estos nuevos conceptos, se hace indispensable recordaralgunas nociones aritméticas y algebraicas básicas en estadística, es por estoquese recomienda al lector iniciar el capítulo repasando la sumatoria comopropiedadaritmética fundamental para entender las medidas estadísticas de una población o
  118. 118. muestra. Todo cuanto tiene que ver con sumatoria y productoria puede serrepasado y consultado en el anexo A, que se encuentra al final del texto.1.3.1 LECCIÓN 11. ESTADIGRAFOSEn el capitulo anterior nos dedicamos a estudiar los métodos que deben seraplicados en el proceso de agrupar, organizar y presentar los datos en cualquiertipo de investigación estadística.

×