Successfully reported this slideshow.

Estadistica descriptiva Unidad I

11,797 views

Published on

Contenidos relacionados con la unidad I

  • Be the first to comment

Estadistica descriptiva Unidad I

  1. 1. Estdistica Ender Meleán Septiembre de 2009
  2. 2. ESTADÍSTA DESCRIPTIVA
  3. 3. ESTADÍSTICA <ul><li>“ ES LA DISCIPLINA QUE SE OCUPA DE 1) LA RECOLECCIÓN, ORGANIZACIÓN, RESUMEN Y ANÁLISIS DE DATOS, Y 2) LA OBTENCIÓN DE INFERENCIAS A PARTIR DE UN VOLUMEN DE DATOS CUANDO SE EXAMINA UNA PARTE DE ELLOS”. (Daniel, 2004:2) </li></ul><ul><li>“ LA ESTADÍSTICA DESCRIPTIVA PUEDE DEFINIRSE COMO LOS MÉTODOS QUE INVOLUCRAN LA RECOPILACIÓN, CARACTERIZACIÓN Y PRESENTACIÓN DE UN CONJUNTO DE DATOS, CON EL FIN DE DESCRIBIR VARIAS DE SUS CARACTERÍSTICAS”. (Berenson, Levine y Krehbiel. 2001:5) </li></ul>
  4. 4. PENSAMIENTO ESTADÍSTICO <ul><li>“ CONJUNTO DE PROCESOS DEL PENSAMIENTO QUE SE ORIENTAN A LA FORMA DE ENTENDER, ADMINISTRAR Y REDUCIR LA VARIACIÓN” (Berenson y Levine, 2001:4) </li></ul><ul><li>“ CONJUNTO DE PRINCIPIOS Y VALORES QUE PERMITEN </li></ul><ul><li>IDENTIFICAR LOS PROCESOS, CARACTERIZARLOS, </li></ul><ul><li>CUANTIFICARLOS, CONTROLAR Y REDUCIR SU </li></ul><ul><li>VARIACIÓN PARA IMPLANTAR ACCIONES DE MEJORA ”. </li></ul><ul><li>(Snee, 1993) </li></ul>
  5. 5. ANALISIS ESTADÌSTICO <ul><li>“ Ciencia que recoge, ordena y analiza los datos de una muestra extraída de una determinada población, para hacer inferencias de esa población valiéndose del cálculo de probabilidades” (Amon, 1979) </li></ul><ul><li>Nos permite: </li></ul><ul><li>Tomar decisiones </li></ul><ul><li>Solucionar problemas </li></ul>
  6. 6. APLICACIONES DE LA ESTADÍSTICA <ul><li>Contabilidad: </li></ul><ul><li>Para seleccionar muestras con propósitos de auditoría. </li></ul><ul><li>En contabilidad de costos. </li></ul><ul><li>Finanzas: </li></ul><ul><li>Para estar al tanto de las medidas financieras en el transcurso del tiempo. </li></ul><ul><li>Para desarrollar formas de pronosticar valores de estas medidas en momentos futuros. </li></ul><ul><li>Administración: </li></ul><ul><li>Para describir las características de los empleados dentro de una organización. </li></ul><ul><li>Para mejorar la calidad de los productos fabricados o de los servicios procurados por la organización. </li></ul><ul><li>Mercadeo: </li></ul><ul><li>Para determinar la proporción de clientes que prefieren un producto en vez de otro y la razón de esto. </li></ul><ul><li>Para sacar conclusiones respecto a la estrategia de publicidad que sería más útil para el incremento de ventas de un producto. </li></ul>Casi todas las áreas del saber requieren del pensamiento estadístico. Las disciplinas de estudio que dependen ampliamente del análisis estadístico, incluyen, pero no se limitan a, marketing, finanzas economía e investigación de operaciones. La contabilidad y gerencia financiera también se basan en principios estadísticos.
  7. 7. TIPOS DE ESTADÍSTICA <ul><li>ESTADÍSTICA INFERENCIAL: Pueden definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población, basándose sólo en los resultados de la muestra. </li></ul><ul><li>ESTADISTICA DESCRIPTIVA: Puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto de datos. </li></ul>
  8. 8. INFERENCIA ESTADÍSTICA Proceso y resultado de extraer conclusiones respecto a una población a partir de una o más muestras . M P conclusiones El eslabón absolutamente crucial entre los resultados que se obtienen de la muestra y la capacidad para generalizar esos resultados a la población, es el supuesto de que un muestreo repetido de la población producirá un conjunto de datos representativos de la población. Si esto no sucede, no se podrá aplicar las pruebas de la estadística inferencial.
  9. 9. PARA QUE SIRVE EL ANÁLISIS ESTADÍSTICO Ciencias Formales (Matemáticas, Física, Medicina) Deducción lógica. Empíricas (psicología, sociología, Economía,) Generalización inductiva <ul><li>En las ciencias empíricas el objetivo fundamental es el de encontrar relaciones de tipo general (leyes), capaces de explicar eventos reales cuando se dan las circunstancias apropiadas. (Se descubren y verifican observando el mundo real). </li></ul><ul><li>La generalización inductiva , intenta ir desde lo que considera que es verdad para un número reducido de observaciones hasta la afirmación de que eso mismo es verdad para el total de observaciones posibles de la misma clase. </li></ul><ul><li>La generalización inductiva . En las ciencias empíricas las fuentes de variación existentes son numerosas y difícil de identificar, medir y controlar, por ello necesita una metodología especial que las valide: “ El análisis estadístico” </li></ul><ul><li>En situaciones aleatorias en que la misma causa puede producir cualquiera de un conjunto de resultados posibles (Respuesta al tratamiento de un paciente) es necesario recurrir al análisis estadístico para extraer conclusiones fiables. (Reducción de la incertidumbre). </li></ul>
  10. 10. Presentación ordenada de datos <ul><li>Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra. </li></ul>Bioestadística U. de Málaga Género Frec. Hombre 4 Mujer 6
  11. 11. Datos desordenados y ordenados en tablas <ul><li>Variable: Género </li></ul><ul><ul><li>Modalidades: </li></ul></ul><ul><ul><ul><li>H = Hombre </li></ul></ul></ul><ul><ul><ul><li>M = Mujer </li></ul></ul></ul><ul><li>Muestra: </li></ul><ul><ul><li>M H H M M H M M M H </li></ul></ul><ul><ul><li>equivale a HHHH MMMMMM </li></ul></ul>Bioestadística U. de Málaga Género Frec. Frec. relat. porcentaje Hombre 4 4/10=0,4=40% Mujer 6 6/10=0,6=60% 10=tamaño muestral
  12. 12. Ejemplo <ul><li>¿ Cuántos individuos tienen menos de 2 hijos? </li></ul><ul><ul><li>frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos </li></ul></ul><ul><li>¿Qué porcentaje de individuos tiene 6 hijos o menos? </li></ul><ul><ul><li>97,3% </li></ul></ul><ul><li>¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? </li></ul><ul><ul><li>2 hijos </li></ul></ul>≥ 50% Bioestadística U. de Málaga
  13. 13. Cuando se tiene un número considerable de datos de un experimento estadístico, se ordenan y clasifican en una tabla numérica a fin de obtener de ella la mejor información y facilitar su interpretación. Se refiere a observaciones independientes entre sí. AGRUPACIÓN Y REPRESENTACIÓN DE DATOS ESTADÍSTICOS Tabulación Simple: Calificaciones de los participantes Puntos Matemáticas Estadística 0 - 5 6 - 10 11 - 15 16 - 20 6 8 20 11 9 12 14 10 Total 45 45
  14. 14. Tabulación Compleja: Se refiere a observaciones dependientes entre sí Estudiantes relación estatura peso Peso - Kg Estatura - mts Fuente: Nijad Hamdan Rendimiento estudiantil por materias Doctorado Educación Asignatura % Aprobados % Aplazados % Deserción Estadística Instrumentos Multivariante A. Del Discurso 43,2 55,7 65,0 77,0 47,8 32,3 32,5 20,0 9,0 12,0 2,5 3,0 55 - 60 61 - 65 66 - 70 71 - 75 76 - 80 1,50 a 1,55 2 5 3 1 1,56 a 1,60 4 1,61 a 1,65 1 2 1,66 a 1,70 5 1,70 a 1,75 3 4 2
  15. 15. DISTRIBUCIONES DE FRECUENCIA Cuando se trabaja con conjuntos grandes de datos, es útil organizarlos y resumirlos por medio de la construcción de una tabla que liste los distintos valores posibles de los datos, individual o por grupos, junto con el número de veces que se presentan dichos valores. (frecuencias ) Diferencia entre ordenamiento de datos y frecuencia Ordenamiento de notas en Estadística 9 9 10 11 11 11 12 12 13 13 13 14 14 14 14 16 17 17 19 20 Clase Frecuencia 9 - 11 6 12 - 14 9 15 - 17 3 18 - 20 2
  16. 16. DISTRIBUCIÓN DE FRECUENCIAS <ul><li>Es una tabla de resumen en la cual los datos se colocan en agrupamiento o categorías establecidas en forma conveniente de clases ordenadas numéricamente </li></ul><ul><li>Una distribución de frecuencia informa sobre los valores concretos que </li></ul><ul><li>adopta una variable y sobre el número (y porcentaje) de veces que repite </li></ul><ul><li>cada uno de esos valores </li></ul><ul><li>Exponen la información recogida en la muestra, de forma que no se pierda </li></ul><ul><li>nada de información (o poca). </li></ul><ul><li>Las distribuciones de frecuencia se construyen por las siguientes razones: </li></ul><ul><li>Resume conjunto grande de datos </li></ul><ul><li>Se logra cierta comprensión respecto a la naturaleza de los datos </li></ul><ul><li>Se logra tener un avance para construir gráficas importantes </li></ul>
  17. 17. DISTRIBUCIÓN DE FRECUENCIAS <ul><li>Obtención de intervalos de clase </li></ul><ul><li>Es conveniente que cada intervalo tenga la misma medida (o anchura). </li></ul>Valor más alto – Valor más bajo <ul><li>Selección del número de clases </li></ul><ul><li>Una gran cantidad de observaciones requiere un mayor número de clases. Sin embargo una distribución de frecuencias debe tener como mínimo 5 clases, pero no mas de 15 </li></ul>Número de clases deseado Ancho de Clase =
  18. 18. <ul><li>Frecuencias relativas (porcentajes): Idem, pero dividido por el total </li></ul><ul><ul><li>Frecuencias absolutas: Es el número de datos que caen en cada uno de los intervalos estructurados (clase) </li></ul></ul>Clase Frecuencia Frecuencia Relativa 9 - 11 6 0.30 30% 12 - 14 9 0.45 45% 15 - 17 3 0.15 15% 18 - 20 2 0.10 10% Clase Frecuencia 9 - 11 6 12 - 14 9 15 - 17 3 18 - 20 2
  19. 19. <ul><ul><li>Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas. Es la frecuencia absoluta acumulada hasta cada clase. </li></ul></ul>Clase Frecuencia Frecuencia Frecuencia Relativa Acumulada 9 - 11 6 0.30 30% 6 12 - 14 9 0.45 45% 15 15 - 17 3 0.15 15% 18 18 - 20 2 0.10 10% 20
  20. 20. Distribuciones de frecuencia, frecuencia acumulada, frecuencia relativa, frecuencia porcentual y frecuencia relativa acumulada Daniel 2004:21 Intervalos Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia de clase acumulada relativa porcentual r. acumul. 10 - 16 4 4 0.0237 2.37 0.0237 20 – 29 66 70 0.3905 39.05 0.4142 30 - 39 47 117 0.2781 27.81 0.6923 40 – 49 36 153 0.2130 21.30 0.9053 50 - 59 12 165 0.0710 7.10 0.9763 60 – 69 4 169 0.0237 2.37 1.0000 Total 169 1.0000 100
  21. 21. EJEMPLO: Arreglo ordenados de rendimientos totales a un año Que alcanzaron 59 fondos de crecimiento Por conveniencia el ancho se redondea = 5 DISTRIBUCIÓN DE FRECUENCIAS Seis clases son suficientes 20.4 23.8 25.6 26.2 27.6 27.7 28.3 28.6 28.8 28.9 28.9 29.3 29.3 29.5 29.9 30.1 31.5 31.6 31.6 31.8 31.9 32.1 32.3 32.3 32.4 32.8 32.9 32.9 33.0 33.3 33.4 33.7 33.8 34.0 34.0 34.3 34.7 34.7 34.8 35.0 38.2 39.0 39.4 40.7 41.1 42.8 42.9 43.3 43.4 43.5 43.6 43.7 44.6 44.7 45.4 45.7 46.6 48.0 48.6 = 4,7 48,6 - 20,4 6 Ancho de intervalo =
  22. 22. Se establece el intervalo de clase en 5%. El primer intervalo va de 20 a menos de 25%, el segundo de 25 a menos de 30% y así sucesivamente, hasta asignar las 6 clases con un ancho de intervalo de 5% sin traslapes. La desventaja de esta tabla resumen es que no muestra la distribución de los datos individuales dentro de un intervalo de clase en particular. En consecuencia, para los 4 fondos cuyo rendimiento total de un año se encuentra entre el 35 y 40 %, no queda claro, si los valores se distribuyen en todo el intervalo, o se aglomeran cerca del 35 o 40%. Sin embargo, el punto medio de clase (37,5) se usa para representar los rendimientos totales a un año de los 4 fondos que están contenidos en ese intervalo. RENDIMIENTO TOTAL A UN AÑO No. de FONDOS De 20.0 a menos de 25.0 2 25.0 30.0 13 30.0 35.0 24 35.0 40.0 4 40.0 45.0 11 45.0 50.0 5 Total 59
  23. 23. GRAFICOS
  24. 24. Gráficos para v. cualitativas <ul><li>Diagramas de barras </li></ul><ul><ul><li>Alturas proporcionales a las frecuencias (abs. o rel.) </li></ul></ul><ul><ul><li>Se pueden aplicar también a variables discretas </li></ul></ul><ul><li>Diagramas de sectores (tartas, polares) </li></ul><ul><ul><li>No usarlo con variables ordinales. </li></ul></ul><ul><ul><li>El área de cada sector es proporcional a su frecuencia (abs. o rel.) </li></ul></ul><ul><li>Pictogramas </li></ul><ul><ul><li>Fáciles de entender. </li></ul></ul><ul><ul><li>El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?. </li></ul></ul>
  25. 25. Gráficos para variables numéricas <ul><li>Son diferentes en función de que las variables sean discretas o continuas. Se utilizan con frec. absolutas o relativas. </li></ul><ul><ul><li>Diagramas barras para v. discretas </li></ul></ul><ul><ul><ul><li>Se deja un hueco entre barras para indicar los valores que no son posibles </li></ul></ul></ul><ul><ul><li>Histogramas para v. continuas </li></ul></ul><ul><ul><ul><li>El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo. </li></ul></ul></ul>
  26. 27. CONSTRUCCIÓN DE HISTOGRAMAS INDICANDO CANTIDAD DE CLASES. <ul><ul><li>1..Archivo “EDAD DANIEL” </li></ul></ul><ul><ul><li>2.- Determinar el Ancho de clase </li></ul></ul><ul><ul><li>a. Localizar la menor y mayor edad. </li></ul></ul><ul><ul><li>Analizar > Estd. Descrip. > Pasar “EDAD” > Opciones > </li></ul></ul><ul><ul><li>Marcar solamente “minimo” y Máximo” </li></ul></ul>Valor más alto – Valor más bajo N úmero de clases deseado Ancho de Clase = Ancho de Clase = 63 - 18 5 = 9
  27. 28. ANCHOS DE CLASE 18 + 9 = 27 1 er Ancho de clase = 27 + 9 = 36 2 do Ancho de clase = 36 + 9 = 45 3 er Ancho de clase = 45 + 9 = 54 4 º Ancho de clase = 54 + 9 = 63 5 º Ancho de clase = 18 - 27 27 - 36 36 - 45 45 - 54 54 - 63 FORMAR NUEVA VARIABLE AGRUPADA : 3. Transformar - Recodificar - En variables diferentes
  28. 30. <ul><li>POLÍGONOS DE FRECUENCIA </li></ul><ul><li>(v. continuas) </li></ul><ul><li>Se construye uniendo con segmentos de recta los puntos medios de las marcas de clase en la parte superior de cada intervalo. Al unir las marcas mediante líneas rectas se obtiene el polígono de frecuencia. </li></ul><ul><li>Cuando se comparan dos o mas conjuntos de datos, resulta imposible la construcción de histogramas en la misma gráfica. </li></ul>POLÍGONOS DE FRECUENCIA 0 10 20 30 40 50 60 70 80 90 100 20 40 60 80 Puntos medios Frecuencias absolutas
  29. 31. GRÁFICAS DE TALLO Y HOJAS Sistema gráfico muy útil para representar conjunto de datos “cuantitativos”. Presenta una gran similitud con el histograma y tiene el mismo propósito. <ul><li>Muestra la ubicación de la mayor concentración de </li></ul><ul><li>mediciones </li></ul><ul><li>Revela la presencia o ausencia de simetría </li></ul><ul><li>Conserva la información contenida en las mediciones </li></ul><ul><li>individuales </li></ul>Abrir el archivo “Edad Daniel” y seguir las instrucciones de la próxima diapositiva
  30. 32. EDAD Stem-and-Leaf Plot Frequency Stem & Leaf 4,00 1 . 8899 26,00 2 . 01112222223333333444444444 40,00 2 . 5555666666666667777777777888888899999999 30,00 3 . 000000000011111112222233344444 17,00 3 . 56667777788888999 19,00 4 . 0000001112222333444 17,00 4 . 55566777788888899 11,00 5 . 00011223333 1,00 5 . 6 4,00 6 . 1233 Stem width: 10,00 Each leaf: 1 case(s) Despliegue de tallos y hojas de la variable “EDAD” del archivo Edad Daniel
  31. 33. DEFINICIONES BÁSICAS <ul><li>POBLACIÓN: Cualquier colección de unidades que pueden interesar en un estudio. Esta colección debe estar bien definida, de tal forma que se puedan distinguir entre sus miembros aquellos que lo son y los que no lo son. </li></ul><ul><li>MUESTRA: Es una parte (sub-conjunto) de la población, obtenida con el propósito de investigar propiedades que posee la población. Es decir, se pretende que dicho sub-conjunto, represente a la población a la cual se extrajo. </li></ul><ul><li>MEDICIÓN CUALITATIVA Y CUANTITATIVA : Una medida es un número o denominación que podemos asignar a una unidad de observación . Si este número expresa dimensiones o capacidades, se denomina medición cuantitativa, si registra características, atributos o actitudes se denomina medición cualitativa </li></ul>
  32. 34. <ul><li>PARÁMETRO: Es una medida de resumen que describe una característica de toda una población. Por lo general se simboliza con letras griegas, así: </li></ul>DEFINICIONES BÁSICAS µ <ul><li>ESTADÍSTICO: Es una medida de resumen que se calcula para describir una característica a partir de una sola muestra de la población. Se calcula a partir de los datos de la muestra y, por lo tanto sirve para estimar parámetros. Generalmente es simbolizado por letras latinas minúsculas, así: media muestral </li></ul>x
  33. 35. ANÁLISIS ESTADÍSTICO <ul><li>TIPO DE VARIABLE </li></ul><ul><li>TIPO DE INVESTIGACIÓN </li></ul>VARIABLE : Propiedad que puede variar y cuya variación es susceptible a medirse u observarse. Sampieri. (2003:143) EJEMPLOS: Sexo, atractivo físico, la religión, la agresividad verbal, presión arterial, nivel socio económico . Las variables adquieren valor para la investigación científica cuando llegan a relacionarse con otras (formar parte de una hipótesis o una teoría).
  34. 36. <ul><li>UNA VARIABLE: </li></ul><ul><ul><li>SE MIDE </li></ul></ul><ul><ul><li>CAMBIA </li></ul></ul>
  35. 37. CLASIFICACIÓN DE LAS VARIABLES VARIABLE CUALITATIVA ORDINAL CUANTITATIVA DISCRETA CONTINUA NOMINAL
  36. 38. NIVEL DE MEDICIÓN NOMINAL Nombra las observaciones en categoría mutuamente excluyente <ul><li>Sexo </li></ul><ul><li>Raza </li></ul><ul><li>Diagnósticos </li></ul>ORDINAL Hay orden y jerarquía <ul><li>Nivel Socioeconómico </li></ul><ul><li>Bajo, medio y alto. </li></ul><ul><li>Actitud: </li></ul><ul><li>En desacuerdo, Indeciso, </li></ul><ul><li>de acuerdo </li></ul>INTERVALO El cero es un valor arbitrario <ul><li>Temperatura </li></ul>RAZÓN El cero es un valor absoluto <ul><li>Peso </li></ul><ul><li>Distancias Km., pie </li></ul>

×