Power Point: Analisis Exploratorio de Datos

4,802 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
4,802
On SlideShare
0
From Embeds
0
Number of Embeds
218
Actions
Shares
0
Downloads
358
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Power Point: Analisis Exploratorio de Datos

  1. 1. INTRODUCCION. CONCEPTOS BASICOS Dra. Luz Carbajal A Setiembre, 2010 Departamento de Estadística, Demografía, Humanidades y Ciencias Sociales
  2. 2. <ul><li>La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis. </li></ul>
  3. 3. <ul><ul><li>Descriptiva </li></ul></ul><ul><ul><li>Sistematizar, recolectar, ordenar y presentar los datos respecto a un fenómeno que presenta variabilidad o incertidumbre para su estudio y describirla. </li></ul></ul><ul><ul><li>Inferencial </li></ul></ul><ul><ul><li>Deducir las leyes que rigen esos fenómenos y poder realizar predicciones sobre los mismos, tomar decisiones u obtener conclusiones a partir de una muestra . </li></ul></ul>n N <ul><ul><li>Areas de la Estadística: </li></ul></ul>
  4. 4. <ul><li>Población: Conjunto de todos los individuos que son susceptibles a ser estudiados. </li></ul><ul><li>Muestra: Subconjunto de la población y que tenemos acceso para realizar el estudio. Debe tener ciertas características que la definen como representativa de la población a estudiar. </li></ul><ul><li>Unidad de análisis: Individuo del cual se obtiene la información. </li></ul><ul><li>Marco Muestral : Es el listado de todos los individuos susceptibles a ser estudiados (población de estudio) </li></ul>
  5. 5. <ul><li>Dato: valor aislado de una variable </li></ul><ul><li>Parámetro: Es una medida estadística (un valor) que resume los datos de una población. Es un valor fijo para la población en estudio. </li></ul><ul><li>Estadístico: es una medida estadística que resume los datos de una muestra. Es un valor variable. </li></ul>
  6. 6. Simbología a utilizar MEDIDAS POBLACION (parámetro) MUESTRA (estadístico) Media aritmética  x Varianza σ 2 s 2 Desviación estándar σ s Proporción π p Tamaño N n
  7. 7. <ul><li>Población: Pacientes del servicio de cardiología del Hospital María Auxiliadora del 2009. </li></ul><ul><li>Se tiene interés en conocer en esta población: </li></ul><ul><ul><li>Frecuencia cardiaca promedio  (  ) </li></ul></ul><ul><ul><li>Proporción de pacientes que consumía tabaco  (  ) </li></ul></ul><ul><li>En este caso  y  se consideran parámetros y para conocer sus valores debemos estudiar toda la población de pacientes del servicio del 2009. </li></ul><ul><li>Si el estudio se realiza mediante una muestra, se calcula estadísticos como: media aritmética (  x ), desviación estándar (s) y proporción (p). </li></ul><ul><li>Veamos algunos ejemplos de medidas estadísticas: </li></ul>Ejemplo:
  8. 8. <ul><li>Variables estadísticas : </li></ul><ul><li>Variable : Cualquier característica de una persona, medio ambiente o situación experimental, que puede variar de persona a persona, de un medio ambiente a otro, o de una situación experimental a otra. </li></ul><ul><li>Clasificación: </li></ul><ul><li>Variable cualitativa (categórica) . Característica que se expresa cualitativamente. </li></ul><ul><li>Ejm: Género, raza, estado nutricional, estado civil, etc. </li></ul><ul><li>Puede ser dicotómica o politómica </li></ul><ul><li>Variable cuantitativa (numérica) . Característica que se expresa cuantitativamente </li></ul><ul><li>Ejm: edad, peso, número de atenciones, etc </li></ul><ul><li>Puede ser discreta (enteros) o continua (decimales) </li></ul>
  9. 9. <ul><li>Población: Niños de 5 a 10 años de edad </li></ul><ul><li>Variables: </li></ul><ul><ul><li>Peso - Frecuencia respiratoria </li></ul></ul><ul><ul><li>Talla - Género </li></ul></ul><ul><ul><li>Obesidad - Nº de hermanos </li></ul></ul><ul><ul><li>Perímetro abdominal - Lugar de procedencia </li></ul></ul><ul><li>Variables cualitativas : </li></ul><ul><ul><li>Dicotómica : Género, obesidad; </li></ul></ul><ul><ul><li>Politómica : Lugar de procedencia; </li></ul></ul><ul><li>Variables cuantitativas : </li></ul><ul><ul><li>Discretas : Nº de hermanos, frec. resp. </li></ul></ul><ul><ul><li>Continuas : Peso, talla, perímetro abdominal </li></ul></ul>
  10. 10. <ul><li>Escalas de medición: </li></ul><ul><li>Nominal, ordinal, de intervalo y de razón </li></ul><ul><li>Nominal .- </li></ul><ul><li>Para cada unidad de análisis se determina la pertenencia a una entre dos o más categorías excluyentes. No es posible establecer relación de orden entre las categorías. Si se usan números estos cumplen la propiedad de = ó  . </li></ul><ul><li>Ejm: Sexo, estado civil, procedencia, área de desempeño laboral, grupo sanguíneo, presencia o ausencia de un atributo, etc. </li></ul>
  11. 11. <ul><li>Ordinal .- </li></ul><ul><li>Se determina la pertenencia de las unidades de análisis a categorías excluyentes, pero existe un grado de intensidad de la propiedad medida, por lo que las categorías guardan un orden. Los números cumplen con la propiedad de =,  , < y >. </li></ul><ul><li>Ejm: Clase social (A, M, B), opinión sobre una propuesta política (TA, A, I, D, TD), nivel de dependencia (TD, MD, TI), Escalas médicas (apgar, EVA para medir dolor, etc) </li></ul>
  12. 12. <ul><li>Veamos los ejemplos: </li></ul><ul><li>Escala nominal </li></ul><ul><li>Sexo : </li></ul><ul><ul><li>Masculino (M) (1) (1)  (2), si </li></ul></ul><ul><ul><li>Femenino (F) (2) </li></ul></ul><ul><li>Estado civil : </li></ul><ul><ul><li>Soltero (S) (1) (1)  (4), si; </li></ul></ul><ul><ul><li>Casado (C) (2) pero (4) >(1), no. </li></ul></ul><ul><ul><li>Viudo (V) (3) </li></ul></ul><ul><ul><li>Divorciado (D) (4) </li></ul></ul><ul><ul><li>Conviviente (Co) (5) </li></ul></ul><ul><ul><li>Separado (Se) (6) </li></ul></ul>
  13. 13. <ul><li>Escala ordinal </li></ul><ul><li>Dolor : </li></ul><ul><ul><li>Leve (1) (1)  (2), si; (1) < (2),si </li></ul></ul><ul><ul><li>Moderado (2) </li></ul></ul><ul><ul><li>Intenso (3) </li></ul></ul><ul><li>Nivel de instrucción : </li></ul><ul><ul><li>Primaria (1) </li></ul></ul><ul><ul><li>Secundaria (2) </li></ul></ul><ul><ul><li>Superior (3) </li></ul></ul>
  14. 14. <ul><li>De intervalo .- </li></ul><ul><li>Se asignan números a cada elemento para indicar la intensidad de una característica, con unidad de medida y origen arbitrarios, que se elige en base a conveniencias prácticas. </li></ul><ul><li>El cero es relativo. </li></ul><ul><li>Entre dos números consecutivos se puede calcular una diferencia. </li></ul><ul><li>Signos utilizables: =,  ,  ,  , +, y – </li></ul>
  15. 15. <ul><li>De razón .- </li></ul><ul><li>Se asignan números a los elementos para indicar la intensidad de una característica con unidades de medida y de origen fijo, manteniendo la igualdad de las proporciones. </li></ul><ul><li>El cero es absoluto. </li></ul><ul><li>Signos útiles: además de los anteriores, el signo de la división ÷ </li></ul>
  16. 16. <ul><li>Escala de intervalo (origen arbitrario) </li></ul><ul><ul><li>Temperatura en ºC </li></ul></ul><ul><ul><li>Origen: 0 ºC (cero relativo) </li></ul></ul><ul><ul><li>Puntajes de pruebas educativas y psicológicas (cero relativo). </li></ul></ul><ul><ul><li>Años calendarios transcurridos (cero relativo). </li></ul></ul><ul><li>La diferencia entre 40º y 35ºC y entre </li></ul><ul><li>25º y 30º es igual tanto, numéricamente como respecto al atributo ( cantidad de calor) </li></ul>
  17. 17. <ul><li>Escala de razón (origen y cero absolutos) </li></ul><ul><ul><li>peso - plomo en sangre </li></ul></ul><ul><ul><li>talla - presión arterial </li></ul></ul><ul><ul><li>frecuencia cardiaca </li></ul></ul><ul><ul><li>ingresos - gastos </li></ul></ul><ul><ul><li>Si José gana 6 mil y César 3 mil, no sólo podemos afirmar que José gana 3 mil más que César, sino además que José gana el doble que César. </li></ul></ul>

×