Distribucioncontinua

697 views
613 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
697
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
12
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Distribucioncontinua

  1. 1. Bioestadística PROGRAMA DE DOCTORADO EN SALUD PÚBLICA
  2. 2. Contactos <ul><li>Mirko Zimic Jefe de la Unidad de Bioinformática y Biología Computacional, Facultad de Ciencias, UPCH </li></ul><ul><li>3190000 anexo 2604 </li></ul><ul><li>[email_address] [email_address] </li></ul><ul><li>http://www.upch.edu.pe/facien/dbmbqf/docentes.htm http://www.abeperu.net/ </li></ul>
  3. 3. Summarizing <ul><li>The ‘randomness’ of a random variable resides on: </li></ul><ul><li>The variability of the initial conditions </li></ul><ul><li>The dynamical instability </li></ul><ul><li>The perturbation suffered during a measurement </li></ul>
  4. 4. Important Conclusion: Determinism and Random Behavior are not actually divorced, but they are connected through the Dynamical Equations. Therefore, Random Behavior is a consequence of determinism under special conditions
  5. 5. Clasificación general : Categórica Cuantitativa o numérica Nominal Ordinal Discreta Continua
  6. 6. Las variables continuas <ul><li>El carácter continuo de una variable lo da la naturaleza intrínseca del observable físico y es independiente de la manera cómo se mida (i.e. del instrumento utilizado) ó de la manera cómo se reporte la medición </li></ul>
  7. 7. Efecto de la manera ‘cómo se mide’ una variable <ul><li>Imaginemos que medimos la induración del PPD en varios pacientes, y para ello utilizamos una regla milimetrada. Las dimensiones medidas para diferentes personas fueron: </li></ul><ul><li>5mm, 12mm, 9mm, 32mm, 21mm </li></ul><ul><li>Aparentemente estamos frente a una variable discreta, aunque en realidad la induración (longitud) es y debe tratarse de manera continua. </li></ul>
  8. 8. Categorización/discretización : <ul><li>Las variables continuas pueden ser convertida en variables discretas y hasta en categóricas </li></ul><ul><li>En este proceso se pierde información (precisión) </li></ul><ul><li>La información debe obtenerse al mayor nivel de precisión posible y luego agruparse si fuera necesario (discretización) </li></ul>
  9. 9. Perfil de la distribución <ul><li>Describe cómo los Datos están Distribuídos </li></ul><ul><li>Caracterización del perfil de la distribución: </li></ul><ul><li>Simétrica o sesgada </li></ul>
  10. 10. Recordemos las características de una variable continua con distribución normal… Figure 10.10 6
  11. 11. Dos bases de datos hipotéticas… Es importante tener una imagen visual de la distribución de la variable La media provee una buena representación de los valores en la base de datos. Datos de baja variabilidad Datos con alta variabilidad La media ya NO provee ahora una buena información de los datos como sucedía anterioremente Al incrementar datos la distribución cambia..
  12. 12. El Teorema del Límite Central da validez a los intervalos de confianza <ul><li>La media de una muestra “grande” de datos de cualquier tipo sigue una distribución normal </li></ul><ul><li>Esto aún se cumple para datos binomiales (sexo, prevalencia, sensibilidad, etc) </li></ul><ul><li>Qué es una muestra grande? Eso varía según cada tipo de dato (entre otras cosas) </li></ul><ul><li>A medida que el tamaño de muestra crece, la distribución de la media muestral se hace más normal </li></ul>
  13. 13. AN ILLUSTRATION OF THE CENTRAL LIMIT THEOREM Bioestadística Aplicada
  14. 14. Continuous Models on the Line <ul><li>Normal </li></ul><ul><li>Logistic </li></ul><ul><li>Cauchy </li></ul><ul><li>Laplace </li></ul><ul><li>Student </li></ul><ul><li>Non-central Student </li></ul>Bioestadística Aplicada
  15. 15. Normal Distribution <ul><li>Mean= 0 </li></ul><ul><li>SD = 0.5, 1, 2 </li></ul>Bioestadística Aplicada
  16. 16. Logistic distribution <ul><li>Mean=0 </li></ul><ul><li>SD=0.5, 1 </li></ul>Bioestadística Aplicada
  17. 17. Student distribution <ul><li>Degrees of freedom= 1,10,100 </li></ul>Bioestadística Aplicada
  18. 18. Laplace distribution <ul><li>Mean=0 </li></ul><ul><li>SD=0.5, 1, 5 </li></ul>Bioestadística Aplicada
  19. 19. Continuous Models on the Half Line <ul><li>Exponential </li></ul><ul><li>Gama </li></ul><ul><li>Chi-square </li></ul><ul><li>Non central Chi-square </li></ul><ul><li>F </li></ul><ul><li>Non central F </li></ul><ul><li>Weibull </li></ul>Bioestadística Aplicada
  20. 20. Exponential distribution <ul><li>Scale parameter = 0.5, 1, 2 </li></ul>Bioestadística Aplicada
  21. 21. Chi-square distribution <ul><li>Degrees of freedom = 3, 5, 10,15 </li></ul>Bioestadística Aplicada
  22. 22. F distribution <ul><li>Degrees of freedom = </li></ul><ul><li>(3,3), (10,10), (30,30) </li></ul>Bioestadística Aplicada
  23. 23. Continuous Models on a Finite Interval <ul><li>Beta </li></ul><ul><li>Uniform </li></ul>Bioestadística Aplicada
  24. 24. Uniform distribution <ul><li>P = 1/3 </li></ul>Bioestadística Aplicada
  25. 25. Beta distribution <ul><li>Parameters: </li></ul><ul><li>(2,15), (5,15), (15,5) </li></ul>Bioestadística Aplicada
  26. 26. Discrete Models <ul><li>Binomial </li></ul><ul><li>Poisson </li></ul><ul><li>Negative Binomal </li></ul><ul><li>Uniform </li></ul>Bioestadística Aplicada
  27. 27. Binomial distribution <ul><li>N=10 </li></ul><ul><li>P= 0.2, 0.5, 0.8 </li></ul>Bioestadística Aplicada
  28. 28. Poisson distribution <ul><li>Intensity parameter = </li></ul><ul><li>1, 3, 7 </li></ul>Bioestadística Aplicada
  29. 29. Negative Binomial <ul><li>P N </li></ul><ul><li>0.5 10 </li></ul><ul><li>0.4 3 </li></ul><ul><li>0.4 6 </li></ul>Bioestadística Aplicada
  30. 30. Distribuciones sesgadas
  31. 31. Perfil de la distribución (skewness coefficient) <ul><li>Describe cómo los Datos están Distribuídos </li></ul><ul><li>Caracterización del perfil de la distribución: </li></ul><ul><li>Simétrica o sesgada </li></ul>
  32. 32. Perfil de la distribución <ul><li>Describe cómo los Datos están Distribuídos </li></ul><ul><li>Caracterización del perfil de la distribución: </li></ul><ul><li>Simétrica o sesgada </li></ul>Sesgada izquierda Simétrica Mean = Median = Mode Mean Median Mode
  33. 33. Perfil de la distribución <ul><li>Describe cómo los Datos están Distribuídos </li></ul><ul><li>Caracterización del perfil de la distribución: </li></ul><ul><li>Simétrica o sesgada </li></ul>Sesgada derecha Sesgada izquierda Simétrica Media = Mediana = Moda Media Mediana Moda Mediana Media Moda
  34. 34. Análisis de OUTLIERS: <ul><li>Datos sesgados: </li></ul><ul><ul><li>Valores que se exceden de 3 rangos intercuartiles por debajo del primer cuartil Q1 o por encima del tercer cuartil (Q3) (percentiles 25 y 75 respectivamente) </li></ul></ul>Sesgada izquierda Sesgada Positiva Q 1 – 3(Q 3 – Q 1 ) Q 1 Q 3 Q 1 Q 3 Q 3 + 3(Q 3 – Q 1 ) outlier region outlier region
  35. 35. Uso de la Teoría de Propagación Errores <ul><li>Se aplica cuando tenemos una o muy pocas mediciones y deseamos presentar un rango de variabilidad en nuestras conclusiones </li></ul>Bioestadística Aplicada

×