Successfully reported this slideshow.
Your SlideShare is downloading. ×

AnáLisis EstadíStico De Datos Usando R 1

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 18 Ad

More Related Content

Viewers also liked (20)

Similar to AnáLisis EstadíStico De Datos Usando R 1 (20)

Advertisement

Recently uploaded (20)

AnáLisis EstadíStico De Datos Usando R 1

  1. 1. Análisis estadístico de datos de cultivos in-vitro usando R Juan Pablo Angamarca G. Becario Escuela de Ciencias de la Computación [email_address] Mat. Pablo Ramón C. Docente Investigador Docente Investigador – LFV – UTPL [email_address] Unidad de Fisiología y Ecología Vegetal
  2. 2. Objetivos <ul><li>Realizar el análisis estadístico de los datos de cultivos in-vitro usando el lenguaje estadístico R como una mejor alternativa entre el software estadístico clásico. </li></ul><ul><li>Incorporar nuevos procedimientos al análisis estadístico mediante el lenguaje R, concretamente representaciones gráficas, con la finalidad de optimizar la interpretación biológico-estadística. </li></ul><ul><li>Aprovechar la flexibilidad que ofrece este lenguaje estadístico en dicho análisis. </li></ul>
  3. 3. Metodología <ul><li>Fase 1: Entender el funcionamiento del lenguaje R mediante la lectura de artículos y tutoriales. </li></ul><ul><li>Fase 2: Realizar aplicaciones sencillas de análisis de datos en el lenguaje. </li></ul><ul><li>Fase 3: Utilizar los datos de las investigaciones realizadas en el laboratorio de Fisiología Vegetal para un análisis estadístico adecuado. </li></ul><ul><li>Fase 4: Extender la fase 3 utilizando las características de programación del lenguaje. </li></ul>
  4. 4. Análisis de Varianza <ul><li>Identificar el origen de la variabilidad de una o más fuentes potenciales, llamadas “tratamientos” o “factores”. </li></ul><ul><li>Variando los factores o niveles en un diseño predeterminado y analizando los resultados. </li></ul>
  5. 5. Análisis de Varianza <ul><li>Comparar promedios de tratamientos. </li></ul><ul><li>Identificar si la variabilidad depende de los diferentes tratamientos o de un error aleatorio. </li></ul><ul><li>Hipótesis: </li></ul><ul><li>H0: μ1 = μ2 = … = μα </li></ul><ul><li>Donde μi representa la media de cada nivel (one-way) o tratamiento (two-way). </li></ul>
  6. 6. Condiciones de ANOVA <ul><li>Test de Bartlett (variabilidad) </li></ul><ul><li>El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). </li></ul><ul><li>Test Kolmogorov-Smirnov </li></ul><ul><li>Es un test de ajuste a una ley continua (normal). </li></ul><ul><li>Test Shapiro-Wilk (Normalidad de los residuos) </li></ul><ul><li>El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”. </li></ul>
  7. 7. Condiciones del ANOVA <ul><li>Test de Bartlett (variabilidad) </li></ul><ul><li>El test de Bartlett (Snedecor y Cochran, 1983) tiene como utilidad el determinar si k muestras tienen varianzas iguales (homogeneidad de varianzas). </li></ul><ul><li>Test Kolmogorov-Smirnov </li></ul><ul><li>Es un test de ajuste a una ley continua (normal). </li></ul><ul><li>Test Shapiro-Wilk (Normalidad de los residuos) </li></ul><ul><li>El test Shapiro-Wilk es un análisis de varianza (semi/no) paramétrico que nos dota de evidencia para afirmar que existen ciertos tipos de normalidad, mas no garantiza “normalidad”. </li></ul>
  8. 8. Análisis de Varianza <ul><li>Luego de realizar el test ANOVA, se realiza una prueba post-hoc, ejm: test Tukey </li></ul><ul><li>Test post-hoc = test comparaciones múltiples </li></ul>
  9. 9. Lenguaje y Entorno R <ul><li>R lenguaje y entorno para computación estadística y gráficos </li></ul><ul><li>Es un proyecto GNU (software libre) </li></ul><ul><li>Posibilidad de crear gráficos, incluir símbolos y fórmulas matemáticas donde se necesiten. </li></ul><ul><li>R es una suite integrada de utilitarios de software </li></ul><ul><li>Un bien logrado, simple y efectivo lenguaje de programación que incluye sentencias condicionales, bucles, funciones definidas por usuario y facilidades para ingreso y presentación de datos </li></ul>
  10. 10. Lectura de datos con R <ul><li>R puede obtener datos desde varias fuentes </li></ul><ul><li>Ejm: datos en Excel, así que, para facilitarnos la importación de datos, podemos exportar una hoja de Excel como un archivo de texto. </li></ul><ul><li>Luego importarlo con la función read.table de R, que al leer el archivo, creará un objeto de datos llamado “Data frame”, que contendrá los datos del archivo. </li></ul><ul><li>Asignación a un objeto brotacionCinchona los datos del archivo: </li></ul><ul><li>> brotacionCinchona <-read.table(“datos_anova.txt”, header = TRUE) </li></ul>
  11. 11. Lectura de datos con R
  12. 12. CASO DE ESTUDIO: Brotación de C. officinalis <ul><li>Desarrollar un test de Bartlett para determinar si las varianzas en cada tratamiento son iguales estadísticamente. </li></ul><ul><li>H0 = No existe diferencia significativa entre las varianzas de los tratamientos. </li></ul><ul><li>> bartlett.test (brotacionCinchona$Brotacion, brotacionCinchona$Tratamientos) </li></ul><ul><li> Bartlett test for homogeneity of variances </li></ul><ul><li>data: brotacionCinchona$Brotacion and brotacionCinchona$Tratamientos </li></ul><ul><li>Bartlett's K-squared = 6.6692, df = 11, p-value = 0.8252 </li></ul><ul><li>Conclusión : Puesto que p-value es mayor que 0.05, no se rechaza la hipótesis de homogeneidad de varianzas. </li></ul>
  13. 13. <ul><li>Test ANOVA </li></ul><ul><li>H0 = No existe diferencia significativa en la brotación media de cada tratamiento. </li></ul><ul><li>> aov.brotacionCinchona <- aov (brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) </li></ul><ul><li>> aov.brotacionCinchona </li></ul><ul><li>Call: </li></ul><ul><li> aov(formula = brotacionCinchona$Brotacion ~ brotacionCinchona$Tratamientos) </li></ul><ul><li>Terms: </li></ul><ul><li> brotacionCinchona$Tratamientos Residuals </li></ul><ul><li>Sum of Squares 45 230 </li></ul><ul><li>Deg. of Freedom 11 24 </li></ul><ul><li>Residual standard error: 3.095696 </li></ul><ul><li>Estimated effects may be unbalanced </li></ul><ul><li>> summary (aov.brotacionCinchona) </li></ul><ul><li> Df Sum Sq Mean Sq F value Pr(>F) </li></ul><ul><li>brotacionCinchona$Tratamientos 11 45.000 4.091 0.4269 0.9287 </li></ul><ul><li>Residuals 24 230.000 9.583 </li></ul><ul><li>Puesto que Pr > 0.05, no se rechaza la hipótesis de igualdad de promedios entre cada tratamiento. </li></ul>
  14. 14. Gráficas de ANOVA
  15. 15. Test TUKEY HSD <ul><li>OBJETIVO: Determinar tratamientos significativamente diferentes </li></ul><ul><li>> resultados.tukey <- TukeyHSD (aov.cinchona) > resultados.tukey Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Brotación ~ Tratamientos) </li></ul>
  16. 16. RESULTADOS TEST DE TUKEY
  17. 17. Tratamientos significativos <ul><li>> parejas.dif.significativa </li></ul><ul><li>Parejas.de.tratamientos Valores.p </li></ul><ul><li>1 T-B1N0 0.0015792 </li></ul><ul><li>2 T-B1N1 0.0230317 </li></ul><ul><li>3 T-B1N2 0.0120260 </li></ul><ul><li>4 T-B1N3 0.0011190 </li></ul><ul><li>5 T-B2N0 0.0031345 </li></ul><ul><li>6 T-B2N1 0.0061755 </li></ul><ul><li>7 T-B2N2 0.0011190 </li></ul><ul><li>8 T-B2N3 0.0044048 </li></ul><ul><li>9 T-B3N0 0.0022264 </li></ul><ul><li>10 T-B3N1 0.0031345 </li></ul><ul><li>11 T-B3N2 0.0011190 </li></ul><ul><li>12 T-B3N3 0.0002812 </li></ul>
  18. 18. Gráfica Test Tukey > plot(datos.tukey)

×