Paquete ggplot - Potencia y facilidad para generar gráficos en R

6,872 views
6,642 views

Published on

El paquete ggplot de R proporciona un poderoso sistema que hace que sea fácil de producir gráficos complejos de varias capas, automatiza varios aspectos tediosos del proceso de graficar manteniendo al mismo tiempo la habilidad de construir paso a paso un gráfico pues se compone de una serie de pequeños bloques de construcción independientes, esto reduce la redundancia dentro del código, y hace que sea fácil de personalizar el gráfico para obtener exactamente lo que se desea.

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
6,872
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
83
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Paquete ggplot - Potencia y facilidad para generar gráficos en R

  1. 1. PAQUETE GGPLOT.- POTENCIA Y FACILIDAD PARA GENERAR GRÁFICOS Néstor Montaño, Julio Villamar Instituto de Ciencias Matemáticas nestor.montano@gmail.com, j.villamar.2009@gmail.com
  2. 2. Componentes de un gráfico • Datos junto con características estéticas • Objetos geométricos, (puntos, líneas, polígonos, áreas, etc.) • Transformaciones estadísticas • Escalas • Sistema de coordenadas • Condicionamiento
  3. 3. Comando qplot • Considere un data.frame llamado “datos” el cual contiene las variables: “Peso” “Altura” y “genero” > qplot(x, y, data) > qplot(altura, peso, data=datos) Los comandos así planteados generan un gráfico de dispersión Altura vs Peso
  4. 4. …Comando qplot “altura” vs “peso” según el “género”, entonces podemos agregar al grafico la característica estética color asociada a la variable categórica “genero”. >qplot(altura, peso, data= datos, colour =genero ,xlab="Altura (Centimetros)", ylab="Peso (Libras)")
  5. 5. …Comando qplot Aquí además de los puntos se muestra la tendencia mediante una línea suavizada. >qplot(altura,peso,data= datos, geom=c("point","smooth"), xlab="Altura (Centimetros)", ylab="Peso (Libras)") > library(splines) >qplot(altura,peso,data= datos, geom=c("point","smooth"), method=”lm”, xlab="Altura (Centimetros)", ylab="Peso (Libras)") También se puede usar librerías especializadas para generar la tendencia.
  6. 6. …Comando qplot Este gráfico se ilustra es uso de transparencias, así los puntos más oscuros indican que hay varias observaciones ocupando el mismo lugar. > qplot(nivel,peso, data = x, alpha=I(1/5), xlab="Nivel de Educacion", ylab="Peso (libras)")
  7. 7. …Comando qplot Si se quiere conocer si existe alguna mejoría en la relación “altura” vs “peso” cuando aumenta el “nivel de educación” de los individuos, se usa el comando facet como se muestra aquí. > qplot(nivel,peso, data = x, alpha=I(1/5), xlab="Nivel de Educacion", ylab="Peso (libras)")
  8. 8. …Comando qplot Ahora agrupamos los datos por nivel de educación y por el género > qplot(altura,peso,data= datos, xlab="Altura (Centimetros)" , ylab="Peso (Libras)") + facet_grid(genero~nivel)
  9. 9. …Comando qplot Histograma de frecuencias para la variable Peso >qplot(peso, data= datos, geom = “histogram”)
  10. 10. …Comando qplot Aquí se modifica el ancho de los intervalos, además se espefica los limites del eje x. >qplot(peso, data= datos, geom = “histogram”, binwidth = 5, xlim=c(80,220))
  11. 11. Comando ggplot Al usar ggplot() el primer paso es crear el objeto “gráfico” de la siguiente manera: > g <- ggplot(datos, aes(altura, peso, colour = genero)) Aquí se asigna a la variable “g” el gráfico creado, el mismo que usa el data.frame “datos” y las características estéticas que se le declaran son “altura” para el eje x, “peso” para el eje y, y “género” para color. Así planteado, el gráfico aún no puede ser visualizado pues no se le ha insertado capa alguna
  12. 12. Comando ggplot Aquí, al la variable “g” se le aumenta un layer de puntos > g + layer( geom = ”point”) > g + geom_point Otra forma (más sencilla) de hacer esto es:
  13. 13. Comando ggplot > g + geom_point()+ geom_smooth()
  14. 14. Comando ggplot > g + geom_point() + facet_grid(.~nivel)
  15. 15. Comando ggplot > h<- ggplot (datos, aes(peso)) > h + geom_histogram(binwidth=5) + xlim=c(80,220))
  16. 16. Comando ggplot > h<- ggplot (datos, aes(peso)) > h + geom_histogram(binwidth=5) + xlim=c(80,220)) + opts(panel.background = theme_rect(colour = NA)) + opts(panel.grid.major = theme_line(linetype = "dotted")) En este gráfico se especifica el ancho del intervalo del histograma, el limite del eje x y además se ha modificado el fondo y la grilla.
  17. 17. Poder del paquete ggplot
  18. 18. Poder del paquete ggplot

×