Introdução ao R

1,859 views

Published on

Minicurso de R
Pós-Graduação em Modelagem Computacional da UFJF

Conteúdo:
1 - Interface R
2 - Sintaxe R
3 - Pacotes do R
4 - Gráficos
5 - Interface com outras linguagens
6 - Análise de casos

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,859
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
75
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Introdução ao R

  1. 1. Introdução ao R Programa de Pós-Graduação em Modelagem Computacional da UFJF Leonardo Goliatt Departamento de Mecânica Aplicada e Computacional UFJF leonardo.goliatt@ufjf.edu.br v. 13.07 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 1 / 132
  2. 2. Programa 1 Interface R 2 Sintaxe R 3 Pacotes do R 4 Gráficos 5 Interface com outras linguagens 6 Análise de casos Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 2 / 132
  3. 3. Conteúdo 1 Interface R 2 Sintaxe R Informações Preliminares Informações Preliminares Sintaxe do R Símbolos Vetores Instruções de Controle Funções Operadores Estruturas de dados Objetos e Classes 3 Pacotes do R Pacotes de dados e funções 4 Gráficos Gráficos no R 5 Interface com outras linguagens R e outras Linguagens de Programação Combinando R com C e Fortran 6 Análise de casos Ajuste de Curvas Vazão da Represa de Furnas Análise de Adubação da Soja Usando o ANOVA Análise Granulométrica do Solo Computação Simbólica no R Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 3 / 132
  4. 4. Interface R Conteúdo 1 Interface R Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 4 / 132
  5. 5. Interface R O R e sua filosofia de trabalho R pode ser definido como um ambiente de programação com ferramentas para manipulação de dados cálculos e apresentação gráfica Como ambiente, entende-se um sistema coerente e totalmente planejado O R não é um software do tipo aplicativo a preocupação não é com amigabilidade, mas com flexibilidade capacidade de manipulação de dados realização de análises Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 4 / 132
  6. 6. Interface R Sobre o R R é free R é open-source Qualquer pessoa tem liberdade para usar e modficar Quem usa R? Google Pfizer Merck Bank of America R possui mas de 1600 pacotes, entre eles: BiodiversityR (ecologia e meio ambiente) Emu (análise da fala) GenABEL (genoma humano) ... Deu no New York Times: http://nyti.ms/Wl12E4 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 5 / 132
  7. 7. Interface R O que é o R? R é um programa para análise estatística e representação gráfica. Funções e resultados de análises são armazenados como objetos, permitindo: fácil modificação de funções construção de modelos R é flexível e personalizável Ideal para análise exploratória de dados Por outro lado, R é pouco eficiente para manipular grandes conjuntos de dados Pouco eficiente na execução de grandes laços (loops) quando comparado com outras linguagens com C, Fortran e C++ Alternativas: Pacotes de acesso a banco de dados (RMySQL) Uso de bibliotecas (escritas em C e Fortran) compiladas (R CMD SHLIB) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 6 / 132
  8. 8. Interface R Objetivos Apresentar o ambiente de programação R contexto de simulação e análise de dados Fornecer exemplos claros e simples da funcionalidade e flexibilidade do R Estimular o aproveitamento do Software Livre, evitando as restrições de softwares comerciais e o uso não autorizado destes. Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 7 / 132
  9. 9. Interface R Página Oficial do R Referência básica para usuários de R: http://www.r-project.org/ inclui programas para download listas de discussão documentação e ajuda Livros: R in a Nutshell The Art of R Programming Onde baixar (Linux, Windows, Mac): http://cran.fiocruz.br/ Ubuntu (Linux): sudo apt-get install r-base Onde ober ajuda: R mailing list Stack Overflow www.stackoverflow.com Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 8 / 132
  10. 10. Interface R Como usar o R? Diretamente do terminal ou console (tela preta) Linux: konsole, xterm, gnome-terminal Usando interfaces gráficas Rstudio: http://rstudio.org/ Rkward: http://rkward.sourceforge.net/ Rcmdr: http://www.rcommander.com/ StatET: http://www.walware.de/goto/statet/ Outras interfaces: http://www.sciviews.org/_rgui/ Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 9 / 132
  11. 11. Interface R Invocando o R na linha de comando Se estiver corretamente instalado, abra um terminal e digite R. O símbolo “>” indica que o R está esperando um comando Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 10 / 132
  12. 12. Interface R Invocando o R na linha de comando 1> R version 2.13.1 (2011-07-08) 2> Copyright (C) 2011 The R Foundation for Statistical Computing 3> ISBN 3-900051-07-0 4> Platform: x86_64-pc-linux-gnu (64-bit) 5> 6> R é um software livre e vem sem GARANTIA ALGUMA. 7> Você pode redistribuí-lo sob certas circunstâncias. 8> Digite 'license()' ou 'licence()' para detalhes de distribuição. 9> 10> R é um projeto colaborativo com muitos contribuidores. 11> Digite 'contributors()' para obter mais informações e 12> 'citation()' para saber como citar o R em publicações. 13> 14> Digite 'demo()' para demonstrações, 'help()' para o sistema 15> de ajuda, ou 'help.start()' a ajuda em HTML no seu navegador. 16> Digite 'q()' para sair do R. Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 11 / 132
  13. 13. Interface R Invocando o R na linha de comando Ajuda sobre algo sobre o que se deseja 1> apropos('help') # busca por comandos similares 2> [1] "help" "help.request" "help.search" "help.start" 3> apropos('mean') 4> [1] "colMeans" "kmeans" "mean" 5> [5] "mean.Date" "mean.default" "mean.difftime" 6> [9] "mean.POSIXlt" "rowMeans" "weighted.mean" Quando só se sabe o que procurar 1> help('mean') # help em modo texto 2> ?mean # o mesmo que help('mean') 3> help('mean',help_type='html') # help em modo html Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 12 / 132
  14. 14. Interface R Invocando o R na linha de comando Para sair do programa, digite 1> quit() 2> Save workspace image? [y/n/c]: n Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 13 / 132
  15. 15. Sintaxe R Conteúdo 2 Sintaxe R Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 14 / 132
  16. 16. Sintaxe R Informações Preliminares Informações Preliminares Tipos de dados: character (“Leonardo”) numeric (1.) integer (3) logical (TRUE or FALSE) vector (tipos homogêneos) list (parecidos vectors, mas heterogêneos) matrix dataframe (a maior parte dos dados estarão em dataframes) factors → Variáveis qualitativas que podem ser incluídas em modelos as.factor missing values (NA) ··· Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 14 / 132
  17. 17. Sintaxe R Informações Preliminares Informações Preliminares Funcionamento básico: entre com uma expressão no console e digite <enter> a expressão é avaliada e o resultado impresso na tela Note que [1] sempre acompanha qualquer resultado 1 # Isto éum comentário 2 1 + 2 + 3 3 [1] 6 4 1 + 2 * 3 # outro comentário 5 [1] 7 6 (1 + 2) * 3 # ... 7 [1] 9 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 15 / 132
  18. 18. Sintaxe R Informações Preliminares Informações Preliminares R é case-sensitive: então A e a são símbolos diferentes e se referem a diferentes variáveis Comandos diferentes são separados por ponto e vírgula “;” O conjunto de símbolos dependem do idioma e do sistema operacional onde se roda o R (tecnicamente, o locale em uso) Todos os símbolos alfanuméricos são permitidos, incluindo “.” e “_” Comentários começam com “#” 1 # 2 A=2; a=banana 3 print(A) 4 [1] 2 5 print(a) 6 [1] banana 7 # 8 .num=45; print(.num+1) 9 [1] 46 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 16 / 132
  19. 19. Sintaxe R Informações Preliminares Informações Preliminares Como a maioria das linguagens de programação, R permite atribuir valores a variáveis A operação de atribuição tem a sintaxe objeto recebe valor Há dois operadores que atribuem valores a um objeto dessa maneira sinal de menor seguido de hífen: - sinal de igual: = 1 # Os dois operadores de atribuição - e = são equivalentes 2 a - 2 3 f - b = 5*a 4 print(a) 5 [1] 2 6 print(b) 7 [1] 10 8 print(f) 9 [1] 10 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 17 / 132
  20. 20. Sintaxe R Informações Preliminares Informações Preliminares Uma forma de atribuição menos usada é valor atribuído a objeto 1 # Outra forma, menos usual é 2 salsa -d -e 3 print(d) 4 [1] salsa 5 print(e) 6 [1] salsa 7 8 # Para saber mais 9 ?= 10 ?- Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 18 / 132
  21. 21. Sintaxe R Informações Preliminares Informações Preliminares Em R, todo resultado é interpretado como um vetor O “[1]” indica o índice do vetor No caso abaixo, os números entre colchetes indicam o índice do primeiro elemento de cada linha 1 # sequência de inteiros no intervalo [1,50] 2 1:50 3 [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 4 [23] 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 5 [42] 42 43 44 45 46 47 48 49 50 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 19 / 132
  22. 22. Sintaxe R Informações Preliminares Informações Preliminares 1 # Usando o R como calculadora 2 4+6 3 [1] 10 4 3/2+1 5 [1] 2.6 6 4*3**3 # potências são indicadas por ** ou ^ 7 [1] 108 8 # Outras funções 9 sqrt(2) 10 [1] 1.414214 11 sin(pi) # os ângulos são interpretados em radianos 12 [1] 1.224606e-16 # zero! 13 sqrt(sin(45*pi/180)) 14 [1] 0.8408964 15 log(1) # logaritmo neperiano (base e) 16 [1] 0 17 log(64,4) # base 4 18 [1] 3 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 20 / 132
  23. 23. Sintaxe R Informações Preliminares Uso de scripts Exemplo um script: exemplo.R 1 # exemplo.R 2 a-3 3 b-6 4 print(a+b) Executando o script de dentro do R 1 source('exemplo.R') Chamando o script via terminal 1 R -f exemplo.R Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 21 / 132
  24. 24. Sintaxe R Sintaxe do R Sintaxe do R Vamos começar com uma visão geral do R È possível escrever quase qualquer expressão em R como uma função Porém, isso pode se tornar confuso e o R permite algumas sintaxes especiais A sintaxe básica envolve: Constantes números caracteres símbolos. Símbolos Operadores Operadores básicos e definidos pelo usuário Atribuição Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 22 / 132
  25. 25. Sintaxe R Sintaxe do R Sintaxe do R Vetores numéricos 1 # Números são interpretados literalmente 2 1.1 3 [1] 1.1 4 2^1023 5 [1] 8.988466e+307 6 7 # Valores em notação hexadecimal comecam com 0x 8 0x1 9 [1] 1 10 0xFFFF 11 [1] 65535 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 23 / 132
  26. 26. Sintaxe R Sintaxe do R Sintaxe do R Vetores numéricos 1 # Qualquer número éinterpretado como ponto flutuante de dupla ← precisão 2 typeof(1) 3 [1] double 4 ?typeof # mais sobre a função typeof() 5 typeof(as(1,integer)) # se deseja um inteiro, use a função ← as 6 [1] integer Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 24 / 132
  27. 27. Sintaxe R Sintaxe do R Sintaxe do R Vetores numéricos 1 # Limites de precisão 2 (2^1023 + 1) == 2^1023 # 2^1023 éo máximo de precisão 3 [1] TRUE 4 # Limites de tamanho 5 2^1024 6 [1] Inf # o universo so existe até 2^1023 7 8 # R suporta complexos, escritos como (real) + (imaginário)i 9 0+1i ^ 2 10 [1] -1+0i 11 sqrt(-1+0i) 12 [1] 0+1i 13 exp(0+1i * pi) 14 [1] -1+0i Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 25 / 132
  28. 28. Sintaxe R Sintaxe do R Sintaxe do R Vetores numéricos 1 # A função sqrt() retorna um valor do mesmo tipo de entrada 2 sqrt(-1) 3 [1] NaN 4 Warning message: 5 In sqrt(-1) : NaNs produced 6 # O operador a:b retorna uma sequência de inteiros no ← intervalo [a,b] 7 1:5 8 [1] 1 2 3 4 5 9 typeof(1:5) 10 [1] integer 11 # Para combinar um conjunto de números em um vetor, use a ← função c() 12 v - c(173,12,1.12312,-93) 13 print(v) 14 [1] 173.00000 12.00000 1.12312 -93.0000000 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 26 / 132
  29. 29. Sintaxe R Sintaxe do R Sintaxe do R Vetores numéricos 1 # Em R, c se refere a função primitiva c(), porém você pode ← redefinitr c 2 c - 3 3 c 4 [1] 3 5 # mesmo após redefinir c, você pode combinar números 6 v - c(3,2,1) 7 v 8 [1] 3 2 1 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 27 / 132
  30. 30. Sintaxe R Sintaxe do R Sintaxe do R Caracteres 1 # Um caracter contém texto entre duas aspas 2 y - abc 3 y 4 [1] abc 5 length(y) # tamanho de y 6 [1] 1 7 mode(y) # equivalente a typeof() 8 [1] character 9 10 # Um vetor de caracteres 11 z - c(abc,29 88) 12 length(z) 13 [1] 2 14 mode(z) 15 [1] character Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 28 / 132
  31. 31. Sintaxe R Sintaxe do R Sintaxe do R Caracteres 1 # Concatenação de caracteres ... 2 u - paste(abc,de,f) # concatena as strings 3 u 4 [1] abc de f 5 # ... e separação (split) 6 v - strsplit(u,.) # divide em função dos espaços 7 v 8 [[1]] 9 [1] abc de f 10 # Outra forma de concaternar ... 11 u - paste(abc,de,f,sep=.) # usa . como separador 12 u 13 [1] abc.de.f 14 # ... e separar 15 strsplit(u,) 16 [[1]] 17 [1] a b c . d e . f Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 29 / 132
  32. 32. Sintaxe R Símbolos Símbolos Um símbolo é um objeto que se refere a outro objeto 1 # Símbolo éo nome da variável em R 2 x1 - 1 3 X1 - 2 4 x1 5 [1] 1 6 X1 7 [1] 2 8 x1.1 - 1 9 x1.1_1 - 1 10 # Se necessário (!?), defina um símbolo assim: 11 1+2=3 - hello 12 1+2=3 13 [1] hello 14 # Nem todas as palavras são símbolos (palavras reservadas) 15 # -- if, else, repeat, while, function, for, in, next, break 16 # -- TRUE, FALSE, NULL, Inf, NaN, NA 17 # -- ... Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 30 / 132
  33. 33. Sintaxe R Símbolos Símbolos Funções Uma função é uma outra forma de atribuir valor a um símbolo 1 # Atribui a função vetorial c(x+1, y+1) ao símbolo f 2 f - function(x,y) {c(x+1, y+1)} 3 f(1,2) 4 [1] 2 3 5 # Para visualizar o conteúdo de f 6 f 7 function(x,y) {c(x+1, y+1)} Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 31 / 132
  34. 34. Sintaxe R Símbolos Símbolos Funções 1 # Visualizando o conteúdo da função desvio padrão 2 sd 3 function (x, na.rm = FALSE) 4 { 5 if (is.matrix(x)) 6 apply(x, 2, sd, na.rm = na.rm) 7 else if (is.vector(x)) 8 sqrt(var(x, na.rm = na.rm)) 9 else if (is.data.frame(x)) 10 sapply(x, sd, na.rm = na.rm) 11 else sqrt(var(as.vector(x), na.rm = na.rm)) 12 } Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 32 / 132
  35. 35. Sintaxe R Vetores Vetores Operações básicas O comando c(), de “combinar”, é a forma principal de criar vetores 1 # Criando objetos 2 x- c(1,2,3); print(x) 3 [1] 1 2 3 4 y- 5:9; print(y) # aqui temos uma sequência 5 [1] 5 6 7 8 9 6 z-c(x,y); print(z) # x e y são aglutinados em z 7 [1] 1 2 3 5 6 7 8 9 8 # Listando os elementos no espaço de trabalho 9 ls() 10 [1] x y z 11 # Apagando alguns deles 12 rm(x,y) 13 # Listando novamente 14 ls() 15 [1] z 16 rm(list=ls()) # apaga tudo Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 33 / 132
  36. 36. Sintaxe R Vetores Vetores Operações básicas 1 # soma de vetores 2 c(1,2,3) + c(1,1,1) 3 [1] 2 3 4 4 # se não têm o mesmo tamanho, a menor sequência érepetida 5 c(1, 2, 3, 4) + 1 6 [1] 2 3 4 5 7 # o mesmo vale para divisão 8 1 / c(1, 2, 3, 4, 5) 9 [1] 1.0000000 0.5000000 0.3333333 0.2500000 0.2000000 10 11 # no caso abaixo, a menor sequência tem tamanho 2 12 c(1, 2, 3, 4) + c(10, 100) 13 [1] 11 102 13 104 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 34 / 132
  37. 37. Sintaxe R Vetores Vetores Operações básicas 1 # A primeira sequência não émúltipla da segunda: 5 não é← mútiplo de 2 2 c(1, 2, 3, 4, 5) + c(10, 100) 3 [1] 11 102 13 104 15 4 Mensagens de aviso perdidas: 5 In c(1, 2, 3, 4, 5) + c(10, 100) : 6 comprimento do objeto maior não émúltiplo do comprimento do ← objeto menor 7 # Em R podemos entrar com expressões de caracteres 8 Hello world. 9 [1] Hello world. 10 # Um vetor de caracteres de comprimento 2 11 c(Hello world, Hello R interpreter) 12 [1] Hello world 13 [2] Hello R interpreter Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 35 / 132
  38. 38. Sintaxe R Vetores Vetores Operações básicas 1 # Formas de acessar os membros de um vetor 2 b = c(1:10) 3 b 4 [1] 1 2 3 4 5 6 7 8 9 10 5 b[5] # acessa o 5o. elemento de b 6 [1] 5 7 b[2:7] # acessa uma fatia de b 8 [1] 2 3 4 5 6 7 9 b%%3 # resto da divisão por 3 10 [1] 1 2 0 1 2 0 1 2 0 1 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 36 / 132
  39. 39. Sintaxe R Vetores Vetores Operações básicas 1 # A operação abaixo retorna um vetor lógico 2 b%%3==0 3 [1] FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE TRUE FALSE 4 5 # Elementos de b congruentes de 0 (mod 3) 6 b[b%%3==0] 7 [1] 3 6 9 8 # 9 b[c(2,6,9)] 10 [1] 2 6 9 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 37 / 132
  40. 40. Sintaxe R Instruções de Controle Instruções de Controle As instruções de controle em R são muito similares àquelas de C, C++, Perl e Python Aqui vamos focar nos laços (loops) e condicionais (if-else) 1 # Python-like for: uma iteração para cada elemento 2 x - c(5,12,13) 3 for (n in x){ 4 + y = x/10 5 + print(n^2+y) 6 + } 7 [1] 25.5 8 [1] 144.12 9 [1] 169.13 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 38 / 132
  41. 41. Sintaxe R Instruções de Controle Instruções de Controle As instruções de controle em R são muito similares àquelas de C, C++, Perl e Python Aqui vamos focar nos laços (loops) e condicionais (if-else) 1 # O mesmo vale para listas 2 l=list(p=21,k=c(1,2,3),z=NaN, f=function(a){return(a^2)}) 3 for(x in l) print(x) 4 [1] 21 5 [1] 1 2 3 6 [1] NaN 7 function(a){return(a^2)} Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 39 / 132
  42. 42. Sintaxe R Instruções de Controle Instruções de Controle 1 # C-style while 2 i - 1 3 while (i = 10) i - i+4 4 i 5 [1] 13 6 7 # Funcionamento básico do if 8 if (r == 4) { 9 + x - 1 10 +} else { 11 + x - 3 12 + y - 4 13 +} Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 40 / 132
  43. 43. Sintaxe R Instruções de Controle Instruções de Controle 1 # Duas formas de representar a mesma operação 2 x - 1 3 y - if(x == 2) x else x+1 4 y 5 [1] 2 6 if(x == 2) y - x else y - x+1 7 y 8 [1] 2 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 41 / 132
  44. 44. Sintaxe R Funções Funções Em R, as operações que fazem todo o trabalho são chamadas funções 1 # Funções com 1 argumento 2 exp(1) 3 [1] 2.718282 4 cos(3.141593) 5 [1] -1 6 # Alguns argumentos podem ser especificados pelo nome 7 log(x=64, base=4) 8 [1] 3 9 # O comando seq() possui vários argumento opcionais 10 seq(from=0,to=10,by=0.8) # intervalo 11 [1] 0.0 0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4 7.2 8.0 8.8 9.6 12 seq(from=0,to=10,length=20) # comprimento 13 [1] 0.0000000 0.5263158 1.0526316 1.5789474 2.1052632 2.6315789 14 [7] 3.1578947 3.6842105 4.2105263 4.7368421 5.2631579 5.7894737 15 [13] 6.3157895 6.8421053 7.3684211 7.8947368 8.4210526 8.9473684 16 [19] 9.4736842 10.000000 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 42 / 132
  45. 45. Sintaxe R Funções Funções Nem todas as funções têm a forma f (x1,x2,....) Algumas aparecem na forma de operadores 1 17 + 2 2 [1] 19 3 2 ^ 10 4 [1] 1024 5 3 == 4 6 [1] FALSE Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 43 / 132
  46. 46. Sintaxe R Funções Funções Assim como em qualquer linguagem de programação, o cerne do R consiste em escrever funções Uma função é um grupo de instruções que recebe as entradas, opera sobre elas e retorma uma saída 1 # Conta o número de números ímpares em um vetor de inteiros 2 oddcount - function(x) 3 + k - 0 # o + indica continuação de linha 4 + for (n in x) { 5 + if (n %% 2 == 1) k 6 + } 7 + return(k) # o função retorna alguma coisa 8 + } 9 10 oddcount(c(1,3,5)) 11 [1] 3 12 oddcount(c(1,2,3,7,9)) 13 [1] 4 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 44 / 132
  47. 47. Sintaxe R Funções Funções Variáveis criadas fora da função são globais e visíveis pela função 1 f - function(x) return(x+y) 2 y - 3 3 f(5) 4 [1] 8 Entradas podem ter um valor default 1 f - function(x,y=10) return(x+y) 2 f(x=3) 3 [1] 13 4 f(x=3,y=3) 5 [1] 6 6 f(k=3) 7 Error in f(k = 3) : unused argument(s) (k = 3) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 45 / 132
  48. 48. Sintaxe R Operadores Operadores Operadores básicos Um operador é uma função que toma um ou mais argumentos e pode ser escrita sem parênteses 1 x - -1:5 2 x 3 [1] -1 0 1 2 3 4 5 4 # adição e multiplicação 5 2 * x + 3 6 [1] 1 3 5 7 9 11 13 7 # exponenciação 8 x^3 9 [1] -1 0 1 8 27 64 125 10 # resto da divisão (módulo) 11 x %% 2 #-- éperiódico 12 [1] 1 0 1 0 1 0 1 13 # divisão inteira 14 x %/% 5 # x %/% 5 == floor(x/5) 15 [1] -1 0 0 0 0 0 1 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 46 / 132
  49. 49. Sintaxe R Operadores Operadores Operadores definidos pelo usuário 1 # Você pode definir seus próprios operadores 2 # Vamos definir o operador %myop% através de uma função 3 %myop% - function(a, b) {2*a + b} 4 1 %myop% 1 5 [1] 3 6 1 %myop% 2 7 [1] 4 8 c(1,2,3,4,5) %myop% 2 9 [1] 4 6 8 10 12 10 # Atribuição éum operador 11 x - c(1,2,3,4,5) 12 # O negativo também éum operador 13 -7 14 [1] -7 15 # O ponto de interrogação ? (help) também éum operador 16 ?? Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 47 / 132
  50. 50. Sintaxe R Operadores Operadores Atribuição 1 # As operações de atribuição atribuem um objeto a um símbolo 2 # Vetor atribuído a um símbolo 3 v - c(1,2,3,4,5,6,7,8) 4 # Objeto lista atribuída a um símbolo 5 y - list(sapato=mocassim, chapeu=gorro, camisa=polo) 6 y 7 $sapato 8 [1] mocassim 9 $chapeu 10 [1] gorro 11 $camisa 12 [1] polo 13 # Objeto função atribuído a um símbolo 14 z - function(a,b,c) {a ^ b / c} 15 z 16 function(a,b,c) {a ^ b / c} Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 48 / 132
  51. 51. Sintaxe R Estruturas de dados Introdução as estruturas de dados Em R, podemos construir estruturas de dados mais complicadas do que vetores Alguns casos arrays listas dataframes ... Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 49 / 132
  52. 52. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Um array éum vetor multidimensional 2 a - array(c(1,2,3,4,5,6,7,8,9,10,11,12),dim=c(3,4)) 3 a 4 [,1] [,2] [,3] [,4] 5 [1,] 1 4 7 10 6 [2,] 2 5 8 11 7 [3,] 3 6 9 12 8 # Para acessar o elemento [2,2] 9 a[2,2] 10 [1] 5 11 # Veja como fica um vetor com o mesmo conteúdo 12 v - c(1,2,3,4,5,6,7,8,9,10,11,12); v 13 [1] 1 2 3 4 5 6 7 8 9 10 11 12 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 50 / 132
  53. 53. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Relembrando do array a, podemos acessá-lo de diferentes formas 2 a 3 [,1] [,2] [,3] [,4] 4 [1,] 1 4 7 10 5 [2,] 2 5 8 11 6 [3,] 3 6 9 12 7 8 # Somente a primeira linha 9 a[1,] 10 [1] 1 4 7 10 11 # Somente a primeira coluna 12 a[,1] 13 [1] 1 2 3 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 51 / 132
  54. 54. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Acessando uma fatia das linhas 2 a[1:2,] 3 [,1] [,2] [,3] [,4] 4 [1,] 1 4 7 10 5 [2,] 2 5 8 11 6 # Relembrando do array a mais uma vez 7 a 8 [,1] [,2] [,3] [,4] 9 [1,] 1 4 7 10 10 [2,] 2 5 8 11 11 [3,] 3 6 9 12 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 52 / 132
  55. 55. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Acessando um conjunto não contíguo colunas 2 a[,c(1,3)] # mostra somente as colunas 1 e 3 3 [,1] [,2] 4 [1,] 1 7 5 [2,] 2 8 6 [3,] 3 9 7 8 # O sinal negativo exclui linhas ou colunas 9 a[-c(1,3),] # exclui linhas 1 e 3 10 [1] 2 5 8 11 11 a[-2,-c(1,4)] # exclui linha 2 e colunas 1 e 4 12 [,1] [,2] 13 [1,] 4 7 14 [2,] 6 9 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 53 / 132
  56. 56. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Uma matriz éum array bidimensional 2 m - matrix(data=c(1,2,3,4,5,6,7,8,9,10,11,12),nrow=3,ncol=4) 3 m 4 [,1] [,2] [,3] [,4] 5 [1,] 1 4 7 10 6 [2,] 2 5 8 11 7 [3,] 3 6 9 12 8 9 # O comando matrix(() preenche as colunas com os dados ← fornecidos 10 matrix(1:6,nrow=2) 11 [,1] [,2] [,3] 12 [1,] 1 3 5 13 [2,] 2 4 6 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 54 / 132
  57. 57. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # O preencimento por linhas também épossível 2 matrix(1:6,nrow=2, byrow=TRUE) 3 [,1] [,2] [,3] 4 [1,] 1 2 3 5 [2,] 4 5 6 6 7 # Uma outra forma de criar uma matriz éusando as funções 8 # -- rbind() 9 m - rbind(c(1,4),c(2,-3)) 10 m 11 [,1] [,2] 12 [1,] 1 4 13 [2,] 2 -3 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 55 / 132
  58. 58. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # -- cbind() 2 n - cbind(c(1,4),c(2,-3)) 3 n 4 [,1] [,2] 5 [1,] 1 2 6 [2,] 4 -3 7 8 # --diag() 9 diag(2) 10 [,1] [,2] 11 [1,] 1 0 12 [2,] 0 1 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 56 / 132
  59. 59. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Além da soma e subtração, temos as operações 2 # -- multiplicação termo a termo 3 m * diag(2)*3 4 [,1] [,2] 5 [1,] 3 0 6 [2,] 0 -9 7 8 # -- divisão termo a termo 9 m/diag(2) 10 [,1] [,2] 11 [1,] 1 Inf 12 [2,] Inf -3 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 57 / 132
  60. 60. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # -- produto matricial 2 m % * % n 3 [,1] [,2] 4 [1,] 17 -10 5 [2,] -10 13 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 58 / 132
  61. 61. Sintaxe R Estruturas de dados Estruturas de dados Arrays Atenção! 1 # O R pode operar com arrays de diferentes tamanhos, por ← causa do reuso dos vetores! 2 x=matrix(1:6,ncol=2) 3 x 4 [,1] [,2] 5 [1,] 1 4 6 [2,] 2 5 7 [3,] 3 6 8 # Aparentemente, a operação não faria sentido 9 x+c(1,2) 10 [,1] [,2] 11 [1,] 2 6 12 [2,] 4 6 13 [3,] 4 8 14 # Vamos vamos fazer algumas considerações... Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 59 / 132
  62. 62. Sintaxe R Estruturas de dados Estruturas de dados Arrays Atenção! 1 # Neste caso, ocorre a repetição dos valores, e a soma ← anterior éequivalente a 2 x + c(1,2,1,2,1,2) 3 [,1] [,2] 4 [1,] 2 6 5 [2,] 4 6 6 [3,] 4 8 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 60 / 132
  63. 63. Sintaxe R Estruturas de dados Estruturas de dados Arrays Atenção! 1 # Observe a construção da matrix y, com c(1,2) repetido nas ← colunas 2 y=matrix(c(1,2,1,2,1,2),ncol=2) 3 y 4 [,1] [,2] 5 [1,] 1 2 6 [2,] 2 1 7 [3,] 1 2 8 x + y 9 [,1] [,2] 10 [1,] 2 6 11 [2,] 4 6 12 [3,] 4 8 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 61 / 132
  64. 64. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Arrays podem ter mais de uma dimensão 2 w - array(c(1:18),dim=c(3,3,2)) 3 print(w) 4 , , 1 5 6 [,1] [,2] [,3] 7 [1,] 1 4 7 8 [2,] 2 5 8 9 [3,] 3 6 9 10 11 , , 2 12 13 [,1] [,2] [,3] 14 [1,] 10 13 16 15 [2,] 11 14 17 16 [3,] 12 15 18 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 62 / 132
  65. 65. Sintaxe R Estruturas de dados Estruturas de dados Arrays 1 # Acessando um dos elementos 2 w[1,1,1] 3 [1] 1 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 63 / 132
  66. 66. Sintaxe R Estruturas de dados Estruturas de dados Listas Uma lista aceita a mistura de objetos de diferentes tipos 1 # Uma lista contendo um número e uma string 2 e - list(elemento=esfera, raio=8.25) 3 e 4 $elemento 5 [1] esfera 6 $raio 7 [1] 8.25 8 # Os objetos podem ser acessados de várias formas 9 e$elemento 10 [1] esfera 11 e[2] 12 $raio 13 [1] 8.25 14 e[[2]] 15 [1] 8.25 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 64 / 132
  67. 67. Sintaxe R Estruturas de dados Estruturas de dados Listas 1 # Uma lista pode referenciar outra lista 2 g - list(Essa lista referencia outra lista, e) 3 g 4 [[1]] 5 [1] Essa lista referencia outra lista 6 7 [[2]] 8 [[2]]$objeto 9 [1] esfera 10 11 [[2]]$raio 12 [1] 8.25 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 65 / 132
  68. 68. Sintaxe R Estruturas de dados Estruturas de dados Dataframes Um dataframe é um objeto que contém múltiplos vetores que são do mesmo tamanho é semelhante a uma planilha ou base de dados bons para representar dados experimentais 1 # As 6 cidades mais populosas do Brasil 2 cidade - c('São Paulo','Rio de ← Janeiro','Salvador','Brasília','Fortaleza', 'Belo ← Horizonte','Manaus') 3 estado - c('SP','RJ','BA','DF','CE','MG','AM') 4 pop - ← c(11376685,6390290,2710698,2648532,2500194,2395785,1861838) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 66 / 132
  69. 69. Sintaxe R Estruturas de dados Estruturas de dados Dataframes Um dataframe é um objeto que contém múltiplos vetores que são do mesmo tamanho é semelhante a uma planilha ou base de dados bons para representar dados experimentais 1 # As informações estão armazenadas em vetores 2 cidade 3 [1] São Paulo Rio de Janeiro Salvador Brasília 4 [5] Fortaleza Belo Horizonte Manaus 5 estado 6 [1] SP RJ BA DF CE MG AM 7 pop 8 [1] 11376685 6390290 2710698 2648532 2500194 2395785 1861838 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 67 / 132
  70. 70. Sintaxe R Estruturas de dados Estruturas de dados Dataframes 1 # Armazenando em um dataframe 2 top6pop -data.frame(cidade,estado,pop) 3 top6pop 4 cidade estado pop 5 1 São Paulo SP 11376685 6 2 Rio de Janeiro RJ 6390290 7 3 Salvador BA 2710698 8 4 Brasília DF 2648532 9 5 Fortaleza CE 2500194 10 6 Belo Horizonte MG 2395785 11 7 Manaus AM 1861838 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 68 / 132
  71. 71. Sintaxe R Estruturas de dados Estruturas de dados Dataframes 1 # Acessando as informações contidas em top6pop 2 top6pop$estado 3 [1] SP RJ BA DF CE MG AM 4 Levels: AM BA CE DF MG RJ SP 5 # 6 top6pop[2] # outra forma de acessar os estados 7 estado 8 1 SP 9 2 RJ 10 3 BA 11 4 DF 12 5 CE 13 6 MG 14 7 AM Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 69 / 132
  72. 72. Sintaxe R Estruturas de dados Estruturas de dados Dataframes 1 top6pop$pop 2.7e6 # cidades com mais de 2.7 mi hab 2 [1] TRUE TRUE TRUE FALSE FALSE FALSE FALSE 3 # 4 top6pop$pop[top6pop$pop2.7e6] # populações maiores que 2.7 ← mi hab 5 [1] 11376685 6390290 2710698 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 70 / 132
  73. 73. Sintaxe R Objetos e Classes Objetos e Classes R é uma linguagem orientada a objetos Cada objeto em R tem um tipo E cada objeto em R é membro de uma classe Já encontramos diferentes classes: vetores de caracteres, vetores numéricos, dataframes, listas, ... 1 class(1:10) 2 [1] integer 3 class(w) 4 [1] array 5 class(v) 6 [1] numeric 7 class(top6pop) 8 [1] data.frame 9 class(e) 10 [1] list 11 class(class) 12 [1] function Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 71 / 132
  74. 74. Sintaxe R Objetos e Classes Objetos e Classes Modelos e fórmulas Um modelo é uma forma concisa de descrever um conjunto de dados, usualmente por meio de uma fórmula matemática Algumas vezes o objetivo é construir um modelo preditivo baseado em dados disponíveis para avaliar novos dados Outras vezes o objetivo é constrir um modelo descritivo que auxilie no melhor entendimento dos dados O R possui uma notação específica para decrever relações entre variáveis Suponha uma variável y onde assumimos uma dependência linear de outras variáveis x1,x2,··· ,xn, resultando no modelo y = c1x1 +c2x2 +··· +cnxn +ε Em R, podemos escrever essa relação como um objeto fórmula 1 y ~ x1 + x2 + ... + xn Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 72 / 132
  75. 75. Sintaxe R Objetos e Classes Objetos e Classes Modelos e fórmulas Vamos analisar o seguinte exemplo 1 # Conjunto de 20 pontos com ruído e distribuição normal 2 set.seed(2) 3 x = seq(from=0,to=5,length=20) 4 y = 2*x - 3 + rnorm(20) # rnorm(): distrib. normal 5 xy= data.frame(x,y) 6 xy 7 x y 8 1 0.0000000 -3.8969145 9 2 0.2631579 -2.2888350 10 ... 11 20 5.0000000 7.4322652 12 # lm() constroi um modelo y~x e atribui a variável xy.lm 13 # -- y : variável dependente 14 # -- x : variável independente 15 xy.lm = lm(formula=y~x, data=xy) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 73 / 132
  76. 76. Sintaxe R Objetos e Classes Objetos e Classes Modelos e fórmulas 1 # Vamos analisar o objeto xy.lm (modelo linear) 2 xy.lm 3 4 Call: 5 lm(formula = y ~ x, data = xy) 6 7 Coefficients: 8 (Intercept) x 9 -2.926 2.049 10 11 # Observe os coeficiente e compare com o modelo y = 2*x - 3 + ← rnorm(20) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 74 / 132
  77. 77. Sintaxe R Objetos e Classes Objetos e Classes Modelos e fórmulas 1 # Para maiores detalhes, use a função summary() 2 summary(xy.lm) 3 Call: 4 lm(formula = y ~ x, data = xy) 5 6 Residuals: 7 Min 1Q Median 3Q Max 8 -2.57694 -0.45741 0.04638 0.62709 1.80821 9 Coefficients: 10 Estimate Std. Error t value Pr(|t|) 11 (Intercept) -2.9261 0.4675 -6.259 6.65e-06 *** 12 x 2.0486 0.1598 12.816 1.74e-10 *** 13 --- 14 Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 15 Residual standard error: 1.085 on 18 degrees of freedom 16 Multiple R-squared: 0.9012, Adjusted R-squared: 0.8957 17 F-statistic: 164.3 on 1 and 18 DF, p-value: 1.738e-10 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 75 / 132
  78. 78. Sintaxe R Objetos e Classes Objetos e Classes Modelos e fórmulas 1 # predict.lm() avalia os dados do dataframe xy no modelo xy.lm 2 xy.pr=predict.lm(xy.lm) 3 4 # Usamos algumas ferramentas gráficas para visualizar 5 plot(x,y,col='blue'); lines(x,xy.pr,col='red') Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 76 / 132
  79. 79. Pacotes do R Conteúdo 3 Pacotes do R Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 77 / 132
  80. 80. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Introdução Um pacote é um conjunto de funções, arquivos de ajuda e arquivos de dados empacotados juntos Pacotes em R são similares aos modulos em Perl e Fortran, bibliotecas em C e classes em Java Tipicamente, todas as funções em um pacote estão relacionadas entre si 1 # Os pacotes de dados disponíveis são listados através 2 data() 3 4 # Os pacotes de funçõesd isponíveis são listados usando 5 library() Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 77 / 132
  81. 81. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Dados O R possui pacotes de dados internos, usados principamente para demos e desenvolvimento de pacotes 1 # Os pacotes de dados disponíveis são listados através do ← comando 2 data() 3 Data sets in package 'datasets': 4 5 AirPassengers Monthly Airline Passenger Numbers 1949-1960 6 BJsales Sales Data with Leading Indicator 7 ... 8 volcano Topographic Information on Maunga Whau Volcano 9 warpbreaks The Number of Breaks in Yarn during Weaving 10 women Average Heights and Weights for American Women 11 12 Use data(package = .packages(all.available = TRUE)) 13 to list the data sets in all *available* packages. Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 78 / 132
  82. 82. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Dados 1 # Para acessar um determinado conteúdo 2 data(trees) 3 trees 4 Girth Height Volume 5 1 8.3 70 10.3 6 2 8.6 65 10.3 7 ... 8 31 20.6 87 77.0 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 79 / 132
  83. 83. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Dados 1 # Operando com os dados 2 class(trees) 3 [1] data.frame 4 mean(trees) 5 Girth Height Volume 6 13.24839 76.00000 30.17097 7 str(trees) # mostra informações sobre a estrututa do ← objeto 8 'data.frame': 31 obs. of 3 variables: 9 $ Girth : num 8.3 8.6 8.8 10.5 10.7 10.8 11 11 11.1 11.2 ... 10 $ Height: num 70 65 63 72 81 83 66 75 80 75 ... 11 $ Volume: num 10.3 10.3 10.2 16.4 18.8 19.7 15.6 18.2 22.6 ← 19.9 ... Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 80 / 132
  84. 84. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Dados 1 # Medidas do fluxo anual do Nilo na cidade de Ashwan 1871-1970 2 data(Nile) 3 Nile 4 Time Series: 5 Start = 1871 6 End = 1970 7 Frequency = 1 8 [1] 1120 1160 963 1210 1160 1160 813 1230 1370 1140 995 935 9 [13] 1110 994 1020 960 1180 799 958 1140 1100 1210 1150 1250 10 ... 11 [85] 918 986 797 923 975 815 1020 906 901 1170 912 746 12 [97] 919 718 714 740 13 str(Nile) 14 Time-Series [1:100] from 1871 to 1970: 1120 1160 963 1210 ← 1160 1160 813 1230 1370 1140 ... 15 class(Nile) # objeto time series (série temporal) 16 [1] ts Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 81 / 132
  85. 85. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Pacotes O pacote stats agrupa funções de análise estatística 1 # Carrega os pacote -- comandos equivalentes 2 library(stats) 3 require(stats) 4 5 # Para maiores informações 6 library(help=stats) 7 ?stats Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 82 / 132
  86. 86. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Pacotes R oferece um grande número de pacotes Análise gráfica Aplicações industriais Ciências sociais .... Alguns pacotes veem com o R, outros são instalados através de repositórios Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 83 / 132
  87. 87. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Pacotes 1 # Pacotes carregados automaticamente 2 getOption(defaultPackages) 3 [1] datasets utils grDevices graphics methods stats 4 # Pacotes disponíveis para serem carregados 5 (.packages(all.available=TRUE)) 6 [1] ade4 calibrate clusterSim corrgram 7 [6] Defaults ellipse gclus Hmisc 8 [11] nutshell quantmod R2HTML RColorBrewer 9 [16] seriation TSP TTR xts 10 [21] ape biclust bitops cba 11 [26] colorspace dataframes2xls e1071 emoa 12 # Instalação de pacotes -- repositórios online 13 install.packages('psy') 14 # Remoção de pacotes 15 remove.packages(c(tree, maptree),.Library) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 84 / 132
  88. 88. Pacotes do R Pacotes de dados e funções Pacotes de dados e funções Pacotes 1 # Exemplo de uso do pacote tsa (time series analysis) 2 Error in library(TSA) : there is no package called tsa 3 # Pacote não instalado 4 5 # Instalação 6 install.packages('TSA') 7 8 # Instalação completa 9 install.packages('TSA', dependencies=T) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 85 / 132
  89. 89. Gráficos Conteúdo 4 Gráficos Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 86 / 132
  90. 90. Gráficos Gráficos no R Gráficos no R R inclui vários pacotes para a visualização de dados Se você é familiarizado com planilhas eletrônicas, vocÊ perceberá que o R pode gerar gráficos de barras gráficos de linhas histogramas gráficos de dispersão ... Vamos verificar alguns casos por meio de exemplos Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 86 / 132
  91. 91. Gráficos Gráficos no R Gráficos no R 1 # Gráfico da função seno 2 x = seq(0,1,0.1) 3 y = sin(2*pi*x) 4 plot(x,y,type='b',col='darkgreen',main='Função ← seno',xlab='eixo-x', ylab='eixo-y',lwd=2) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 87 / 132
  92. 92. Gráficos Gráficos no R Gráficos no R 1 # Gráficos de funções paramétricas de uma variável 2 par(mfrow=c(1,2)) # uma linha e duas colunas 3 curve( 3*x^2+2*x+1, -1, 2,col=red,lwd=2) 4 curve(-3*x^2+2*x+1, -1, 2,col=blue,lwd=2) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 88 / 132
  93. 93. Gráficos Gráficos no R Gráficos no R 1 # Histograma de uma série dados com distribuição normal 2 x = rnorm(1000) 3 hist(x,col=yellow,breaks=40) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 89 / 132
  94. 94. Gráficos Gráficos no R Gráficos no R 1 # Um gráfico de barras 2 barplot(c(2,4,7,5,3,1),col='lightblue') Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 90 / 132
  95. 95. Gráficos Gráficos no R Gráficos no R 1 # Gráfico de pizza 2 pie(1:6, col = rainbow(6), labels= LETTERS[1:6], radius = 0.9) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 91 / 132
  96. 96. Gráficos Gráficos no R Gráficos no R 1 # Gráfico de densidade 2 x = rnorm(200) 3 plot(density(x),col='red',lwd=2) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 92 / 132
  97. 97. Gráficos Gráficos no R Gráficos no R 1 # Boxplots 2 x - rnorm(200) # distribuição normal 3 y - rlnorm(200) # distribuição log-normal 4 plot(x, y, xlim=c(-5,5), ylim=c(-2,8)) 5 boxplot(x, col=gold , horizontal=TRUE, at=-1, add=TRUE) 6 boxplot(y, col=blue, horizontal=FALSE, at=-4, add=TRUE) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 93 / 132
  98. 98. Interface com outras linguagens Conteúdo 5 Interface com outras linguagens Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 94 / 132
  99. 99. Interface com outras linguagens R e outras Linguagens de Programação R e outras Linguagens de Programação Em R, podemos reutilizar códigos desenvolvidos em outras linguagens R e C (ou C++) R e Fortran R e Python (pacotes rpy, rpy2 e RSPython) R e Java (pacotes RJava e JRI) R e Perl (pacote RSPerl) R e MySQL (pacote RMySQL) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 94 / 132
  100. 100. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran O R é relativamente lento em algoritmos iterativos que exigem laços (loops) repetidas vezes Uma maneira de obter todas as vantagens de velocidade de C ou Fortran com a maioria da conveniência de R é escrever o loop interno em C e chamá-lo de dentro do R Vamos considerar um problema bem simples, elevar ao quadradoos elementos de um vetor x = (x1,x2,...,xn−1,xn) q(x) = (x2 1 ,x2 2 ,...,x2 n−1,x2 n ) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 95 / 132
  101. 101. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Aqui temos o código em linguagem C com uma solução para o problema O R exige duas proriedades da função: A função não retorna nenhum valor. Todo o trabalho é feito mudando os valores dos argumento. Todos os argumentos são ponteiros. Em R, mesmo escalares são vetores (de comprimento um). 1 /* pot2c.c */ 2 void pot2c(int *nin, double *x) 3 { 4 int n = nin[0]; 5 int i; 6 7 for (i=0; in; i++) 8 x[i] = x[i] * x[i]; 9 } Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 96 / 132
  102. 102. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Aqui temos o a mesma função em uma subrotina em Fortran Ela tem as mesmas duas propriedades da função em C: Ela não retorna valor, pois é uma subrotina. Funções (em Fortran) não são reconhecidas pelo R. A segunda proriedade é automática em Fortran. Fortran só aceita passagens de argumentos por referência, que corresponde aos ponteiros em C. 1 ! pot2f.f 2 subroutine pot2f(n, x) 3 integer n 4 double precision x(n) 5 integer i 6 7 do i = 1, n 8 x(i) = x(i) ** 2 9 enddo 10 end Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 97 / 132
  103. 103. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran A compilação para a geração de bibliotecas dinâmicas, é feita em um terminal Linux, e portanto fora do R (e usando o proprio R) 1 # Compila o código em C 2 R CMD SHLIB pot2c.c 3 # Resultado do comando 4 # gcc -I/usr/share/R/include -fpic -std=gnu99 -O3 -pipe -g ← -c pot2c.c -o pot2c.o 5 # gcc -shared -o pot2c.so pot2c.o -L/usr/lib/R/lib -lR 6 7 8 # Compila o código em Fortran 9 R CMD SHLIB pot2f.f 10 # Resultado do comando 11 # gfortran -fpic -O3 -pipe -g -c pot2f.f -o pot2f.o 12 # gcc -shared -o pot2f.so pot2f.o -lgfortran -lm -lquadmath ← -L/usr/lib/R/lib -lR Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 98 / 132
  104. 104. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Voltando ao R, podemos carregar as bibliotecas 1 # Carregas as biblotecas geradas 2 dyn.load(pot2c.so) 3 dyn.load(pot2f.so) 4 5 # Verifica as bibliotecas carregadas com o comando ← getLoadedDLLs() 6 getLoadedDLLs() 7 Filename ← Dynamic.Lookup 8 base base FALSE 9 methods /usr/lib/R/library/methods/libs/methods.so FALSE 10 grDevices /usr/lib/R/library/grDevices/libs/grDevices.so FALSE 11 stats /usr/lib/R/library/stats/libs/stats.so FALSE 12 pot2c /tmp/pot2c.so TRUE 13 pot2f /tmp/pot2f.so TRUE Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 99 / 132
  105. 105. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Executando o função em C 1 # Para testar, vamos criar um vetor x 2 x=c(1,2,3,4,5) 3 x 4 [1] 1 2 3 4 5 5 6 typeof(x) # x deve ser double, assim como o argumento ← na função em C 7 [1] double 8 9 # A chamada da função em R éfeita pelo comando .C() 10 .C(pot2c, n=length(x), x=x) 11 $n 12 [1] 5 13 14 $x 15 [1] 1 4 9 16 25 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 100 / 132
  106. 106. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Executando o subrotina em Fortran 1 # A chamada da subrotina em R éfeita pelo comando .Fortran() 2 .Fortran(pot2f, n=length(x), x=x) 3 $n 4 [1] 5 5 6 $x 7 [1] 1 4 9 16 25 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 101 / 132
  107. 107. Interface com outras linguagens Combinando R com C e Fortran Combinando R com C e Fortran Uma solução mais agradável é criar uma função envelope Permite checar alguns erros em R, o que é mais fácil que em C Permite que alguns argumento calculados não sejam mostrados Permite retornar somente o que o necessário 1 # Função envelope 2 pot2c - function(x) { 3 if (!is.numeric(x)) 4 stop(O argumento x deve ser numérico) 5 out - .C(pot2c, 6 n=as.integer(length(x)), 7 x=as.double(x)) 8 return(out$x) 9 } 10 11 # Executando a função 12 pot2c(x) 13 [1] 1 4 9 16 25 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 102 / 132
  108. 108. Análise de casos Conteúdo 6 Análise de casos Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 103 / 132
  109. 109. Análise de casos Ajuste de Curvas Ajuste de Curvas Vamos usar dados que relacionam a temperatura em graus Celsius com o valor da pressão de mercúrio. 1 # Carrega os dados 2 data(pressure) 3 head(pressure) 4 temperature pressure 5 1 0 0.0002 6 2 20 0.0012 7 3 40 0.0060 8 4 60 0.0300 9 5 80 0.0900 10 6 100 0.2700 11 12 pres = pressure$pressure # cria variáveis auxiliares 13 temp = pressure$temperature 14 plot(pres~temp, ylim=c(-50,400)) # gráfico dos dados Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 103 / 132
  110. 110. Análise de casos Ajuste de Curvas Ajuste de Curvas 1 # Constrói os modelos 2 lm1=lm(pres~temp) # linear 3 lm2=lm(pres~temp + I(temp^2)) # quadrático 4 lm3=lm(pres~temp + I(temp^2)+ I(temp^3)) # cúbico 5 6 summary(lm1) 7 summary(lm2) 8 summary(lm3) 9 10 # Gráficos dos modelos 11 plot(pres~temp, ← ylim=c(-50,400),xlab='Temperatura',ylab='Pressão') 12 lines(predict(lm1)~temp,col='green') 13 lines(predict(lm2)~temp,col='red') 14 lines(predict(lm3)~temp,col='blue') 15 # Legenda 16 legend(x='topleft',legend=c('linear','quadrático','cúbico'), ← col=c(3,2,4), lwd=1) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 104 / 132
  111. 111. Análise de casos Ajuste de Curvas Ajuste de Curvas Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 105 / 132
  112. 112. Análise de casos Vazão da Represa de Furnas Vazão da Represa de Furnas Análise gráfica da série histórica (1931-2010) da vazão natural mensal da represa de Furnas Fonte: http://www.ons.org.br/operacao/vazoes_naturais.aspx Planilha eletrônica contendo as séries de vazões naturais médias mensais Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 106 / 132
  113. 113. Análise de casos Vazão da Represa de Furnas Vazão da Represa de Furnas 1 # Análise da série histórica das vazões mensais da barragens ← de Furnas 2 # Fonte: http://www.ons.org.br/operacao/vazoes_naturais.aspx 3 rm(list=ls()) # apaga todo o workspace 4 print(getwd()) # onde estamos? 5 6 # Dados das vazões na planilha 7 # Vazoes_Mensais_1931_2010.xls 8 library(gdata) # suporte para leitura de planilhas 9 v - read.xls(xls='./data/Vazoes_Mensais_1931_2010.xls',sheet=1) 10 View(v) 11 12 ano - v[ANO] # primeira coluna 13 vaz - v[,-1] # todos os dados exceto a 1a coluna 14 15 # Aplica a função média nas colunas de v 16 vaz.m - apply(vaz,2,mean) # médias das vazões mensais 17 View(vaz.m) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 107 / 132
  114. 114. Análise de casos Vazão da Represa de Furnas Vazão da Represa de Furnas 1 # Análise gráfica das médias das vazões mensais 2 bp - barplot(vaz.m, ylim=c(0,1.2*max(vaz.m)), ← col=seagreen, ylab=Vazão, las=3) 3 text(bp, vaz.m, label=round(vaz.m, 0), pos=3,srt=90, cex=0.8, ← offset=1.5) 4 title(Médias mensais das vazões de Furnas); box() Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 108 / 132
  115. 115. Análise de casos Vazão da Represa de Furnas Vazão da Represa de Furnas 1 # Boxplots das vazões mensais 2 boxplot(vaz, las=3, col=steelblue, notch=1, ylab=Vazão, ← main=Vazões mensais de Furnas) 3 points(vaz.m, col='red', lwd=1, pch=19) 4 lines(vaz.m, col='red', lwd=1) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 109 / 132
  116. 116. Análise de casos Vazão da Represa de Furnas Vazão da Represa de Furnas 1 # Histograma das vazões mensais 2 vaz.t - unlist(vaz) 3 hist(vaz.t,breaks=20,freq=F,ylim=c(0,12e-4), ← ylab='Densidade', xlab='Vazão', 4 main='Histograma das Vazões', col='lightblue') 5 lines(density(vaz.t), col='red'); rug(vaz.t, col='red') Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 110 / 132
  117. 117. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja Experimento em casa de vegetação com a cultura da soja, 2 plantas por parcela com: 3 níveis do fator conteúdo de do solo água (agua), 5 níveis do fator adubação potássica (potassio), parcelas arranjadas em 5 blocos (bloco). Foram observadas as seguintes variáveis: 1 rengrao : redimento de grãos 2 pesograo : peso de grãos 3 kgrao : conteúdo de potássio no grão 4 pgrao : conteúdo de fósforo no grão 5 ts : total de sementes por planta 6 nvi : número de vagens inviáveis 7 nv : número de vagens total Fonte: http://www.leg.ufpr.br/~walmes/ Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 111 / 132
  118. 118. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Leitura dos dados no arquivo soja.txt que encontra-se no ← diretório data 2 # 3 # Primeiro, devemos saber em que diretório estamos 4 getwd() 5 # Depois, devemos mudar para o diretório onde estão os dados 6 setwd('diretorio_onde_estao_os_dados') 7 # 8 # O comando read.table() lê o arquivo em formato de tabela e ← cria um 9 # dataframe a partir dele, com as entradas correspondendo às ← linhas 10 # e as variáveis correspondendo às colunas 11 # 12 soja - read.table('./data/soja.txt',header=TRUE) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 112 / 132
  119. 119. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 View(soja) # visualização dos dados 2 3 # Algumas informações sobre os dados 4 class(soja) # classe do objeto 5 names(soja) # nomes das colunas 6 dim(soja) # dimensões 7 str(soja) # estrutura 8 head(soja) # cabeçalho 9 soja # imprime todos os registros Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 113 / 132
  120. 120. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Visualização rápida dos dados 2 head(soja) # cabeçalho 3 potassio agua bloco rengrao pesograo kgrao pgrao ts nvi nv 4 1 0 37.5 I 14.55 10.70 15.13 1.18 136 22 56 5 2 30 37.5 I 21.51 13.53 17.12 0.99 159 2 62 6 3 60 37.5 I 24.62 15.78 19.11 0.82 156 0 66 7 4 120 37.5 I 21.88 12.80 18.12 0.85 171 2 68 8 5 180 37.5 I 28.11 14.79 19.11 0.88 190 0 82 9 6 0 50.0 I 17.16 12.26 12.14 1.05 140 20 63 10 11 names(soja) 12 [1] potassio agua bloco rengrao pesograo kgrao ← pgrao ts 13 [9] nvi nv Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 114 / 132
  121. 121. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Acessando informações das variáveis ($) 2 3 soja$bloco # a variável bloco foi lida como um fator ← (variável categórica) 4 [1] I I I I I I I I I I I I I I I II ← II II 5 [24] II II II II II II II III III III III III III III III ← III III III 6 [47] IV IV IV IV IV IV IV IV IV IV IV IV IV IV V V ← V V 7 [70] V V V V V V 8 Levels: I II III IV V 9 10 soja$rengrao 11 [1] 14.55 21.51 24.62 21.88 28.11 17.16 24.44 28.50 32.94 ← 28.76 14.13 19.71 12 [16] 15.72 19.72 24.29 25.39 28.45 15.44 28.12 31.49 29.95 ← 30.06 15.42 23.68 13 [31] 12.77 20.45 24.35 27.15 24.08 16.01 24.57 28.85 26.23 ← Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 115 / 132
  122. 122. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # O comando attach() anexa a base de dados ao workspace do R 2 # 3 # Os objetos no banco de dados podem ser acessados simplesmente 4 # digitando seus nomes 5 6 attach(soja) 7 rengrao 8 [1] 14.55 21.51 24.62 21.88 28.11 17.16 24.44 28.50 32.94 28.76 9 ... 10 [73] 29.90 20.86 35.50 11 12 # Para desanexar a base de dados 13 detach(soja) 14 rengrao 15 Error: object 'rengrao' not found Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 116 / 132
  123. 123. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Exploração númerica, médias por nível de potássio, água e ← potássio:água 2 attach(soja) # anexa a base de dados 3 levels(factor(potassio)) # factor() transforma a variável em ← categórica e levels() extrai as categorias 4 [1] 0 30 60 120 180 5 6 tapply(rengrao,potassio,mean) # tapply() aplica um função a ← um grupo de valores de um array 7 0 30 60 120 180 8 15.10733 21.29733 27.48200 29.51067 30.43200 9 10 tapply(rengrao,list(agua),mean) 11 37.5 50 62.5 12 21.6956 25.1040 27.4980 13 14 tapply(rengrao,list(potassio,agua),mean) # médias de ← rendimento para potassio:agua 15 37.5 50 62.5 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 117 / 132
  124. 124. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # O comando with avalia uma expressão em uma base de dados 2 # Assim, não precisamos anexar soja 3 4 # A mesma exploração numérica anterior 5 with(soja, tapply(rengrao, list(potassio), mean)) 6 0 30 60 120 180 7 15.10733 21.29733 27.48200 29.51067 30.43200 8 9 with(soja, tapply(rengrao, list(agua), mean)) 10 37.5 50 62.5 11 21.6956 25.1040 27.4980 12 13 with(soja, tapply(rengrao, list(potassio, agua), mean)) 14 37.5 50 62.5 15 0 13.520 15.712 16.090 16 30 20.334 22.570 20.988 17 60 23.926 28.692 29.828 18 120 25.308 29.786 33.438 19 180 25.390 28.760 37.146 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 118 / 132
  125. 125. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Selecionando subconjuntos dos dados de acordo com os níveis ← das categorias 2 subset(soja, potassio==0) 3 subset(soja, bloco==I) 4 subset(soja, potassio==0 bloco==I) 5 6 7 # Selecionando subconjunto dos dados por valores das respostas 8 subset(soja, rengrao15) 9 subset(soja, rengrao15 pesograo11) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 119 / 132
  126. 126. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Gráficos simples de dispersão (rótulos, cores, simbolos, ← tamanhos) 2 plot(rengrao~potassio, data=subset(soja, agua==50)) 3 plot(rengrao~potassio, data=subset(soja, agua==50), 4 xlab=Dose de potássio, ylab=Rendimento de grãos, 5 col=2, pch=19, cex=1.2) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 120 / 132
  127. 127. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Boxplot (subconjuntos e cores) 2 boxplot(rengrao~potassio, data=subset(soja, agua==50)) 3 boxplot(rengrao~potassio, data=soja, col=yellow) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 121 / 132
  128. 128. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Todos níveis de água ao mesmo tempo (título) 2 par(mfrow=c(1,3)) # divide a janela gráfica em uma linha em ← três colunas 3 boxplot(rengrao~potassio, data=subset(soja, agua==37.5), ← ylim=c(10,45), main=37.5%) 4 boxplot(rengrao~potassio, data=subset(soja, agua==50 ), ← ylim=c(10,45), main=50.0%) 5 boxplot(rengrao~potassio, data=subset(soja, agua==62.5), ← ylim=c(10,45), main=62.5%) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 122 / 132
  129. 129. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Gráficos de barras (adição de texto) 2 par(mfrow=c(1,1)) # restaura a janela gráfica 3 pot.m - with(soja, tapply(rengrao, potassio, mean)) 4 bp - barplot(pot.m) # alterar para ylim=c(0,32) 5 text(bp, pot.m, label=round(pot.m, 3), pos=3) # pos=3 6 title(Médias dos tratamentos) 7 box() Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 123 / 132
  130. 130. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Melhorando o aspecto 2 bp - barplot(pot.m, ylim=c(0,33), col=seagreen, 3 xlab=Dose de potássio, ylab=Rendimento médio ← de grãos) 4 text(bp, pot.m, label=round(pot.m, 3), pos=3, font=3) 5 title(Médias dos tratamentos) 6 box() Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 124 / 132
  131. 131. Análise de casos Análise de Adubação da Soja Análise de Adubação da Soja 1 # Mais análise gráfica: rendimento em função de potassio para ← cada grupo de água 2 require(lattice) # biblioteca para gráficos mais elaborados 3 xyplot(rengrao~potassio, groups=agua, data=soja) 4 xyplot(rengrao~potassio, groups=agua, data=soja, ← type=c(p,a)) 5 xyplot(rengrao~potassio|agua, data=soja, type=c(p,a)) 6 xyplot(rengrao~potassio|agua, data=soja, type=c(p,smooth)) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 125 / 132
  132. 132. Análise de casos Usando o ANOVA Usando o ANOVA http://www.personality-project.org/r/r.anova.html Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 126 / 132
  133. 133. Análise de casos Análise Granulométrica do Solo Análise Granulométrica do Solo Dados de análise de imagens de agregados (análise morfométrica) de amostras de solo identificadas por dois níveis de profundidade de coleta. As variáveis observadas foram: área: area (da projeção no plano) do agregado; perimetro: perimetro do poligono (obtido da projeção no plano) do agregado; aspecto e roundness: medidas relativas à forma de um círculo; maioreixo e menoreixo: retas de maior e menor comprimentos com extremos na borda; Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 127 / 132
  134. 134. Análise de casos Análise Granulométrica do Solo Análise Granulométrica do Solo 1 # Os dados encontram-se na planilha 'agregados.xls' na pasta ← data 2 # Para a leitura dos dados, vamos precisar do pacote gdata 3 library(gdata) 4 agr - read.xls(xls='./data/agregados.xls') 5 6 str(agr) 7 'data.frame': 600 obs. of 7 variables: 8 $ profundidade: int 5 5 5 5 5 5 5 5 5 5 ... 9 $ area : num 0.0038 0.005 0.008 0.0052 0.0055 0.0046 ← 0.0055 0.0039 ... 10 $ perimetro : num 0.2 0.3 0.4 0.3 0.3 0.2 0.3 0.2 0.3 0.4 ... 11 $ aspecto : num 0.947 0.913 0.806 0.955 0.792 ... 12 $ roundness : num 0.968 0.871 0.795 0.83 0.897 ... 13 $ maioreixo : int 18 22 30 21 23 20 22 23 23 28 ... 14 $ menoreixo : num 17 20 24 20 18 20 19 15 17 27 ... 15 16 head(agr) 17 profundidade area perimetro aspecto roundness maioreixo ← Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 128 / 132
  135. 135. Análise de casos Computação Simbólica no R Computação Simbólica no R Em R podemos calcular as derivadas (simbólicas) de expressões simples 1 # Operações simbólicas com expressões simples 2 rm(list=ls()) # limpa o espaço de trabalho 3 # Cria uma expressão simbólica 4 f = expression(cos(x) + x * sin(x)) 5 class(f) 6 [1] expression 7 # Avalia a expressão, mas x ainda não exite... 8 eval(c) 9 Error in eval(expr, envir, enclos) : object 'x' not found 10 # Repetindo, mas agora com a criação de x 11 x=seq(0,pi,length=20) 12 eval(f) 13 [1] 1.00000000 1.01357652 1.05319340 1.11556315 1.19537338 14 ... 15 [19] -0.49648737 -1.00000000 Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 129 / 132
  136. 136. Análise de casos Computação Simbólica no R Computação Simbólica no R 1 # O grafico de f -- o rótulo de y éuma expressão 2 plot(ef~x,type='b', ylab=f, col='violetred4') Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 130 / 132
  137. 137. Análise de casos Computação Simbólica no R Computação Simbólica no R 1 # Derivando f simbolicamente usando o comando D() 2 D(f) # faltou o x 3 Error in .Internal(D(expr, name)) : 'name' is missing 4 D(f,x) 5 sin(x) + x * cos(x) - sin(x) 6 # Para derivadas de ordem superior, definimos a função 7 DD - function(expr,name, order = 1) { 8 if(order 1) stop('order' must be = 1) 9 if(order == 1) D(expr,name) 10 else DD(D(expr, name), name, order - 1) 11 } 12 13 DD(f,x,1) 14 sin(x) + x * cos(x) - sin(x) 15 DD(f,x,2) 16 cos(x) + (cos(x) - x * sin(x)) - cos(x) 17 DD(f,x,4) 18 -(cos(x) + (cos(x) + (cos(x) - x * sin(x))) + cos(x) - cos(x)) Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 131 / 132
  138. 138. Análise de casos Computação Simbólica no R Computação Simbólica no R 1 # Continuando com as derivadas de ordem superior 2 f4=DD(f,x,4) 3 f4 4 -(cos(x) + (cos(x) + (cos(x) - x * sin(x))) + cos(x) - cos(x)) 5 6 plot(eval(f4)~x, main=f4, type='b') # observe o título do ← gráfico Leonardo Goliatt (MAC/UFJF) Introdução ao R v. 13.07 132 / 132

×