R language presentation

10,015 views
9,873 views

Published on

Published in: Technology, Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
10,015
On SlideShare
0
From Embeds
0
Number of Embeds
8,293
Actions
Shares
0
Downloads
17
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

R language presentation

  1. 1. #VilniusR
  2. 2. Dzidorius Martinaitisdzidorius@gmail.comwww.investuotojas.euwww.twitter.com/dzidoriuswww.linkedin.com/in/dzidorius 2
  3. 3. Remėjai 3
  4. 4. VilniusRPraeitis • idėja • www.vilniusR.orgDabartis • pirmas susitikimasAteitis • susitikimai • komandinis darbas virtualioje erdvėje (kaggle.com) • hackaton/datadive • lobizmas (data.gov) 4
  5. 5. Duomenų badas INaudota vrk.lt pateiktamedžiaga 5
  6. 6. Duomenų badas IINaudota viesai.ltpateikta medžiaga http://www.viesai.lt/savivaldybiu-efektyvumas/ 6
  7. 7. Duomenų badas IIINaudotavilniaus.policija.ltpateikta medžiaga http://www.vilnius.policija.lt/?lang=1&sid=75&tid=11036 7
  8. 8. Asmeninė patirtis naudojant RNekilnojamas turtasFinansaiITLaisvalaikisPolitika 8
  9. 9. Performance tuning 9
  10. 10. Anomalijų paieškaPrisijungimų skaičiusUžklausų skaičius 10
  11. 11. Anomalijų paieška IIOracle DB sesijųskaičius 11
  12. 12. ggplot2http://had.co.nz/ggplot2/ggplot2: Elegant Graphics for Data Analysis (Use R)simple=read.table(simple.txt)node=read.table(node.txt) simple=cbind(simple,as.character(c(simple)))colnames(simple)=c(time,type)node=cbind(node,c(node))colnames(node)=c(time,type) rez=data.frame(rbind(simple, node)) require(ggplot2) ggplot(rez,aes(time,fill=type))+geom_density(alpha=0.6,size=1.3) 12
  13. 13. Butų kainos VilniujeNaudota aruodas.ltmedžiaga http://www.vilnius.policija.lt/?lang=1&sid=75&tid=11036 13
  14. 14. High frequency data30 akcijų+indeksas+etf20 dienų5000 minutinių duomenųRCpp – pagreitintiskaičiavimus 14
  15. 15. High frequency data v1 • Java JMS/klientas • MySql • RMySQL V2 • C++ klientas • Mongodb • rmongodbhttps://github.com/kafka399/Rproject/blob/master/HFD/showHFD.R 15
  16. 16. Apyvartos prognozavimas 250 dienų 10 000 atsitiktine tvarka sugeneruotų laiko eilučių 95 % konfidencialumo intervalas 16
  17. 17. Dujų kainų sezoniškumasAteities sandoriai dujomis 17
  18. 18. R greitisSugeneruotiduomenys https://github.com/kafka399/Rproject/tree/master/performance 18
  19. 19. RCpplibrary(inline)library(Rcpp)Code=###########    pure C++  ################# NumericVector bid(bid_); NumericVector ask(ask_); NumericVector close(close_); int bid_size = bid.size(); NumericVector ret(bid_size); for(int i =0;i<bid_size;i++){   if(close[i]>0)  {     if(bid[i]>close[i])           ret[i] = bid[i];  else if(ask[i]>0 && ask[i]<close[i])          ret[i] = ask[i]; else           ret[i] = close[i];//     }   else       ret[i]=(bid[i]+ask[i])/2;     } return ret;getLastPrice <- cxxfunction(signature( bid_ = "numeric",ask_ = "numeric",close_="numeric"),body=code,plugin="Rcpp") 19
  20. 20. Maratonas, 10 km.Naudotahttp://luxembourg.mikatiming.de/2011/medžiaga 20

×