Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Embedded R Execution using SQL


Published on

This presentation was given at OUG Ireland in March 2017. All about running R in the Oracle Database using SQL

Published in: Data & Analytics
  • Be the first to comment

Embedded R Execution using SQL

  1. 1.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           Embedded                          Execu)on  in  the  Oracle  Database      using                                                      .       Brendan Tierney
  2. 2.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           §  Data  Warehousing  since  1997   §  Data  Mining  since  1998   §  Analy)cs  since  1993   11th  May  18:00-­‐20:00   Bank  of  Ireland,     Grand  Canal  Dock  
  3. 3.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)          
  4. 4.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           Oracle  R  Technologies   R  Distribu)on   Oracle's  supported  redistribu)on  of  open  source  R,  provided  as  a  free   download  from  Oracle,  enhanced  with  dynamic  loading  of  high   performance  linear  algebra  libraries.     Oracle  R  Enterprise   Integra)on  of  R  with  Oracle  Database.  A  component  of  the  Oracle   Advanced  Analy)cs  Op)on.  Oracle  R  Enterprise  makes  the  open  source  R   sta)s)cal  programming  language  and  environment  ready  for  the   enterprise  with  scalability,  performance,  and  ease  of  produc)on   deployment.   Oracle  R  Advanced  Analy)cs  for   Hadoop   High  performance  na)ve  access  to  the  Hadoop  Distributed  File  System   (HDFS)  and  MapReduce  programming  framework  for  R  users.  Oracle  R   Advanced  Analy)cs  for  Hadoop  is  a  component  of  Oracle  Big  Data   Connectors  soXware  suite.     ROracle   An  open  source  R  package,  maintained  by  Oracle  and  enhanced  to  use  the   Oracle  Call  Interface  (OCI)  libraries  to  handle  database  connec)ons  -­‐   providing  a  high-­‐performance,  na)ve  C-­‐language  interface  to  Oracle   Database.  
  5. 5.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)          
  6. 6.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           But  !  
  7. 7.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           But  !  
  8. 8.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           But  !   Our  data  no  longer  fits  on  our  laptop.     a  Big  Data  issue?  
  9. 9.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           R  -­‐  The  Challenges     §  Scalability   §  Regardless  of  the  number  of  cores  on  your  CPU,  R  will  only  use  1  on  a  default   build   §  Performance   §  R  reads  data  into  memory  by  default.  Easy  to  exhaust  RAM  by  storing  unnecessary   data.  Typically  R  will  throw  an  excep)on  at  2GB.   §  Paralleliza)on  can  be  challenge.  Is  not  Default.  Packages  available   §  Produc)on  Deployment   §  Difficul)es  deploying  R  in  produc)on   §  Typically  need  to  re-­‐code  in  …..  
  10. 10.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           What  has  Oracle  done?  
  11. 11.      www.oraly)  t  :  @brendan)erney  e  :  brendan.)erney@oraly)           > AggData <- aggregate(CUSTOMER_V$CUST_ID, by = list(CUST_GENDER = CUSTOMER_V$CUST_GENDER),
 FUN = length) 
 > # Display the results 
 > AggData 
 F F 18325 
 M M 37175 select  cust_gender,  count(*)  X   from      customer_v   group  by  cust_gender;