Successfully reported this slideshow.
Your SlideShare is downloading. ×

Analisa data di python dengan pandas

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 12 Ad

More Related Content

Advertisement

Recently uploaded (20)

Analisa data di python dengan pandas

  1. 1. Analisa  Data  di  Python   dengan  Pandas   Sigit  Nurseto   sigit@zinglab.com     2014  
  2. 2. Fokus  kita     •  Pengenalan  Pandas   •  Pandas  Basic   •  Live  Review,  analisa  data  film  IMDB  
  3. 3. Data  Analysis   Data  Analysis  memberi  kita  informasi  yang   berguna  tentang  pattern,  relationship  atau  tren   dari  suatu  kumpulan  data.  
  4. 4. Pandas   •  Python  Library  open  source  untuk  Data  Analysis   •  Panel  Data  System   •  Open  Sourced  sejak  2009,  30  ribu  Python/Cython  code   •  Mulai  digunakan  di  production  di  banyak  perusahaan   •  Cepat  dan  intuitive    
  5. 5. Gunanya  ?   •  Munging  Data   •  Cleaning  Data   •  Analyzing   •  Modeling  Data   •  Menghasilkan  bentuk  lain  dari  analisa  data   misalnya  Chart  
  6. 6. Instalasi   •  Minimum  Python  2.6.8   •  pip  install  numpy   •  pip  install  pandas  
  7. 7. Data  Model     •  Series  :  Object  Satu  Dimensi   •  DataFrame  :  Object  Dua  Dimensi  dengan  row   dan  column  
  8. 8. Series   •  Object  1  dimensi  seperti  array,  list,  atau   column  di  table   •  Memiliki  label  index  untuk  setiap  item   •  Bisa  memiliki  tipe  data  yang  berbeda-­‐beda   •  Bisa  di  convert  ke  dict,  json  dll  
  9. 9. Data  Frame   •  Struktur  data  yang  terdiri  dari  rows  dan  columns,   seperti  excel  spreadsheet  atau  database  table.   •  Group  dari  object  series  yang  memiliki  column   yang  sama.   •  Tiap  column  bisa  memiliki  tipe  data  yg  berbeda   •  Bisa  di  convert  ke  dict,  json,  dll  
  10. 10. Indexes   •  Setiap  axis  memiliki  index   •  Digunakan  untuk  :   – Fast  lookups   – Data  alignment  atau  join  
  11. 11. Methods   •  Group  by:  split-­‐apply-­‐combine   •  Merge,  join  dan  aggregate   •  Reshaping     •  Plotting  with  matplotlib   •  IO  Tools  (Text,  CSV,  HDF5,  Json,..)  
  12. 12. Live  Preview   •  Tools  yang  digunakan  :   –  Pandas   –  Ipython  notebook   –  Imdbpy  (  untuk  export  raw  data  imdb  ke  database  )   •  Source  Data  :   –   http://www.imdb.com/interfaces  

×