SlideShare a Scribd company logo
1 of 12
Download to read offline
Analisa	
  Data	
  di	
  Python	
  
dengan	
  Pandas	
  
Sigit	
  Nurseto	
  
sigit@zinglab.com	
  	
  
2014	
  
Fokus	
  kita	
  	
  
•  Pengenalan	
  Pandas	
  
•  Pandas	
  Basic	
  
•  Live	
  Review,	
  analisa	
  data	
  film	
  IMDB	
  
Data	
  Analysis	
  
Data	
  Analysis	
  memberi	
  kita	
  informasi	
  yang	
  
berguna	
  tentang	
  pattern,	
  relationship	
  atau	
  tren	
  
dari	
  suatu	
  kumpulan	
  data.	
  
Pandas	
  
•  Python	
  Library	
  open	
  source	
  untuk	
  Data	
  Analysis	
  
•  Panel	
  Data	
  System	
  
•  Open	
  Sourced	
  sejak	
  2009,	
  30	
  ribu	
  Python/Cython	
  code	
  
•  Mulai	
  digunakan	
  di	
  production	
  di	
  banyak	
  perusahaan	
  
•  Cepat	
  dan	
  intuitive	
  
	
  
Gunanya	
  ?	
  
•  Munging	
  Data	
  
•  Cleaning	
  Data	
  
•  Analyzing	
  
•  Modeling	
  Data	
  
•  Menghasilkan	
  bentuk	
  lain	
  dari	
  analisa	
  data	
  
misalnya	
  Chart	
  
Instalasi	
  
•  Minimum	
  Python	
  2.6.8	
  
•  pip	
  install	
  numpy	
  
•  pip	
  install	
  pandas	
  
Data	
  Model 	
  	
  
•  Series	
  :	
  Object	
  Satu	
  Dimensi	
  
•  DataFrame	
  :	
  Object	
  Dua	
  Dimensi	
  dengan	
  row	
  
dan	
  column	
  
Series	
  
•  Object	
  1	
  dimensi	
  seperti	
  array,	
  list,	
  atau	
  
column	
  di	
  table	
  
•  Memiliki	
  label	
  index	
  untuk	
  setiap	
  item	
  
•  Bisa	
  memiliki	
  tipe	
  data	
  yang	
  berbeda-­‐beda	
  
•  Bisa	
  di	
  convert	
  ke	
  dict,	
  json	
  dll	
  
Data	
  Frame	
  
•  Struktur	
  data	
  yang	
  terdiri	
  dari	
  rows	
  dan	
  columns,	
  
seperti	
  excel	
  spreadsheet	
  atau	
  database	
  table.	
  
•  Group	
  dari	
  object	
  series	
  yang	
  memiliki	
  column	
  
yang	
  sama.	
  
•  Tiap	
  column	
  bisa	
  memiliki	
  tipe	
  data	
  yg	
  berbeda	
  
•  Bisa	
  di	
  convert	
  ke	
  dict,	
  json,	
  dll	
  
Indexes	
  
•  Setiap	
  axis	
  memiliki	
  index	
  
•  Digunakan	
  untuk	
  :	
  
– Fast	
  lookups	
  
– Data	
  alignment	
  atau	
  join	
  
Methods	
  
•  Group	
  by:	
  split-­‐apply-­‐combine	
  
•  Merge,	
  join	
  dan	
  aggregate	
  
•  Reshaping	
  	
  
•  Plotting	
  with	
  matplotlib	
  
•  IO	
  Tools	
  (Text,	
  CSV,	
  HDF5,	
  Json,..)	
  
Live	
  Preview	
  
•  Tools	
  yang	
  digunakan	
  :	
  
–  Pandas	
  
–  Ipython	
  notebook	
  
–  Imdbpy	
  (	
  untuk	
  export	
  raw	
  data	
  imdb	
  ke	
  database	
  )	
  
•  Source	
  Data	
  :	
  
–  	
  http://www.imdb.com/interfaces	
  

More Related Content

What's hot

membuat function dalam mysql
membuat function dalam mysqlmembuat function dalam mysql
membuat function dalam mysqlsukangimpi
 
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarmaArdianDwiPraba
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)Simon Patabang
 
Basis Data : Pemodelan Erd
Basis Data : Pemodelan ErdBasis Data : Pemodelan Erd
Basis Data : Pemodelan Erdamalianuryamin
 
Modul Pengantar Teknologi Informasi
Modul Pengantar Teknologi InformasiModul Pengantar Teknologi Informasi
Modul Pengantar Teknologi InformasiPutra Wanda
 
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerAuliaa Oktarianii
 
Desain arsitektur
Desain arsitekturDesain arsitektur
Desain arsitekturqwiew
 
Kd4 fungsi fungsi agregasi
Kd4 fungsi fungsi agregasiKd4 fungsi fungsi agregasi
Kd4 fungsi fungsi agregasiDesty Yani
 
7 Metode Pencarian Data Array
7 Metode Pencarian Data Array7 Metode Pencarian Data Array
7 Metode Pencarian Data ArraySimon Patabang
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Miningdedidarwis
 

What's hot (20)

membuat function dalam mysql
membuat function dalam mysqlmembuat function dalam mysql
membuat function dalam mysql
 
Pengertian sistem berkas
Pengertian sistem berkasPengertian sistem berkas
Pengertian sistem berkas
 
Sistem operasi input output
Sistem operasi input outputSistem operasi input output
Sistem operasi input output
 
Pertemuan 3 Record
Pertemuan 3 RecordPertemuan 3 Record
Pertemuan 3 Record
 
Latihan soal struktur data
Latihan soal struktur dataLatihan soal struktur data
Latihan soal struktur data
 
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
8 modul 8-dts-fitur dan cleaning data-univ-gunadarma
 
4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)4 diagram relasi antar entitas (ERD)
4 diagram relasi antar entitas (ERD)
 
Basis Data : Pemodelan Erd
Basis Data : Pemodelan ErdBasis Data : Pemodelan Erd
Basis Data : Pemodelan Erd
 
Modul Pengantar Teknologi Informasi
Modul Pengantar Teknologi InformasiModul Pengantar Teknologi Informasi
Modul Pengantar Teknologi Informasi
 
Rpl 015 - interface user
Rpl   015 - interface userRpl   015 - interface user
Rpl 015 - interface user
 
GoLang_1
GoLang_1GoLang_1
GoLang_1
 
02 struktur-sistem-operasi
02 struktur-sistem-operasi02 struktur-sistem-operasi
02 struktur-sistem-operasi
 
Deadlock
DeadlockDeadlock
Deadlock
 
Linked List
Linked ListLinked List
Linked List
 
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan Komputer
 
Desain arsitektur
Desain arsitekturDesain arsitektur
Desain arsitektur
 
Kd4 fungsi fungsi agregasi
Kd4 fungsi fungsi agregasiKd4 fungsi fungsi agregasi
Kd4 fungsi fungsi agregasi
 
7 Metode Pencarian Data Array
7 Metode Pencarian Data Array7 Metode Pencarian Data Array
7 Metode Pencarian Data Array
 
Konsep Data Mining
Konsep Data MiningKonsep Data Mining
Konsep Data Mining
 
Struktur data
Struktur dataStruktur data
Struktur data
 

Similar to PANDAS_ANALISIS

Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsHendro Subagyo
 
2. hapzi ali, information resoure information system (iris), ut
2. hapzi ali, information resoure information system (iris), ut2. hapzi ali, information resoure information system (iris), ut
2. hapzi ali, information resoure information system (iris), utHapzi Ali
 
Monitor2012 dimensiweb
Monitor2012 dimensiwebMonitor2012 dimensiweb
Monitor2012 dimensiwebFajri Abdillah
 
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptx
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptxStrukDat Pertemuan 1 - Pengenalan Struktur Data.pptx
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptxSuprapto60
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxSuraClips
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2muissyahril
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATAkejolo
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2biedoen
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2kejolo
 
KONSEP PANGKALAN DATA (DBMS)
KONSEP PANGKALAN DATA (DBMS)KONSEP PANGKALAN DATA (DBMS)
KONSEP PANGKALAN DATA (DBMS)Naveen Segaran
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)ArianDerida
 
Pengantar basis data
Pengantar basis dataPengantar basis data
Pengantar basis dataPas Irvanus
 
Pertemuan 10 (bab x basis data)
Pertemuan 10 (bab x basis data)Pertemuan 10 (bab x basis data)
Pertemuan 10 (bab x basis data)Soim Ahmad
 

Similar to PANDAS_ANALISIS (20)

Visualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan NetlyticsVisualisasi Data Kualitatif dengan Netlytics
Visualisasi Data Kualitatif dengan Netlytics
 
pptModul5
pptModul5pptModul5
pptModul5
 
Modul5ppt
Modul5pptModul5ppt
Modul5ppt
 
Data & basis data
Data & basis dataData & basis data
Data & basis data
 
Struktur data
Struktur dataStruktur data
Struktur data
 
2. hapzi ali, information resoure information system (iris), ut
2. hapzi ali, information resoure information system (iris), ut2. hapzi ali, information resoure information system (iris), ut
2. hapzi ali, information resoure information system (iris), ut
 
Monitor2012 dimensiweb
Monitor2012 dimensiwebMonitor2012 dimensiweb
Monitor2012 dimensiweb
 
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptx
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptxStrukDat Pertemuan 1 - Pengenalan Struktur Data.pptx
StrukDat Pertemuan 1 - Pengenalan Struktur Data.pptx
 
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
STRUKTUR DATA
STRUKTUR DATASTRUKTUR DATA
STRUKTUR DATA
 
Struktur data pertemuan 1 & 2
Struktur data   pertemuan 1 & 2Struktur data   pertemuan 1 & 2
Struktur data pertemuan 1 & 2
 
Sd pertemuan 1 & 2
Sd   pertemuan 1 & 2Sd   pertemuan 1 & 2
Sd pertemuan 1 & 2
 
KONSEP PANGKALAN DATA (DBMS)
KONSEP PANGKALAN DATA (DBMS)KONSEP PANGKALAN DATA (DBMS)
KONSEP PANGKALAN DATA (DBMS)
 
Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)Big Data - Python for Data Science (Bahas Indonesia)
Big Data - Python for Data Science (Bahas Indonesia)
 
Pengantar basis data
Pengantar basis dataPengantar basis data
Pengantar basis data
 
Power poin modul 5
Power poin modul 5Power poin modul 5
Power poin modul 5
 
Pertemuan 10 (bab x basis data)
Pertemuan 10 (bab x basis data)Pertemuan 10 (bab x basis data)
Pertemuan 10 (bab x basis data)
 

More from zakiakhmad

Python for Earth
Python for EarthPython for Earth
Python for Earthzakiakhmad
 
Raspberry Pi dan Alat Parkir UI
Raspberry Pi dan Alat Parkir UIRaspberry Pi dan Alat Parkir UI
Raspberry Pi dan Alat Parkir UIzakiakhmad
 
Load Balancer Linux with LVS - Rizki Nanda Agam
Load Balancer Linux with LVS - Rizki Nanda AgamLoad Balancer Linux with LVS - Rizki Nanda Agam
Load Balancer Linux with LVS - Rizki Nanda Agamzakiakhmad
 
RaspberryPi 101 at Python ID October 2013 Meetup
RaspberryPi 101 at Python ID October 2013 MeetupRaspberryPi 101 at Python ID October 2013 Meetup
RaspberryPi 101 at Python ID October 2013 Meetupzakiakhmad
 
RNDC - Eulogi Arif Wicaksono aka @sakitjiwa
RNDC - Eulogi Arif Wicaksono aka @sakitjiwaRNDC - Eulogi Arif Wicaksono aka @sakitjiwa
RNDC - Eulogi Arif Wicaksono aka @sakitjiwazakiakhmad
 
Exploit Development: EzServer Buffer Overflow oleh Tom Gregory
Exploit Development: EzServer Buffer Overflow oleh Tom GregoryExploit Development: EzServer Buffer Overflow oleh Tom Gregory
Exploit Development: EzServer Buffer Overflow oleh Tom Gregoryzakiakhmad
 
Pengantar Mobile Security
Pengantar Mobile Security Pengantar Mobile Security
Pengantar Mobile Security zakiakhmad
 

More from zakiakhmad (8)

Python for Earth
Python for EarthPython for Earth
Python for Earth
 
Raspberry Pi dan Alat Parkir UI
Raspberry Pi dan Alat Parkir UIRaspberry Pi dan Alat Parkir UI
Raspberry Pi dan Alat Parkir UI
 
Load Balancer Linux with LVS - Rizki Nanda Agam
Load Balancer Linux with LVS - Rizki Nanda AgamLoad Balancer Linux with LVS - Rizki Nanda Agam
Load Balancer Linux with LVS - Rizki Nanda Agam
 
RaspberryPi 101 at Python ID October 2013 Meetup
RaspberryPi 101 at Python ID October 2013 MeetupRaspberryPi 101 at Python ID October 2013 Meetup
RaspberryPi 101 at Python ID October 2013 Meetup
 
RNDC - Eulogi Arif Wicaksono aka @sakitjiwa
RNDC - Eulogi Arif Wicaksono aka @sakitjiwaRNDC - Eulogi Arif Wicaksono aka @sakitjiwa
RNDC - Eulogi Arif Wicaksono aka @sakitjiwa
 
rq talk
rq talkrq talk
rq talk
 
Exploit Development: EzServer Buffer Overflow oleh Tom Gregory
Exploit Development: EzServer Buffer Overflow oleh Tom GregoryExploit Development: EzServer Buffer Overflow oleh Tom Gregory
Exploit Development: EzServer Buffer Overflow oleh Tom Gregory
 
Pengantar Mobile Security
Pengantar Mobile Security Pengantar Mobile Security
Pengantar Mobile Security
 

PANDAS_ANALISIS

  • 1. Analisa  Data  di  Python   dengan  Pandas   Sigit  Nurseto   sigit@zinglab.com     2014  
  • 2. Fokus  kita     •  Pengenalan  Pandas   •  Pandas  Basic   •  Live  Review,  analisa  data  film  IMDB  
  • 3. Data  Analysis   Data  Analysis  memberi  kita  informasi  yang   berguna  tentang  pattern,  relationship  atau  tren   dari  suatu  kumpulan  data.  
  • 4. Pandas   •  Python  Library  open  source  untuk  Data  Analysis   •  Panel  Data  System   •  Open  Sourced  sejak  2009,  30  ribu  Python/Cython  code   •  Mulai  digunakan  di  production  di  banyak  perusahaan   •  Cepat  dan  intuitive    
  • 5. Gunanya  ?   •  Munging  Data   •  Cleaning  Data   •  Analyzing   •  Modeling  Data   •  Menghasilkan  bentuk  lain  dari  analisa  data   misalnya  Chart  
  • 6. Instalasi   •  Minimum  Python  2.6.8   •  pip  install  numpy   •  pip  install  pandas  
  • 7. Data  Model     •  Series  :  Object  Satu  Dimensi   •  DataFrame  :  Object  Dua  Dimensi  dengan  row   dan  column  
  • 8. Series   •  Object  1  dimensi  seperti  array,  list,  atau   column  di  table   •  Memiliki  label  index  untuk  setiap  item   •  Bisa  memiliki  tipe  data  yang  berbeda-­‐beda   •  Bisa  di  convert  ke  dict,  json  dll  
  • 9. Data  Frame   •  Struktur  data  yang  terdiri  dari  rows  dan  columns,   seperti  excel  spreadsheet  atau  database  table.   •  Group  dari  object  series  yang  memiliki  column   yang  sama.   •  Tiap  column  bisa  memiliki  tipe  data  yg  berbeda   •  Bisa  di  convert  ke  dict,  json,  dll  
  • 10. Indexes   •  Setiap  axis  memiliki  index   •  Digunakan  untuk  :   – Fast  lookups   – Data  alignment  atau  join  
  • 11. Methods   •  Group  by:  split-­‐apply-­‐combine   •  Merge,  join  dan  aggregate   •  Reshaping     •  Plotting  with  matplotlib   •  IO  Tools  (Text,  CSV,  HDF5,  Json,..)  
  • 12. Live  Preview   •  Tools  yang  digunakan  :   –  Pandas   –  Ipython  notebook   –  Imdbpy  (  untuk  export  raw  data  imdb  ke  database  )   •  Source  Data  :   –   http://www.imdb.com/interfaces