SlideShare a Scribd company logo
1 of 13
i
DAFTAR ISI
BAGIAN I LANDASAN TEORI ........................................ Error! Bookmark not defined.
1.1 PENGERTIAN...........................................................................................................1
1.2 Sejarah Big Data........................................................................................................2
1.3 Karakteristik Big Data ..............................................................................................3
1.4 Membangun Big Data Platform ..............................................................................3
1.5 Pemanfaatan Big Data dan implementasinya......................................................5
BAGIAN II
TRAVELOKAOPEN SOURCE LIBRARY FOR DATA SCIENCE....................................6
2.1 EKOSISTEM DATA DI TRAVELOKA.......................................................................6
2.2 Pemanfaatan Big Data dan implementasinya pada Traveloka Co...................8
BAGIAN III KRITIK DAN SARAN..........................................................................................9
3.1 KRITIK .........................................................................................................................9
3.2 SARAN ........................................................................................................................9
BAGIAN IV DAFTAR PUSTAKA........................................................................................ 10
ii
1
BAGIAN I LANDASAN TEORI
1.1 PENGERTIAN
Mahadata, lebih dikenal dengan istilah bahasa Inggris big data, adalah istilah
umum untuk segala himpunan data (data set) dalam jumlah yang sangat besar, rumit
dan tak terstruktur sehingga menjadikannya sukar ditangani apabila hanya
menggunakan perkakas manajemen basis data biasa atau aplikasi pemroses data
tradisional belaka. Mahadata(Big data) juga dapat diartikan sebagai pertumbuhan
data dan informasi yang eksponensial dengan kecepatan dalam pertambahannya dan
memiliki data yang bervariasi sehingga menyebabkan tantangan baru dalam
pengolahan sejumlah data besar yang heterogen dan mengetahui bagaimana cara
memahami semua data tersebut1.
Berikut merupakan pengertian big data diruju dari pendapat para ahli,
๏‚ท Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah
yang berlaku untuk informasi yang tidak dapat diproses atau dianalisis
menggunakan alat tradisional.
๏‚ท Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses
kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan
terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang
ada. Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif
untuk memprosesnya.
Berdasarkan pengertian para ahli di atas, dapat disimpulkan bahwa Big
Data adalah data yang memiliki volume besar sehingga tidak dapat diproses
menggunakan alat tradisional biasa dan harus menggunakan cara dan alat baru untuk
mendapatkan nilai dari data ini.
1 Wikipedia ,โ€œ Big Dataโ€, diakses dari https://id.wikipedia.org/wiki/Mahadata ,pada tanggal 20 Februari 2019
pukul 14.28
2
1.2 Sejarah Big Data
Sebelum mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau
sejarah dari hal yang ingin dipelajari tersebut. Berikut urutannya sejarah big data;
๏‚ง 1944 โ€“ Fremont Rider, Pustakawan universitas Wesleyan. Dia
memperkirakan bahwa Perpustakana yang ada di amerika serikat ukurannya
meningkat dua kali lipat setiap 16 tahun
๏‚ง 1961 โ€“ Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah
dengan cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah
๏‚ง 1967 โ€“ B.A. Marron dan P.A.D. De Maine menerbitkan โ€œAutomatic data
compressionโ€ dalam Komunikasi dari ACM, yang menyatakan bahwa โ€œledakan
informasiโ€ tercatat dalam beberapa tahun terakhir membuatnya penting bahwa
persyaratan penyimpanan untuk semua informasi harus dijaga agar tetap
minimum.
๏‚ง 1971 โ€“ Arthur Miller Menulis dalam โ€œThe Assault on Privacyโ€ menyatakan,
โ€œTerlalu banyak informasi. pengurus tampaknya mengukur seorang pria
seimbang dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi.โ€
๏‚ง 1975 โ€“ Departemen Pos dan Telekomunikasi di Jepang mulai melakukan
Arus Informasi Sensus, pelacakan volume informasi yang beredar di Jepang
(ide pertama kali diusulkan dalam makalah 1969)
๏‚ง 1980 โ€“ I.A. Tjomsland memberikan ceramah berjudul โ€œWhere do we go from
here?โ€ Di IEEE Keempat Symposium on Mass Storage Systems, dia
mengatakan โ€œMereka yang terkait dengan perangkat penyimpanan lama
menyadari bahwa Hukum parkinson Pertama dapat diparafrasekan untuk
menggambarkan Industry kami โ€˜Data mengembang untuk mengisi ruang yang
tersediaโ€™.
๏‚ง 1981 โ€“ Kantor Pusat statistic hungaria memulai proyek penelitian untuk
menjelaskan informasi indsutri negara, termasuk mengukur Volume informasi
dalam bit.
๏‚ง 1983 โ€“ Ithiel de Sola Pool menerbitkan โ€œPelacakan Arus Informasiโ€ di
Science. Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977,
3
ia menyimpulkan bahwa โ€œkata-kata yang tersedia untuk Amerika (di atas usia
10) melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata
benar-benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per
tahun, Pada periode pengamatan, sebagianbesar pertumbuhan arus informasi
adalah karena pertumbuhan penyiaran, Tapi menjelang akhir periode [1977]
situasi berubah: media point-to-point yang tumbuh lebih cepat dari penyiaran.โ€
1.3 Karakteristik Big Data
Berikut merupakan karakteristik yang dimiliki oleh Big Data :
Volume
Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja tercatat
800,000 petabyte data tersimpan di seluruh dunia dan angka ini diperkirakan akan
mencapai 35 zettabyte di tahun 2020 atau bahkan lebih. big data memiliki jumlah
data yang sangat besar sehingga dalam proses pengolahan data dibutuhkan suatu
penyimpanan yang besar dan dibutuhkan analisis yang lebih spesifik.
Variety
Selain data relasional, data apa saja yang umum dianalisis? Dengan
meledaknya jumlah sensor, dan perangkat pintar , dan juga teknologi social
networking yang menghasilkan data-data yang akan sulit jika harus disimpan di
dalam relasional database. big data memiliki aliran data yang yang cepat dan real
time.
Velocity
Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang
pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya
velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil
analisis terhadap aliran data yang terus mengalir di saat yang hampir bersamaan
dengan datangnya data tersebut.
1.4 Membangun Big Data Platform
Seperti data pergudangan, toko web atau platform TI, infrastruktur untuk data yang
besar memiliki kebutuhan yang unik. Dalam mempertimbangkan semua komponen
platform data yang besar, penting untuk diingat bahwa tujuan akhir adalah untuk
4
dengan mudah mengintegrasikan data yang besar dengan data perusahaan Anda
untuk memungkinkan Anda untuk melakukan analisis mendalam pada set data
gabungan.
Infrastructure Requirements
โ€“ Data Acquisition
Tahap akuisisi adalah salah satu perubahan besar dalam infrastruktur pada
hari-hari sebelum big data. Karena big data mengacu pada aliran data dengan
kecepatan yang lebih tinggi dan ragam yang bervariasi, infrastruktur yang diperlukan
untuk mendukung akuisisi data yang besar harus disampaikan secara perlahan,
dapat diprediksi baik di dalam menangkap data dan dalam memprosesnya secara
cepat dan sederhana, dapat menangani volume transaksi yang sangat tinggi , sering
dalam lingkungan terdistribusi, dan dukungan yang fleksibel, struktur data dinamis
โ€“ Data Organization
Dalam istilah Data pergudangan klasik, pengorganisasian data disebut
integrasi data. Karena ada volume/jumlah data yang sangat besar, ada
kecenderungan untuk mengatur data pada lokasi penyimpanan aslinya, sehingga
menghemat waktu dan uang dengan tidak memindah-midahkan data dengen volume
yang besar. Infrastruktur yang diperlukan untuk mengatur data yang besar harus
mampu mengolah dan memanipulasi data di lokasi penyimpanan asli. Biasanya
diproses didalam batch untuk memproses data yang besar, beragam format, dari
tidak terstruktur menjadi terstruktur.
โ€“ Data Analysis
Karena data tidak selalu bergerak selama fase organisasi, analisis ini juga
dapat dilakukan dalam lingkungan terdistribusi, di mana beberapa data akan tinggal
di mana data itu awalnya disimpan dan diakses secara transparan dari sebuah data
warehouse. Infrastruktur yang diperlukan untuk menganalisis data yang besar harus
mampu mendukung analisis yang lebih dalam seperti analisis statistik dan data
mining, pada data dengan jenis yang beragam dan disimpan dalam sistem yang
terpisah, memberikan waktu respon lebih cepat didorong oleh perubahan perilaku;
dan mengotomatisasi keputusan berdasarkan model analitis.
5
1.5 Pemanfaatan Big Data dan implementasinya
Big data dapat dikonsiderasikan sebagai suatu investasi, dimana implikasi yang nyata
baru dapat dirasakan apabila proses penelitian dan interpretasi big data telah
dirampungkan dan menghasilkan strategi bisnis yang solutif dan implementatif.
Manfaat pertama dari pemanfaatan big data adalah perusahaan memiliki
kesempatan untuk mengambil keputusan bisnis yang didasarkan atas data yang
ilmiah dan terukur, bukan berdasarkan common sense, intuisi, atau kebijaksanaan
yang bersifat praktis.
Selama bertahun-tahun, HR telah menggunakan data tidak terstruktur dari
jawaban karyawan dalam survei engagement, performance review, dll. Di era big data
ini, data tak terstruktur tersebut datang dari sumber dalam dan luar organisasi,
termasuk dari social media, blog, wiki, email, dan lain-lain. Semua sumber ini akan
memberikan semakin banyak insight terhadap keterlibatan karyawan terhadap
perusahaan.
Big Data sendiri diimplementasikan hampir ke semua lini kehidupan masyarakat.
Seperti dalam dunia Bisnis, kesehatan, pendidikan, pariwisata, ekonomi, sosial,
budaya ,politik dsb.
6
BAGIAN II
TRAVELOKA OPEN SOURCE LIBRARY FOR DATA SCIENCE
2.1 EKOSISTEM DATA DI TRAVELOKA
Traveloka mengadakan meetup data untuk pertama kalinya dengan tema "How to
Feed Data Hungry Organization". Pembahasannya kebanyakan berkutat dengan
ekosistem data yang dibangun di Traveloka seperti teknologi apa saja yang
digunakan untuk penyimpanan, pengolahan maupun analisis data. Setidaknya ada
40 lebih, data scientist/analyst/engineer di Traveloka yang dikomandoi oleh Ainun
Najib dengan tim data engineer dikomandoi oleh Rendy B. Junior dan tim data
science dikomandoi oleh Dr. Philip Thomas. Mari kita kupas beberapa teknologi dan
perangkat yang digunakan oleh tim data Traveloka.
dplyr dan data.table merupakan library R yang digunakan untuk data wrangling,
mirip seperti query SQL. Untuk
readiblity, dplyr lebih baik
dibandingkan data.table.
Sedangkan, data.table lebih cepat
untuk proses data yang lebih besar.
Dengan
adanya sparklyr pun, query data
dari Data Lake dengan
gaya dplyr bisa lebih digunakan
secara langsung ketimbang dengan bahasa SQL. Selain itu, library R lain yang
digunakan di Traveloka ada ggplot2 untuk visualisasi data statis, Shiny untuk
visualisasi data interaktif, dan caret maupun e1071 untuk machine learning.
Python
Sebagai multipurpose language, Python bisa digunakan untuk banyak hal. Di
Traveloka, Python digunakan untuk proses ETL, lempar data antar database,
transformasi data/pembersihan maupun machine learning. Dibandingkan R, Python
memiliki ekosistem machine learning yang lebih padu dengan adanya scikit-learn.
Untuk data wrangling, ada pandas dengan filosofi seperti halnya kelas data
frame yang ada di R. Terlebih lagi, Python juga digunakan untuk keperluan deep
7
learning via TensorFlow yang memang a big no kalau dilakukan di R. Saya pun
penasaran seperti apakah use case deep learning yang ada di Traveloka.
Dataiku
Mungkin ada data scientist yang terlalu R-ish maupun Python-ish, dan disinilah
Dataiku berperan sebagai platform agar sesama data scientist saling berkolaborasi
meskipun bahasa pemrograman yang digunakan berbeda-beda. Bukan hanya itu,
Dataiku juga bisa menjadi jembatan untuk data engineer, data
scientist maupun business analyst untuk saling berkolaborasi.
Database dan Penyimpanan
Data disimpan di Cloud via
AWS maupun Google Cloud.
Ada berbagai macam
database yang digunakan di
Traveloka baik RDBMS
maupun NoSQL dengan
tujuan yang juga berbeda-
beda. Untuk RDBMS, ada
MemSQL, Redshift dan
PostgreSQL. Sedangkan
untuk NoSQL, ada DynamoDB dan MongoDB. Untuk query engine dari data lake
AWS S3 bisa menggunakan Qubole, Presto, Hive atau mungkin menggunakan
SparkSQL.
Lainnya
Traveloka juga menggunakan bahasa pemgrograman seperti Julia yang bisa
dibilang masih baru. Java yang merupakan core dari Big Data juga digunakan untuk
membuat aplikasi untuk presentation layer yang kemungkinan besar
digunakan business users. Ada juga beberapa perangkat lainnya yang terdengar
asing bagi saya seperti Domo, Keboola, Holistics serta Periscope Data.
8
2.2 Pemanfaatan Big Data dan implementasinya pada Traveloka Co.
1. Penghematan biaya, Teknologi analisis Big data berbasis cloud membawa
pengurangan biaya yang signifikan dalam hal untuk menyimpan data set dalam
jumlah besar, selain mereka dapat mengidentifikasi cara-cara yang lebih
efisien dalam melakukan bisnis.
2. Lebih cepat dan lebih baik dalam pengambilan keputusan, dengan kecepatan
teknologi big data dapat melakukan analisis yang dikombinasikan dengan
kemampuan untuk menganalisis berbagai macam sumber data baru, membuat
bisnis mampu menganalisis informasi dengan cepat dan membuat keputusan
berdasarkan hasil analisis tersebut.
3. Melahirkan produk dan pelayanan baru, dengan kemampuan mengukur
kebutuhan dan kepuasan pelanggan mendatangkan keunggulan dari bisnis
untuk menciptakan produk dan layanan baru yang sesuai dengan keinginan
dan kebutuhan dari pelanggan.
4. Menganalisis perilaku konsumen dalam bepergian maupun berbelanja di fitur
e-commerce Traveloka.
5. Meningkatkan akurasi proyeksi penjualan dan produk layanan traveloka.
6. Membantu memperkirakan pendapatan dengan lebih akurat.
7. Memecahkan pola perilaku konsumen.
8. Membantu menyediakan layanan baru yang sesuai dengan kebutuhan
konsumen.
9. Terjaminnya data yang akan menjadi informasi baik bagi pihak manajemen
maupun karyawan.
10.Membantu menciptakan peluang usaha baru.
9
BAGIAN III KRITIK DAN SARAN
3.1 KRITIK
๏‚ท Traveloka mempunyai fitur pada Halaman awal sangat rumit untuk pencarian.
Setidaknya traveloka menyeimbangkan antara fitur dengan teknologi Data
Resources mereka yang sudah cukup bagus.
๏‚ท Fokus kepada situs boking domestic , sangat disayangkan pengembangkan
Big Data yang mereka miliki tidak mampu mengakomodir semua layanan baik
domestik maupun Internasional.
๏‚ท Pencarian hotel masih sangat kecil informasi. Traveloka mempunyai komponen
Big Data yang baik tapi tidak mampu mengintegrasikan platform informasi
perhotelan dengan memadai.
๏‚ท Traveloka tidak menyediakan layanan paket traveling padahal dengan adanya
Big Data mereka mampu meningkatkan keuntungan kompetitif.
๏‚ท Jika terjadi pembatalan penerbagan atau tiket oleh customer , pihak traveloka
tidak sigap untuk melakukan refund money.
3.2 SARAN
๏‚ท Traveloka sebaiknya sigap dan cepat dalam mengolah dan menganalisis data
yang diperoleh untuk meningkatkan kompetitif apalagi banyak ecommerce
yang mulai booming.
๏‚ท Melakuakn maintenance terhadap aplikasi fitur layanan.
๏‚ท Melakukan integrasi data dengan pelbagai platform akomodasi agar dapat
bertukar informasi dengan cepat.
๏‚ท Memanfaatkan penggunaan Big Data dengan berani merambah ke seluruh
dunia.
๏‚ท Mengembangkan bisnis baru yang dapat menyediakan paket layanan traveling
dan akomodasi.
๏‚ท Membangun pusat Data analysis khusus untuk era 4.0 dan usaha menyiapkan
bisnis yang lebih kompetitif di masa yang akan datang. Karena banyak fintech
ata pn aplikasi pasaran yang menyediakan fitur traveling dan akomodasi.
10
BAGIAN IV DAFTAR PUSTAKA
(t.thn.). Diambil kembali dari wikipedia: https://id.wikipedia.org/wiki/Mahadata
ARDIYANTO. (2016, maret). Diambil kembali dari kelebihan dan kekurangan
Trtaveloka: http://ardiyanto14002.blogspot.com/2016/03/32-contoh-kelebihan-
dan-kekurangan-di.html
Arni, U. D. (2018, desember 17). Diambil kembali dari garudacyber:
https://garudacyber.co.id/artikel/1446-kelebihan-dan-kekurangan-aplikasi-
traveloka
MAULANA.S, I. (2016, nofember). Diambil kembali dari implementasi big data:
http://ilhammaulanasuryani.blogspot.com/2016/11/implementasi-big-data.html
Puruhita. (2016, Februari 6). Diambil kembali dari Informasi Seputar Dunia
Informatika: https://puruhitas.blog.uns.ac.id/2016/02/06/409/
Ridha, R. (2018). Diambil kembali dari MENGINTIP EKOSISTEM DATA DI
TRAVELOKA: https://datascience.or.id/article/Mengintip-Ekosistem-Data-di-
Traveloka-5a8fa6e6#

More Related Content

What's hot

Sistem Pengendalian Manajemen - Perencanaan Strategi
Sistem Pengendalian Manajemen - Perencanaan StrategiSistem Pengendalian Manajemen - Perencanaan Strategi
Sistem Pengendalian Manajemen - Perencanaan Strategi
Yunika Lestari
ย 
Cover dan pertanyaan kel 4
Cover dan pertanyaan kel 4 Cover dan pertanyaan kel 4
Cover dan pertanyaan kel 4
erlineili
ย 
Studi kasus sistem informasi akuntansi
Studi kasus sistem informasi akuntansiStudi kasus sistem informasi akuntansi
Studi kasus sistem informasi akuntansi
dianpipit
ย 
Mengelola perusahaan digiital
Mengelola perusahaan digiitalMengelola perusahaan digiital
Mengelola perusahaan digiital
Erliyan Redy Susanto
ย 
Hubungan antara materialitas, risiko audit dan bukti audit
Hubungan antara  materialitas, risiko audit dan  bukti auditHubungan antara  materialitas, risiko audit dan  bukti audit
Hubungan antara materialitas, risiko audit dan bukti audit
Syafdinal Ncap
ย 
ppt Sistem informasi manajemen
ppt Sistem informasi manajemenppt Sistem informasi manajemen
ppt Sistem informasi manajemen
rin_oktarina
ย 
Kunci jawaban bab 6 teori akuntansi suwardjono
Kunci jawaban bab 6 teori akuntansi suwardjonoKunci jawaban bab 6 teori akuntansi suwardjono
Kunci jawaban bab 6 teori akuntansi suwardjono
Herna Ferari
ย 
Tugas uas akpri individu donny
Tugas uas akpri individu donnyTugas uas akpri individu donny
Tugas uas akpri individu donny
University of Bengkulu
ย 

What's hot (20)

E-Procurement
E-ProcurementE-Procurement
E-Procurement
ย 
Analisis Kebutuhan Sistem Informasi bagi Organisasi
Analisis Kebutuhan Sistem Informasi bagi OrganisasiAnalisis Kebutuhan Sistem Informasi bagi Organisasi
Analisis Kebutuhan Sistem Informasi bagi Organisasi
ย 
Sistem Pendukung Keputusan
Sistem Pendukung KeputusanSistem Pendukung Keputusan
Sistem Pendukung Keputusan
ย 
Sistem Database menggunakan Model REA
Sistem Database menggunakan Model REASistem Database menggunakan Model REA
Sistem Database menggunakan Model REA
ย 
Penerapan electronic data interchange
Penerapan electronic data interchangePenerapan electronic data interchange
Penerapan electronic data interchange
ย 
Hakikat perencanaan strategis
Hakikat perencanaan strategisHakikat perencanaan strategis
Hakikat perencanaan strategis
ย 
Sistem Pengendalian Manajemen - Perencanaan Strategi
Sistem Pengendalian Manajemen - Perencanaan StrategiSistem Pengendalian Manajemen - Perencanaan Strategi
Sistem Pengendalian Manajemen - Perencanaan Strategi
ย 
Cover dan pertanyaan kel 4
Cover dan pertanyaan kel 4 Cover dan pertanyaan kel 4
Cover dan pertanyaan kel 4
ย 
Studi kasus sistem informasi akuntansi
Studi kasus sistem informasi akuntansiStudi kasus sistem informasi akuntansi
Studi kasus sistem informasi akuntansi
ย 
Mengelola perusahaan digiital
Mengelola perusahaan digiitalMengelola perusahaan digiital
Mengelola perusahaan digiital
ย 
Pengelolaan Keuangan di Era Industri 4.0 - Dewan Pengawas RS
Pengelolaan Keuangan di Era Industri 4.0 - Dewan Pengawas RSPengelolaan Keuangan di Era Industri 4.0 - Dewan Pengawas RS
Pengelolaan Keuangan di Era Industri 4.0 - Dewan Pengawas RS
ย 
Proposal
ProposalProposal
Proposal
ย 
Hubungan antara materialitas, risiko audit dan bukti audit
Hubungan antara  materialitas, risiko audit dan  bukti auditHubungan antara  materialitas, risiko audit dan  bukti audit
Hubungan antara materialitas, risiko audit dan bukti audit
ย 
ppt Sistem informasi manajemen
ppt Sistem informasi manajemenppt Sistem informasi manajemen
ppt Sistem informasi manajemen
ย 
Pengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaanPengertian sistem informasi perusahaan
Pengertian sistem informasi perusahaan
ย 
Kunci jawaban bab 6 teori akuntansi suwardjono
Kunci jawaban bab 6 teori akuntansi suwardjonoKunci jawaban bab 6 teori akuntansi suwardjono
Kunci jawaban bab 6 teori akuntansi suwardjono
ย 
Tugas uas akpri individu donny
Tugas uas akpri individu donnyTugas uas akpri individu donny
Tugas uas akpri individu donny
ย 
Pengamanan dan Pengendalian Sistem Informasi Manajemen
Pengamanan dan Pengendalian Sistem Informasi ManajemenPengamanan dan Pengendalian Sistem Informasi Manajemen
Pengamanan dan Pengendalian Sistem Informasi Manajemen
ย 
IMPLEMENTASI STRATEGIK PERUSAHAAN
IMPLEMENTASI STRATEGIK PERUSAHAANIMPLEMENTASI STRATEGIK PERUSAHAAN
IMPLEMENTASI STRATEGIK PERUSAHAAN
ย 
Metodologi penelitian uma sekaran
Metodologi penelitian uma sekaranMetodologi penelitian uma sekaran
Metodologi penelitian uma sekaran
ย 

Similar to Tugas Manajemen sistem Informasi big data

Pengantar-Big-Data.pdf
Pengantar-Big-Data.pdfPengantar-Big-Data.pdf
Pengantar-Big-Data.pdf
Dedek28
ย 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri946883
ย 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
BatakMusikGroup
ย 
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdfadoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
DinarSafa1
ย 
PPT Big Data_Farhan Aditya_6017210033
PPT Big Data_Farhan Aditya_6017210033PPT Big Data_Farhan Aditya_6017210033
PPT Big Data_Farhan Aditya_6017210033
Farhan Aditya
ย 
Membangun platform big data
Membangun platform big data Membangun platform big data
Membangun platform big data
Okta Jilid II
ย 
Sejarah perkembangan basis data
Sejarah perkembangan basis dataSejarah perkembangan basis data
Sejarah perkembangan basis data
Dayu Ratna
ย 

Similar to Tugas Manajemen sistem Informasi big data (20)

Pengantar-Big-Data.pdf
Pengantar-Big-Data.pdfPengantar-Big-Data.pdf
Pengantar-Big-Data.pdf
ย 
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
ย 
pengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptxpengenalan-Pengantar-Big-Data _____.pptx
pengenalan-Pengantar-Big-Data _____.pptx
ย 
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptxPengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
Pengantar-Big-Databhgfhfhfdhgfdghgfdhdfhfhf.pptx
ย 
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdfadoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
adoc.pub_buku-saku-big-data-kementerian-komunikasi-dan-info.pdf
ย 
Tahapan Analisis Data Digital
Tahapan Analisis Data DigitalTahapan Analisis Data Digital
Tahapan Analisis Data Digital
ย 
Paper big data
Paper big dataPaper big data
Paper big data
ย 
Consumer behavior and big data
Consumer behavior and big dataConsumer behavior and big data
Consumer behavior and big data
ย 
Eps3 - Data Adalah Kunci.pdf
Eps3 - Data Adalah Kunci.pdfEps3 - Data Adalah Kunci.pdf
Eps3 - Data Adalah Kunci.pdf
ย 
Presentation1.pptx
Presentation1.pptxPresentation1.pptx
Presentation1.pptx
ย 
WOSS 003 mahadata
WOSS 003 mahadataWOSS 003 mahadata
WOSS 003 mahadata
ย 
SIM-09_pdf
SIM-09_pdfSIM-09_pdf
SIM-09_pdf
ย 
Consumer behavior and big data
Consumer behavior and big dataConsumer behavior and big data
Consumer behavior and big data
ย 
PPT Big Data_Farhan Aditya_6017210033
PPT Big Data_Farhan Aditya_6017210033PPT Big Data_Farhan Aditya_6017210033
PPT Big Data_Farhan Aditya_6017210033
ย 
Alin dian ayuni 6018210055 consumer & big data
Alin dian ayuni 6018210055 consumer & big dataAlin dian ayuni 6018210055 consumer & big data
Alin dian ayuni 6018210055 consumer & big data
ย 
Perkembangan database di era globalisasi
Perkembangan database di era globalisasiPerkembangan database di era globalisasi
Perkembangan database di era globalisasi
ย 
Membangun platform big data
Membangun platform big data Membangun platform big data
Membangun platform big data
ย 
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ย 
Sejarah perkembangan basis data
Sejarah perkembangan basis dataSejarah perkembangan basis data
Sejarah perkembangan basis data
ย 
Big data Traveloka.pptx
Big data Traveloka.pptxBig data Traveloka.pptx
Big data Traveloka.pptx
ย 

More from chienmario (8)

Manajemen Risiko Pada Jantess Screenprinting
Manajemen Risiko Pada Jantess ScreenprintingManajemen Risiko Pada Jantess Screenprinting
Manajemen Risiko Pada Jantess Screenprinting
ย 
Ringkasan Ch 3 Consumer Motivation and Personality
Ringkasan Ch 3 Consumer Motivation and PersonalityRingkasan Ch 3 Consumer Motivation and Personality
Ringkasan Ch 3 Consumer Motivation and Personality
ย 
Perceptual selection
Perceptual selection Perceptual selection
Perceptual selection
ย 
Tugas paper mata kuiiah manajemen operasi dan inovasi 1
Tugas paper mata kuiiah manajemen operasi dan inovasi 1Tugas paper mata kuiiah manajemen operasi dan inovasi 1
Tugas paper mata kuiiah manajemen operasi dan inovasi 1
ย 
Manajemen Operasi Strategi Proses
Manajemen Operasi Strategi Proses Manajemen Operasi Strategi Proses
Manajemen Operasi Strategi Proses
ย 
Upacara Penti dan NIlai_Nilai Pancasila yang terkandung didalamnya.
Upacara Penti dan NIlai_Nilai Pancasila yang terkandung didalamnya.Upacara Penti dan NIlai_Nilai Pancasila yang terkandung didalamnya.
Upacara Penti dan NIlai_Nilai Pancasila yang terkandung didalamnya.
ย 
Pancasila sebagai paradigma pengembangan HAM
Pancasila  sebagai  paradigma  pengembangan  HAMPancasila  sebagai  paradigma  pengembangan  HAM
Pancasila sebagai paradigma pengembangan HAM
ย 
Pengantar Manajemen "Sony Corporation"
Pengantar Manajemen "Sony Corporation"Pengantar Manajemen "Sony Corporation"
Pengantar Manajemen "Sony Corporation"
ย 

Recently uploaded

ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARUATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
sayangkamuu240203
ย 
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di IndonesiaPerkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
langkahgontay88
ย 
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
FORTRESS
ย 
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
Abortion pills in Riyadh +966572737505 get cytotec
ย 
Pelembagaan Badan Usaha Milik Desa (BUMDes)ppt
Pelembagaan Badan Usaha Milik Desa (BUMDes)pptPelembagaan Badan Usaha Milik Desa (BUMDes)ppt
Pelembagaan Badan Usaha Milik Desa (BUMDes)ppt
JhonSutarka1
ย 
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptxPERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
inichaneldhea
ย 
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docxLAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
AnissaPratiwi3
ย 

Recently uploaded (20)

STRATEGI BERSAING MENGGUNAKAN ANALISIS SWOT
STRATEGI BERSAING MENGGUNAKAN ANALISIS SWOTSTRATEGI BERSAING MENGGUNAKAN ANALISIS SWOT
STRATEGI BERSAING MENGGUNAKAN ANALISIS SWOT
ย 
abortion pills in Kuwait City+966572737505 get Cytotec
abortion pills in Kuwait City+966572737505 get Cytotecabortion pills in Kuwait City+966572737505 get Cytotec
abortion pills in Kuwait City+966572737505 get Cytotec
ย 
ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARUATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
ATRIUM GAMING : SLOT GACOR MUDAH MENANG 2024 TERBARU
ย 
UNIKBET : Bandar Slot Gacor Pragmatic Play Deposit Pakai Bank Mega Bonus Berl...
UNIKBET : Bandar Slot Gacor Pragmatic Play Deposit Pakai Bank Mega Bonus Berl...UNIKBET : Bandar Slot Gacor Pragmatic Play Deposit Pakai Bank Mega Bonus Berl...
UNIKBET : Bandar Slot Gacor Pragmatic Play Deposit Pakai Bank Mega Bonus Berl...
ย 
APAKAH LOGISTIK SIAP UNTUK PERTUMBUHAN? Michael Rada
APAKAH LOGISTIK SIAP UNTUK PERTUMBUHAN? Michael RadaAPAKAH LOGISTIK SIAP UNTUK PERTUMBUHAN? Michael Rada
APAKAH LOGISTIK SIAP UNTUK PERTUMBUHAN? Michael Rada
ย 
CALL/WA: 0822 348 60 166 ( TSEL ) Jasa Digital Marketing Solo
CALL/WA: 0822 348 60 166 ( TSEL ) Jasa Digital Marketing SoloCALL/WA: 0822 348 60 166 ( TSEL ) Jasa Digital Marketing Solo
CALL/WA: 0822 348 60 166 ( TSEL ) Jasa Digital Marketing Solo
ย 
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di IndonesiaPerkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
Perkembangan Perbankan di Indonesia Perkembangan Perbankan di Indonesia
ย 
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
BERKELAS!!! WA 0821 7001 0763 (FORTRESS) Harga Pintu Aluminium Kamar Mandi di...
ย 
PPT Klp 5 Sistem Informasi Manajemen.pdf
PPT Klp 5 Sistem Informasi Manajemen.pdfPPT Klp 5 Sistem Informasi Manajemen.pdf
PPT Klp 5 Sistem Informasi Manajemen.pdf
ย 
analisa kelayakan bisnis aspek keuangan.
analisa kelayakan bisnis aspek keuangan.analisa kelayakan bisnis aspek keuangan.
analisa kelayakan bisnis aspek keuangan.
ย 
BAMBUHOKI88 Situs Game Gacor Menggunakan Doku Mudah Jackpot Besar
BAMBUHOKI88 Situs Game Gacor Menggunakan Doku Mudah Jackpot BesarBAMBUHOKI88 Situs Game Gacor Menggunakan Doku Mudah Jackpot Besar
BAMBUHOKI88 Situs Game Gacor Menggunakan Doku Mudah Jackpot Besar
ย 
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
Abortion pills in Muscat ( Oman) +966572737505! Get CYTOTEC, unwanted kit mis...
ย 
Pelembagaan Badan Usaha Milik Desa (BUMDes)ppt
Pelembagaan Badan Usaha Milik Desa (BUMDes)pptPelembagaan Badan Usaha Milik Desa (BUMDes)ppt
Pelembagaan Badan Usaha Milik Desa (BUMDes)ppt
ย 
Nilai-Waktu-Uang.pptx kdgmkgkdm ksfmkdkmdg
Nilai-Waktu-Uang.pptx kdgmkgkdm ksfmkdkmdgNilai-Waktu-Uang.pptx kdgmkgkdm ksfmkdkmdg
Nilai-Waktu-Uang.pptx kdgmkgkdm ksfmkdkmdg
ย 
Administrasi Kelompok Tani atau kelompok wanita tani
Administrasi Kelompok Tani  atau kelompok wanita taniAdministrasi Kelompok Tani  atau kelompok wanita tani
Administrasi Kelompok Tani atau kelompok wanita tani
ย 
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptxPERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
PERAN DAN FUNGSI KOPERASI-TUGAS PPT NOVAL 2B.pptx
ย 
Pernyataan SAK 1 Pelaporan Keuangan.pptx
Pernyataan SAK 1 Pelaporan Keuangan.pptxPernyataan SAK 1 Pelaporan Keuangan.pptx
Pernyataan SAK 1 Pelaporan Keuangan.pptx
ย 
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docxLAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
LAPORAN HASIL OBSERVASI ENGLISH COURSE (1).docx
ย 
ASKEP WAHAM KELOMPOK 4 vvvvvvvvvPPT.pptx
ASKEP WAHAM KELOMPOK 4 vvvvvvvvvPPT.pptxASKEP WAHAM KELOMPOK 4 vvvvvvvvvPPT.pptx
ASKEP WAHAM KELOMPOK 4 vvvvvvvvvPPT.pptx
ย 
Bab 11 Liabilitas Jangka Pendek dan Penggajian.pptx
Bab 11 Liabilitas Jangka Pendek dan   Penggajian.pptxBab 11 Liabilitas Jangka Pendek dan   Penggajian.pptx
Bab 11 Liabilitas Jangka Pendek dan Penggajian.pptx
ย 

Tugas Manajemen sistem Informasi big data

  • 1.
  • 2. i DAFTAR ISI BAGIAN I LANDASAN TEORI ........................................ Error! Bookmark not defined. 1.1 PENGERTIAN...........................................................................................................1 1.2 Sejarah Big Data........................................................................................................2 1.3 Karakteristik Big Data ..............................................................................................3 1.4 Membangun Big Data Platform ..............................................................................3 1.5 Pemanfaatan Big Data dan implementasinya......................................................5 BAGIAN II TRAVELOKAOPEN SOURCE LIBRARY FOR DATA SCIENCE....................................6 2.1 EKOSISTEM DATA DI TRAVELOKA.......................................................................6 2.2 Pemanfaatan Big Data dan implementasinya pada Traveloka Co...................8 BAGIAN III KRITIK DAN SARAN..........................................................................................9 3.1 KRITIK .........................................................................................................................9 3.2 SARAN ........................................................................................................................9 BAGIAN IV DAFTAR PUSTAKA........................................................................................ 10
  • 3. ii
  • 4. 1 BAGIAN I LANDASAN TEORI 1.1 PENGERTIAN Mahadata, lebih dikenal dengan istilah bahasa Inggris big data, adalah istilah umum untuk segala himpunan data (data set) dalam jumlah yang sangat besar, rumit dan tak terstruktur sehingga menjadikannya sukar ditangani apabila hanya menggunakan perkakas manajemen basis data biasa atau aplikasi pemroses data tradisional belaka. Mahadata(Big data) juga dapat diartikan sebagai pertumbuhan data dan informasi yang eksponensial dengan kecepatan dalam pertambahannya dan memiliki data yang bervariasi sehingga menyebabkan tantangan baru dalam pengolahan sejumlah data besar yang heterogen dan mengetahui bagaimana cara memahami semua data tersebut1. Berikut merupakan pengertian big data diruju dari pendapat para ahli, ๏‚ท Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk informasi yang tidak dapat diproses atau dianalisis menggunakan alat tradisional. ๏‚ท Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif untuk memprosesnya. Berdasarkan pengertian para ahli di atas, dapat disimpulkan bahwa Big Data adalah data yang memiliki volume besar sehingga tidak dapat diproses menggunakan alat tradisional biasa dan harus menggunakan cara dan alat baru untuk mendapatkan nilai dari data ini. 1 Wikipedia ,โ€œ Big Dataโ€, diakses dari https://id.wikipedia.org/wiki/Mahadata ,pada tanggal 20 Februari 2019 pukul 14.28
  • 5. 2 1.2 Sejarah Big Data Sebelum mempelajari suatu hal tentu diperlukan untuk memahami asal muasal atau sejarah dari hal yang ingin dipelajari tersebut. Berikut urutannya sejarah big data; ๏‚ง 1944 โ€“ Fremont Rider, Pustakawan universitas Wesleyan. Dia memperkirakan bahwa Perpustakana yang ada di amerika serikat ukurannya meningkat dua kali lipat setiap 16 tahun ๏‚ง 1961 โ€“ Derek Price. Dia mendiagramkan pertumbuhan pengetahuan ilmiah dengan cara melihat jumlah pertumbuhan jurnal ilmiah dan makalah ๏‚ง 1967 โ€“ B.A. Marron dan P.A.D. De Maine menerbitkan โ€œAutomatic data compressionโ€ dalam Komunikasi dari ACM, yang menyatakan bahwa โ€œledakan informasiโ€ tercatat dalam beberapa tahun terakhir membuatnya penting bahwa persyaratan penyimpanan untuk semua informasi harus dijaga agar tetap minimum. ๏‚ง 1971 โ€“ Arthur Miller Menulis dalam โ€œThe Assault on Privacyโ€ menyatakan, โ€œTerlalu banyak informasi. pengurus tampaknya mengukur seorang pria seimbang dengan jumlah bit kapasitas penyimpanan berkas itu akan mengisi.โ€ ๏‚ง 1975 โ€“ Departemen Pos dan Telekomunikasi di Jepang mulai melakukan Arus Informasi Sensus, pelacakan volume informasi yang beredar di Jepang (ide pertama kali diusulkan dalam makalah 1969) ๏‚ง 1980 โ€“ I.A. Tjomsland memberikan ceramah berjudul โ€œWhere do we go from here?โ€ Di IEEE Keempat Symposium on Mass Storage Systems, dia mengatakan โ€œMereka yang terkait dengan perangkat penyimpanan lama menyadari bahwa Hukum parkinson Pertama dapat diparafrasekan untuk menggambarkan Industry kami โ€˜Data mengembang untuk mengisi ruang yang tersediaโ€™. ๏‚ง 1981 โ€“ Kantor Pusat statistic hungaria memulai proyek penelitian untuk menjelaskan informasi indsutri negara, termasuk mengukur Volume informasi dalam bit. ๏‚ง 1983 โ€“ Ithiel de Sola Pool menerbitkan โ€œPelacakan Arus Informasiโ€ di Science. Melihat tren pertumbuhan di 17 Media komunikasi utama 1960-1977,
  • 6. 3 ia menyimpulkan bahwa โ€œkata-kata yang tersedia untuk Amerika (di atas usia 10) melalui media ini tumbuh pada tingkat 8,9 persen per tahun, kata-kata benar-benar hadir untuk dari media tersebut tumbuh hanya 2,9 persen per tahun, Pada periode pengamatan, sebagianbesar pertumbuhan arus informasi adalah karena pertumbuhan penyiaran, Tapi menjelang akhir periode [1977] situasi berubah: media point-to-point yang tumbuh lebih cepat dari penyiaran.โ€ 1.3 Karakteristik Big Data Berikut merupakan karakteristik yang dimiliki oleh Big Data : Volume Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja tercatat 800,000 petabyte data tersimpan di seluruh dunia dan angka ini diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau bahkan lebih. big data memiliki jumlah data yang sangat besar sehingga dalam proses pengolahan data dibutuhkan suatu penyimpanan yang besar dan dibutuhkan analisis yang lebih spesifik. Variety Selain data relasional, data apa saja yang umum dianalisis? Dengan meledaknya jumlah sensor, dan perangkat pintar , dan juga teknologi social networking yang menghasilkan data-data yang akan sulit jika harus disimpan di dalam relasional database. big data memiliki aliran data yang yang cepat dan real time. Velocity Seberapa cepat kita dapat memproses data yang ada? Mungkin hal itu yang pertama ada dalam benak anda ketika anda membaca ini. Namun sebenarnya velocity di sini kita lihat dari persepsi seberapa cepat kita mampu mendapatkan hasil analisis terhadap aliran data yang terus mengalir di saat yang hampir bersamaan dengan datangnya data tersebut. 1.4 Membangun Big Data Platform Seperti data pergudangan, toko web atau platform TI, infrastruktur untuk data yang besar memiliki kebutuhan yang unik. Dalam mempertimbangkan semua komponen platform data yang besar, penting untuk diingat bahwa tujuan akhir adalah untuk
  • 7. 4 dengan mudah mengintegrasikan data yang besar dengan data perusahaan Anda untuk memungkinkan Anda untuk melakukan analisis mendalam pada set data gabungan. Infrastructure Requirements โ€“ Data Acquisition Tahap akuisisi adalah salah satu perubahan besar dalam infrastruktur pada hari-hari sebelum big data. Karena big data mengacu pada aliran data dengan kecepatan yang lebih tinggi dan ragam yang bervariasi, infrastruktur yang diperlukan untuk mendukung akuisisi data yang besar harus disampaikan secara perlahan, dapat diprediksi baik di dalam menangkap data dan dalam memprosesnya secara cepat dan sederhana, dapat menangani volume transaksi yang sangat tinggi , sering dalam lingkungan terdistribusi, dan dukungan yang fleksibel, struktur data dinamis โ€“ Data Organization Dalam istilah Data pergudangan klasik, pengorganisasian data disebut integrasi data. Karena ada volume/jumlah data yang sangat besar, ada kecenderungan untuk mengatur data pada lokasi penyimpanan aslinya, sehingga menghemat waktu dan uang dengan tidak memindah-midahkan data dengen volume yang besar. Infrastruktur yang diperlukan untuk mengatur data yang besar harus mampu mengolah dan memanipulasi data di lokasi penyimpanan asli. Biasanya diproses didalam batch untuk memproses data yang besar, beragam format, dari tidak terstruktur menjadi terstruktur. โ€“ Data Analysis Karena data tidak selalu bergerak selama fase organisasi, analisis ini juga dapat dilakukan dalam lingkungan terdistribusi, di mana beberapa data akan tinggal di mana data itu awalnya disimpan dan diakses secara transparan dari sebuah data warehouse. Infrastruktur yang diperlukan untuk menganalisis data yang besar harus mampu mendukung analisis yang lebih dalam seperti analisis statistik dan data mining, pada data dengan jenis yang beragam dan disimpan dalam sistem yang terpisah, memberikan waktu respon lebih cepat didorong oleh perubahan perilaku; dan mengotomatisasi keputusan berdasarkan model analitis.
  • 8. 5 1.5 Pemanfaatan Big Data dan implementasinya Big data dapat dikonsiderasikan sebagai suatu investasi, dimana implikasi yang nyata baru dapat dirasakan apabila proses penelitian dan interpretasi big data telah dirampungkan dan menghasilkan strategi bisnis yang solutif dan implementatif. Manfaat pertama dari pemanfaatan big data adalah perusahaan memiliki kesempatan untuk mengambil keputusan bisnis yang didasarkan atas data yang ilmiah dan terukur, bukan berdasarkan common sense, intuisi, atau kebijaksanaan yang bersifat praktis. Selama bertahun-tahun, HR telah menggunakan data tidak terstruktur dari jawaban karyawan dalam survei engagement, performance review, dll. Di era big data ini, data tak terstruktur tersebut datang dari sumber dalam dan luar organisasi, termasuk dari social media, blog, wiki, email, dan lain-lain. Semua sumber ini akan memberikan semakin banyak insight terhadap keterlibatan karyawan terhadap perusahaan. Big Data sendiri diimplementasikan hampir ke semua lini kehidupan masyarakat. Seperti dalam dunia Bisnis, kesehatan, pendidikan, pariwisata, ekonomi, sosial, budaya ,politik dsb.
  • 9. 6 BAGIAN II TRAVELOKA OPEN SOURCE LIBRARY FOR DATA SCIENCE 2.1 EKOSISTEM DATA DI TRAVELOKA Traveloka mengadakan meetup data untuk pertama kalinya dengan tema "How to Feed Data Hungry Organization". Pembahasannya kebanyakan berkutat dengan ekosistem data yang dibangun di Traveloka seperti teknologi apa saja yang digunakan untuk penyimpanan, pengolahan maupun analisis data. Setidaknya ada 40 lebih, data scientist/analyst/engineer di Traveloka yang dikomandoi oleh Ainun Najib dengan tim data engineer dikomandoi oleh Rendy B. Junior dan tim data science dikomandoi oleh Dr. Philip Thomas. Mari kita kupas beberapa teknologi dan perangkat yang digunakan oleh tim data Traveloka. dplyr dan data.table merupakan library R yang digunakan untuk data wrangling, mirip seperti query SQL. Untuk readiblity, dplyr lebih baik dibandingkan data.table. Sedangkan, data.table lebih cepat untuk proses data yang lebih besar. Dengan adanya sparklyr pun, query data dari Data Lake dengan gaya dplyr bisa lebih digunakan secara langsung ketimbang dengan bahasa SQL. Selain itu, library R lain yang digunakan di Traveloka ada ggplot2 untuk visualisasi data statis, Shiny untuk visualisasi data interaktif, dan caret maupun e1071 untuk machine learning. Python Sebagai multipurpose language, Python bisa digunakan untuk banyak hal. Di Traveloka, Python digunakan untuk proses ETL, lempar data antar database, transformasi data/pembersihan maupun machine learning. Dibandingkan R, Python memiliki ekosistem machine learning yang lebih padu dengan adanya scikit-learn. Untuk data wrangling, ada pandas dengan filosofi seperti halnya kelas data frame yang ada di R. Terlebih lagi, Python juga digunakan untuk keperluan deep
  • 10. 7 learning via TensorFlow yang memang a big no kalau dilakukan di R. Saya pun penasaran seperti apakah use case deep learning yang ada di Traveloka. Dataiku Mungkin ada data scientist yang terlalu R-ish maupun Python-ish, dan disinilah Dataiku berperan sebagai platform agar sesama data scientist saling berkolaborasi meskipun bahasa pemrograman yang digunakan berbeda-beda. Bukan hanya itu, Dataiku juga bisa menjadi jembatan untuk data engineer, data scientist maupun business analyst untuk saling berkolaborasi. Database dan Penyimpanan Data disimpan di Cloud via AWS maupun Google Cloud. Ada berbagai macam database yang digunakan di Traveloka baik RDBMS maupun NoSQL dengan tujuan yang juga berbeda- beda. Untuk RDBMS, ada MemSQL, Redshift dan PostgreSQL. Sedangkan untuk NoSQL, ada DynamoDB dan MongoDB. Untuk query engine dari data lake AWS S3 bisa menggunakan Qubole, Presto, Hive atau mungkin menggunakan SparkSQL. Lainnya Traveloka juga menggunakan bahasa pemgrograman seperti Julia yang bisa dibilang masih baru. Java yang merupakan core dari Big Data juga digunakan untuk membuat aplikasi untuk presentation layer yang kemungkinan besar digunakan business users. Ada juga beberapa perangkat lainnya yang terdengar asing bagi saya seperti Domo, Keboola, Holistics serta Periscope Data.
  • 11. 8 2.2 Pemanfaatan Big Data dan implementasinya pada Traveloka Co. 1. Penghematan biaya, Teknologi analisis Big data berbasis cloud membawa pengurangan biaya yang signifikan dalam hal untuk menyimpan data set dalam jumlah besar, selain mereka dapat mengidentifikasi cara-cara yang lebih efisien dalam melakukan bisnis. 2. Lebih cepat dan lebih baik dalam pengambilan keputusan, dengan kecepatan teknologi big data dapat melakukan analisis yang dikombinasikan dengan kemampuan untuk menganalisis berbagai macam sumber data baru, membuat bisnis mampu menganalisis informasi dengan cepat dan membuat keputusan berdasarkan hasil analisis tersebut. 3. Melahirkan produk dan pelayanan baru, dengan kemampuan mengukur kebutuhan dan kepuasan pelanggan mendatangkan keunggulan dari bisnis untuk menciptakan produk dan layanan baru yang sesuai dengan keinginan dan kebutuhan dari pelanggan. 4. Menganalisis perilaku konsumen dalam bepergian maupun berbelanja di fitur e-commerce Traveloka. 5. Meningkatkan akurasi proyeksi penjualan dan produk layanan traveloka. 6. Membantu memperkirakan pendapatan dengan lebih akurat. 7. Memecahkan pola perilaku konsumen. 8. Membantu menyediakan layanan baru yang sesuai dengan kebutuhan konsumen. 9. Terjaminnya data yang akan menjadi informasi baik bagi pihak manajemen maupun karyawan. 10.Membantu menciptakan peluang usaha baru.
  • 12. 9 BAGIAN III KRITIK DAN SARAN 3.1 KRITIK ๏‚ท Traveloka mempunyai fitur pada Halaman awal sangat rumit untuk pencarian. Setidaknya traveloka menyeimbangkan antara fitur dengan teknologi Data Resources mereka yang sudah cukup bagus. ๏‚ท Fokus kepada situs boking domestic , sangat disayangkan pengembangkan Big Data yang mereka miliki tidak mampu mengakomodir semua layanan baik domestik maupun Internasional. ๏‚ท Pencarian hotel masih sangat kecil informasi. Traveloka mempunyai komponen Big Data yang baik tapi tidak mampu mengintegrasikan platform informasi perhotelan dengan memadai. ๏‚ท Traveloka tidak menyediakan layanan paket traveling padahal dengan adanya Big Data mereka mampu meningkatkan keuntungan kompetitif. ๏‚ท Jika terjadi pembatalan penerbagan atau tiket oleh customer , pihak traveloka tidak sigap untuk melakukan refund money. 3.2 SARAN ๏‚ท Traveloka sebaiknya sigap dan cepat dalam mengolah dan menganalisis data yang diperoleh untuk meningkatkan kompetitif apalagi banyak ecommerce yang mulai booming. ๏‚ท Melakuakn maintenance terhadap aplikasi fitur layanan. ๏‚ท Melakukan integrasi data dengan pelbagai platform akomodasi agar dapat bertukar informasi dengan cepat. ๏‚ท Memanfaatkan penggunaan Big Data dengan berani merambah ke seluruh dunia. ๏‚ท Mengembangkan bisnis baru yang dapat menyediakan paket layanan traveling dan akomodasi. ๏‚ท Membangun pusat Data analysis khusus untuk era 4.0 dan usaha menyiapkan bisnis yang lebih kompetitif di masa yang akan datang. Karena banyak fintech ata pn aplikasi pasaran yang menyediakan fitur traveling dan akomodasi.
  • 13. 10 BAGIAN IV DAFTAR PUSTAKA (t.thn.). Diambil kembali dari wikipedia: https://id.wikipedia.org/wiki/Mahadata ARDIYANTO. (2016, maret). Diambil kembali dari kelebihan dan kekurangan Trtaveloka: http://ardiyanto14002.blogspot.com/2016/03/32-contoh-kelebihan- dan-kekurangan-di.html Arni, U. D. (2018, desember 17). Diambil kembali dari garudacyber: https://garudacyber.co.id/artikel/1446-kelebihan-dan-kekurangan-aplikasi- traveloka MAULANA.S, I. (2016, nofember). Diambil kembali dari implementasi big data: http://ilhammaulanasuryani.blogspot.com/2016/11/implementasi-big-data.html Puruhita. (2016, Februari 6). Diambil kembali dari Informasi Seputar Dunia Informatika: https://puruhitas.blog.uns.ac.id/2016/02/06/409/ Ridha, R. (2018). Diambil kembali dari MENGINTIP EKOSISTEM DATA DI TRAVELOKA: https://datascience.or.id/article/Mengintip-Ekosistem-Data-di- Traveloka-5a8fa6e6#