Chapter 1 : The Compelling Need for Data Warehousing .pdf
DATABASE AND CUSTOMER DATA DEVELOPMENT
1.
2. PENDAHULUAN
Organisasi menjadi sangat mahir dalam menghasilkan data. Infusi secara
masal dari generasi data ini dalam masyarakat kita telah menciptakan
peluang tak terbatas untuk membangun hubungan dengan pelanggan.
Internet telah mempercepat generasi data ini. Hal itu telah menantang
organisasi untuk menentukan bagaimana memanfaatkan data dalam upaya
untuk mempertahankan dan mengembangkan hubungan dengan
pelanggan mereka. Hal itu juga telah menciptakan banyak peluang untuk
mnghambat pertumbuhan sebuah hubungan dalam beberapa kasus yang
menghancurkan apa yang mungkin menjadi hubungan yang baik.
3. DEFINISI DATA
Data merupakan serangkaian angka, karakter dan piksel. Tersusun
secara logis, angka, karakter, atau piksel tersebut yang mewakili
informasi. Sebuah daftar nama orang itu sendiri dengan atau tanpa
ada deskripsi lain yang dapat disebut kumpulan data. Data dapat
dibagi menjadi beberapa kategori, yaitu:
Primary Data
Secondary Data
Derived Data
4. PRIMARY DATA, SECONDARY DATA,
DERIVED DATA
Primary data diperoleh secara langsung dari sumber
asli.
Contoh: Jika seorang konsumen mengisi sebuah formulir
dengan data pribadi mereka kepada seorang pengecer dan
mengembalikannya kepada pengecer, maka pengecer itu
telah memiliki data primer pada konsumen tersebut.
5. Secondary data diperoleh dari beberapa pihak selain
pihak yang mewakili data atau sumber aslinya.
Contoh: Jika sebuah perusahaan telemarketing menelpon
seorang konsumen untuk meminta dan menerima informasi
pribadi, data itu merupakan data primer untuk perusahaan
telemarketing tersebut dan jika perusahaan telemarketing itu
memberikan informasi konsumen tersebut kepada seorang
pengecer, maka pengecer tersebut akan menanggapi hal itu
sebagai data sekunder yang secara langsung tidak diperoleh
dari sumber aslinya, karena data sudah tersedia.
6. Derived data adalah informasi yang dibuat dari data
lainnya, data ini merupakan data yang diperoleh dari
penarikan kesimpulan data sekunder. Data ini
terkadang dapat diandalkan dan terkadang tidak dapat
diandalkan. Perusahaan yang membeli derived data
harus berusaha untuk melakukan pengecekan ulang
terhadap data tersebut apakah valid atau tidak.
7. INDIVIDUALAND HOUSEHOLD DATA
Individual data adalah data yang dikaitkan dengan
seseorang tetentu (setiap keluarga mungkin memiliki
beberapa anggota keluarga). Setiap individu dapat
menghasilkan data dalam berbagai transaksi dengan
berbagai organisasi.
8. PENDEKATAN ORGANISASI DALAM
PENGUMPULAN DATA
Organisasi melakukan pendekatan pengumpulan data dalam dua cara:
Pertama, dengan mengumpulkan data sebanyak mungkin. Terkadang
organisasi tidak yakin data apa yang harus mereka kumpulkan, untuk itu
dengan mengumpulkan data sebanyak mungkin mereka yakin tidak ada
data yang hilang.
Kedua, pengumpulan data secara spesifik. Mereka mengumpulkan data
sesuai dengan ketentuan. Salah satu pendekatan belum tentu lebih baik
atau lebih buruk daripada yang lain. Metode mana yang dipilih tergantung
pada pengetahuan data dan ketersediaan sumber daya.
9. TRANSFORMASI DATA
Data sangat penting untuk proses operasional. Mengubah data
menjadi informasi adalah salah satu dari dua langkah yang harus
dilakukan sebelum pemasar memanfaatkan data. Setelah data
ditransformasikan menjadi informasi, data kemudian dapat
dianalisis atau diolah untuk menentukan apakah ada nilai yang
melekat. Informasi tersebut kemudian dapat digunakan untuk
mendukung upaya CRM. Hal ini mengubah informasi menjadi
pengetahuan yang dapat mengarah kepada tindakan.
10. INFORMATION AGING
Informasi apa yang harus terjaga, dalam bentuk apa informasi
tersebut (agregat, ringkasan atau detail), dan untuk berapa
lama informasi tersebut dibutuhkan oleh industri. Pada
tingkat yang lebih rendah, posisi organisasi dalam industri
itu, sumber daya (manusia, komputer, dan keuangan).
Perusahaan harus terus mengupdate riwayat data transaksi
dari waktu ke waktu karena dapat bersifat expired.
11. DATA MINING
Data mining adalah serangkaian proses untuk menggali nilai
tambah dari suatu kumpulan data berupa pengetahuan yang
selama ini tidak deketahui secara manual. Yang bertujuan
untuk mencari informasi tipe hubungan atau pola yang paling
umum dideskripsikan terhadap data mining. Ketika data telah
ditransformasikan menjadi informasi, maka data mining akan
efektif.
12. Beberapa metodologi yang termasuk dalam pembahasan data mining, sistem-sistem
ini dapat mendukung upaya CRM secara teknis meskipun mereka bukan data
mining :
o Decision Support System (DSS) adalah sistem perangkat lunak, bagian dari
sistem informasi berbasis komputer yang digunakan untuk mendukung
pengambilan keputusan dalam suatu organisasi atau perusahaan.
o Executive Information System (EIS) adalah sistem yang berbasis komputer ,
dirancang untuk pengambilan keputusan dengan tingkat yang lebih tinggi yaitu
membantu executive dalam mengakses data dan informasi untuk mengetahui
suatu permasalahan, meneliti solusi yang akan diberikan, dan menunjukkan
proses strategic planning.
o Enterprise Resource Planning (ERP) adalah sistem informasi yang
diperuntukkan bagi perusahaan manufaktur maupun jasa yang berperan
mengintegrasikan dan mengotomatisasikan proses bisnis yang berhubungan
dengan aspek operasi, produksi maupun distribusi pada sebuah perusahaan.
13. Lokasi dan Akses Pertimbangan
Dimana untuk dapat mengakses data mining memiliki beberapa dependensi,
terdapat tiga area yang substansial:
Operational Data Store (ODS) adalah gudang data yang dinamis, biasanya
dirancang dan beroperasi dengan cara mendukung fungsi bisnis yang spesifik.
Data Warehouse (DW) adalah kumpulan data yang mempunyai sifat
berorientasi obyek, bersifat tetap. Data warehouse tidak terupdate secara real
time, tetapi direfresh secara reguler dalam schedule tertentu dari kumpulan
data dalam mendukung proses pengambilan keputusan manajemen.
Data Mart (DM) adalah suatu bagian pada data warehouse yang mendukung
pembuatan laporan dan data informasi pada suatu unit bagian atau operasi
pada sebuah perusahaan. Data Mart memberikan respon yang lebih cepat dan
lebih mudah dibandingkan data warehouse karena data mart mengandung
informasi yang tidak sebanyak data warehouse.
14. Teknik Data Mining :
Recency, Frequency, and Monetary (RFM)
Recency yaitu pencatatan terbaru tanggal transaksi
pelanggan (bersifat update).
Frequency yaitu jumlah transaksi nasabah dengan
organisasi/perusahaan dalam periode waktu tertentu.
Monetary yaitu jumlah yang dikeluarkan pelanggan dalam
waktu tertentu.
15. Theory Aside
VICTORIA’S SECRET
The limited experienced rapid growth in its sales when it launched its web site in 1998
Concurrently, catalogue sales dropped precipitously. The company had to rethink its
channel strategy especially because the costs of serving custoemr by printed catalogues
were higher and more customers were acquired by the web. The company still believed
that it needed to distribute catalogues to compliment its web channel. Consequntly, the
distribution of catalogues was targeted to customers based on the RFM or recency,
frequency and monetary value figures. Customerss with higher scores on RFM are
more likely to receive catalogues. In addtion, the company segmented the customers for
purposes of customer acquisition, retention, and extention. This helped the company to
lower its distribution of catalogues from a peak of 400 million to 350 million.
Decision Trees
Pohon keputusan memiliki struktur seperti pohon, dimana daun mewakili klasifikasi
dan cabang merupakam konjungsi fitur yang mengarah pada klasifikasi tersebut.
16. Cluster Analysis
Proses menempatkan pelanggan atau prospek ke dalam kelompok sehingga semua
orang dalam kelompok tersebut memiliki sifat yang mirip.
Ada beberapa kategori dalam cluster analysis:
1. Demographics, meliputi umur, jenis kelamin, jumlah anggota keluarga,
penghasilan, agama, dll.
2. Psychographics, meliputi kepribadiaan, gaya hidup, nilai, sikap, dll.
3. Behaviour, meliputi manfaat yang dicari, status pembeliaan tingkat penggunaan
produk, dll.
4. Geographic, meliputi negara, daerah, kota, kode pos, iklim, dll.
17. MANFAAT DATA MINING
Data mining dapat memungkinkan organisasi untuk
memanfaatkan sumber daya mereka yang terbatas untuk
mempererat hubungan dengan pelanggan dan prospek dalam
upaya mereka untuk mempertahankan pertumbuhan jangka
panjang yang menguntungkan.
18. ENABLING CRM
Contoh-contoh dalam industri :
- Manufacturer tools product - Apparel Cataloger
- Entertainment and hotel - Hotel and Travel
- Financial services - Retail Grocery
- Toy manufacturers - Small Business
- Infant formula manufacturer - Fraud Detection and Other
Nonfavorable Behavior
19. Entertainment and Hotel
Hotel dan fasilitas entertain seperti kasino, karaoke, bar dll masing-masing saling berdekatan
satu sama lain. Meskipun mereka terdapat dalam satu bagian namun mereka memiliki
suasana yang berbeda dan mereka bersaing untuk mendapatkan pelanggan.
Theory Aside
HARRAH’S ENTERTAINMENT
Casino operators routinely offer low hotel rates to motivate their guests to spend more
on games. Yet not all customers spend enough on games to justify the discounts on the
hotel rates. Harrah’s Entertainment, with twenty-six casinos in thirteen states, used data
mining to analyze spending on games in real time and custoemrs are offered incentives
while they are still in the hotel. It processes sixteen terabytes of data every day
emanating from the slotting machines and analyzes data on time spent on each of the
games, the preferences of tourists and local visitors, gender differences in game
expenditure, and a host of other variables. The share of expenditure on games has
increased from 36 percent to nearly 50 percent after its started to use data mining
technologies.
20. Theory Aside
CAPITAL ONE
Capital One, a financial services company, pionereed fact-based decision making,
based on analysis of large data sets, in its lending operations. In the past, credit cards
were issued to only those custoemrs who had a sound history of repayment, and loans
were extented to borrowers who could secure their loans with collateral. Capital One
changed the rules of the game by using data to determine credit worthiness. Its strategy
was based on the premise that customers, without a credit history, could potentially
have the potential to be good borrowers. Atypical example is a recent college graduate,
with limited means and a large student debt, who could eventually succeed in business.
Capital One created a huge DW, an equivalent of twenty pages for each of its 30
million custoemrs with information relevant for sub-prime lending. It uses this
information to conduct experiments as many as 45,000 product and marketing tests in
2001, to find financially sound offers for its various segments
Financial Services
Organisasi dalam jasa keuangan biasanya mengedepankan penggunaa data mining.
Sifat bisnis mereka yang telah menghasilkan transaksi yang tak terhitung jumlahnya
21. Theory Aside
WAL-MART
Retail store struggle to balance their ineventory with consumer demand and their
suppliers ofen unable to dispatch the right amounts of goods to warehouses. Wal-
Mart set up a massive DW in the 1980s to store information about sales and
inventorie. Its Retail Link program shared information with its suppliers like
Procter & Gamble which has expertise in predicting consumer demand. The
availability of real-time information enabled suppliers to stock goods without
waiting for orders to be placed. Furthemore, Wal-Mart is now able to respond
quickly for exception circum stances such as the severe storms in Florida Based on
pas experiences, Wal-Mart could predict that the demand fpr Strawberry Pop Tarts
would rise for example. A streamlined supply chain has enabled Wal-Mart and
Procter & Gamble to refocus their energies on category management and to use
information for merchandising.
Retail Grocery
Toko retail menerima jumlah data transaksi setiap kali seseorang belanja dengan jumlah yang
Sangat besar, dengan memberikan diskon harga melalui kartu yang disukai oleh pelanggan
toko retail dapat dengan mduah mengidentifikasi kebiasaan berbelanja, hari dan jam
kunjungan, dan jumlah kunjungan.
22. Theory Aside
VISA
Credit card fraud is endemic at a rate of 0,93 percent for off-line transactions and a
higher 1,97 percent for online transaction. The challenge of detecting fraud is avoiding
false alarms were generated for every genuine alarm. Credit card companies have to
meet the conflicting demands of keeping fraud low without irrtitating custoemrs with
false alarms. This is hard to achieve with statistical models, which compare the normal
with abnormal behavior, with abnormal behavior because criminals are generally
savvy enough to circumvent them. Visa introduced its new software, Visa, Itelligent,
Scoring of Risk (VISOR) across all banks in Europe to lower the rate of fraud. Its new
system analyzes abnormal behavior of not only the card holder but also for each
merchant in addition, it now uses artifical intelligence software, which changes the
rules of identifying fraud based on the most recent data. The rate of fraud has dropped
from 1,576 to 458 cases. The false alarms have declined to 10.
Fraud Detection and Other Nonfavorable Behaviour
Sebuah manfaat tambahan untuk pengumpulan data dan data mining yaitu timbulnya
aktifitas konsumen yang tdiak biasa, termasuk penipuan.
23. 1. Hambatan organisasi memperoleh data untuk transformasi.
2. Tekanan politik dan sosial mengenai privasi.
3. Ketersediaan data sekunder yang berkelanjutan.
4. Biaya dan manfaat yang juga membutuhkan kemampuan untuk
mengukurnya.
5. Kemampuan untuk melakukan semua transformasi data menjadi pengetahuan
secara real time.
6. Pengetahuan dan informasi dalam implementasi.
7. Interprestasi informasi dan mengubah pengetahuanke dalam tindakan.
8. Ketidakmampuan untuk menangkap transaksi nasabah.
TANTANGAN DATA MINING
24. 1. Apa saja perbedaan jenis data?
Jawab :
- Primary data, data primer yang diperoleh langsung dari
sumber aslinya.
- Secondary data, diperoleh dari pihak lain selain phak yang
memiliki data atau sumber aslinya.
- Derived data, diperoleh dari penarikan kesimpulan data
sekunder.
QUESTIONS
25. 2. Apa perbedaan antara data dan informasi?
Jawab :
Data merupakan serangkaian angka, karakter, dan gambar, yang akan mewakili
informasi. Jadi informasi adalah hasil pengolahan dari sebuah perubahan
bentuk data.
3. Apa saja variabel yang dibutuhkan untuk melakukan analisis RFM?
Jawab:
Terdapat 3 variabel, yaitu :
Recency, pencatatan terbaru tanggal transaksi pelanggan (bersifat update)
Frequency, jumlah transaksi nasabah dengan organisasi perusahaan dalam
periode wajtu tertentu.
Monetary, jumlah yang dikeluarkan pelanggan dalam waktu tertentu.
26. 4. Jelaskan perbedaan jenis data ini, ODSs, DWs dan Data Mart.
Jawab :
ODS, gudang data yang dinamis (membutuhkan pergerakan secara cepat),
biasanya dirancang dengan cara yang mendukung fungsi bisnis yang
spesifik.
DW (data warehouse), kumpulan data yang mempunyai sifat berorientasi
dan bersifat tetap atau data warehouse tidak terupdate secara real time
tetapi direfresh secara reguler dalam schedule tertentu dari kumpulan data
dalam mendukung proses pengambilan keputusan manajemen.
Data mart, suatu bagian dari data warehouse yang mendukung pembuatan
laporan dan analisa data pada suatu unit bagian atau operasi pada suatu
perusahaan.