Teks tersebut merangkum tentang Database Management System (DBMS) dan data mining. DBMS digunakan untuk membangun sistem basis data yang berbasis komputer dan mengelola kumpulan data besar secara terstruktur, sedangkan data mining digunakan untuk menggali pola dan pengetahuan tersembunyi dari basis data. Teks tersebut juga menjelaskan bahasa yang digunakan pada DBMS serta manfaat dan proses data mining.
1. TUGAS SISTEM INFORMASI MANAGEMENT
1418191 Haikal Muqoddasy
DBMS
Basis data merupakan kumpulan data yang saling berhubungan satu dengan yang lainnya
yang diaorganisasikan sesuai struktur tertentu dan disimpan dengan baik. Untuk
mendapatkan informasi yang berguna dari kumpulan data maka diperlukan suatu perangkat
lunak (software) untuk memanipulasi data sehingga mendapatkan informasi yang berguna.
Database Manajement System (DBMS) merupakan software yang digunakan untuk
membangun sebuah sistem basis data yang berbasis komputerisasi. DBMS membantu dalam
pemeliharaan dan pengolahan kumpulan data dalam jumlah besar. Sehingga dengan
menggunakan DBMS tidak menimbulkan kekacauan dan dapat digunakan oleh pengguna
sesuai dengan kebutuhan.
DBMS merupakan perantara bagi pemakai dengan basis data. Untuk merinteraksi dengan
DBMS (basis data) menggunakan bahasa basis data yang telah ditentukan oleh perusahaan
DBMS. Bahasa basis data biasanya terdiri atas perintah-perintah yang di formulasikan
sehingga perintah tersebut akan diproses olah DBMS. Perintah-perintah biasanya ditentukan
oleh user. Ada 2 bahasa basis data:
1. Data Definition Language (DDL)
DDL digunakan untuk menggambarkan desain basis data secara keseluruhan. DDL digunakan
untuk membuat tabel baru, menuat indeks, ataupun mengubah tabel. Hasil kompilasi DDL
disimpan di kamus data.
2. Data Manipulation Language (DML)
DML digunakan untuk melakukan menipulasi dan pengambilan data pada suatu basis data
seperti penambahan data baru ke dalam basis data, menghapus data dari suatu basis data dan
pengubahan data di suatu basis data.
Dalam pembuatan DBMS diperlukan beberapa komponen fungsional penyusunnya sebagai
berikut:
1. DML Precompiler : mengkonversi pernyataan-pernyataan DML yang dimasukkan
di dalam program aplikasi ke dalam pemanggilan prosedur normal di dalam bahasa induknya.
Procompiler harus berinteraksi dengan query processor untuk membuat kode-kode yang
diperlukan.
2. Query Processor : menterjemahkan pernyataan-pernyataan bahasa query ke dalam
instruksi-instruksi low-level yang dimengerti oleh database manager
3. DDL Compiler : mengkonversi pernyataan DDL ke dalam sekumpulan table
yang mengandung metadata atau “data mengenai data”
2. 4. Database Manager : menyediakan interface antara data low-level yang disimpan
didalam basisdata dengan program-program aplikasi dan queries yang dikirimkan ke system.
Tujuan utama DBMS adalah untuk menyediakan tinjauan abstrak dari data bagi user. Jadi
sistem menyembunyikan informasi mengenai bagaimana data disimpan dan dirawat, tetapi
data tetap dapat diambil
dengan efisien. Pertimbangan efisien yang digunakan adalah
bagaimana merancang struktur data yang kompleks, tetapi tetap dapat digunakan oleh
pengguna yang masih awam, tanpa mengetahui kompleksitas struktur data. Basis data menjadi
penting karena munculnya beberapa masalah bila tidak menggunakan data yang terpusat,
seperti adanya duplikasi data, hubungan antar data tidak jelas, organisasi data dan update
menjadi rumit. Jadi tujuan dari pengaturan data dengan menggunakan basis data yaitu sebagai
berikut:
- Menyediakan penyimpanan data untuk dapat digunakan oleh organisasi saat sekarang
dan masa yang akan datang.
- Kemudahan pemasukan data, sehingga meringankan tugas operator dan menyangkut
pula waktu yang diperlukan oleh pemakai untuk mendapatkan data serta hak-hak yang
dimiliki terhadap data yang ditangani.
- Pengendalian data untuk setiap siklus agar data selalu up-to-date dan dapat
mencerminkan perubahan spesifik yang terjadi di setiap sistem.
3. - Pengamanan data terhadap kemungkinan penambahan, pengubahan, pengerusakan dan
gangguan-gangguan lain.
Data mining
Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan
data berupa pengetahuan yang selama ini tidak diketahui secara manual. Patut diingat bahwa
kata mining sendiri berarti usaha untuk mendapatkan sedikit barang berharga dari sejumlah
besar material dasar. Karena itu Data Mining sebenarnya memiliki akar yang panjang dari
bidang ilmu seperti kecerdasan buatan (artificial intelligent), machine learning, statistik dan
database. Data mining adalah proses menerapkan metode ini untuk data dengan maksud untuk
mengungkap pola-pola tersembunyi. Dengan arti lain Data mining adalah proses untuk
penggalian pola-pola dari data. Data mining menjadi alat yang semakin penting untuk
mengubah data tersebut menjadi informasi. Hal ini sering digunakan dalam berbagai praktek
profil, seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah. Telah
digunakan selama bertahun-tahun oleh bisnis, ilmuwan dan pemerintah untuk menyaring
volume data seperti catatan perjalanan penumpang penerbangan, data sensus dan supermarket
scanner data untuk menghasilkan laporan riset pasar.
Alasan utama untuk menggunakan data mining adalah untuk membantu dalam analisis koleksi
pengamatan perilaku. Data tersebut rentan terhadap collinearity karena diketahui keterkaitan.
Fakta yang tak terelakkan data mining adalah bahwa subset/set data yang dianalisis mungkin
tidak mewakili seluruh domain, dan karenanya tidak boleh berisi contoh-contoh hubungan
kritis tertentu dan perilaku yang ada di bagian lain dari domain . Untuk mengatasi masalah
semacam ini, analisis dapat ditambah menggunakan berbasis percobaan dan pendekatan lain,
seperti Choice Modelling untuk data yang dihasilkan manusia. Dalam situasi ini, yang
melekat dapat berupa korelasi dikontrol untuk, atau dihapus sama sekali, selama konstruksi
desain eksperimental.
Beberapa teknik yang sering disebut-sebut dalam literatur Data Mining dalam penerapannya
antara lain: clustering, classification, association rule mining, neural network, genetic
algorithm dan lain-lain. Yang membedakan persepsi terhadap Data Mining adalah
perkembangan teknik-teknik Data Mining untuk aplikasi pada database skala besar. Sebelum
populernya Data Mining, teknik-teknik tersebut hanya dapat dipakai untuk data skala kecil
saja.
Manfaat Data Mining
1. Segmentasi Pasar
Mengidentifikasi karakteristikumumdari pelangganyang membeli produkyangsama
2. Analisiskeranjangpenjualan
Memahami produkatau servisyangpadaumumnyadijual bersama-sama.
4. 3. Analisiskecenderungan
Menyatakanperbedaanantaratipe pelangganbulanini danyanglalu.
4. Intelligence Marketing
Kebanyakanaplikasi dataminingtujuanutamanyaadalahmembuatprediksi dandeskripsi.
Prediksi menggunakanbeberapavariableataufield-fieldbasisdatauntukmemprediksinilai-
nilai variable masamendatangyangdiperlukanyangbelumdiketahui saat ini.
Deskripsi berfokuspadapenemuanpola-polatersembunyi dari datayangditelaah.
Proses Data minings
Data mining sesunggunghnya merupakan salah satu rangkaian dari proses pencarian
pengetahuan pada database (Knowledge Discovery in Database/KDD). KDD berhubungan dengan
teknikintegrasi danpenemuanilmiah,interprestasi danvisualisasi dari pola-polasejumlahkumpulan
data. KDD adalah keseluruhan proses non-trivial untuk mencari dan mengidentifikasi pola (pattern)
5. dalamdata, dimanapolayang ditemukanbersifatsah,baru,dapatbermanfaatdandapat dimengerti.
Serangkaian proses tersebut yang memiliki tahap sebagai berikut (Tan, 2004):
1. Pembersihandata dan integrasi data (cleaning and integration) Proses ini digunakanuntuk
membuang data yang tidak konsistendan bersifat noise dari data yang terdapat di berbagai
basisdata yang mungkin berbeda format maupun platform yang kemudian diintegrasikan
dalam satu database datawarehouse.
2. Seleksi dan transformasi data (selection and transformation) Data yang terdapat dalam
database datawarehouse kemudian direduksi dengan berbagai teknik. Proses reduksi
diperlukan untuk mendapatkan hasil yang lebih akurat dan mengurangi waktu komputasi
terutama utuk masalah dengan skala besar (large scale problem).
Fungsi data mining
Assosiation, adalah proses untukmenemukan aturan assosiatif antara suatu kombinasi item
dalam suatu waktu
Secuence, hampir sama dengan association bedanya seccuence diterapkan lebih dari satu
periode.
Clastering,adalahprosespengelompokansejumlahdata/obyekke dalamkelompok-kelompok
data (klaster) sehingga setiap klaster akan berisi data yang saling mirip.