1. Introduction to Data Warehouse & Business Intelligence 1 Hadziq Fabroyir . Department of Informatics
2. Makin Banyak Istilah OLTP, OLAP, DSS, Data Warehouse, Data Mining. Tapi intinya adalah:Teknologi untuk mengambil keputusan berdasarkan data yang cukup Hadziq Fabroyir . Department of Informatics 2
12. OLTP(OnLine Transaction Processing) Tidak semua transaksi yang online bisa dibilang online. Seperti contohnya adalah proses transaksi kliring Dulu tahun 1980, transaksi online mungkin dapat disebut sebagai pemrosesan yang interaktif atau waktu-nyata (real-time). Sehingga kliring seperti contoh di atas itu termasuk offline atau lebih dikenal dengan istilah batch. Hadziq Fabroyir . Department of Informatics 12
13. Decision Support System Istilah Decision Support System diperkenalkan P.G.W Keen dan M.S.Scott Morton lewat bukunya : Decision Support System: An Organizational Perspective” tahun 1978. Arsitekturnya terdiri atas: Database (knowledge base), Model (the Decision context and user criteria), dan Antar muka. Hadziq Fabroyir . Department of Informatics 13
14. Sejarah Pengambilan Keputusan Sampai dekade 1970 masih banyak software yang belum memakai SQL dan relational database. Pada masa itu, data komputer sudah dipakai untuk membantu pengambilan keputusan menggunakan: Riset Operasional, Teori Manajemen, dan Teori Perilaku. DSS pada saat itu berkenaan dengan data agregat (data yang diperoleh dengan memakai operasi-operasi agregat seperti SUM, COUNT, AVG, MIN, MAX). Jelasnya RDBMS dan SQL sangat memudahkan pembuatan data agregat, hal yang sulit dalam COBOL. Hadziq Fabroyir . Department of Informatics 14
15. Data Warehouse Istilah ini baru diperkenalkan pada tahun 1988 (10 tahun setelah diperkenalkannya istilah DSS) Yang memperkenalkan adalah W. H. Inmon dalam bukunya “Data Architecture: The Information Paradigm” Hadziq Fabroyir . Department of Informatics 15
16. Data Warehouse Muncullah rumusan bahwa subjek datawarehouse berkenaan dengan: Pengolahan data agregat Tipe snapshot, bitmap index, function index Tipe Table Partition dan Index Partition Operasi star join dan operasi-operasi yang aware terhadap partition Star-schema (ad0hoc database design) Hadziq Fabroyir . Department of Informatics 16
17. OLAP(OnLine Analytical Processing) Muncul tahun 1993 oleh Edgar F. Codd, S. B. Codd, dan C. T. Salley dalam dokumen untuk Arbor Corporation berjudul “Providing OLAP (OnLine Analytical Processing) to User-Analyst: An IT Mandate”. Analytical Processing diterapkan ke datawarehousing bukan production database. Lagi-lagi tidak ada dasar ilmiah. Kejadian yang mirip dengan DSS. Hadziq Fabroyir . Department of Informatics 17
18. OLAP(OnLine Analytical Processing) Euforia banyak saintis dan akademis tentang OLAP telah mereda. Berikut adalah butir-butir berikut sebagai dasar ilmiah untuk OLAP: Tipe: TABLE, REPORT, dan CUBE Operasi: GROUPING, ROLLUP, CUBE Nilai: pemakaian nilai NULL bagi nilai-nilai ‘sel’ di kubus (cube) dan report untuk data agregat. Hadziq Fabroyir . Department of Informatics 18
20. Data Mining Istilah ini dikenalkan tahun 1996 oleh Peter Adriaans dan Dolf Zatinge dalam bukungan “Data Mining” oleh Addison-Wesley. Mereka menulis aspek-aspek dan teknik-teknik ilmiah yang bisa dipakai untuk Data Mining. Secara umum Data Mining adalah mengolah data. Hadziq Fabroyir . Department of Informatics 20
21. Teknik & Aturan Data Mining Secara khusus, data mining sebagai pengolahan data memakai teknik atau aturan yang di antaranya adalah sebagai berikut: Association rule Classification rule Clustering rule Prediction rule Hadziq Fabroyir . Department of Informatics 21
23. It’s All About Technology … Apabila Data Mining, OLAP, Datawarehouse, dan lain-lain dianggap sebagai teknologi, maka: Semuanya mengarah ke satu hal: untuk mengambil keputusan Sia-sia menyimpan data, membuat algoritme, dan lain-lain, jika tidak dipakai untuk mengambil keputusan. Dengan memanfaatkan semua teknologi tersebut (dengan bijaksana), keputusan yang diambil adalah well-informed decision. Hadziq Fabroyir . Department of Informatics 23
24. Kesamaan Selain kesamaan tujuan inti, semua teknologi di atas juga memiliki kesamaan: Untuk mengolah data-data agregat Memakai sumber data yang berukuran sangat besar Memakai analisis Hadziq Fabroyir . Department of Informatics 24
25. Microsoft’s Mind Microsoft Corp memakai frasa Analysis Service untuk semua fasilitas-fasilitas di SQL Server 9 DBMS. Hadziq Fabroyir . Department of Informatics 25
30. The Tools Evolution Hadziq Fabroyir . Department of Informatics 30 Target Audience: DBA Developer SQL 2005 SQL 2000 EM 2000 EM 2000 SQL Management Studio QA 2000 QA 2000 BI Development Studio AM 2000 AM 2000
31. SQL ’05 BI Components Hadziq Fabroyir . Department of Informatics 31
32. SQL Server Management Studio “Replacement” for SQL Server Enterprise Manager and Query Analyzer Visual Studio 2005 IDE Manage all Databases Relational Databases Analysis Databases CE Databases Hadziq Fabroyir . Department of Informatics 32
34. Integration Services Formerly Data Transformation Services (DTS) Build and debug complex integration packages Separation of Control Flow and Data Flow Integrated Source Control Hadziq Fabroyir . Department of Informatics 34
36. New England Code Camp IV: “Developer’s Gone Wild” Universal Dimensional Model Unified logical model for both relational and OLAP analysis databases with high performance and scalability Capture and model all of your data Relational reporting and OLAP converge through a single relational model
37. New England Code Camp IV: “Developer’s Gone Wild” Datamart Datamart SQL Server 2005 Enterprise BI A Unified Dimensional Model MOLAP OLAP Browser MOLAP Reporting Tool UDM BI Applications DW
39. New England Code Camp IV: “Developer’s Gone Wild” Which models are available with SQL ’05?
40. New England Code Camp IV: “Developer’s Gone Wild” Reporting Services Deliver traditional and interactive reports Single platform and tools for all types of structured data (relational, hierarchical, multidimensional) Single platform for authoring, management, and delivery of reports
41. New England Code Camp IV: “Developer’s Gone Wild” Reporting Services
42. New England Code Camp IV: “Developer’s Gone Wild” Reporting Services
43. IIS XMLA ISAPI PTS/OLEDB XML for Analysis AS 2000 vs. AS 2005 Server Middle Tier Client Application HTTP Analysis Server XMLA AS2000 AS2005 Application Analysis Server XMLA TCP XMLA IIS HTTP
44. New England Code Camp IV: “Developer’s Gone Wild” Resources SQL Server Developer Center http://msdn.microsoft.com/sql/ OLAP Blog http://www.sqljunkies.com/weblog/mosha SQL Server 2005 Data Mining http://www.sqlserverdatamining.com SQL Server Integration Services http://www.sqlis.com Introduction to SQL Server Report Builder http://www.developer.com/db/article.php/3520116
Editor's Notes
Banyak istilah di dunia komputasi1998, ada istilah: OLTP, OLAP, DSS, Data Warehouse, Data Mining.Data Mining, OLAP, Data Warehouse teknologi untuk mengambil keputusan.Sia-sia menyimpan data, membuat algoritme, dll jika mereka tidak digunakan untuk mendukung pembuatan keputusan.Keputusan yang dihasilkan nanti bersifat well-informed decision.Jadi, mereka adalah teknologi yang membantu manusia mengambil keputusan berdasarkan data yang cukup.
Sejarah Singkat Pemakaian KomputerOLAP: OnLine Analytical Processing (1993)DSS sendiri muncul tahun 1978Hanya beda kata online saja, karena tahun 1978 akses online (teknologi client server) masih asing bagi individu dan pelaku bisnis.Client ma server , mana yang duluan ? 1970 baru kedengaran istilah client-server
1950 komputer hanya dipake di AS, terbatas di kalangan militer, pemerintah, dan akademis. Model komputasi untuk basisdata hampir tidak dikenal.1960 komputer mulai dipake kalangan bisnis AS. COBOL banyak yang pake, DBMS bermunculan (IMS dari IBM). Tapi itu didahului oleh riset. IMS pake model pohon.Tahun 1960 kebanyakan model komputasi basisdata adalah masih model pohon dan model jaringan.1970 baru ada model relasional. Edgar F. Codd.1972 prototipe dibuat.1975 IBM bikin versi komersialnya.1977 Oracle menyusul.1980 dBASE banyak yang pake, karena running di atas DOS yang lagi naik daun.
Masih ada transaksi-transaksi yang tidak benar-benar online. Seperti contohnya adalah proses transaksi kliring di bank yang harus menunggu keesokan harinya.Dulu tahun 1980, transaksi online mungkin dapat disebut sebagai pemrosesan yang interaktif atau waktu-nyata (real-time). Sehingga kliring kayak contoh di atas itu termasuk offline atau lebih dikenal dengan istilah batch.
Sampai dekade 1970 masih banyak software yang belum memakai SQL dan relational database. Karena alasan kegagalan saintis untuk merumuskan dasar ilmiah yang kuat, termasuk dalam hal ini Keen dan Morton.Pada masa itu, data komputer sudah dipakai untuk membantu pengambilan keputusan. Data hasil transaksi harian disalin ke media penyimpanan yang lain, dan dianalisis. Metode yang dipakai adalah metode yang sudah ditemukan, yaitu Riset Operasional, Teori Manajemen, dan Teori Perilaku.Perbaikan konsep baru dimulai pada dekade 1980 setelah RDBMS mulai banyak dipakai.DSS pada saat itu berkenaan dengan data agregat (data yang diperoleh dengan memakai operasi-operasi agregat seperti SUM, COUNT, AVG, MIN, MAX).Jelasnya RDBMS dan SQL sangat memudahkan pembuatan data agregat, hal yang sulit dalam COBOL.
Muncullah rumusan bahwa subjek datawarehouse berkenaan dengan:Pengolahan data agregatTipe snapshot, bitmap index, function indexTipe Table Partition dan Index PartitionOperasi star join dan operasi-operasi yang aware terhadap partitionStar-schema (ad0hoc database design)Dari kelima butir di atas yang memiliki dasar ilmiah kuat Cuma 2 sama 4. Star-schema gag punya dasar ilmiah kuat.
Muncul tahun 1993 oelh Edgar F. Codd, S. B. Codd, dan C. T. Salley dalam dokumen untuk Arbor Corporation berjudul “Providing OLAP (OnLine Analytical Processing) to User-Analyst: An IT Mandate”.Analytical Processing diterapkan ke datawarehousing bukan production database.Lagi-lagi tidak ada dasar ilmiah. Kejadian yang mirip dengan DSS.
Fasilitas Analysis Service mencakup fasilitas datawarehousing (table partition dan index partition), OLAP (tipe cube, operasi GROUPING, ROLLUP, dan CUBE), serta Data Mining (Microsoft Decision Trees, Naïve Banyan Trees, dan lain-lain).