SlideShare a Scribd company logo
1 of 11
Download to read offline
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ GIANG
XÂY DỰNG HỆ THỐNG DATA WAREHOUSE VÀ BUSINESS
INTELLIGENCE ỨNG DỤNG TRONG NGÀNH BƢU CHÍNH
CỦA TỔNG CÔNG TY BƢU ĐIỆN VIỆT NAM
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
HÀ NỘI - 2015
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ GIANG
XÂY DỰNG HỆ THỐNG DATA WAREHOUSE VÀ BUSINESS
INTELLIGENCE ỨNG DỤNG TRONG NGÀNH BƢU CHÍNH
CỦA TỔNG CÔNG TY BƢU ĐIỆN VIỆT NAM
Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGUYÊN HẢI CHÂU
HÀ NỘI - 2015
LỜI CẢM ƠN
Lời đầu tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới PGS.TS Nguyễn Hải
Châu, người đã tận tình hướng dẫn và chỉ bảo tôi trong suốt quá trình thực hiện khóa luận
tốt nghiệp đại học và luận văn cao học.
Tôi chân thành cảm ơn các thầy, cô trong trường Đại học Công nghệ đã cho tôi một môi
trường rất tốt để học tập và nghiên cứu. Các thầy cô đã giảng dạy và cho tôi những kiến
thức quý báu, làm nền tảng để tôi hoàn thành luận văn cũng như công việc trong tương
lai.
Tôi cũng xin gửi lời tri ân tới các anh, chị, bạn học viên K19 đã luôn bên cạnh, ủng hộ và
giúp đỡ tôi trong suốt quá trình học tập tại trường.
Cuối cùng, tôi muốn gửi lời cảm ơn vô hạn tới gia đình và bạn bè – những người thân
yêu luôn ở bên, khuyến khích và động viên tôi trong cuộc sống cũng như trong học tập.
Tôi xin chân thành cảm ơn.
Hà nội, tháng 5 năm 2015
Học viên
Trần Thị Giang
LỜI CAM ĐOAN
Tôi xin cam đoan đề tài Xây dựng hệ thống Data Warehouse và Business Intelligence
ứng dụng trong ngành bưu chính của Tổng công ty Bưu điện Việt Nam được trình bày
trong luận văn này là do tôi thực hiện dưới sự hướng dẫn và chỉ bảo của PGS.TS Nguyễn
Hải Châu.
Tất cả các tài liệu tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một
cách rõ ràng trong danh mục Tài liệu tham khảo của luận văn. Trong luận văn, không có
việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ về tài liệu
tham khảo.
Hà nội, tháng 5 năm 2015
Học viên
Trần Thị Giang
i
MỤC LỤC
MỤC LỤC ...........................................................................................................................i
DANH SÁCH CÁC BẢNG..............................................................................................iv
DANH SÁCH CÁC HÌNH VẼ .........................................................................................v
DANH SÁCH CÁC TỪ VIẾT TẮT...............................................................................vii
DANH SÁCH CÁC THUẬT NGỮ ...............................................................................viii
MỞ ĐẦU.............................................................................................................................1
CHƢƠNG 1: GIỚI THIỆU VỀ DATA WAREHOUSE VÀ BUSINESS
INTELLIGENCE ..............................................................................................................3
1. Các khái niệm cơ bản..............................................................................................3
1.1. Định nghĩa Data Warehouse ...........................................................................3
1.2. Định nghĩa Business Intelligence....................................................................4
2. Lợi ích của hệ thống Data Warehouse và Business Intelligence.........................5
3. Kiến trúc của hệ thống Data Warehouse và Business Intelligence.....................6
3.1. Data Source - Dữ liệu nguồn...........................................................................7
3.2. Data Warehouse - Kho dữ liệu tập trung ........................................................7
3.3. Tầng Business Intelligence (BI)......................................................................8
3.4. Administration (Quản trị hệ thống).................................................................8
4. Thiết kế logic hệ thống Data Warehouse và Business Intelligence.....................8
4.1. Thiết kế thành phần Data Warehouse .............................................................8
4.1.1. Các mô hình CSDL trong Data Warehouse.................................................8
4.1.2. Một số thuật ngữ trong Data Warehouse...................................................10
4.1.3. Thiết kế CSDL chủ đề (Data Mart) ...........................................................11
4.1.4. Thiết kế CSDL tích hợp (Enterprise Model - EM)....................................13
4.1.5. Thiết kế CSDL trung chuyển (Data Staging Area – DSA)........................15
4.1.6. Thiết kế tiến trình Thu thập, làm sạch và tích hợp dữ liệu (Extraction -
Transformation - Loading - ETL) ........................................................................17
4.2. Thiết kế metadata ..........................................................................................18
ii
4.3. Thiết kế tầng khai thác và phân tích thông tin ..............................................18
4.3.1. Thiết kế CSDL đa chiều với OLAP...........................................................18
4.3.2. Thiết kế tầng khai thác và phân tích thông tin...........................................19
CHƢƠNG 2: BÀI TOÁN XÂY DỰNG HỆ THỐNG DW VÀ BI TẠI VNPOST.....21
1. Hiện trạng ngành bƣu chính của Tổng công ty bƣu điện Việt Nam ................21
1.1. Hiện trạng các hệ thống công nghệ thông tin................................................21
1.2. Hiện trạng công tác lập báo cáo tổng hợp.....................................................22
1.3. Vấn đề đặt ra .................................................................................................23
2. Mục tiêu bài toán...................................................................................................23
3. Phạm vi bài toán....................................................................................................24
CHƢƠNG 3: KHẢO SÁT, PHÂN TÍCH, THIẾT KẾ VÀ TRIỂN KHAI HỆ
THỐNG DW VÀ BI TẠI VNPOST...............................................................................25
1. Khảo sát..................................................................................................................25
1.1. Khảo sát dữ liệu nguồn .................................................................................25
1.2. Khảo sát báo cáo ...........................................................................................26
2. Phân tích, thiết kế..................................................................................................29
2.1. Thiết kê kiến trúc tổng thể ............................................................................29
2.2. Thiết kế các CSDL chủ đề ............................................................................31
2.3. Thiết kế CSDL EM .......................................................................................35
2.4. Thiết kế CSDL DSA .....................................................................................36
2.5. Thiết kế tiến trình ETL..................................................................................37
2.5.1. ETL các bảng danh mục ............................................................................37
2.5.2. ETL các bảng sự kiện ................................................................................42
2.5.3. Thiết kế tầng Business Intelligence ...........................................................58
3. Triển khai...............................................................................................................59
3.1. Cài đặt hệ thống ............................................................................................59
3.2. Triển khai module ETL.................................................................................60
3.2.1. Module ETL tổng hợp ...............................................................................60
iii
3.2.2. ETL bảng danh mục D_POST...................................................................61
3.2.3. ETL bảng danh mục D_PRODUCTION...................................................61
3.2.4. ETL bảng danh mục D_COST ..................................................................62
3.2.5. ETL bảng sự kiện F_BCCP .......................................................................62
3.2.6. ETL bảng sự kiện F_TCBC.......................................................................63
3.2.7. ETL bảng sự kiện F_REVENUE...............................................................64
3.2.8. ETL bảng sự kiện F_COST .......................................................................65
4. Kết quả ...................................................................................................................66
KẾT LUẬN ......................................................................................................................74
TÀI LIỆU THAM KHẢO...............................................................................................76
iv
DANH SÁCH CÁC BẢNG
Bảng 1: Thực trạng công nghệ của các phần mềm tại VNPOST......................................22
v
DANH SÁCH CÁC HÌNH VẼ
Hình 1: Đặc trưng của Data Warehouse..............................................................................3
Hình 2: Lợi ích của DW và BI trong hỗ trợ ra quyết định ..................................................5
Hình 3: Mô hình kiến trúc tổng thể .....................................................................................6
Hình 4: CSDL hình sao .......................................................................................................9
Hình 5: CSDL hình bông tuyết............................................................................................9
Hình 6: ERD của một Data Mart về Doanh số..................................................................13
Hình 7: ERD của một Enterprise Model ...........................................................................15
Hình 8: Báo cáo mẫu về tổng hợp cân đối kế hoạch SXKD toàn Tổng công ty...............27
Hình 9: Báo cáo mẫu về Sơ kết công tác 6 tháng..............................................................28
Hình 10: Báo cáo mẫu Tình hình sản xuất kinh doanh khối HTPT..................................29
Hình 11: Kiến trúc tổng thể của hệ thống tại VNPOST....................................................29
Hình 12: Sơ đồ quan hệ của CSDL chủ đề Sản lượng dịch vụ BCCP..............................31
Hình 13: Sơ đồ quan hệ của CSDL chủ đề sản lượng dịch vụ TCBC...............................32
Hình 14: Sơ đồ quan hệ của CSDL chủ đề doanh thu.......................................................33
Hình 15: Sơ đồ quan hệ của CSDL chủ đề chi phí............................................................34
Hình 16: Sơ đồ quan hệ của CSDL EM ............................................................................35
Hình 17: Luồng dữ liệu của các bảng danh mục...............................................................37
Hình 18: Luồng dữ liệu của bảng sự kiện F_BCCP..........................................................42
Hình 19: Luồng dữ liệu của bảng sự kiện F_TCBC..........................................................45
Hình 20: Luồng dữ liệu của bảng sự kiện F_REVENUE .................................................48
Hình 21: Luồng dữ liệu của bảng F_COST.......................................................................53
Hình 22: Kết quả cài đặt hệ quản trị CSDL và tầng Business Intelligence.......................59
Hình 20: Module ETL tổng hợp........................................................................................60
Hình 21: Module ETL bảng danh mục D_POST..............................................................61
Hình 22: Load dữ liệu từ file excel Danh sách tỉnh thành vào bảng DSA_D_POST .......61
Hình 23: Module ETL bảng danh mục D_PRODUCTION..............................................61
vi
Hình 24: Load dữ liệu từ file excel Danh sách dịch vụ vào bảng DSA_D_PRODUCTION
...........................................................................................................................................61
Hình 25: Module ETL bảng danh mục D_COST..............................................................62
Hình 26: Load dữ liệu từ file excel Danh sách khoản chi phí vào bảng DSA_D_COST.62
Hình 27: Module ETL bảng sự kiện F_BCCP ..................................................................62
Hình 28: Load dữ liệu từ file excel Danh sách sản lượng dịch vụ BCCP vào bảng
DSA_F_BCCP...................................................................................................................63
Hình 29: Module ETL bảng sự kiện F_TCBC ..................................................................63
Hình 30: Load dữ liệu từ file excel Danh sách sản lượng dịch vụ TCBC vào bảng
DSA_F_TCBC...................................................................................................................63
Hình 31: Module ETL bảng sự kiện F_REVENUE..........................................................64
Hình 32: Load dữ liệu từ file excel Kế hoạch doanh thu vào bảng
TMP_REVENUE_PLAN..................................................................................................64
Hình 33: Load dữ liệu từ file excel Doanh thu vào bảng TMP_REVENUE_PLAN........64
Hình 34: Module ETL bảng sự kiện F_COST ..................................................................65
Hình 35: Load dữ liệu từ file excel Kế hoạch doanh thu vào bảng TMP_COST_PLAN.65
Hình 36: Load dữ liệu từ file excel Chi phí vào bảng TMP_COST_PLAN.....................65
Hình 37: Báo cáo về doanh thu – dạng bảng biểu.............................................................66
Hình 38: Báo cáo về sản lượng BCCP trong năm 2012 – dạng bảng biểu .......................67
Hình 39: Báo cáo về sản lượng TCBC trong năm 2012 – dạng bảng biểu.......................69
Hình 40: Báo cáo doanh thu – dạng đồ thị........................................................................70
Hình 41: Báo cáo Top các bưu điện tỉnh thành về thực hiện doanh thu ...........................71
Hình 42: Báo cáo Bottom các bưu điện tỉnh thành về thực hiện doanh thu......................71
Hình 43: Báo cáo tình hình thực hiện doanh thu – dạng dashboard .................................72
Hình 44: Báo cáo tình hình chi phí phát sinh – dạng dashboard.......................................73
76
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Văn Trung, Thiết kế và triển khai kho dữ liệu khách hàng sử dụng dịch vụ
viễn thông của Tổng công ty Bưu chính Viễn thông Việt Nam (VNPT), Luận cao học,
Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, 2008.
Tiếng Anh:
[2] Fon Silvers, Building and Maintaining a Data Warehouse, 2008, pp. 11-42
[3] W. H. Inmon, Building the Data Warehouse, Fourth Edition, 2005, pp. 71-136
[4] Ralph Kimball, Margy Ross, The Data Warehouse Toolkit, Third Edition, 2013, pp.
37-68
[5] http://bi-insider.com/portfolio/benefits-of-a-data-warehouse/

More Related Content

What's hot

[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress
[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress
[Athena]Nghiên Cứu Và Xây Dựng Website Bằng WordpressCương Trần
 
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...sunflower_micro
 
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụng
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụngGiải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụng
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụngsunflower_micro
 
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu học
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu họcXây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu học
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu họcsunflower_micro
 
Luan van hadoop-final
Luan van hadoop-finalLuan van hadoop-final
Luan van hadoop-finalnobjta2015
 
Ung dung email_client
Ung dung email_clientUng dung email_client
Ung dung email_clientViet Nam
 
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...sunflower_micro
 
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...Viết thuê trọn gói ZALO 0934573149
 

What's hot (14)

[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress
[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress
[Athena]Nghiên Cứu Và Xây Dựng Website Bằng Wordpress
 
Đề tài: Áp dụng kỹ thuật trong Big data vào lưu trữ dữ liệu, HOT
Đề tài: Áp dụng kỹ thuật trong Big data vào lưu trữ dữ liệu, HOTĐề tài: Áp dụng kỹ thuật trong Big data vào lưu trữ dữ liệu, HOT
Đề tài: Áp dụng kỹ thuật trong Big data vào lưu trữ dữ liệu, HOT
 
Đề tài: Tìm hiểu về Web Service và ứng dụng, HAY, 9đ
Đề tài: Tìm hiểu về Web Service và ứng dụng, HAY, 9đĐề tài: Tìm hiểu về Web Service và ứng dụng, HAY, 9đ
Đề tài: Tìm hiểu về Web Service và ứng dụng, HAY, 9đ
 
Elearning v.0.0
Elearning v.0.0Elearning v.0.0
Elearning v.0.0
 
Elearning v.0.0
Elearning v.0.0Elearning v.0.0
Elearning v.0.0
 
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...
Ứng dụng smartcity tại thành phố Amsterdam (Hà Lan) và đề xuất giải pháp phân...
 
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụng
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụngGiải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụng
Giải pháp ảo hóa máy chủ cho một doanh nghiệp phần mềm nhỏ và ứng dụng
 
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu học
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu họcXây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu học
Xây dựng dự án thư viện điện tử cho các trường trung học phổ thông và tiểu học
 
Đề tài đẩy mạnh cho vay khách hàng cá nhân,, RẤT HAY
Đề tài đẩy mạnh cho vay khách hàng cá nhân,, RẤT HAYĐề tài đẩy mạnh cho vay khách hàng cá nhân,, RẤT HAY
Đề tài đẩy mạnh cho vay khách hàng cá nhân,, RẤT HAY
 
Luan van hadoop-final
Luan van hadoop-finalLuan van hadoop-final
Luan van hadoop-final
 
Ung dung email_client
Ung dung email_clientUng dung email_client
Ung dung email_client
 
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
 
Luận văn: Huy động vốn tiền gửi dân cư tại Ngân hàng, HOT!
Luận văn: Huy động vốn tiền gửi dân cư tại Ngân hàng, HOT!Luận văn: Huy động vốn tiền gửi dân cư tại Ngân hàng, HOT!
Luận văn: Huy động vốn tiền gửi dân cư tại Ngân hàng, HOT!
 
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...
Luận văn: Quản Trị Rủi Ro Tín Dụng Trong Cho Vay Khách Hàng Cá Nhân Tại Ngân ...
 

Similar to Datawarehouse

Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...
Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...
Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...sunflower_micro
 
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...lamluanvan.net Viết thuê luận văn
 
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...HanaTiti
 
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...KhoTi1
 
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdf
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdfChất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdf
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdfMan_Ebook
 
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811jackjohn45
 
Luận văn thạc sĩ máy tính.
Luận văn thạc sĩ máy tính.Luận văn thạc sĩ máy tính.
Luận văn thạc sĩ máy tính.ssuser499fca
 

Similar to Datawarehouse (20)

Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...
Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...
Chiến lược phát triển và ứng dụng công nghệ thông tin tại trung tâm chỉ đạo t...
 
Luận văn: Nghiên cứu hệ thống trợ lý thông minh ảo, 9đ
Luận văn: Nghiên cứu hệ thống trợ lý thông minh ảo, 9đLuận văn: Nghiên cứu hệ thống trợ lý thông minh ảo, 9đ
Luận văn: Nghiên cứu hệ thống trợ lý thông minh ảo, 9đ
 
BÀI MẪU Luận văn viện công nghệ thông tin, 9 ĐIỂM
BÀI MẪU Luận văn viện công nghệ thông tin, 9 ĐIỂMBÀI MẪU Luận văn viện công nghệ thông tin, 9 ĐIỂM
BÀI MẪU Luận văn viện công nghệ thông tin, 9 ĐIỂM
 
Xây dựng khung kiến trúc bảo đảm an toàn thông tin cho doanh nghiệp
Xây dựng khung kiến trúc bảo đảm an toàn thông tin cho doanh nghiệpXây dựng khung kiến trúc bảo đảm an toàn thông tin cho doanh nghiệp
Xây dựng khung kiến trúc bảo đảm an toàn thông tin cho doanh nghiệp
 
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...
NÂNG CAO CHẤT LƯỢNG DỊCH VỤ NGÂN HÀNG ĐIỆN TỬ TẠI NGÂN HÀNG TMCP ĐẦU TƯ VÀ PH...
 
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
Nghiên cứu công nghệ mã vạch hai chiều và đề xuất dự án ứng dụng nghiệp vụ nh...
 
Phân Tích Báo Cáo Tài Chính Tại Công Ty Điện Tử Viễn Thông
Phân Tích Báo Cáo Tài Chính Tại Công Ty Điện Tử Viễn ThôngPhân Tích Báo Cáo Tài Chính Tại Công Ty Điện Tử Viễn Thông
Phân Tích Báo Cáo Tài Chính Tại Công Ty Điện Tử Viễn Thông
 
Đề tài: chương trình quản lý lớp học của trung tâm ngoại ngữ, HAY
Đề tài: chương trình quản lý lớp học của trung tâm ngoại ngữ, HAYĐề tài: chương trình quản lý lớp học của trung tâm ngoại ngữ, HAY
Đề tài: chương trình quản lý lớp học của trung tâm ngoại ngữ, HAY
 
Đề tài: Quản lí các lớp học ngoại ngữ tại trung tâm đào tạo, HAY
Đề tài: Quản lí các lớp học ngoại ngữ tại trung tâm đào tạo, HAYĐề tài: Quản lí các lớp học ngoại ngữ tại trung tâm đào tạo, HAY
Đề tài: Quản lí các lớp học ngoại ngữ tại trung tâm đào tạo, HAY
 
Đề tài chương trình quản lý các lớp ngoại ngữ, HAY
Đề tài  chương trình quản lý các lớp ngoại ngữ, HAYĐề tài  chương trình quản lý các lớp ngoại ngữ, HAY
Đề tài chương trình quản lý các lớp ngoại ngữ, HAY
 
Luận văn: Phát triển nhân lực công nghệ thông tin tại Việt Nam, 9đ
Luận văn: Phát triển nhân lực công nghệ thông tin tại Việt Nam, 9đLuận văn: Phát triển nhân lực công nghệ thông tin tại Việt Nam, 9đ
Luận văn: Phát triển nhân lực công nghệ thông tin tại Việt Nam, 9đ
 
Luận Văn Tốt Nghiệp Hoàn Thiện Chiến Lược Kinh Doanh Của Công Ty
Luận Văn Tốt Nghiệp Hoàn Thiện Chiến Lược Kinh Doanh Của Công TyLuận Văn Tốt Nghiệp Hoàn Thiện Chiến Lược Kinh Doanh Của Công Ty
Luận Văn Tốt Nghiệp Hoàn Thiện Chiến Lược Kinh Doanh Của Công Ty
 
Luận án: Phát triển công nghiệp hỗ trợ tăng trưởng kinh tế Việt Nam
Luận án: Phát triển công nghiệp hỗ trợ tăng trưởng kinh tế Việt NamLuận án: Phát triển công nghiệp hỗ trợ tăng trưởng kinh tế Việt Nam
Luận án: Phát triển công nghiệp hỗ trợ tăng trưởng kinh tế Việt Nam
 
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...
PHÁT TRIỂN CÔNG NGHIỆP HỖ TRỢ VÀ TĂNG TRƢỞNG KINH TẾ VIỆT NAM TRƢỜNG HỢP NGÀN...
 
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdf
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdfChất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdf
Chất Lượng Dịch Vụ Thương Mại Điện Tử Tại Công Ty Tnhh Shopee​.pdf
 
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811
Chất lượng dịch vụ thương mại điện tử tại công ty tnhh shopee 6752811
 
Luận văn thạc sĩ máy tính.
Luận văn thạc sĩ máy tính.Luận văn thạc sĩ máy tính.
Luận văn thạc sĩ máy tính.
 
Luận văn: Nghiên cứu mô hình phân lớp câu hỏi và ứng dụng, 9đ
Luận văn: Nghiên cứu mô hình phân lớp câu hỏi và ứng dụng, 9đLuận văn: Nghiên cứu mô hình phân lớp câu hỏi và ứng dụng, 9đ
Luận văn: Nghiên cứu mô hình phân lớp câu hỏi và ứng dụng, 9đ
 
Nâng cao vai trò Nhà nước về quản lý thuế đối với doanh nghiệp nhỏ và vừa
Nâng cao vai trò Nhà nước về quản lý thuế đối với doanh nghiệp nhỏ và vừaNâng cao vai trò Nhà nước về quản lý thuế đối với doanh nghiệp nhỏ và vừa
Nâng cao vai trò Nhà nước về quản lý thuế đối với doanh nghiệp nhỏ và vừa
 
Luận văn: Ứng dụng chữ số trong quá trình gửi nhận tài liệu điện tử
Luận văn: Ứng dụng chữ số trong quá trình gửi nhận tài liệu điện tửLuận văn: Ứng dụng chữ số trong quá trình gửi nhận tài liệu điện tử
Luận văn: Ứng dụng chữ số trong quá trình gửi nhận tài liệu điện tử
 

Datawarehouse

  • 1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN THỊ GIANG XÂY DỰNG HỆ THỐNG DATA WAREHOUSE VÀ BUSINESS INTELLIGENCE ỨNG DỤNG TRONG NGÀNH BƢU CHÍNH CỦA TỔNG CÔNG TY BƢU ĐIỆN VIỆT NAM LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2015
  • 2. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN THỊ GIANG XÂY DỰNG HỆ THỐNG DATA WAREHOUSE VÀ BUSINESS INTELLIGENCE ỨNG DỤNG TRONG NGÀNH BƢU CHÍNH CỦA TỔNG CÔNG TY BƢU ĐIỆN VIỆT NAM Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGUYÊN HẢI CHÂU HÀ NỘI - 2015
  • 3. LỜI CẢM ƠN Lời đầu tiên, tôi xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới PGS.TS Nguyễn Hải Châu, người đã tận tình hướng dẫn và chỉ bảo tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp đại học và luận văn cao học. Tôi chân thành cảm ơn các thầy, cô trong trường Đại học Công nghệ đã cho tôi một môi trường rất tốt để học tập và nghiên cứu. Các thầy cô đã giảng dạy và cho tôi những kiến thức quý báu, làm nền tảng để tôi hoàn thành luận văn cũng như công việc trong tương lai. Tôi cũng xin gửi lời tri ân tới các anh, chị, bạn học viên K19 đã luôn bên cạnh, ủng hộ và giúp đỡ tôi trong suốt quá trình học tập tại trường. Cuối cùng, tôi muốn gửi lời cảm ơn vô hạn tới gia đình và bạn bè – những người thân yêu luôn ở bên, khuyến khích và động viên tôi trong cuộc sống cũng như trong học tập. Tôi xin chân thành cảm ơn. Hà nội, tháng 5 năm 2015 Học viên Trần Thị Giang
  • 4. LỜI CAM ĐOAN Tôi xin cam đoan đề tài Xây dựng hệ thống Data Warehouse và Business Intelligence ứng dụng trong ngành bưu chính của Tổng công ty Bưu điện Việt Nam được trình bày trong luận văn này là do tôi thực hiện dưới sự hướng dẫn và chỉ bảo của PGS.TS Nguyễn Hải Châu. Tất cả các tài liệu tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một cách rõ ràng trong danh mục Tài liệu tham khảo của luận văn. Trong luận văn, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ về tài liệu tham khảo. Hà nội, tháng 5 năm 2015 Học viên Trần Thị Giang
  • 5. i MỤC LỤC MỤC LỤC ...........................................................................................................................i DANH SÁCH CÁC BẢNG..............................................................................................iv DANH SÁCH CÁC HÌNH VẼ .........................................................................................v DANH SÁCH CÁC TỪ VIẾT TẮT...............................................................................vii DANH SÁCH CÁC THUẬT NGỮ ...............................................................................viii MỞ ĐẦU.............................................................................................................................1 CHƢƠNG 1: GIỚI THIỆU VỀ DATA WAREHOUSE VÀ BUSINESS INTELLIGENCE ..............................................................................................................3 1. Các khái niệm cơ bản..............................................................................................3 1.1. Định nghĩa Data Warehouse ...........................................................................3 1.2. Định nghĩa Business Intelligence....................................................................4 2. Lợi ích của hệ thống Data Warehouse và Business Intelligence.........................5 3. Kiến trúc của hệ thống Data Warehouse và Business Intelligence.....................6 3.1. Data Source - Dữ liệu nguồn...........................................................................7 3.2. Data Warehouse - Kho dữ liệu tập trung ........................................................7 3.3. Tầng Business Intelligence (BI)......................................................................8 3.4. Administration (Quản trị hệ thống).................................................................8 4. Thiết kế logic hệ thống Data Warehouse và Business Intelligence.....................8 4.1. Thiết kế thành phần Data Warehouse .............................................................8 4.1.1. Các mô hình CSDL trong Data Warehouse.................................................8 4.1.2. Một số thuật ngữ trong Data Warehouse...................................................10 4.1.3. Thiết kế CSDL chủ đề (Data Mart) ...........................................................11 4.1.4. Thiết kế CSDL tích hợp (Enterprise Model - EM)....................................13 4.1.5. Thiết kế CSDL trung chuyển (Data Staging Area – DSA)........................15 4.1.6. Thiết kế tiến trình Thu thập, làm sạch và tích hợp dữ liệu (Extraction - Transformation - Loading - ETL) ........................................................................17 4.2. Thiết kế metadata ..........................................................................................18
  • 6. ii 4.3. Thiết kế tầng khai thác và phân tích thông tin ..............................................18 4.3.1. Thiết kế CSDL đa chiều với OLAP...........................................................18 4.3.2. Thiết kế tầng khai thác và phân tích thông tin...........................................19 CHƢƠNG 2: BÀI TOÁN XÂY DỰNG HỆ THỐNG DW VÀ BI TẠI VNPOST.....21 1. Hiện trạng ngành bƣu chính của Tổng công ty bƣu điện Việt Nam ................21 1.1. Hiện trạng các hệ thống công nghệ thông tin................................................21 1.2. Hiện trạng công tác lập báo cáo tổng hợp.....................................................22 1.3. Vấn đề đặt ra .................................................................................................23 2. Mục tiêu bài toán...................................................................................................23 3. Phạm vi bài toán....................................................................................................24 CHƢƠNG 3: KHẢO SÁT, PHÂN TÍCH, THIẾT KẾ VÀ TRIỂN KHAI HỆ THỐNG DW VÀ BI TẠI VNPOST...............................................................................25 1. Khảo sát..................................................................................................................25 1.1. Khảo sát dữ liệu nguồn .................................................................................25 1.2. Khảo sát báo cáo ...........................................................................................26 2. Phân tích, thiết kế..................................................................................................29 2.1. Thiết kê kiến trúc tổng thể ............................................................................29 2.2. Thiết kế các CSDL chủ đề ............................................................................31 2.3. Thiết kế CSDL EM .......................................................................................35 2.4. Thiết kế CSDL DSA .....................................................................................36 2.5. Thiết kế tiến trình ETL..................................................................................37 2.5.1. ETL các bảng danh mục ............................................................................37 2.5.2. ETL các bảng sự kiện ................................................................................42 2.5.3. Thiết kế tầng Business Intelligence ...........................................................58 3. Triển khai...............................................................................................................59 3.1. Cài đặt hệ thống ............................................................................................59 3.2. Triển khai module ETL.................................................................................60 3.2.1. Module ETL tổng hợp ...............................................................................60
  • 7. iii 3.2.2. ETL bảng danh mục D_POST...................................................................61 3.2.3. ETL bảng danh mục D_PRODUCTION...................................................61 3.2.4. ETL bảng danh mục D_COST ..................................................................62 3.2.5. ETL bảng sự kiện F_BCCP .......................................................................62 3.2.6. ETL bảng sự kiện F_TCBC.......................................................................63 3.2.7. ETL bảng sự kiện F_REVENUE...............................................................64 3.2.8. ETL bảng sự kiện F_COST .......................................................................65 4. Kết quả ...................................................................................................................66 KẾT LUẬN ......................................................................................................................74 TÀI LIỆU THAM KHẢO...............................................................................................76
  • 8. iv DANH SÁCH CÁC BẢNG Bảng 1: Thực trạng công nghệ của các phần mềm tại VNPOST......................................22
  • 9. v DANH SÁCH CÁC HÌNH VẼ Hình 1: Đặc trưng của Data Warehouse..............................................................................3 Hình 2: Lợi ích của DW và BI trong hỗ trợ ra quyết định ..................................................5 Hình 3: Mô hình kiến trúc tổng thể .....................................................................................6 Hình 4: CSDL hình sao .......................................................................................................9 Hình 5: CSDL hình bông tuyết............................................................................................9 Hình 6: ERD của một Data Mart về Doanh số..................................................................13 Hình 7: ERD của một Enterprise Model ...........................................................................15 Hình 8: Báo cáo mẫu về tổng hợp cân đối kế hoạch SXKD toàn Tổng công ty...............27 Hình 9: Báo cáo mẫu về Sơ kết công tác 6 tháng..............................................................28 Hình 10: Báo cáo mẫu Tình hình sản xuất kinh doanh khối HTPT..................................29 Hình 11: Kiến trúc tổng thể của hệ thống tại VNPOST....................................................29 Hình 12: Sơ đồ quan hệ của CSDL chủ đề Sản lượng dịch vụ BCCP..............................31 Hình 13: Sơ đồ quan hệ của CSDL chủ đề sản lượng dịch vụ TCBC...............................32 Hình 14: Sơ đồ quan hệ của CSDL chủ đề doanh thu.......................................................33 Hình 15: Sơ đồ quan hệ của CSDL chủ đề chi phí............................................................34 Hình 16: Sơ đồ quan hệ của CSDL EM ............................................................................35 Hình 17: Luồng dữ liệu của các bảng danh mục...............................................................37 Hình 18: Luồng dữ liệu của bảng sự kiện F_BCCP..........................................................42 Hình 19: Luồng dữ liệu của bảng sự kiện F_TCBC..........................................................45 Hình 20: Luồng dữ liệu của bảng sự kiện F_REVENUE .................................................48 Hình 21: Luồng dữ liệu của bảng F_COST.......................................................................53 Hình 22: Kết quả cài đặt hệ quản trị CSDL và tầng Business Intelligence.......................59 Hình 20: Module ETL tổng hợp........................................................................................60 Hình 21: Module ETL bảng danh mục D_POST..............................................................61 Hình 22: Load dữ liệu từ file excel Danh sách tỉnh thành vào bảng DSA_D_POST .......61 Hình 23: Module ETL bảng danh mục D_PRODUCTION..............................................61
  • 10. vi Hình 24: Load dữ liệu từ file excel Danh sách dịch vụ vào bảng DSA_D_PRODUCTION ...........................................................................................................................................61 Hình 25: Module ETL bảng danh mục D_COST..............................................................62 Hình 26: Load dữ liệu từ file excel Danh sách khoản chi phí vào bảng DSA_D_COST.62 Hình 27: Module ETL bảng sự kiện F_BCCP ..................................................................62 Hình 28: Load dữ liệu từ file excel Danh sách sản lượng dịch vụ BCCP vào bảng DSA_F_BCCP...................................................................................................................63 Hình 29: Module ETL bảng sự kiện F_TCBC ..................................................................63 Hình 30: Load dữ liệu từ file excel Danh sách sản lượng dịch vụ TCBC vào bảng DSA_F_TCBC...................................................................................................................63 Hình 31: Module ETL bảng sự kiện F_REVENUE..........................................................64 Hình 32: Load dữ liệu từ file excel Kế hoạch doanh thu vào bảng TMP_REVENUE_PLAN..................................................................................................64 Hình 33: Load dữ liệu từ file excel Doanh thu vào bảng TMP_REVENUE_PLAN........64 Hình 34: Module ETL bảng sự kiện F_COST ..................................................................65 Hình 35: Load dữ liệu từ file excel Kế hoạch doanh thu vào bảng TMP_COST_PLAN.65 Hình 36: Load dữ liệu từ file excel Chi phí vào bảng TMP_COST_PLAN.....................65 Hình 37: Báo cáo về doanh thu – dạng bảng biểu.............................................................66 Hình 38: Báo cáo về sản lượng BCCP trong năm 2012 – dạng bảng biểu .......................67 Hình 39: Báo cáo về sản lượng TCBC trong năm 2012 – dạng bảng biểu.......................69 Hình 40: Báo cáo doanh thu – dạng đồ thị........................................................................70 Hình 41: Báo cáo Top các bưu điện tỉnh thành về thực hiện doanh thu ...........................71 Hình 42: Báo cáo Bottom các bưu điện tỉnh thành về thực hiện doanh thu......................71 Hình 43: Báo cáo tình hình thực hiện doanh thu – dạng dashboard .................................72 Hình 44: Báo cáo tình hình chi phí phát sinh – dạng dashboard.......................................73
  • 11. 76 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Văn Trung, Thiết kế và triển khai kho dữ liệu khách hàng sử dụng dịch vụ viễn thông của Tổng công ty Bưu chính Viễn thông Việt Nam (VNPT), Luận cao học, Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội, 2008. Tiếng Anh: [2] Fon Silvers, Building and Maintaining a Data Warehouse, 2008, pp. 11-42 [3] W. H. Inmon, Building the Data Warehouse, Fourth Edition, 2005, pp. 71-136 [4] Ralph Kimball, Margy Ross, The Data Warehouse Toolkit, Third Edition, 2013, pp. 37-68 [5] http://bi-insider.com/portfolio/benefits-of-a-data-warehouse/