BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐH NGOẠI NGỮ TIN HỌC TP.HCM
KHOA CÔNG NGHỆ THÔNG TIN
BÁO CÁO THỰC TẬP TỐT NGHIỆP CỬ NHÂN CNTT
TÌM HIỂU KỸ THUẬT PHÂN TÍCH
DỮ LIỆU TRỰC TUYẾN
VÀ ỨNG DỤNG TRONG
HỆ THỐNG QUẢN LÝ BÁN HÀNG
GIẢNG VIÊN HƢỚNG DẪN: Th.S NGUYỄN PHƢỚC ĐẠI
SINH VIÊN THỰC HIỆN: LAI ĐẠI KIỆT
LÊ HOÀNG PHƢƠNG NAM
Nội dung trình bày
 Phần 1 :Giới thiệu OLAP
 Định nghĩa OLAP
 Nguyên tắc và đặc trưng Codd
 Vì sao sử dụng OLAP
 Các thành phần của OLAP
 Các loại mô hình dữ liệu đa chiều của OLAP
 Phần 2 : Xây dựng hệ thống bán hàng.
 Phần 3 : Demo
Giới thiệu OLAP
Phần 1:
Định nghĩa OLAP
OLAP là từ viết tắt của On-Line Analytical
Processing (phân tích trực tuyến) khác với OLTP On-
Line Transactional Processing (giao dịch trực tuyến).
OLAP thường được định nghĩa bao gồm các đặc
điểm đa chiều, hồi đáp nhanh, được diễn tả như 1 sơ đồ
hình khối.
Các ứng dụng của OLAP khác với các ứng dụng của
OLTP ở chổ lưu trữ dữ liệu, cách thức phân tích dữ liệu
và cách hiển thị dữ liệu cho người dùng. OLAP cho phép
trả lời các câu hỏi phức tạp hơn trong lĩnh vực kinh
doanh.
Nguyên tắc và đặc trưng Codd
Edgar F. Codd (1923-2003)
Các đặc trƣng cơ bản
 Thể hiện ở mức quan niệm đa chiều – Multidimensional
Conceptual View.
 Tương tác dữ liệu trực quan – Intuitive Data Manipulation.
 Tính liên kết với OLAP là trung gian – Accessibility: OLAP as
a Mediator
 Trích xuất thông tin từng phần và dẫn giải – Batch Extraction
vs Interpretive.
 Mô hình phân tích OLAP – OLAP Analysis Models
 Kiến trúc Client/Server – Client/Server Architecture.
 Trong suốt dữ liệu – Transparency
 Hỗ trợ đa người dùng – Multi-User Support
Các đặc trƣng đặc biệt
 Xử lý dữ liệu chưa chuẩn hoá – Treatment of Non-
Normalized Data.z
 Lưu trữ kết quả OLAP độc lập với dữ liệu nguồn – Storing
OLAP Results: Keeping them Separate from Source Data
 Trích xuất giá trị khuyết – Extraction of Missing Values.
 Xử lý giá trị khuyết – Treatment of Missing Values.
Các đặc trƣng báo cáo
 Báo cáo linh hoạt – Flexible Reporting
 Hiển thị báo cáo đồng bộ - Uniform Reporting
Performance
 Tự động điều chỉnh tầng vật lý – Automatic Adjustment of
Physical Level.
Các đặc trƣng đa chiều:
 Không giới hạn chiều và kết hợp các tầng – Unlimited
Dimensions & Aggregation Levels
 Không hạn chế các hoạt động nối nhiều chiều –
Unrestricted Cross-dimensional Operations.
Tại sao sử dụng OLAP
 Nhu cầu thực tế
 Tăng lƣu trữ dữ liệu
 Dữ liệu so với thông tin
 Bố trí dữ liệu
Các thành phần của OLAP
Các thành phần của OLAP
 Khối dữ liệu – Cube
Các thành phần của OLAP
 Bảng sự kiện – FACT TABLE
 Chiều – DIMENSION
Các thành phần của OLAP
 Độ đo – MEASURE
Các đơn vị đo của khối là các cột trong bảng Fact. Các
đơn vị đo lƣờng xác định những giá trị số từ bảng Fact mà
đƣợc tổng hợp phân tích nhƣ định giá, trị giá, hoặc số lƣợng
bán.
Các mô hình xử lý đa chiều OLAP
 Mô hình Multidimensional OLAP(MOLAP)
Các mô hình xử lý đa chiều OLAP
 Mô hình Relational OLAP (ROLAP)
Các mô hình xử lý đa chiều OLAP
 Mô hình Hybird OLAP (HOLAP)
Phần 2:
ỨNG DỤNG OLAP
VÀO HỆ THỐNG BÁN HÀNG
Nội dung
 Phát biểu bài toán
 Sơ đồ Usecase
 Mô hình cơ sở dữ liệu OLTP
 Mô hình cơ sở dữ liệu OLAP
Phát biểu bài toán
 Sử dụng cơ sở dữ liệu của công ty Adventure Work.
 Chương trình rút trích từ cơ sở dữ liệu có sẵn.
Sơ đồ Usecase
Bao cao doanh thu giua cac doanh thu cua hang
Bao cao doanh thu cua hang
Bao cao doanh thu ban hang qua mang
Bao cao cong viec giua cac nhan viec
NQL
Mô hình cơ sở dữ liệu OLTP
Mô hình cơ sở dữ liệu OLAP
Kết luận
•Hiểu được tổng quan về hệ thống phân tích dữ
liệu trực tuyến OLAP
•Thấy được sự khác biệt về cơ sở dữ liệu OLAP
và cơ sở dữ liệu truyền thống.
•Biết được điểm mạnh của cở sơ dữ liệu OLAP
trong việc xử lý phân tích và tổng hợp dữ liệu.
Kết quả đạt đƣợc – Phần nghiên cứu
Kết luận
Kết quả đạt đƣợc – Phần ứng dụng
•Xây dựng được ứng dụng giúp cho nhà quản lý xem
được báo cáo tổng hợp kinh doanh.
•Vận dụng được các khả năng hổ trợ của OLAP trong
việc phân tích tình hình kinh doanh của công ty.
•Tạo được các mẫu báo cáo theo ý muốn, tùy vào
mục đích và yêu cầu phân tích của người quản lý mà
không đòi hỏi phụ thuộc nghiệp vụ.
Kết luận
•Chương trình tải giao diện chậm, dẫn đến hiểu
lầm tốc độ truy xuất của dữ liệu.
•Chưa thể hiện hết những khả năng của OLAP.
•Chưa sử dụng khả năng tính toán (calculate) của
OLAP để tạo các báo cáo có khả năng tính toán
xác suất, thống kê.
Hạn chế
Phần 3
DEMO

De an-tttn-olap-slide

  • 1.
    BỘ GIÁO DỤCVÀ ĐÀO TẠO TRƢỜNG ĐH NGOẠI NGỮ TIN HỌC TP.HCM KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO THỰC TẬP TỐT NGHIỆP CỬ NHÂN CNTT TÌM HIỂU KỸ THUẬT PHÂN TÍCH DỮ LIỆU TRỰC TUYẾN VÀ ỨNG DỤNG TRONG HỆ THỐNG QUẢN LÝ BÁN HÀNG GIẢNG VIÊN HƢỚNG DẪN: Th.S NGUYỄN PHƢỚC ĐẠI SINH VIÊN THỰC HIỆN: LAI ĐẠI KIỆT LÊ HOÀNG PHƢƠNG NAM
  • 2.
    Nội dung trìnhbày  Phần 1 :Giới thiệu OLAP  Định nghĩa OLAP  Nguyên tắc và đặc trưng Codd  Vì sao sử dụng OLAP  Các thành phần của OLAP  Các loại mô hình dữ liệu đa chiều của OLAP  Phần 2 : Xây dựng hệ thống bán hàng.  Phần 3 : Demo
  • 3.
  • 4.
    Định nghĩa OLAP OLAPlà từ viết tắt của On-Line Analytical Processing (phân tích trực tuyến) khác với OLTP On- Line Transactional Processing (giao dịch trực tuyến). OLAP thường được định nghĩa bao gồm các đặc điểm đa chiều, hồi đáp nhanh, được diễn tả như 1 sơ đồ hình khối. Các ứng dụng của OLAP khác với các ứng dụng của OLTP ở chổ lưu trữ dữ liệu, cách thức phân tích dữ liệu và cách hiển thị dữ liệu cho người dùng. OLAP cho phép trả lời các câu hỏi phức tạp hơn trong lĩnh vực kinh doanh.
  • 5.
    Nguyên tắc vàđặc trưng Codd Edgar F. Codd (1923-2003)
  • 6.
    Các đặc trƣngcơ bản  Thể hiện ở mức quan niệm đa chiều – Multidimensional Conceptual View.  Tương tác dữ liệu trực quan – Intuitive Data Manipulation.  Tính liên kết với OLAP là trung gian – Accessibility: OLAP as a Mediator  Trích xuất thông tin từng phần và dẫn giải – Batch Extraction vs Interpretive.  Mô hình phân tích OLAP – OLAP Analysis Models  Kiến trúc Client/Server – Client/Server Architecture.  Trong suốt dữ liệu – Transparency  Hỗ trợ đa người dùng – Multi-User Support
  • 7.
    Các đặc trƣngđặc biệt  Xử lý dữ liệu chưa chuẩn hoá – Treatment of Non- Normalized Data.z  Lưu trữ kết quả OLAP độc lập với dữ liệu nguồn – Storing OLAP Results: Keeping them Separate from Source Data  Trích xuất giá trị khuyết – Extraction of Missing Values.  Xử lý giá trị khuyết – Treatment of Missing Values.
  • 8.
    Các đặc trƣngbáo cáo  Báo cáo linh hoạt – Flexible Reporting  Hiển thị báo cáo đồng bộ - Uniform Reporting Performance  Tự động điều chỉnh tầng vật lý – Automatic Adjustment of Physical Level. Các đặc trƣng đa chiều:  Không giới hạn chiều và kết hợp các tầng – Unlimited Dimensions & Aggregation Levels  Không hạn chế các hoạt động nối nhiều chiều – Unrestricted Cross-dimensional Operations.
  • 10.
    Tại sao sửdụng OLAP  Nhu cầu thực tế  Tăng lƣu trữ dữ liệu  Dữ liệu so với thông tin  Bố trí dữ liệu
  • 11.
  • 12.
    Các thành phầncủa OLAP  Khối dữ liệu – Cube
  • 13.
    Các thành phầncủa OLAP  Bảng sự kiện – FACT TABLE  Chiều – DIMENSION
  • 14.
    Các thành phầncủa OLAP  Độ đo – MEASURE Các đơn vị đo của khối là các cột trong bảng Fact. Các đơn vị đo lƣờng xác định những giá trị số từ bảng Fact mà đƣợc tổng hợp phân tích nhƣ định giá, trị giá, hoặc số lƣợng bán.
  • 15.
    Các mô hìnhxử lý đa chiều OLAP  Mô hình Multidimensional OLAP(MOLAP)
  • 16.
    Các mô hìnhxử lý đa chiều OLAP  Mô hình Relational OLAP (ROLAP)
  • 17.
    Các mô hìnhxử lý đa chiều OLAP  Mô hình Hybird OLAP (HOLAP)
  • 18.
    Phần 2: ỨNG DỤNGOLAP VÀO HỆ THỐNG BÁN HÀNG
  • 19.
    Nội dung  Phátbiểu bài toán  Sơ đồ Usecase  Mô hình cơ sở dữ liệu OLTP  Mô hình cơ sở dữ liệu OLAP
  • 20.
    Phát biểu bàitoán  Sử dụng cơ sở dữ liệu của công ty Adventure Work.  Chương trình rút trích từ cơ sở dữ liệu có sẵn.
  • 22.
    Sơ đồ Usecase Baocao doanh thu giua cac doanh thu cua hang Bao cao doanh thu cua hang Bao cao doanh thu ban hang qua mang Bao cao cong viec giua cac nhan viec NQL
  • 23.
    Mô hình cơsở dữ liệu OLTP
  • 24.
    Mô hình cơsở dữ liệu OLAP
  • 25.
    Kết luận •Hiểu đượctổng quan về hệ thống phân tích dữ liệu trực tuyến OLAP •Thấy được sự khác biệt về cơ sở dữ liệu OLAP và cơ sở dữ liệu truyền thống. •Biết được điểm mạnh của cở sơ dữ liệu OLAP trong việc xử lý phân tích và tổng hợp dữ liệu. Kết quả đạt đƣợc – Phần nghiên cứu
  • 26.
    Kết luận Kết quảđạt đƣợc – Phần ứng dụng •Xây dựng được ứng dụng giúp cho nhà quản lý xem được báo cáo tổng hợp kinh doanh. •Vận dụng được các khả năng hổ trợ của OLAP trong việc phân tích tình hình kinh doanh của công ty. •Tạo được các mẫu báo cáo theo ý muốn, tùy vào mục đích và yêu cầu phân tích của người quản lý mà không đòi hỏi phụ thuộc nghiệp vụ.
  • 27.
    Kết luận •Chương trìnhtải giao diện chậm, dẫn đến hiểu lầm tốc độ truy xuất của dữ liệu. •Chưa thể hiện hết những khả năng của OLAP. •Chưa sử dụng khả năng tính toán (calculate) của OLAP để tạo các báo cáo có khả năng tính toán xác suất, thống kê. Hạn chế
  • 28.

Editor's Notes

  • #6 Tiến sĩ Codd là một nhà nghiên cứu cơ sở dữ liệu nổi tiếng từ thập niên 1960 đến thập niên 1980, là người phát minh ra mô hình dữ liệu quan hệ năm 1969. Vào năm 1993 ông đã xuất bản một cuốn sách về OLAP trong đó ông đưa ra 12 nguyên tắc nổi tiếng về OLAP, ông đã thêm 5 nguyên tắc nữa vào năm 1995 và tái cấu trúc lại các nguyên tắc này thành 4 nhóm và gọi chúng là các đặc trưng.