[Opendata] Tich hop du lieu va xay dung bao cao.pptx
1. HƯỚNG DẪN TÍCH HỢP DỮ LIỆU VÀ
XÂY DỰNG BÁO CÁO TRÊN NỀN TẢNG
OPENDATA PLATFORM
Thanh Hoa, 23/02/2023
2. NỘI DUNG GIỚI THIỆU
GIỚI THIỆU VỀ CÔNG CỤ POWERBI GIỚI THIỆU CÔNG CỤ PENTAHO
GIỚI THIỆU BIỂU ĐỒ POWER BI
QUY TRÌNH TÍCH HỢP DỮ LIỆU
QUY TRÌNH XÂY DỰNG BÁO CÁO
GIỚI THIỆU CHỨC NĂNG PENTAHO
THỰC HÀNH XÂY DỰNG BÁO CÁO THỰC HÀNH TÍCH HỢP DỮ LIỆU
3. GIỚI THIỆU CÔNG CỤ POWER BI
• Microsoft Power BI là một sản phẩm phần mềm trực quan hóa dữ liệu tương tác được phát
triển bởi Microsoft với trọng tâm chính là kinh doanh thông minh.
• Power BI là tập hợp các dịch vụ phần mềm, ứng dụng và trình kết nối, hoạt động cùng nhau
để biến các nguồn dữ liệu không liên quan thành thông tin chi tiết, mạch lạc, trực quan.
Power BI là gì
4. GIỚI THIỆU CÔNG CỤ POWER BI
• Được xây dựng từ nền tảng AI (trí tuệ
nhân tạo) và Machine Learning (máy học)
nên nhạy bén trong việc xử lý dữ liệu.
• Cung cấp các báo cáo và dashboard có
sẵn.
• Truy vấn ngôn ngữ tự nhiên khi khai thác
dữ liệu.
• Người dùng có thể tạo lịch trình để cập
nhật dữ liệu tự động thay vì tốn thời gian
thao tác thủ công.
Ưu điểm của Power BI
5. GIỚI THIỆU CÔNG CỤ POWER BI
Các thành phần của Power BI
Power BI Desktop có vai trò xử lý, tập
hợp và xây dựng mô hình dữ liệu dùng để
trực quan hóa dữ liệu cho các báo cáo.
Power BI Service Dịch vụ lưu trữ cloud
cho phép người dung lưu trữ báo cáo
Dashboard
Power BI Report Server Người dung có
thể xuất bản báo cáo sau khi hoàn thành
lên hệ thống Power BI của công ty
Power BI Apps ở dạng ứng dụng trên
thiết bị di động
6. QUY TRÌNH XÂY DỰNG BÁO CÁO
Các bước xây dựng báo cáo
CSDL
BƯỚC 01
Kết nối nguồn dữ liệu
BƯỚC 02
Làm sạch và chuẩn hóa
dữ liệu
BƯỚC 03
Xây dựng biểu đồ báo
cáo
BƯỚC 04
Xuất bản báo cáo cho
người dùng
NGUỒN DỮ LIỆU
7. GIỚI THIỆU BIỂU ĐỒ POWERBI
Các dạng biểu đồ trong Power BI
Biểu đồ Vùng Biểu đồ cột và thanh Biểu đồ đường
Biểu đồ kết hợp Biểu đồ Doughnut Biểu đô đo lường
8. GIỚI THIỆU BIỂU ĐỒ POWERBI
Các dạng biểu đồ sử dụng cho Opendata
9. THỰC HÀNH POWER BI
Thực hiện mô hình hóa dữ liệu sang các dạng biểu đồ
Sử dụng Power BI tạo một số biểu đồ trên hệ thông Opendata
Các học viên tạo thử theo chỉ định của giảng viên
Tham khảo
https://learn.microsoft.com/vi-vn/power-apps/maker/canvas-apps/sharepoint-scenario-build-report
11. GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn trích xuất trong ETL
Dữ liệu thô hoàn toàn có thể chiết suất từ rất
nhiều những nguồn đa dạng khác nhau gồm có:
Nền tảng về lưu trữ dữ liệu
Hệ thống quản lý tất cả khách hàng CRM
Thiết bị cũng như ứng dụng di động
Ứng dụng phản ánh kiến nghị
Văn bản số hóa của các sở ban nghành
Ứng dụng tiếp thị và bán hàng
Cơ sở dữ liệu hiện đang có
Kho dữ liệu
12. GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn chuyển đổi trong ETL
• Data cleansing: có mục đích là
truyền những dữ liệu đúng dành cho
mục tiêu.
• Loại bỏ những dữ liệu trùng lặp
• Tiêu chuẩn hóa.
• Xác minh.
• Sắp xếp.
13. GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn tải trong ETL
Tải toàn bộ: Trong suốt quá trình
tải toàn bộ thì dữ liệu sẽ đi vào
những bản ghi mới mới và duy nhất
tại kho dữ liệu. Dù điều này sẽ vô
cùng hữu ích với mục đích nghiên
cứu, tuy nhiên cách thức tải toàn bộ
này sẽ tạo ra những tập dữ liệu
tăng lên theo cấp số nhân, đồng
thời cũng có thể trở nên khó bảo
chơi một cách nhanh chóng
Tải tăng dần: So sánh
những dữ liệu đến cùng với
những gì trước đây đã có
và chỉ tạo ra những bản ghi
bổ sung trong trường hợp
nếu như tìm thấy thông tin
duy nhất và mới. Kiểu này
sẽ giúp quản lý kinh doanh
một cách thông minh và ít
gây ra tốn kém hơn.
14. QUY TRÌNH TÍCH HỢP DỮ LIỆU
14
Hệ thống dữ liệu mở
Nguồn dữ liệu
Tích hợp dữ liệu mở từ hệ thống dịch vụ.
Cơ sở dữ liệu
mở
Tạo file chuyển đổi dữ liệu ETL
Đặt lịch đồng bộ dữ liệu
API
chia
sẻ
dữ
liệu
Trích
xuất
dữ liệu
mở
Phân loại dữ liệu
chuyên ngành
Làm sạch và chuẩn
hóa dữ liệu
17. THỰC HÀNH PENTAHO
17
Thực hiện ETL dữ liệu bằng công cụ Pentaho
Sử dụng Pentaho ETL các dữ liệu theo chỉ định của giảng
viên
Giảng viên mời một số học viên lên thực hành