SlideShare a Scribd company logo
1 of 17
HƯỚNG DẪN TÍCH HỢP DỮ LIỆU VÀ
XÂY DỰNG BÁO CÁO TRÊN NỀN TẢNG
OPENDATA PLATFORM
Thanh Hoa, 23/02/2023
NỘI DUNG GIỚI THIỆU
GIỚI THIỆU VỀ CÔNG CỤ POWERBI GIỚI THIỆU CÔNG CỤ PENTAHO
GIỚI THIỆU BIỂU ĐỒ POWER BI
QUY TRÌNH TÍCH HỢP DỮ LIỆU
QUY TRÌNH XÂY DỰNG BÁO CÁO
GIỚI THIỆU CHỨC NĂNG PENTAHO
THỰC HÀNH XÂY DỰNG BÁO CÁO THỰC HÀNH TÍCH HỢP DỮ LIỆU
GIỚI THIỆU CÔNG CỤ POWER BI
• Microsoft Power BI là một sản phẩm phần mềm trực quan hóa dữ liệu tương tác được phát
triển bởi Microsoft với trọng tâm chính là kinh doanh thông minh.
• Power BI là tập hợp các dịch vụ phần mềm, ứng dụng và trình kết nối, hoạt động cùng nhau
để biến các nguồn dữ liệu không liên quan thành thông tin chi tiết, mạch lạc, trực quan.
Power BI là gì
GIỚI THIỆU CÔNG CỤ POWER BI
• Được xây dựng từ nền tảng AI (trí tuệ
nhân tạo) và Machine Learning (máy học)
nên nhạy bén trong việc xử lý dữ liệu.
• Cung cấp các báo cáo và dashboard có
sẵn.
• Truy vấn ngôn ngữ tự nhiên khi khai thác
dữ liệu.
• Người dùng có thể tạo lịch trình để cập
nhật dữ liệu tự động thay vì tốn thời gian
thao tác thủ công.
Ưu điểm của Power BI
GIỚI THIỆU CÔNG CỤ POWER BI
Các thành phần của Power BI
Power BI Desktop có vai trò xử lý, tập
hợp và xây dựng mô hình dữ liệu dùng để
trực quan hóa dữ liệu cho các báo cáo.
Power BI Service Dịch vụ lưu trữ cloud
cho phép người dung lưu trữ báo cáo
Dashboard
Power BI Report Server Người dung có
thể xuất bản báo cáo sau khi hoàn thành
lên hệ thống Power BI của công ty
Power BI Apps ở dạng ứng dụng trên
thiết bị di động
QUY TRÌNH XÂY DỰNG BÁO CÁO
Các bước xây dựng báo cáo
CSDL
BƯỚC 01
Kết nối nguồn dữ liệu
BƯỚC 02
Làm sạch và chuẩn hóa
dữ liệu
BƯỚC 03
Xây dựng biểu đồ báo
cáo
BƯỚC 04
Xuất bản báo cáo cho
người dùng
NGUỒN DỮ LIỆU
GIỚI THIỆU BIỂU ĐỒ POWERBI
Các dạng biểu đồ trong Power BI
Biểu đồ Vùng Biểu đồ cột và thanh Biểu đồ đường
Biểu đồ kết hợp Biểu đồ Doughnut Biểu đô đo lường
GIỚI THIỆU BIỂU ĐỒ POWERBI
Các dạng biểu đồ sử dụng cho Opendata
THỰC HÀNH POWER BI
Thực hiện mô hình hóa dữ liệu sang các dạng biểu đồ
Sử dụng Power BI tạo một số biểu đồ trên hệ thông Opendata
Các học viên tạo thử theo chỉ định của giảng viên
Tham khảo
https://learn.microsoft.com/vi-vn/power-apps/maker/canvas-apps/sharepoint-scenario-build-report
GIỚI THIỆU CÔNG CỤ PENTAHO
ETL dữ liệu là gì
GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn trích xuất trong ETL
Dữ liệu thô hoàn toàn có thể chiết suất từ rất
nhiều những nguồn đa dạng khác nhau gồm có:
 Nền tảng về lưu trữ dữ liệu
 Hệ thống quản lý tất cả khách hàng CRM
 Thiết bị cũng như ứng dụng di động
 Ứng dụng phản ánh kiến nghị
 Văn bản số hóa của các sở ban nghành
 Ứng dụng tiếp thị và bán hàng
 Cơ sở dữ liệu hiện đang có
 Kho dữ liệu
GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn chuyển đổi trong ETL
• Data cleansing: có mục đích là
truyền những dữ liệu đúng dành cho
mục tiêu.
• Loại bỏ những dữ liệu trùng lặp
• Tiêu chuẩn hóa.
• Xác minh.
• Sắp xếp.
GIỚI THIỆU CÔNG CỤ PENTAHO
Giai đoạn tải trong ETL
Tải toàn bộ: Trong suốt quá trình
tải toàn bộ thì dữ liệu sẽ đi vào
những bản ghi mới mới và duy nhất
tại kho dữ liệu. Dù điều này sẽ vô
cùng hữu ích với mục đích nghiên
cứu, tuy nhiên cách thức tải toàn bộ
này sẽ tạo ra những tập dữ liệu
tăng lên theo cấp số nhân, đồng
thời cũng có thể trở nên khó bảo
chơi một cách nhanh chóng
Tải tăng dần: So sánh
những dữ liệu đến cùng với
những gì trước đây đã có
và chỉ tạo ra những bản ghi
bổ sung trong trường hợp
nếu như tìm thấy thông tin
duy nhất và mới. Kiểu này
sẽ giúp quản lý kinh doanh
một cách thông minh và ít
gây ra tốn kém hơn.
QUY TRÌNH TÍCH HỢP DỮ LIỆU
14
Hệ thống dữ liệu mở
Nguồn dữ liệu
Tích hợp dữ liệu mở từ hệ thống dịch vụ.
Cơ sở dữ liệu
mở
Tạo file chuyển đổi dữ liệu ETL
Đặt lịch đồng bộ dữ liệu
API
chia
sẻ
dữ
liệu
Trích
xuất
dữ liệu
mở
Phân loại dữ liệu
chuyên ngành
Làm sạch và chuẩn
hóa dữ liệu
GIAO DIỆN PENTAHO
15
CÁC CHỨC NĂNG CỦA PENTAHO
16
THỰC HÀNH PENTAHO
17
Thực hiện ETL dữ liệu bằng công cụ Pentaho
Sử dụng Pentaho ETL các dữ liệu theo chỉ định của giảng
viên
Giảng viên mời một số học viên lên thực hành

More Related Content

Similar to [Opendata] Tich hop du lieu va xay dung bao cao.pptx

Bai ii khai quat ha tang co so
Bai ii   khai quat ha tang co soBai ii   khai quat ha tang co so
Bai ii khai quat ha tang co soGiang Nguyễn
 
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT nataliej4
 
Bài 2: Hệ quản trị cơ sở dữ liệu
Bài 2: Hệ quản trị cơ sở dữ liệuBài 2: Hệ quản trị cơ sở dữ liệu
Bài 2: Hệ quản trị cơ sở dữ liệuChâu Trần
 
Thương mại điện tử
Thương  mại điện tửThương  mại điện tử
Thương mại điện tửgacon2009
 
Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2NTPhuong
 
Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2NTPhuong
 
De an-tttn-olap-slide
De an-tttn-olap-slideDe an-tttn-olap-slide
De an-tttn-olap-slideMan El
 
Báo cáo khóa luận share point
Báo cáo khóa luận share pointBáo cáo khóa luận share point
Báo cáo khóa luận share pointPrototyp Iilies
 
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử microsoft exchange2016
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử   microsoft exchange2016[Itech] giải pháp, dịch vụ về hệ thống thư điện tử   microsoft exchange2016
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử microsoft exchange2016laonap166
 
CVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViCVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViLam Nguyen
 
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...nataliej4
 
Tableau solution for Insurance
Tableau solution for InsuranceTableau solution for Insurance
Tableau solution for InsuranceBSD SOLUTIONS
 
BTL-kinh doanh thông minh
BTL-kinh doanh thông minhBTL-kinh doanh thông minh
BTL-kinh doanh thông minhHongQucVit9
 
Atlassian ITSM Case Study Ebook - VN
Atlassian ITSM Case Study Ebook - VNAtlassian ITSM Case Study Ebook - VN
Atlassian ITSM Case Study Ebook - VNJoseph Huynh
 
SQL SERVER BUSINESS INTELLIGENCE & WINDOWS SERVICE
SQL SERVER BUSINESS INTELLIGENCE  & WINDOWS SERVICESQL SERVER BUSINESS INTELLIGENCE  & WINDOWS SERVICE
SQL SERVER BUSINESS INTELLIGENCE & WINDOWS SERVICEMinh Tri Lam
 
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdf
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdfSmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdf
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdfSmartBiz
 
Tableau business intelligence
Tableau business intelligenceTableau business intelligence
Tableau business intelligenceBSD SOLUTIONS
 

Similar to [Opendata] Tich hop du lieu va xay dung bao cao.pptx (20)

Bai ii khai quat ha tang co so
Bai ii   khai quat ha tang co soBai ii   khai quat ha tang co so
Bai ii khai quat ha tang co so
 
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT
Triển khai dịch vụ công trực tuyến nguồn mở theo hình thức thuê dịch vụ CNTT
 
Bài 2: Hệ quản trị cơ sở dữ liệu
Bài 2: Hệ quản trị cơ sở dữ liệuBài 2: Hệ quản trị cơ sở dữ liệu
Bài 2: Hệ quản trị cơ sở dữ liệu
 
Thương mại điện tử
Thương  mại điện tửThương  mại điện tử
Thương mại điện tử
 
Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2
 
Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2Bai 9 -_trien_khai_du_an_tmdt_-_v2
Bai 9 -_trien_khai_du_an_tmdt_-_v2
 
De an-tttn-olap-slide
De an-tttn-olap-slideDe an-tttn-olap-slide
De an-tttn-olap-slide
 
Báo cáo khóa luận share point
Báo cáo khóa luận share pointBáo cáo khóa luận share point
Báo cáo khóa luận share point
 
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử microsoft exchange2016
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử   microsoft exchange2016[Itech] giải pháp, dịch vụ về hệ thống thư điện tử   microsoft exchange2016
[Itech] giải pháp, dịch vụ về hệ thống thư điện tử microsoft exchange2016
 
CVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-ViCVNguyenThanhLam-102015-Vi
CVNguyenThanhLam-102015-Vi
 
Dich vu webapplication
Dich vu webapplicationDich vu webapplication
Dich vu webapplication
 
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...
Nghiên cứu khả năng triển khai ứng dụng hệ thống quản trị doanh nghiệp tích h...
 
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
Phân Tích Dữ Liệu Phân Hạng Tín Dụng Dựa Trên Bộ Dữ Liệu Xyz Bằng Phần Mềm Or...
 
Tableau solution for Insurance
Tableau solution for InsuranceTableau solution for Insurance
Tableau solution for Insurance
 
BTL-kinh doanh thông minh
BTL-kinh doanh thông minhBTL-kinh doanh thông minh
BTL-kinh doanh thông minh
 
Atlassian ITSM Case Study Ebook - VN
Atlassian ITSM Case Study Ebook - VNAtlassian ITSM Case Study Ebook - VN
Atlassian ITSM Case Study Ebook - VN
 
SQL SERVER BUSINESS INTELLIGENCE & WINDOWS SERVICE
SQL SERVER BUSINESS INTELLIGENCE  & WINDOWS SERVICESQL SERVER BUSINESS INTELLIGENCE  & WINDOWS SERVICE
SQL SERVER BUSINESS INTELLIGENCE & WINDOWS SERVICE
 
Pivot grid on ps v1.0
Pivot grid on ps v1.0Pivot grid on ps v1.0
Pivot grid on ps v1.0
 
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdf
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdfSmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdf
SmartBiz_Cach trien khai ERP thanh cong_B15_20221107.pdf
 
Tableau business intelligence
Tableau business intelligenceTableau business intelligence
Tableau business intelligence
 

[Opendata] Tich hop du lieu va xay dung bao cao.pptx

  • 1. HƯỚNG DẪN TÍCH HỢP DỮ LIỆU VÀ XÂY DỰNG BÁO CÁO TRÊN NỀN TẢNG OPENDATA PLATFORM Thanh Hoa, 23/02/2023
  • 2. NỘI DUNG GIỚI THIỆU GIỚI THIỆU VỀ CÔNG CỤ POWERBI GIỚI THIỆU CÔNG CỤ PENTAHO GIỚI THIỆU BIỂU ĐỒ POWER BI QUY TRÌNH TÍCH HỢP DỮ LIỆU QUY TRÌNH XÂY DỰNG BÁO CÁO GIỚI THIỆU CHỨC NĂNG PENTAHO THỰC HÀNH XÂY DỰNG BÁO CÁO THỰC HÀNH TÍCH HỢP DỮ LIỆU
  • 3. GIỚI THIỆU CÔNG CỤ POWER BI • Microsoft Power BI là một sản phẩm phần mềm trực quan hóa dữ liệu tương tác được phát triển bởi Microsoft với trọng tâm chính là kinh doanh thông minh. • Power BI là tập hợp các dịch vụ phần mềm, ứng dụng và trình kết nối, hoạt động cùng nhau để biến các nguồn dữ liệu không liên quan thành thông tin chi tiết, mạch lạc, trực quan. Power BI là gì
  • 4. GIỚI THIỆU CÔNG CỤ POWER BI • Được xây dựng từ nền tảng AI (trí tuệ nhân tạo) và Machine Learning (máy học) nên nhạy bén trong việc xử lý dữ liệu. • Cung cấp các báo cáo và dashboard có sẵn. • Truy vấn ngôn ngữ tự nhiên khi khai thác dữ liệu. • Người dùng có thể tạo lịch trình để cập nhật dữ liệu tự động thay vì tốn thời gian thao tác thủ công. Ưu điểm của Power BI
  • 5. GIỚI THIỆU CÔNG CỤ POWER BI Các thành phần của Power BI Power BI Desktop có vai trò xử lý, tập hợp và xây dựng mô hình dữ liệu dùng để trực quan hóa dữ liệu cho các báo cáo. Power BI Service Dịch vụ lưu trữ cloud cho phép người dung lưu trữ báo cáo Dashboard Power BI Report Server Người dung có thể xuất bản báo cáo sau khi hoàn thành lên hệ thống Power BI của công ty Power BI Apps ở dạng ứng dụng trên thiết bị di động
  • 6. QUY TRÌNH XÂY DỰNG BÁO CÁO Các bước xây dựng báo cáo CSDL BƯỚC 01 Kết nối nguồn dữ liệu BƯỚC 02 Làm sạch và chuẩn hóa dữ liệu BƯỚC 03 Xây dựng biểu đồ báo cáo BƯỚC 04 Xuất bản báo cáo cho người dùng NGUỒN DỮ LIỆU
  • 7. GIỚI THIỆU BIỂU ĐỒ POWERBI Các dạng biểu đồ trong Power BI Biểu đồ Vùng Biểu đồ cột và thanh Biểu đồ đường Biểu đồ kết hợp Biểu đồ Doughnut Biểu đô đo lường
  • 8. GIỚI THIỆU BIỂU ĐỒ POWERBI Các dạng biểu đồ sử dụng cho Opendata
  • 9. THỰC HÀNH POWER BI Thực hiện mô hình hóa dữ liệu sang các dạng biểu đồ Sử dụng Power BI tạo một số biểu đồ trên hệ thông Opendata Các học viên tạo thử theo chỉ định của giảng viên Tham khảo https://learn.microsoft.com/vi-vn/power-apps/maker/canvas-apps/sharepoint-scenario-build-report
  • 10. GIỚI THIỆU CÔNG CỤ PENTAHO ETL dữ liệu là gì
  • 11. GIỚI THIỆU CÔNG CỤ PENTAHO Giai đoạn trích xuất trong ETL Dữ liệu thô hoàn toàn có thể chiết suất từ rất nhiều những nguồn đa dạng khác nhau gồm có:  Nền tảng về lưu trữ dữ liệu  Hệ thống quản lý tất cả khách hàng CRM  Thiết bị cũng như ứng dụng di động  Ứng dụng phản ánh kiến nghị  Văn bản số hóa của các sở ban nghành  Ứng dụng tiếp thị và bán hàng  Cơ sở dữ liệu hiện đang có  Kho dữ liệu
  • 12. GIỚI THIỆU CÔNG CỤ PENTAHO Giai đoạn chuyển đổi trong ETL • Data cleansing: có mục đích là truyền những dữ liệu đúng dành cho mục tiêu. • Loại bỏ những dữ liệu trùng lặp • Tiêu chuẩn hóa. • Xác minh. • Sắp xếp.
  • 13. GIỚI THIỆU CÔNG CỤ PENTAHO Giai đoạn tải trong ETL Tải toàn bộ: Trong suốt quá trình tải toàn bộ thì dữ liệu sẽ đi vào những bản ghi mới mới và duy nhất tại kho dữ liệu. Dù điều này sẽ vô cùng hữu ích với mục đích nghiên cứu, tuy nhiên cách thức tải toàn bộ này sẽ tạo ra những tập dữ liệu tăng lên theo cấp số nhân, đồng thời cũng có thể trở nên khó bảo chơi một cách nhanh chóng Tải tăng dần: So sánh những dữ liệu đến cùng với những gì trước đây đã có và chỉ tạo ra những bản ghi bổ sung trong trường hợp nếu như tìm thấy thông tin duy nhất và mới. Kiểu này sẽ giúp quản lý kinh doanh một cách thông minh và ít gây ra tốn kém hơn.
  • 14. QUY TRÌNH TÍCH HỢP DỮ LIỆU 14 Hệ thống dữ liệu mở Nguồn dữ liệu Tích hợp dữ liệu mở từ hệ thống dịch vụ. Cơ sở dữ liệu mở Tạo file chuyển đổi dữ liệu ETL Đặt lịch đồng bộ dữ liệu API chia sẻ dữ liệu Trích xuất dữ liệu mở Phân loại dữ liệu chuyên ngành Làm sạch và chuẩn hóa dữ liệu
  • 16. CÁC CHỨC NĂNG CỦA PENTAHO 16
  • 17. THỰC HÀNH PENTAHO 17 Thực hiện ETL dữ liệu bằng công cụ Pentaho Sử dụng Pentaho ETL các dữ liệu theo chỉ định của giảng viên Giảng viên mời một số học viên lên thực hành