Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng ứng dụng Android nghe nhạc trên internet, cho các bạn làm luận văn tham khảo
Tiểu luận thương mại điện tử Phân tích mô hình kinh doanh của Shopee
tải tài liệu qua zalo 0936.885.877
phí tải tài liệu 50k
để được tải miễn phí liên hệ zalo
Xây dựng hệ thống thông tin quản lý khách hàng bằng PHP và MySQLAskSock Ngô Quang Đạo
[Nghiên cứu khoa học sinh viên]
Sử dụng mã nguồn mở PHP và hệ quản trị cơ sở dữ liệu MySQL để xây dựng hệ thống quản lý khách hàng tại hãng Thời trang công sở cao cấp MOKARA
----------------------------------------------
Trong nền kinh tế hiện nay, việc thành công hay thất bại của một doanh nghiệp không phải là tạo ra tối đa những sản phẩm, dịch vụ của mình có mà quan trọng nhất là tạo ra những sản phẩm, dịch vụ đáp ứng được nhu cầu của khách hàng, tạo hình ảnh riêng ghi sâu trong mỗi khách hàng. Các doanh nghiệp cũng đã sớm nhận ra rằng cần có một hệ thống quản lý thông tin khách hàng như : thông tin cá nhân, tài khoản, nhu cầu . . . nhằm phục vụ khách hàng tốt hơn.
Yêu cầu ngay lúc này chính là sự hiểu biết đầy đủ về tri thức khách hàng được rút ra từ nhiều nguồn dữ liệu, chẳng hạn qua một số các hệ thống tính cước và in hóa đơn, hệ thống chuyển đổi, mạng lưới kênh phân phối, báo cáo phân tích và các mạng xã hội.
Các doanh nghiệp đã và đang ngày nỗ lực hơn trong việc hiểu khách hàng nhằm mang đến cho họ sự trải nghiệm cùng những dịch vụ được nâng cấp tốt hơn. Tuy nhiên, vẫn có sự khác biệt quá lớn giữa việc hiểu rõ các yêu cầu với những mong muốn thực sự của khách hàng.
Sự khác biệt này có thể do việc định hướng vào nhóm khách hàng sai, thất bại trong việc nắm bắt các yêu cầu thực sự của khách hàng, thiếu tuyên bố giá trị thuyết phục hoặc đơn giản là lựa chọn sai kênh truyền thông. Để quản lý được các thách thức do những nguyên nhân trên, chúng ta cần tới sự trợ giúp của một cơ cấu tổ chức mới biết sử dụng thông tin khách hàng và thúc đẩy những mô hình chuẩn phù hợp nhằm giúp hệ thống hỗ trợ quyết định nắm bắt chính xác tri thức của khách hàng. Trước tiên, chúng ta cũng nhìn lại những cách thức quản lý khách hàng mà doanh nghiệp đang sử dụng.
Mục đích của kinh doanh là phát triển và duy trì nguồn khách hàng mục tiêu. Điều này có nghĩa là mỗi công ty đều phải có dữ liệu khách hàng của mình. Để nguồn dữ liệu này luôn được làm mới, công ty phải thường xuyên cập nhật tất cả mọi thông tin giao dịch liên quan đến khách hàng ấy trong suốt quá trình hoạt động kinh doanh của doanh nghiệp. Vấn đề cấp thiết nhất của các doanh nghiệp là cần có một hệ thống quản lý quy trình khách hàng, bán hàng, chăm sóc khách hàng với các giai đoạn được phân định rõ ràng. Và hệ thống quản lý khách hàng sẽ giúp cho nhiệm vụ làm việc trực tiếp với khách hàng trở thành sự hỗ trợ quyết định hiệu quả nhằm cải thiện sâu sắc tình hình doanh thu, nhiệm vụ tiếp thị và dịch vụ trong cả doanh nghiệp, bằng cách đó mang đến cho khách hàng sự hài lòng hơn cũng như giữ vững mối quan hệ với khách hàng.
Với sự trợ giúp của một hệ thống quản trị khách hàng hiệu quả, doanh nghiệp có thể phân tích thấu đáo mọi thông tin về mỗi khách hàng cả ở dạng tiềm năng và thân thiết. Từ đó định ra các giá trị thực mà khách hàng có khả năng mang lại và phân loại các nhóm khách hàng theo các thị trường mục tiêu nhằm có chính sách chăm sóc hợp lý hơn.
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng chương trình quản lý cho thuê nhà của một cơ sở dịch vụ, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng ứng dụng Android nghe nhạc trên internet, cho các bạn làm luận văn tham khảo
Tiểu luận thương mại điện tử Phân tích mô hình kinh doanh của Shopee
tải tài liệu qua zalo 0936.885.877
phí tải tài liệu 50k
để được tải miễn phí liên hệ zalo
Xây dựng hệ thống thông tin quản lý khách hàng bằng PHP và MySQLAskSock Ngô Quang Đạo
[Nghiên cứu khoa học sinh viên]
Sử dụng mã nguồn mở PHP và hệ quản trị cơ sở dữ liệu MySQL để xây dựng hệ thống quản lý khách hàng tại hãng Thời trang công sở cao cấp MOKARA
----------------------------------------------
Trong nền kinh tế hiện nay, việc thành công hay thất bại của một doanh nghiệp không phải là tạo ra tối đa những sản phẩm, dịch vụ của mình có mà quan trọng nhất là tạo ra những sản phẩm, dịch vụ đáp ứng được nhu cầu của khách hàng, tạo hình ảnh riêng ghi sâu trong mỗi khách hàng. Các doanh nghiệp cũng đã sớm nhận ra rằng cần có một hệ thống quản lý thông tin khách hàng như : thông tin cá nhân, tài khoản, nhu cầu . . . nhằm phục vụ khách hàng tốt hơn.
Yêu cầu ngay lúc này chính là sự hiểu biết đầy đủ về tri thức khách hàng được rút ra từ nhiều nguồn dữ liệu, chẳng hạn qua một số các hệ thống tính cước và in hóa đơn, hệ thống chuyển đổi, mạng lưới kênh phân phối, báo cáo phân tích và các mạng xã hội.
Các doanh nghiệp đã và đang ngày nỗ lực hơn trong việc hiểu khách hàng nhằm mang đến cho họ sự trải nghiệm cùng những dịch vụ được nâng cấp tốt hơn. Tuy nhiên, vẫn có sự khác biệt quá lớn giữa việc hiểu rõ các yêu cầu với những mong muốn thực sự của khách hàng.
Sự khác biệt này có thể do việc định hướng vào nhóm khách hàng sai, thất bại trong việc nắm bắt các yêu cầu thực sự của khách hàng, thiếu tuyên bố giá trị thuyết phục hoặc đơn giản là lựa chọn sai kênh truyền thông. Để quản lý được các thách thức do những nguyên nhân trên, chúng ta cần tới sự trợ giúp của một cơ cấu tổ chức mới biết sử dụng thông tin khách hàng và thúc đẩy những mô hình chuẩn phù hợp nhằm giúp hệ thống hỗ trợ quyết định nắm bắt chính xác tri thức của khách hàng. Trước tiên, chúng ta cũng nhìn lại những cách thức quản lý khách hàng mà doanh nghiệp đang sử dụng.
Mục đích của kinh doanh là phát triển và duy trì nguồn khách hàng mục tiêu. Điều này có nghĩa là mỗi công ty đều phải có dữ liệu khách hàng của mình. Để nguồn dữ liệu này luôn được làm mới, công ty phải thường xuyên cập nhật tất cả mọi thông tin giao dịch liên quan đến khách hàng ấy trong suốt quá trình hoạt động kinh doanh của doanh nghiệp. Vấn đề cấp thiết nhất của các doanh nghiệp là cần có một hệ thống quản lý quy trình khách hàng, bán hàng, chăm sóc khách hàng với các giai đoạn được phân định rõ ràng. Và hệ thống quản lý khách hàng sẽ giúp cho nhiệm vụ làm việc trực tiếp với khách hàng trở thành sự hỗ trợ quyết định hiệu quả nhằm cải thiện sâu sắc tình hình doanh thu, nhiệm vụ tiếp thị và dịch vụ trong cả doanh nghiệp, bằng cách đó mang đến cho khách hàng sự hài lòng hơn cũng như giữ vững mối quan hệ với khách hàng.
Với sự trợ giúp của một hệ thống quản trị khách hàng hiệu quả, doanh nghiệp có thể phân tích thấu đáo mọi thông tin về mỗi khách hàng cả ở dạng tiềm năng và thân thiết. Từ đó định ra các giá trị thực mà khách hàng có khả năng mang lại và phân loại các nhóm khách hàng theo các thị trường mục tiêu nhằm có chính sách chăm sóc hợp lý hơn.
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng chương trình quản lý cho thuê nhà của một cơ sở dịch vụ, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp với đề tài: Xây dựng chương trình dự báo doanh thu bán hàng cho siêu thị Minh Cầu - Thái Nguyên, cho các bạn làm luận văn tham khảo
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Phân tích thiết kế hệ thống thông tin quản lý phân phối Gas Petrolimex Hải Phòng, cho các bạn làm luận văn tham khảo
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
http://bookbooming.com/
Tại sao lại là sách ?
Bản thân chúng tôi được truyền cảm hứng rất nhiều từ những câu chuyện về những nhà sáng lập IBM, Sony, Samsung, Hyundai..Nó làm chúng tôi hừng hực khí thế, sôi sục một ước mơ xây dựng những công ty vĩ đại có thể thay đổi đất nước Việt Nam này và vươn ra toàn cầu. Ước mơ một nền văn hóa, một tinh thần chiến đấu, đoàn kết của người Nhật....một sự cách tân, một giấc mơ Mỹ. VÀ BOOKBOOMING SINH RA ĐỂ MANG LẠI GIẤC MƠ ĐÓ CHO CÁC BẠN.
NHỮNG NGƯỜI NÀO KHÔNG ĐỌC SÁCH LÀ HỌ ĐÃ LÃNG PHÍ MỘT NỬA CUỘC ĐỜI MÌNH
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Chuyên đề hoàn thiện kênh phân phối hàng,, ĐIỂM CAO. Chia sẻ cho các bạn sinh viên tài liệu tốt nghiệp ngành quản trị kinh doanh, các bạn làm chuyên đề tốt nghiệp quản trị kinh doanh vào tải nhé.
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp với đề tài: Xây dựng chương trình dự báo doanh thu bán hàng cho siêu thị Minh Cầu - Thái Nguyên, cho các bạn làm luận văn tham khảo
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Phân tích thiết kế hệ thống thông tin quản lý phân phối Gas Petrolimex Hải Phòng, cho các bạn làm luận văn tham khảo
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
http://bookbooming.com/
Tại sao lại là sách ?
Bản thân chúng tôi được truyền cảm hứng rất nhiều từ những câu chuyện về những nhà sáng lập IBM, Sony, Samsung, Hyundai..Nó làm chúng tôi hừng hực khí thế, sôi sục một ước mơ xây dựng những công ty vĩ đại có thể thay đổi đất nước Việt Nam này và vươn ra toàn cầu. Ước mơ một nền văn hóa, một tinh thần chiến đấu, đoàn kết của người Nhật....một sự cách tân, một giấc mơ Mỹ. VÀ BOOKBOOMING SINH RA ĐỂ MANG LẠI GIẤC MƠ ĐÓ CHO CÁC BẠN.
NHỮNG NGƯỜI NÀO KHÔNG ĐỌC SÁCH LÀ HỌ ĐÃ LÃNG PHÍ MỘT NỬA CUỘC ĐỜI MÌNH
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Chuyên đề hoàn thiện kênh phân phối hàng,, ĐIỂM CAO. Chia sẻ cho các bạn sinh viên tài liệu tốt nghiệp ngành quản trị kinh doanh, các bạn làm chuyên đề tốt nghiệp quản trị kinh doanh vào tải nhé.
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, cho các bạn làm luận văn tham khảo
DOWNLOAD MIỄN PHÍ 30000 TÀI LIỆU https://s.pro.vn/Z3UW
Dịch vụ viết thuê luận án tiến sĩ, luận văn thạc sĩ,báo cáo thực tập, khóa luận
Sdt/zalo 0967 538 624/0886 091 915
https://lamluanvan.net/gia-den-2024-viet-thue-bao-cao-thuc-tap/
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC CHO
VIỆT NAM
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng chương trình quản lý tài sản cố định ở một khách sạn, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Xây dựng chương trình quản lý tài sản cố định ở khách sạn City View, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn thạc sĩ ngành kế toán với đề tài: Kế toán chi phí sản xuất và tính giá thành sản phẩm xây lắp tại công ty thi công cơ giới, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn thạc sĩ với đề tài: Kế toán chi phí sản xuất và tính giá thành sản phẩm hiện nay tại Công ty Cổ phần Đại Kim, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn thạc sĩ ngành kế toán với đề tài: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ phần Đại Kim, cho các bạn có thể làm luận văn tham khảo
DOWNLOAD MIỄN PHÍ 30000 TÀI LIỆU https://s.pro.vn/Z3UW
Dịch vụ viết thuê luận án tiến sĩ, luận văn thạc sĩ,báo cáo thực tập, khóa luận
Sdt/zalo 0967 538 624/0886 091 915
https://lamluanvan.net/dich-vu-2-viet-thue-luan-van-thac-si-kem-bao-gia/
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
1. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
VIỆN DẦU KHÍ VIỆT NAM
N À XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG
H
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
2.
3. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
VIỆN DẦU KHÍ VIỆT NAM
NHÀ XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG
5. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1. Thông điệp ...................................................................10
1.2. Ai sẽ đọc cuốn sách này?...........................................11
1.3. Nền tảng sử dụng ........................................................12
1.4. Người đọc nhận được những gì? ..............................13
1.5. Nội dung của cuốn sách ............................................14
CHƯƠNG 2: BUSINESS INTELLIGENCE
2.1. Tầm quan trọng của Business Intelligence ..............15
2.2. Phân tích Business Intelligence ................................15
CHƯƠNG 3: SẢN PHẨM SỐ
3.1. Hiểu rõ về dữ liệu .......................................................20
3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc
dữ liệu ......................................................................................20
3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu ......................24
3.2. Sản phẩm số ................................................................24
3.2.1. Khái niệm sản phẩm số ..........................................24
3.2.2. Phân loại sản phẩm số ............................................26
3.2.3. Quy trình xây dựng sản phẩm số ..........................29
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN
TẢNG POWER BI SERVICES
4.1. Tại sao sử dụng Power BI Service? ...........................40
4.2. Công cụ cho tổ chức dữ liệu trên nền tảng Power BI
Service. .....................................................................................42
4.2.1. Power Query ............................................................42
MỤC LỤC
6. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
4.2.2. Dataset ......................................................................47
4.2.3. Dataflow ....................................................................49
4.2.4. Datamart ...................................................................50
4.3. Trực quan hóa dữ liệu ................................................53
4.3.1. Khái niệm trực quan hóa dữ liệu ...........................53
4.3.2. Tầm quan trọng của trực quan hóa dữ liệu...........53
4.3.3. Các dạng biểu diễn cơ bản trong Power BI ..........54
4.3.4. Trực quan hóa dữ liệu nâng cao ............................56
4.4. Auto Machine Learning (AutoML) - Học máy tự
động .....................................................................................59
4.4.1. Học máy/Học máy tự động là gì? ..........................59
4.4.2. Automated Machine Learning (AutoML) trong
Power BI ..............................................................................61
4.5. Automation .................................................................65
4.5.1. Schedule Refresh .....................................................65
4.5.2. Quy trình xây dựng, duy trì và phân phối sản
phẩm số trên Power BI Service sử dụng Power BI
pipeline ................................................................................66
CHƯƠNG 5: CHIA SẺ SẢN PHẨM SỐ
5.1. Workspace.....................................................................73
5.1.1. Giới thiệu chung ......................................................73
5.1.2. Các chức năng của workspace ...............................73
5.1.3. Phân quyền và quản lý workspace .........................75
5.2. Power BI Embed .........................................................76
5.2.1. Giới thiệu chung ......................................................76
7. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
5.2.2. Publish to web ..........................................................77
5.2.3. Embed to Website or Portal (Secured Embed -
Nhúng an toàn) ..................................................................79
5.2.4. Embed to Sharepoint Online .................................80
5.3. Power BI App ..............................................................81
CHƯƠNG 6: CÁC SẢN PHẨM SỐ CHO LĨNH VỰC DẦU
VÀ KHÍ
6.1. Báo cáo số ...................................................................83
6.1.1. CCUS .......................................................................83
6.1.2. Chỉ số Hydrogen ....................................................95
6.1.3. Biostratigraphic Analysis .....................................104
6.2. Phân tích số ..............................................................114
6.2.1. Oil price forecast ..................................................114
6.2.2. Fracture prediction ...............................................121
CHƯƠNG 7: HƯỚNG DẪN SỬ DỤNG CÔNG CỤ
TRÊN NỀN TẢNG POWER BI SERVICE
7.1. Hướng dẫn thực hiện một số loại kết nối dữ liệu 130
7.1.1. Kết nối với SharePoint Online .............................130
7.1.2. Kết nối với SharePoint Online List ......................132
7.1.3. Kết nối với Dataverse ............................................135
7.1.4. Kết nối với Datamart ............................................138
7.2. Cách khởi tạo công cụ tổ chức dữ liệu ..................140
7.2.1. Cách khởi tạo Dataset ...........................................140
7.2.2. Cách khởi tạo Dataflow ........................................142
7.2.3. Cách khởi tạo Datamart .......................................149
7.3. Khái niệm các dạng biểu diễn cơ bản ....................154
8. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
7.4. Cách triển khai áp dụng biểu đồ bản đồ nâng cao .156
7.4.1. Biểu diễn bản đồ với công cụ IconMap ..............156
7.4.2. Cài đặt IconMap ....................................................157
7.4.3. Biểu diễn IconMap ................................................158
7.4.4. Tùy biến dữ liệu biểu tượng .................................162
7.4.5. Biểu diễn các đối tượng lớp thông tin địa lý. .....163
7.5. Cách triển khai áp dụng biểu diễn nâng cao kết hợp
với Python ........................................................................165
7.5.1. Cài đặt Python .......................................................165
7.5.2. Biểu diễn với Python trên Power BI ...................166
7.6. Các bước triển khai thực hiện mô hình AutoML
trên Power BI Service ......................................................167
7.7. Hướng dẫn thiết lập làm mới dữ liệu ....................178
CHƯƠNG 8: HƯỚNG DẪN CHIA SẺ SẢN PHẨM SỐ
TRÊN NỀN TẢNG POWER BI SERVICE
8.1. Hướng dẫn tạo mới, phân quyền và quản lý Work-
space ..................................................................................181
8.2. Hướng dẫn Power BI Embed ..................................184
8.2.1. Publish to web (Public) .........................................184
8.2.2. Embed to website or portal (Secured embed)....185
8.2.3. Embed to Sharepoint online ................................187
8.3. Các bước tạo, phân quyền và chia sẻ một Power BI
App ....................................................................................190
9. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
AI
AutoML
BI Tools
DA
DE
NLP
PPU
SQL
ETL
MVP
ERD
LLM
Giải thích
Artifical Intelligence
Trí tuệ nhân tạo
Auto Machine Learning
Học máy tự động
Business Intelligence Tools
Data Analyst
Data Engineer
Natural Language Processing
Premium Per User
Structured Query Language
Extract-Transform-Loading
Minimum Viable Product
Sản phẩm khả dụng tối thiểu
Entity Relational Diagram
Sơ đồ mối quan hệ
Large Language Model
Mô hình ngôn ngữ lớn
10. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
LỜI TỰA
"Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng
Power BI Service và AutoML trong lĩnh vực dầu khí" là cuốn
sách đầu tiên trong loạt sách "Ai cũng dùng AI" của Viện Dầu
khí Việt Nam. Đây là một cuốn sách cung cấp giá trị kiến thức
và nguồn cảm hứng cho những ai muốn tiến xa hơn trong thế
giới số.
Mục tiêu của nhóm tác giả khi viết cuốn sách này không chỉ
là truyền đạt kiến thức, mà còn là khơi dậy niềm đam mê sáng
tạo. Chúng tôi muốn quý vị, những nhà nghiên cứu, những
người làm việc trong ngành dầu khí, sẽ thấy được tiềm năng to
lớn của công nghệ số trong việc cải thiện công việc của mình.
Đặc biệt, cuốn sách này sẽ giúp bạn hiểu rõ hơn về công
nghệ AI, Power BI Service và AutoML - những công nghệ đang
thay đổi cách chúng ta làm việc, học hỏi và tạo ra giá trị. Đồng
thời, chúng tôi cũng muốn nhấn mạnh tầm quan trọng của việc
áp dụng công nghệ số trong ngành dầu khí. Trong suốt hơn 60
năm qua, ngành Dầu khí Việt Nam đã cung cấp nguồn năng
lượng cho đất nước, thúc đẩy sự phát triển không chỉ về kinh
tế mà còn đối với nhiều lĩnh vực khác. Những người làm việc
trong ngành Dầu khí đã cống hiến, đã chịu trách nhiệm với sứ
mệnh lớn lao này. Bây giờ, hãy tưởng tượng rằng, nếu bạn có
thêm một người đồng hành không biết mệt mỏi, luôn sẵn sàng
hỗ trợ, có khả năng học hỏi nhanh chóng và giúp cải thiện hiệu
suất công việc. Đó chính là AI, công nghệ trí tuệ nhân tạo.
Đến với "Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng
dụng Power BI Service và AutoML trong lĩnh vực dầu khí", bạn
sẽ thấy rõ hơn về sức mạnh của Power BI Service và AutoML -
những công cụ giúp bạn nhanh chóng tổ chức, biểu diễn và chia
11. SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
sẻ dữ liệu cũng như sản phẩm của mình. Đây là những công cụ
tiện lợi, như một bước đệm để bạn tiếp cận và ứng dụng công
nghệ AI vào công việc nghiên cứu khoa học của mình.
Công nghệ AI không còn xa lạ nữa khi chúng ta có ChatGPT
và những công cụ AI khác dựa trên ngôn ngữ tự nhiên, giúp
bạn tạo ra các tri thức mới, đồng thời hỗ trợ cho phương pháp
làm việc truyền thống trong ngành dầu khí.
Điều thú vị nhất là, đây chỉ mới là khởi đầu. "Ai cũng dùng
AI" sẽ tiếp tục giới thiệu đến bạn những công cụ và kiến thức
cao cấp hơn thông qua ngôn ngữ lập trình Python, cùng với sự
áp dụng của các mô hình vật lý - địa chất từ các chuyên gia của
Viện Dầu khí Việt Nam.
Với cuốn sách này, Viện Dầu khí Việt Nam mong muốn
bạn không chỉ học hỏi kiến thức mới mà còn tìm thấy niềm
đam mê, sức mạnh sáng tạo từ bên trong, để cùng chúng tôi
khám phá và tạo ra những giá trị mới cho ngành dầu khí và đất
nước. Với AI, tất cả các cán bộ làm việc trong ngành dầu khí,
từ thượng nguồn tới hạ nguồn, từ kỹ thuật tới kinh tế, quản lý,
đều có thể tận dụng những công cụ mới mạnh mẽ này để tối ưu
hóa công việc, tạo ra các giải pháp mới và tiếp tục sứ mệnh tìm
kiếm, khai thác nguồn năng lượng cho đất nước.
Chúng ta đang ở trên con đường mới mà AI sẽ giúp chúng
ta đi nhanh hơn, xa hơn. "Sáng tạo sản phẩm số - Ai cũng
dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh
vực dầu khí" chính là bước khởi đầu, là cầu nối giữa con
người, dầu khí và thế giới của AI. Với sự hỗ trợ của AI, chúng
ta sẽ cùng nhau tiếp tục sứ mệnh cao cả, đảm bảo nguồn năng
lượng cho sự phát triển bền vững của đất nước.
12. 10
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1. Thông điệp
AI (Artificial Intelligence) không chỉ đơn thuần là công cụ
cho các công ty công nghệ lớn, mà đang trở thành một yếu tố
không thể thiếu trong mọi lĩnh vực. Cùng với sự tiến bộ vượt
bậc trong những năm gần đây, khái niệm “trí tuệ nhân tạo”
không còn là những phát minh xa vời mà dần trở nên “bình
dân hóa” và từng bước thay đổi cách con người sống và làm
việc. Sự nở rộ của mô hình ngôn ngữ lớn (LLM) với đại diện
tiêu biểu là ChatGPT khiến cho việc con người giao tiếp, làm
việc và sáng tạo với sự hỗ trợ của AI đơn giản hơn bao giờ
hết. Các ông lớn trong ngành công nghệ chạy đua cùng xu
hướng low-code/no-code AI (AI không sử dụng ngôn ngữ
lập trình) càng giúp thu hẹp khoảng cách giữa con người với
trí tuệ nhân tạo. AI đã hiện diện ở mọi ngóc ngách của cuộc
sống.
Khi máy móc trở nên thông minh hơn, cùng với sự phát
triển về năng lực và tốc độ tính toán, năng suất công việc và
sự tự động hóa ngày càng gia tăng trong tất cả các lĩnh vực.
Không thể phủ nhận một phần công việc của con người sẽ
thay thế bằng máy móc. Đây sẽ là thách thức đối với những
lao động không nắm bắt được công nghệ và làm chủ được AI.
Tuy nhiên, chúng tôi tin rằng đây là một cơ hội hiếm có để
con người giảm bớt được những gánh nặng trong công việc
và đời sống hàng ngày để dành thời gian và tập trung làm
những việc mang lại giá trị khác biệt, vốn là thế mạnh của
con người, đó là sáng tạo và đồng cảm. Để làm được điều này,
mỗi cá nhân cần tiếp cận và hiểu về AI - “Ai cũng dùng AI”,
13. VIỆN DẦU KHÍ VIỆT NAM
11
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
hơn nữa là làm chủ công nghệ và tận dụng AI như là “trợ thủ”
để khám phá và vươn tới những tiềm năng mới. Đây cũng là
động lực để nhóm tác giả Viện Dầu khí Việt Nam xây dựng
tập sách “Ai cũng dùng AI”, mở đầu bằng cuốn sách “Sáng tạo
sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service
và AutoML trong lĩnh vực dầu khí”.
Cuốn sách sẽ giúp bạn mở khóa toàn bộ dữ liệu và chuyển
dữ liệu của bạn thành những sản phẩm số và xây dựng mô
hình học máy tự động mang lại giá trị hữu ích cho doanh
nghiệp. Độc giả sẽ được hướng dẫn sáng tạo một sản phẩm số
hoàn chỉnh: Từ kết nối các nguồn dữ liệu khác nhau, tổ chức,
quản lý và duy trì nguồn dữ liệu cho báo cáo, tạo các biểu đồ
bắt mắt với khả năng tương tác theo tùy chọn của người dùng
cuối. Độc giả sẽ có được những kiến thức nền tảng cơ bản đến
nâng cao để xây dựng sản phẩm số đầu tiên. Cùng với cuốn
sách này, tin rằng các cán bộ làm việc trong lĩnh vực dầu khí
“ai cũng có thể xây dựng sản phẩm số” với sự hỗ trợ của Power
BI Service - nền tảng tiêu biểu tích hợp vô vàn tính năng trí
tuệ nhân tạo.
1.2. Ai sẽ đọc cuốn sách này?
Cuốn sách này sẽ cung cấp nhiều giá trị kiến thức dành
cho tất cả độc giả đã có kiến thức nền tảng từ cơ bản đến nâng
cao hoặc chưa có nền tảng về lĩnh vực phân tích dữ liệu, học
máy hay trí tuệ nhân tạo nhưng có sự đam mê và nhu cầu
tìm hiểu đối với những lĩnh vực này. Để đạt được những kết
quả tốt nhất từ cuốn sách, độc giả nên tìm hiểu song song với
thực hành theo các bước để tạo ra sản phẩm số và mô hình
học máy tự động cho cá nhân. Cuốn sách này sẽ cung cấp
14. 12
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cho độc giả những khái niệm đơn giản và dễ hiểu, hướng dẫn
thực hiện các thao tác chi tiết, cụ thể. Đặc biệt, nội dung giới
thiệu các sản phẩm tiêu biểu cũng đưa ra những hướng dẫn
để độc giả có thể tham khảo và mô phỏng lại trong sản phẩm
số của mình. Tất cả các sản phẩm tiêu biểu được giới thiệu
trong cuốn sách này đều được xây dựng với công cụ Power BI.
1.3. Nền tảng sử dụng
Power BI nằm trong mô hình kinh doanh của nhiều
doanh nghiệp với khả năng phân tích dữ liệu vô cùng hiệu
quả. Power BI có thể kết nối nhiều loại tệp, chuyển đổi và trực
quan hóa thành các sản phẩm số, cũng như tạo biểu đồ, đồ thị
để cung cấp hình ảnh trực quan và sự tương quan của dữ liệu.
Cho dù dữ liệu là một bảng làm việc đơn giản từ Microsoft
Excel hay các hệ cơ sở dữ liệu được lưu trữ trên điện toán đám
mây, Power BI cho phép bạn dễ dàng kết nối với các nguồn dữ
liệu này để xử lý và mô hình hóa dữ liệu của bạn mà không
ảnh hưởng đến nguồn dữ liệu ban đầu và chia sẻ điều đó với
bất kỳ ai. Sản phẩm số của người dùng có thể được chia sẻ với
15. VIỆN DẦU KHÍ VIỆT NAM
13
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
những người dùng Power BI khác trong tổ chức hoặc khách
hàng thông qua nền tảng Power BI Service. Nền tảng Power
BI Service hỗ trợ người dùng trong tổ chức có khả năng cộng
tác để cùng phát triển sản phẩm, đưa sản phẩm cuối hoàn
chỉnh đến với khách hàng ngoài tổ chức thông qua hình thức
nhúng vào các nền tảng khác hoặc một sản phẩm độc lập với
hình thức ứng dụng (Power BI app). Cuốn sách này hướng
dẫn phương pháp để khai thác triệt để tiềm năng của nền
tảng Power BI Service. Để làm được điều đó, một số tính năng
(xây dựng CSDL trên datamart, xây dựng mô hình học máy
tự động AutoML…) yêu cầu người dùng cần được trang bị
license Premium - Premium Per User (PPU).
1.4. Người đọc nhận được những gì?
Sau khi đọc xong cuốn sách, độc giả sẽ được trang bị
những kiến thức sau:
- Cách một công cụ Business Intelligence (BI) thay đổi
cách người dùng khai thác dữ liệu;
- Các loại phân tích dữ liệu trong Business Intelligence
(BI);
- Các khái niệm cơ bản về sản phẩm số;
- Hiểu được quy trình xây dựng các sản phẩm số cơ bản
hướng tới người dùng cuối;
- Nắm bắt cơ bản về mô hình học máy.
Độc giả có thể xây dựng, sáng tạo sản phẩm số từ những
kỹ năng sau:
- Sử dụng các công cụ lưu trữ trên nền tảng Power BI
16. 14
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Service cùng với sự hỗ trợ của Power Query để kết nối các
nguồn dữ liệu và tổ chức dữ liệu cho sản phẩm;
- Sử dụng các biểu đồ trong Power BI để trực quan hóa
và xây dựng các sản phẩm số;
- Ứng dụng tự động hóa cho quá trình cập nhật sản
phẩm;
- Sử dụng tính năng Auto-ML trên nền tảng Power BI
Service để xây dựng sản phẩm phân tích nâng cao có chứa
mô hình học máy;
- Cộng tác xây dựng sản phẩm và chia sẻ sản phẩm tới
những người dùng khác.
1.5. Nội dung của cuốn sách
Cuốn sách được chia thành 2 phần chính: Hướng dẫn
người dùng với nền tảng Power BI Service, áp dụng mô hình
học máy tự động và giới thiệu những sản phẩm số tiêu biểu
ứng dụng trong lĩnh vực dầu khí được các tác giả Bộ phận
Phân tích dữ liệu - Viện Dầu khí Việt Nam xây dựng. Phần 1
tập trung cung cấp cho độc giả các khái niệm lý thuyết, quy
trình thực hiện, các thao tác cơ bản để xây dựng sản phẩm
số và mô hình học máy tự động. Phần 2 đưa ra các ứng dụng
thực tế đã được xây dựng cụ thể để độc giả có thể hình dung
rõ hơn về các nội dung đã được giới thiệu trước đó.
17. VIỆN DẦU KHÍ VIỆT NAM
15
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
1
. https://blogs.gartner.com/jason-mcnellis/2019/11/05/youre-likely-invest-
ing-lot-marketing-analytics-getting-right-insights/
CHƯƠNG 2: BUSINESS INTELLIGENCE
2.1. Tầm quan trọng của Business Intelligence
Business Intelligence (BI) là sự kết hợp của các hoạt động
phân tích kinh doanh, khai thác dữ liệu, trực quan hóa dữ
liệu, công cụ và hạ tầng dữ liệu để hỗ trợ doanh nghiệp đưa
ra quyết định dựa trên dữ liệu (data-driven decision). BI lần
đầu tiên xuất hiện vào những năm 1960 dưới dạng một hệ
thống chia sẻ thông tin nội bộ. Vào những năm 1980, BI tiếp
tục được nâng cấp kết hợp với mô hình máy tính để giúp
doanh nghiệp đưa ra quyết định tốt hơn nhờ biến dữ liệu
thành “Insight” - những hiểu biết sâu sắc hơn. Giải pháp
BI hiện đại ưu tiên tính linh hoạt trong phân tích, quản lý
dữ liệu trên các nền tảng đáng tin cậy, cấp quyền cho người
dùng và nhanh chóng tìm ra “Insight”. BI có thể hỗ trợ doanh
nghiệp đưa ra những quyết định sáng suốt bằng cách so sánh
dữ liệu về hoạt động kinh doanh trong hiện tại và quá khứ.
Các nhà phân tích có thể tận dụng BI để đánh giá về hiệu
suất và đối thủ cạnh tranh, từ đó hỗ trợ doanh nghiệp hoạt
động thuận lợi và hiệu quả hơn; dễ dàng nắm bắt xu hướng
thị trường và thúc đẩy doanh thu. Nếu dữ liệu được sử dụng
hiệu quả, doanh nghiệp sẽ nhận được rất nhiều lợi ích.
2.2. Phân tích Business Intelligence
Để hiểu rõ hơn về BI có thể tận dụng AI như thế nào,
độc giả hãy tham khảo mô hình “Analytical insights model”
được xuất bản bởi Gartner (Hình 2.1)1
.
18. CHƯƠNG 2: BUSINESS INTELLIGENCE
16
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Trong một doanh nghiệp, “Insight” thường được chia
thành 3 nhóm, các nhóm sẽ mang lại những giá trị khác
nhau và tăng dần nhưng kèm theo đó là những yêu cầu
cao hơn về dữ liệu và độ khó. 3 nhóm bao gồm: Hindsight,
Insight, Foresight.
Chức năng cốt lõi của mỗi BI hoặc cơ sở hạ tầng báo cáo
thường theo hướng “Hindsight” và “Insight” bằng cách sử
dụng phương pháp phân tích mô tả (descriptive analytics)
và chẩn đoán (diagnostic analytics) dựa trên dữ liệu quá
khứ. Hai phương pháp này là tối quan trọng đối với tất cả
các phương pháp phân tích. Ngoài ra, còn có 2 phương pháp
phân tích nâng cao hơn là phân tích dự đoán (Predictive
analytics) và phân tích đề xuất (Prescriptive analytics). Các
độc giả tham khảo một số khái niệm cơ bản về các loại phân
tích sau đây để hiểu rõ hơn.
Hình2.1.Cácloại“Insight”vàcácphươngphápphântíchdữliệu.Nguồn:Gartner,2019.
Giá trị
Sự việc đã xảy ra
Sự việc sẽ xảy ra
Làm thế nào
để sự việc sẽ xảy ra
Tại sao xảy ra
Phân tích
mô tả
Phân tích
chẩn đoán
Phân tích
dự đoán
Phân tích
đề xuất
Hindsight Insight Foresight
Độ khó
19. VIỆN DẦU KHÍ VIỆT NAM
17
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Phân tích mô tả (Descriptive analytics)
Phân tích mô tả trả lời câu hỏi về những gì đã xảy ra.
Phân tích mô tả thu thập dữ liệu thô từ nhiều nguồn dữ
liệu để cung cấp chi tiết những thông tin trong quá khứ có
giá trị. Tuy nhiên, những phát hiện này chỉ đơn giản là báo
hiệu và cho biết có điều gì đó sai hoặc đúng mà không giải
thích tại sao. Vì lý do này, các công ty có dữ liệu lớn không
chỉ tự mình sử dụng phân tích mô tả mà còn kết hợp với các
phương pháp phân tích dữ liệu khác.
- Phân tích chẩn đoán (Diagnostic analytics)
Ở giai đoạn này, dữ liệu trong quá khứ có thể được đo
lường dựa trên các dữ liệu khác để trả lời/giải thích những
câu hỏi về lý do/tại sao điều gì đó đã xảy ra. Nhờ phân tích
chẩn đoán, có thể đi sâu vào chi tiết để tìm ra những yếu tố
phụ thuộc và xác định các mô hình.
- Phân tích dự đoán (Predictive analytics)
Phân tích dự đoán cho biết điều gì có khả năng xảy ra.
Nó sử dụng kết quả phân tích mô tả và chẩn đoán để phát
hiện xu hướng trong tương lai. Do đó, phân tích dự đoán trở
thành công cụ để dự báo. Mặc dù phân tích dự đoán mang
lại nhiều giá trị, nhưng cần phải hiểu rằng dự báo chỉ là
ước tính, độ chính xác tùy thuộc vào chất lượng dữ liệu và
tính ổn định của tình huống. Nhờ cách tiếp cận chủ động
của loại phân tích này, doanh nghiệp có thể xác định những
người mua hàng trong tháng tới để tiến hành kích hoạt các
hoạt động tiếp thị nhằm phát triển doanh thu. Hoặc một
20. CHƯƠNG 2: BUSINESS INTELLIGENCE
18
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nhóm quản lý có thể cân nhắc các rủi ro khi quyết định đầu
tư vào việc mở rộng của doanh nghiệp dựa trên phân tích
dòng tiền và dự báo dòng tiền thu được.
- Phân tích đề xuất (Prescriptive analytics)
Phân tích đề xuất là một bước tiến xa hơn phân tích mô
tả và phân tích dự đoán khi đưa ra đề xuất hành động thích
hợp và dự đoán những kết quả có thể xảy ra. Nó trả lời cho
câu hỏi: “Điều gì nên xảy ra?”
Loại phân tích dữ liệu hiện đại này không chỉ yêu cầu
dữ liệu lịch sử mà còn yêu cầu thông tin bên ngoài do bản
chất của thuật toán thống kê. Bên cạnh đó, phân tích đề
xuất sử dụng các công cụ và công nghệ tinh vi như học máy
(Machine Learning), các quy tắc kinh doanh và thuật toán.
Thông thường, có 3 cách để AI có thể tạo ra giá trị cho
BI:
- Tạo “Insight” tự động và thực hiện các phân tích thân
thiện với người dùng;
- Tính toán tốt hơn đối với các dự báo;
- Cho phép hệ thống BI thúc đẩy “Insight” thậm chí đối
với các database không có cấu trúc.
Hình 2.2 thể hiện bức tranh tổng quan về sự hỗ trợ của
AI theo các phương pháp phân tích.
AI hỗ trợ các phương pháp phân tích giúp cho:
• Tự động và dễ dàng sử dụng (Automation and Ease of
Use): Làm cho công cụ BI thông minh hơn và dễ sử dụng
hơn sẽ giúp người dùng dễ tiếp cận hơn, làm giảm khối
21. VIỆN DẦU KHÍ VIỆT NAM
19
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
lượng công việc của các nhà phân tích. Lợi ích này thường
đạt được thông qua quá trình tự động hóa. Ngoài ra, có thể
sử dụng các ngôn ngữ tự nhiên để tương tác với dữ liệu (AI-
powered natural language processing (NLP) technologies),
tổng hợp các kết quả phân tích, tự động tìm ra các dữ liệu
quan trọng, các điểm khó phát hiện trong cơ sở dữ liệu.
• Ứng dụng tốt hơn đối với các dự đoán và dự báo (Better
Forecasting and Predictions): Mặc dù các phân tích mô tả và
chẩn đoán là trung tâm của mọi hệ thống BI, nhưng mong
muốn biết được cái sắp xảy ra cũng là điều nhiều doanh
nghiệp hướng tới, khả năng được tăng cường bởi AI có thể
hỗ trợ người dùng cuối áp dụng các phương pháp phân tích
dự đoán mạnh mẽ để dự báo và dự đoán tốt hơn dựa trên
dữ liệu lịch sử.
Hình2.2. KhảnăngAIhỗtrợtheocácphươngphápphântích.Nguồn:Gartner,2019.
Giá trị
Dự đoán tốt hơn
Tự động và dễ sử dụng
Sự việc đã xảy ra
Phân tích
mô tả
Phân tích
chẩn
đoán
Phân tích
dự đoán
Phân tích
đề xuất
Hindsight Insight Foresight Độ khó
22. CHƯƠNG 3: SẢN PHẨM SỐ
20
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 3: SẢN PHẨM SỐ
3.1. Hiểu rõ về dữ liệu
3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc dữ liệu
Ngày nay, dưới sự phát triển mạnh mẽ của khoa học công
nghệ, ứng dụng của công nghệ thông tin đã lan tỏa mạnh
mẽ vào từng khía cạnh công việc và cuộc sống. Năng lực
tính toán và sức mạnh phần cứng cũng được gia tăng nhanh
chóng. Trên cơ sở đó, việc khai thác cơ sở dữ liệu trong các
doanh nghiệp và hiệu quả mang lại gây ấn tượng không chỉ
với các nhà quản lý mà cả các nhà hoạch định. Các khái
niệm về khoa học dữ liệu, học máy, học sâu hay trí tuệ nhân
tạo ngày càng phổ biến và được ứng dụng rộng rãi trong
nhiều lĩnh vực khác nhau. Cụ thể, theo sau là các khái niệm
cơ bản mà độc giả nên nắm bắt để hiểu và áp dụng triển khai
các sản phẩm số.
3.1.1.1. Khái niệm cơ sở dữ liệu
Theo Từ điển Oxford, cơ sở dữ liệu là một tập hợp có cấu
trúc của dữ liệu được lưu trong máy tính, theo một cách đặc
biệt nào đó có thể được tiếp cận theo những cách khác nhau.
Cơ sở dữ liệu cũng được hiểu là một hệ thống các thông tin
có cấu trúc, được lưu trữ trên các thiết bị lưu trữ nhằm thỏa
mãn yêu cầu khai thác thông tin đồng thời của nhiều người
sử dụng hay nhiều chương trình ứng dụng chạy cùng một
lúc với những mục đích khác nhau.
Từ đó, có thể thấy một số điểm chung của cơ sở dữ liệu
là: Tập hợp thông tin có cấu trúc; được quản lý và duy trì
23. VIỆN DẦU KHÍ VIỆT NAM
21
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
phục vụ khai thác thông tin; có thể phục vụ nhiều đối tượng
khai thác với nhiều cách thức khác nhau; có nhiều giải pháp
khác nhau để xây dựng và quản lý cơ sở dữ liệu. Vì vậy, khi
nói về cơ sở dữ liệu thường trọng tâm nói về thông tin, dữ
liệu được quản lý, lưu trữ và khai thác mà không phải là vỏ
bọc chứa thông tin, dữ liệu.
3.1.1.2. Phân loại cơ sở dữ liệu
Phân loại dữ liệu được hiểu là cách tổ chức dữ liệu thành
các nhóm liên quan để có thể sử dụng và lưu trữ hiệu quả. Ở
mức độ cơ bản, quá trình phân loại dữ liệu chủ yếu đáp ứng
mục tiêu dễ dàng lưu trữ và truy xuất. Việc tổ chức, phân
loại dữ liệu hiệu quả đóng vai trò vô cùng quan trọng trong
công tác quản lý rủi ro, quản trị và bảo mật dữ liệu.
Tùy thuộc vào dạng dữ liệu và mục đích sử dụng mà có
thể áp dụng cách phân loại dữ liệu khác nhau, trong đó có 3
cách phân loại chính:
- Phân loại nội dung (content-based): Dựa vào nội dung
của dữ liệu để phân tách.
- Phân loại bối cảnh (context-based): Dựa vào mục đích
sử dụng dữ liệu.
- Phân loại theo người dùng (user-based): Dựa vào lựa
chọn và mong muốn của người dùng.
3.1.1.3. Mô hình cơ sở dữ liệu
Mô hình cơ sở dữ liệu là tập hợp các cấu trúc logic được
sử dụng để diễn tả cấu trúc dữ liệu và các mối quan hệ dữ
liệu được tìm thấy trong một cơ sở dữ liệu. Xuyên suốt lịch
24. CHƯƠNG 3: SẢN PHẨM SỐ
22
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
sử phát triển của khoa học máy tính, có rất nhiều khái niệm
về mô hình cơ sở dữ liệu. Mỗi mô hình có ưu, nhược điểm
và tính ứng dụng trong một thời điểm nhất định. Với cách
tiếp cận hiện tại, có thể đề cập đến hai mô hình dữ liệu được
ứng dụng phổ biến và rộng rãi là mô hình dữ liệu tập trung
và phi tập trung.
Mô hình dữ liệu tập trung (centralized data)
Hệ thống dữ liệu tập trung là hệ thống mà ở đó tất cả các
thành phần dữ liệu được lưu trữ và quản trị tại một chỗ. Hệ
thống còn được biết đến dưới tên hệ thống cơ sở dữ liệu máy
tính tập trung.
Hệ thống này thường được sử dụng trong các tổ chức,
doanh nghiệp với các nhiệm vụ tập trung, sử dụng kết nối
nội bộ (LAN). Giải pháp tập trung đã chứng minh được
nhiều điểm mạnh, tuy nhiên tồn tại nhiều điểm yếu, có thể
kể đến:
- Ưu điểm:
+ Dễ dàng chia sẻ dữ liệu, tập trung vào các vấn đề cụ
thể;
+ Khả năng bảo mật, tính toàn vẹn của dữ liệu cao;
+ Dung lượng lưu trữ lớn;
+ Dễ dàng truy cập, chỉnh sửa dữ liệu;
+ Chi phí thấp.
- Nhược điểm:
+ Khả năng tùy biến, linh động thấp;
25. VIỆN DẦU KHÍ VIỆT NAM
23
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
+ Xung đột cục bộ có thể dẫn đến gián đoạn toàn cục;
+ Do tất cả dữ liệu được lưu trữ tại một chỗ nên khi có
nhiều truy cập cùng một lúc, có thể xảy ra xung đột.
Mô hình dữ liệu phi tập trung (decentralized data)
Trái ngược với hệ thống cơ sở dữ liệu tập trung, hệ thống
cơ sở dữ liệu phi tập trung không gom dữ liệu về một chỗ
mà cho phép lưu trữ dữ liệu thành các phần khác khau tại
các trạm khác nhau và cung cấp kết nối giữa các trạm. Với
cách xây dựng hệ thống này, các điểm mạnh, yếu cũng được
thể hiện rõ ràng:
- Ưu điểm:
+ Phù hợp với bản chất phân tán của người dùng;
+ Dữ liệu được quản lý tại mỗi trạm địa phương mà
không phụ thuộc vào các trạm khác;
+ Dữ liệu có tính tin cậy cao, dễ dàng khắc phục sự cố
mà không ảnh hưởng đến hệ thống;
+ Hiệu năng cao;
+ Cho phép tổ chức và tùy biến linh hoạt mà không ảnh
hưởng đến các hoạt động sẵn có.
- Nhược điểm:
+ Hệ thống phức tạp;
+ Chi phí cao;
+ Khó khăn hơn trong công tác bảo mật;
+ Khó đảm bảo tính nhất quán của dữ liệu.
26. CHƯƠNG 3: SẢN PHẨM SỐ
24
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu
Dữ liệu dầu khí có tính chất đặc thù và yêu cầu khắt khe
về bảo mật. Do đó các ứng dụng, sản phẩm về dữ liệu cần
phải được trang bị chặt chẽ về việc phân quyền, quản lý truy
cập, xây dựng và quản trị kết nối.
3.2. Sản phẩm số
3.2.1. Khái niệm sản phẩm số
Nhiều công ty sử dụng dữ liệu như một dạng sản phẩm
giúp công ty rút ngắn thời gian làm việc khi áp dụng vào
một chu trình mới. Điều này có thể giúp giảm đến 90% thời
gian và 30% chi phí, đồng thời công tác quản trị rủi ro cũng
được cải thiện đáng kể.
Sản phẩm số cung cấp các giải pháp sẵn có với chất
lượng cao trên nền tảng cơ sở dữ liệu mà tất cả người dùng
trong cùng tổ chức có thể dễ dàng truy cập và sử dụng dễ
dàng.
Sản phẩm số thường nằm ở cuối chu trình lưu trữ, vận
hành dữ liệu, có thể kể đến Data Warehouses hay Data Lake.
Việc sử dụng các sản phẩm số giúp rút ngắn thời gian tìm
kiếm dữ liệu, xử lý định dạng và xây dựng các tập dữ liệu
riêng hay chu trình dữ liệu (data pipeline).
Trong cách tiếp cận truyền thống khi xây dựng giải pháp
dữ liệu, các nhóm phân tích sẽ xác định dữ liệu cần sử dụng
trong kho dữ liệu sau đó tạo ra khối dữ liệu riêng và áp dụng
nó để xây dựng sản phẩm. Phương pháp này tạo thành một
quy trình làm việc lặp đi lặp lại với mỗi sản phẩm và tạo ra
27. VIỆN DẦU KHÍ VIỆT NAM
25
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình3.2.Cấutrúctriểnkhaidạngsảnphẩmsố.Nguồn:HarvardBusinessReview,2022.
Hình3.1.Cấutrúctriểnkhaidữliệutruyềnthống.Nguồn:HarvardBusinessReview,2022.
Hệ thống
ghi nhận
Hệ thống lõi
xử lý
Kho dữ liệu
Hồ dữ
liệu gốc
Dữ liệu
ngoại vi
Dữ liệu không
cấu trúc
Lưu trữ dữ liệu
vận hành
Dữ liệu người dùng
Ứng dụng số
Mảnh ghép số
Báo cáo số
Dữ liệu số
Phân tích số
Nền tảng
dữ liệu
Dữliệuriêngcho
từngdạngsảnphẩm
Côngnghệriêngcho
từngdạngsảnphẩm
Sảnphẩm
số
Hệ thống
ghi nhận
Hệ thống lõi xử lý Kho dữ liệu
Hồ dữ liệu gốc
Dữ liệu ngoại vi
Dữ liệu không
cấu trúc
Lưu trữ dữ liệu
vận hành
Ứng dụng số
Mảnh ghép số
Báo cáo số
Dữ liệu số
Nhà cung cấp
Khách hàng
Lĩnh vực
Sản phẩm/Dịch vụ
Phân phối
Phân tích số
Nền tảng
dữ liệu
Sảnphẩm
số
28. CHƯƠNG 3: SẢN PHẨM SỐ
26
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cấu trúc dữ liệu phức tạp khó thể duy trì và tái sử dụng. Độc
giả có thể tham khảo thêm ở Hình 3.1.
Với cách tiếp cận dạng sản phẩm số, nhóm phát triển sẽ
xây dựng giải pháp nâng chuẩn sản phẩm và đóng gói các
công nghệ với nhau theo các mẫu (consumption archetype
patterns) nhằm tối ưu thời gian làm việc và đạt hiệu quả
cao, tinh giản cấu trúc dữ liệu của doanh nghiệp. Độc giả
có thể tham khảo Hình 3.2 để rõ hơn đối với phương pháp
này.
3.2.2. Phân loại sản phẩm số
Phương pháp tiếp cận dạng sản phẩm số được chia thành
5 dạng chính dựa vào mục đích cuối cùng của sản phẩm.
Bao gồm: Ứng dụng số, Mảnh ghép số, Phân tích số, Báo cáo
số, và Dữ liệu số. Thông tin mô tả các dạng sản phẩm được
thể hiện ở Bảng 3.1.
Trong số các sản phẩm số kể trên, sản phẩm phân tích
số và sản phẩm báo cáo số là những loại sản phẩm khai thác
tối ưu được những tính năng của Power BI Service. Dưới sự
hỗ trợ của API, người dùng cũng có thể xây dựng cho mình
sản phẩm chia sẻ dữ liệu đơn thuần. Ngoài ra, với tính năng
xuất bản ứng dụng cùng với sự kết hợp của công cụ Power
ứng dụng - một công cụ thuộc nền tảng Power Platform của
Microsoft, người dùng chuyên sâu hoàn toàn có thể xuất bản
một sản phẩm ứng dụng số. Độc giả có thể tìm hiểu thêm các
sản phẩm cụ thể theo các nhóm sản phẩm này ở Chương 6:
Các sản phẩm số cho lĩnh vực dầu và khí.
29. VIỆN DẦU KHÍ VIỆT NAM
27
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Bảng3.1.Thôngtincácdạngsảnphẩmsố
STT
Các dạng
sản phẩm
số
Miêu tả
1
Phân tích
số
Phân tích số là dạng sản phẩm hướng
đến cung cấp cho người dùng các
công cụ để tự phân tích, khai phá dữ
liệu hoặc dưới sự hỗ trợ của các nhà
phân tích. Áp dụng các tính năng về
học máy và trí tuệ nhân tạo có thể
được xây dựng và đính kèm sản
phẩm.
2 Báo cáo số
Dạng sản phẩm này yêu cầu dữ liệu
phải có sẵn và được tổng hợp cũng
như làm sạch và phân loại rõ ràng.
Nhà phân tích dữ liệu đóng vai trò
quan trọng trong việc truy xuất dữ
liệu, sử dụng kiến thức chuyên môn
để xây dựng các biểu diễn nhằm
truyền đạt thông tin hiệu quả đến
khách hàng. Bên cạnh đó, công tác
quản trị dữ liệu cần được đề cao với
các nhiệm vụ quản lý dữ liệu gốc, xây
Sản phẩm báo cáo số là một dạng
sản phẩm số đặc trưng cung cấp
thông tin được tổng hợp, phân tích
cho người dùng dưới dạng các bảng
điều khiển (dashboard) hoặc các bản
in (pdf).
30. CHƯƠNG 3: SẢN PHẨM SỐ
28
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
dựng nền tảng kết nối với khách hàng,
phân quyền và bảo mật.
Thông thường, dữ liệu phải được
truyền tải tự động đến khách hàng,
hiện nay các công ty đang hướng đến
xây dựng các mô hình tự phục vụ và
cập nhật dữ liệu liên tục theo thời gian
thực.
3
Mảnh
ghép số
4 Dữ liệu số
Dữ liệu và sản phẩm số trong lĩnh
vực dầu khí là vô cùng đa dạng và
đặc trưng. Để cung cấp giải pháp sử
dụng và kết nối dữ liệu, mảnh ghép
số được cung cấp với điểm mạnh có
thể sử dụng trên nhiều nền tảng, bảo
mật dữ liệu, tối đa hóa khả năng tái
sử dụng. Các sản phẩm mảnh ghép số
bao gồm: Biến đổi dữ liệu, Thuật toán
và Mô hình.
Sản phẩm số hướng đến cung cấp
thông tin về dữ liệu gốc, trong khi
khách hàng là người gửi yêu cầu và
nhận về dữ liệu không kèm với báo
cáo hay phân tích phía sau. Để duy
trì dạng sản phẩm này, nhà quản trị
dữ liệu đóng vai trò quan trọng với
các nhiệm vụ duy trì nền tảng quản lý
cơ sở dữ liệu, cập nhật cơ sở dữ liệu,
cung cấp cổng yêu cầu, tiếp nhận
thông tin truy xuất, lọc và gửi dữ liệu.
31. VIỆN DẦU KHÍ VIỆT NAM
29
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
3.2.3. Quy trình xây dựng sản phẩm số
3.2.3.1. Xác định sơ đồ mô tả vấn đề (Problem statement)
Sơ đồ mô tả vấn đề là miêu tả chính xác về vấn đề cần giải
quyết hay một điều kiện cần cải thiện. Miêu tả này xác định
rõ khoảng cách giữa vấn đề gặp phải với mục tiêu mong
muốn trong quá trình xây dựng sản phẩm. Mục đích chính
của Sơ đồ mô tả vấn đề là chỉ rõ và giải thích vấn đề.
Sơ đồ mô tả vấn đề được sử dụng rộng rãi bởi các doanh
nghiệp và tổ chức để cải thiện các dự án. Một yêu cầu cần
đạt đơn giản và đủ tốt sẽ được cả nhóm sử dụng như kim
chỉ nam để giải quyết các vấn đề gặp phải khi xây dựng sản
phẩm. Sơ đồ mô tả vấn đề cũng cho phép quản trị, làm rõ
Các chính sách về bảo mật và an toàn
dữ liệu cũng cần được đề cao trong
quy trình xây dựng dạng sản phẩm
này.
5
Ứng dụng
số
Sản phẩm ứng dụng số (digital
applications) là dạng sản phẩm cao
cấp nhất trong các sản phẩm số. Sản
phẩm được hoàn thiện, đóng gói và
triển khai đến người dùng cuối như
một ứng dụng thương mại hoàn
chỉnh với các tính năng hoàn chỉnh,
giao diện thân thiện, tối ưu tính toán
và vận hành. Quản lý dữ liệu và cung
cấp luồng dữ liệu cũng được hoàn
thiện chặt chẽ.
32. CHƯƠNG 3: SẢN PHẨM SỐ
30
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình3.4.Phươngpháp,cáchxâydựngsơđồmôtảvấnđề.
Hình3.3.Kháiniệmsơđồmôtảvấnđề.
A PROBLEM
STATEMENT IS A
CUIDING STAR FOR
YOUR CREATIVE
THINKING
Yêu cầu cần đạt của sản phẩm (Problem Statement) là gì?
Tài liệu ngắn gọn mô tả vấn đề và sản phẩm cần đạt
Đề bài toàn diện của bài toán mà dự án cần xử lý
Bước đầu tiên triển khai dự án
ĐẶT CÂU HỎI HIỆU QUẢ
Có thể áp dụng quy tắc 5W1H để tìm hiểu về vấn đề đang gặp phải:
What?Why?When?Where?Who? How?
ĐẶT GIỚI HẠN
Thời gian thực hiện dự án
Các chỉ tiêu cần đạt của sản phẩm
NGẮN GỌN
Cố gắng viết ngắn gọn, rõ ràng, cần chi tiết hơn có thể trao đổi trong các cuộc
họp hoặc trong những tài liệu khác đi kèm
CỐ ĐỊNH PROBLEM STATEMENT
Problem Statement sẽ thay đổi và hoàn thiện dần theo yêu cầu của khách hàng
và khả năng đáp ứng của nhóm phát triển sản phẩm
DÙNG NHIỀU NGÔN NGỮ CHUYÊN MÔN/KỸTHUẬT
Nên đảm bảo mọi nhân sự liên quan của dự án đều có thể hiểu được mà không
nhất thiết phải có hiểu biết sâu về chuyên môn/kỹ thuật
NÊN
KHÔNG NÊN
Cách viết Problem Statement hiệu quả
33. VIỆN DẦU KHÍ VIỆT NAM
31
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
trực diện vấn đề từ đó đưa ra giải pháp thực thi phù hợp cho
toàn bộ dự án. Một điều quan trọng nữa để đạt được điều
này là Sơ đồ mô tả vấn đề cần thật sự rõ ràng và được hiểu
rõ giữa các thành viên trong nhóm thực hiện.
Thông thường, cách tiếp cận sử dụng bộ câu hỏi 5W1H
(Cái gì - Khi nào - Ở đâu - Tại sao - Ai - Như thế nào) thường
được sử dụng trong quá trình xây dựng yêu cầu cần đạt của
sản phẩm. Độc giả tham khảo Hình 3.3, Hình 3.4 và Hình
3.5 để hiểu rõ hơn về khái niệm và cách thức xây dựng và
tiêu chí cần đạt.
3.2.3.2. Cấu trúc 3 lớp của một sản phẩm số (3 layers
architectures)
Một sản phẩm số được đóng gói hoàn thiện là thành quả
của một quá trình làm việc chặt chẽ với sự tham gia của
nhiều nhân sự. Để sản phẩm được dễ hiểu và rõ ràng hơn,
cấu trúc 3 lớp được chỉ ra với các vai trò của sản phẩm ở lớp
Hình3.5.Tiêuchíxâydựng,xácđịnhsơđồmôtảvấnđề.
SMART Problem Statement
SPECIFIC
Cụ thể vấn đề
cần giải quyết
một cách ngắn
gọn, dễ hiểu
MEASURABLE
Định lượng và
định tính đối
với yêu cầu sản
phẩm đầu ra
ACTION
Cần làm gì để
giải quyết vấn
đề?
RELEVANT
So sánh với các
giải pháp đang
có sẵn trên thị
trường
TIMEBOUND
Thời gian dự
kiến giải quyết
vấn đề
34. CHƯƠNG 3: SẢN PHẨM SỐ
32
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
người sử dụng, lớp khám phá, phân tích dữ liệu và lớp tổ
chức dữ liệu.
- Lớp người sử dụng (User layer): Người sử dụng là lớp
đầu tiên trong mô hình cấu trúc 3 lớp. Tại đây yêu cầu của
người dùng được định hình và sản phẩm hay giải pháp cuối
cùng cũng được chỉ ra. Đâu là đầu vào cần phải có để triển
khai được sản phẩm và đâu là sản phẩm mà người dùng hay
khách hàng nhận về sau khi đi qua các bước xử lý trung gian;
- Lớp phân tích (Analysis layer): Là lớp mà người xây
dựng lên sản phẩm số thực hiện các công việc, thao tác liên
quan đến: tạo lập bảng biểu, báo cáo, nghiên cứu insight và
các phân tích chuyên sâu như xây dựng các mô hình dự báo
với machine learning,… Đây là bước quan trọng nhất để tạo
nên sản phẩm số cuối cùng;
- Lớp dữ liệu (Data layer): Lớp dữ liệu đóng vai trò nền
tảng và kết nối giữa người sử dụng và nhà phân tích. Ở lớp
này, các nhiệm vụ liên quan đến luồng dữ liệu, xử lý số liệu
đầu vào, xây dựng cơ sở dữ liệu, lưu trữ dữ liệu, xây dựng
nền tảng, kết nối người dùng, quản lý quyền truy cập được
thực hiện để đảm bảo dữ liệu cho sản phẩm số.
Trên cơ sở các dạng sản phẩm chính được đề cập ở mục
3.2.2, một số biểu mẫu cấu trúc 3 lớp được chỉ ra dưới đây:
Sản phẩm Phân tích số
Sản phẩm phân tích số với mục đích cung cấp các giải
pháp, thông tin phân tích dữ liệu. Sản phẩm tích hợp các
bước xử lý, làm chuẩn và biến đổi dữ liệu theo hướng chuyên
môn để chỉ ra các tri thức cho khách hàng. Bên cạnh đó, sản
35. VIỆN DẦU KHÍ VIỆT NAM
33
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
phẩm áp dụng các ứng dụng của học máy và trí tuệ nhân tạo
để nâng cao chất lượng tri thức. Cấu trúc 3 lớp được mô tả
như sau:
+ Lớp người sử dụng: Lớp người sử dụng cung cấp yêu
cầu về phân tích dữ liệu và nhận về sản phẩm phân tích dữ
liệu đã được xử lý và trình bày, chỉ ra được các yếu tố tri
thức, đặc trưng của dữ liệu.
+ Lớp phân tích: Lớp phân tích đóng vai trò chính trong
việc xử lý, biến đổi dữ liệu, ứng dụng học máy và trí tuệ
nhân tạo để đưa ra kết quả mong muốn. Sản phẩm cuối
được trình bày dưới dạng các báo cáo với mức độ trực quan
hoá tốt, dễ dàng theo dõi và đáp ứng được yêu cầu đặt ra từ
lớp người dùng.
Hình3.6.MôhìnhcấutrúcsảnphẩmPhântíchsố.
Phân tích số
Người sử
dụng
Dữ liệu
Biểu diễn
dữ liệu
Phân tích dữ
liệu
Phân tích
Dự báo dữ liệu
Xây dựng bảng điều khiển
và biểu diễn tri thức,
hiện trạng, dự báo
và giải pháp
Kết quả
Phân tích số
Khai phá
dữ liệu
Dữ liệu hiện
trạng
Ứng dụng học
máy và trí tuệ
nhân tạo
36. CHƯƠNG 3: SẢN PHẨM SỐ
34
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
+ Lớp dữ liệu: Nơi triển khai cấu trúc dữ liệu và lưu trữ
dữ liệu phục vụ cho sản phẩm đến khách hàng.
Sản phẩm Báo cáo số
Báo cáo số cung cấp thông tin dữ liệu dưới các dạng báo
cáo. Với đặc trưng riêng của dạng sản phẩm báo cáo, vai trò
của 3 lớp cấu trúc cụ thể như sau:
+ Lớpngườisửdụng:Gửivàoyêucầucụthểvềdạngthông
tin mong muốn và dạng kết quả nhận về (dạng báo cáo).
+ Lớp phân tích: Tiếp nhận yêu cầu từ người dùng, thu
thập, xử lý dữ liệu và xây dựng sản phẩm cuối là các báo cáo
theo định dạng khách hàng đề nghị.
+ Lớp dữ liệu: Cung ứng các cổng kết nối để tiếp nhận
yêu cầu từ khách hàng, cấp quyền truy cập dữ liệu cho nhà
phân tích, tạo các kết nối của sản phẩm cuối cùng đến người
sử dụng.
Hình3.7.MôhìnhcấutrúcsảnphẩmBáocáosố.
Bảng phân tích
Báo cáo
Khung
sản phẩm
Nền tảng lưu trữ
Cấu trúc dữ liệu
Báo cáo số
Người sử dụng
Phân tích
Dữ liệu
37. VIỆN DẦU KHÍ VIỆT NAM
35
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm Mảnh ghép số
Mảnh ghép số cung cấp giải pháp kết nối mạnh mẽ dưới
sự quản lý hiệu quả. Thay vì xây dựng một sản phẩm với
giao diện hoàn thiện, mảnh ghép số đóng vai trò như một
thành phần của sản phẩm cuối. Các mảnh ghép có thể là dữ
liệu, khả năng phân tích, biểu diễn, thuật toán tối ưu hay các
mô hình chất lượng cao được xây dựng trước. Mỗi thành
phần này có thể được gọi và sử dụng trong các sản phẩm số
khác. Người dùng có thể gửi yêu cầu và nhận về các mảnh
ghép và sử dụng với mục đích riêng.
Mảnh ghép số được phân thành 3 loại chính bao gồm:
Biến đổi dữ liệu, Thuật toán và Mô hình.
Mảnh ghép số dạng Biến đổi dữ liệu: cung cấp công cụ
khai phá dữ liệu, cho phép người dùng có thể khám phá dữ
liệu, tìm hiểu đặc trưng, xử lý dữ liệu với các công cụ được
cung cấp, tích hợp trong mảnh ghép.
Hình3.8.MôhìnhcấutrúcsảnphẩmMảnhghépsố(dạngBiếnđổidữliệu).
Mảnh ghép số
Biến đổi dữ liệu
Người sử dụng
Phân tích
Dữ liệu
Biến đổi dữ liệu Mảnh ghép
số
Giải thích thuật toán,
phương pháp đo lường,
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu đầu vào
Kết quả biến đổi
38. CHƯƠNG 3: SẢN PHẨM SỐ
36
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Mảnh ghép số dạng Thuật toán: cung cấp giải pháp về
thuật toán để tối ưu và giải quyết các bài toán chuyên môn
đặc trưng. Các thuật toán được cung cấp cùng mô tả, giải
thích và cách hoạt động. Các thuật toán cho phép người
Hình3.9.MôhìnhcấutrúcsảnphẩmMảnhghépsố
(dạngthuậttoán).
Mảnh ghép số
Thuật toán
Người sử
dụng
Phân tích
Dữ liệu
Thuật toán Mảnh ghép
số
Giải thích thuật toán
phương pháp đo lường
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu đầu vào
Mô hình và
kết quả dự báo
Hình3.10.MôhìnhcấutrúcsảnphẩmMảnhghépsố
(dạngMôhình).
Mảnh ghép số
Mô hình
Người sử
dụng
Phân tích
Dữ liệu
Mô hình dự báo
Mô hình
huấn luyện trước
Mảnh ghép
số
Giải thích thuật toán
phương pháp đo lường
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu
huấn luyện trước
Dữ liệu đầu vào
Kết quả dự báo
Dữ liệu đầu vào
39. VIỆN DẦU KHÍ VIỆT NAM
37
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
dùng xây dựng mô hình riêng dựa trên dữ liệu riêng. Mô
hình cuối cùng có thể được sử dụng để chuyên biệt và tối ưu
vấn đề riêng của khách hàng.
Mảnh ghép số dạng Mô hình: cung cấp các mô hình được
huấn luyện trước bởi tập dữ liệu mẫu với kết quả dự báo tốt,
có sự tin cậy cao. Việc thực hiện dự báo được tiếp tục trên
tập dữ liệu của người dùng sau khi người dùng ghép nối
mảnh ghép này vào sản phẩm của họ. Việc sử dụng mô hình
dự báo sẵn có giúp tối ưu thời gian và chi phí tuy nhiên cần
xem xét mức độ phù hợp của dữ liệu huấn luyện trước với
dữ liệu riêng của khách hàng.
Sản phẩm Dữ liệu số
Hình3.11.MôhìnhcấutrúcsảnphẩmDữliệusố.
Dữ liệu số
Người sử dụng
Phân tích
Dữ liệu
Nền tảng lưu trữ
Kiểm soát
chất lượng, cập nhật
dữ liệu
Danh mục
dữ liệu
Mô hình dữ liệu
Định nghĩa
dữ liệu
Mô tả dữ liệu
Sharepoint
& DataMart
40. CHƯƠNG 3: SẢN PHẨM SỐ
38
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm hệ thống chia sẻ dữ liệu tập trung vào tính
minh bạch, nguồn gốc của dữ liệu. Sản phẩm cung cấp dữ
liệu gốc, thô chưa qua xử lý.
Vai trò của các lớp trong sơ đồ cấu trúc sản phẩm được
làm rõ như Hình 3.11. Trong đó:
+ Lớp người sử dụng: Gửi yêu cầu dữ liệu theo bảng truy
vấn sẵn có. Thông tin sẽ được gửi đến người quản lý dữ liệu.
+ Lớp phân tích: Không đóng vai trò trong dạng sản
phẩm này do tập trung vào dữ liệu gốc.
+ Lớp dữ liệu: Tiếp nhận truy vấn, truy xuất dữ liệu, cung
cấp nền tảng kết nối và trả về kết quả dữ liệu theo yêu cầu.
Hình3.12.MôhìnhcấutrúcsảnphẩmỨngdụngsố.
Mô hình và
kết quả dự báo
Người sử dụng
Dữ liệu người dùng
Mô tả vận hành
Giải thích thuật toán,
phương pháp đo lường,
hiệu quả thử nghiệm
Mã nguồn
Mô hình
Dữ liệu thời gian thực
Nền tảng đám mây
Dữ liệu
Phân tích
Ứng dụng số Ứng dụng số
41. VIỆN DẦU KHÍ VIỆT NAM
39
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm Ứng dụng số
Sản phẩm ứng dụng số (Hình 3.12) là sản phẩm đặc biệt
kết hợp các tính năng nâng cao. Các ứng dụng số được đóng
gói và phát hành như một phần mềm chuyên dụng, cung
cấp giải pháp tới một số lượng người dùng lớn, dữ liệu đa
dạng. Việc phát triển các ứng dụng số cũng có yêu cầu chặt
chẽ về mặt vận hành và lưu trữ như sử dụng nền tảng tính
toán đám mây, lưu trữ dữ liệu đám mây thời gian thực...
42. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
40
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình4.1.TổngthểcấutrúcnềntảngPowerBI.
Nguồn dữ liệu Power BI Service
Power BI
Truy cập
Power BI Gateways
Tổ chức dữ liệu
Kết nối
Publish
Power BI Desktop
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ
TRÊN NỀN TẢNG POWER BI SERVICE
4.1. Tại sao sử dụng Power BI Service?
Như đã đề cập ở phần mở đầu, cuốn sách chủ yếu tập
trung giới thiệu đến bạn đọc công cụ Power BI trên nền tảng
Power BI Service (https://app.powerbi.com), hoàn toàn nằm
trên cloud. Vậy Power BI có thể hoạt động trên những nền
tảng nào, và tại sao lựa chọn Power BI Service?
Power BI hoạt động trên 3 nền tảng cơ bản:
- Ứng dụng trên máy tính cá nhân, chỉ với hệ điều hành
Windows được gọi là Power BI Desktop.
- Dịch vụ phần mềm trực tuyến dưới dạng SaaS (phần
mềm dạng dịch vụ dựa trên đám mây) được gọi là Power BI
Service.
- Ứng dụng Power BI Mobile dành cho thiết bị di động
Windows, iOS và Android.
43. VIỆN DẦU KHÍ VIỆT NAM
41
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Trong quy trình làm việc Power BI điển hình, người dùng
bắt đầu bằng cách xây dựng sản phẩm số dưới dạng Power
BI Report trong Power BI Desktop, sau đó xuất bản báo cáo
đó lên Power BI Service. Tuy nhiên, nhờ có sự hỗ trợ của
datamart (Tham khảo mục 4.2.4) các tính năng của Power
BI Service đã dần tiệm cận đến Power BI Desktop và trở nên
mạnh hơn với tính năng cộng tác và chia sẻ mà phiên bản
trên máy tính không hỗ trợ.
Việc xây dựng, cộng tác và chia sẻ các sản phẩm số được
diễn ra trong không gian làm việc chung, gọi là workspace
(Tham khảo mục 5.1). Sau khi tạo report và dashboard,
người dùng có thể chia sẻ các sản phẩm số của mình. Người
dùng cuối trong Power BI Service và thiết bị di động thông
qua Power BI Mobile App có thể xem và tương tác với các
sản phẩm này. Power BI Service cho phép người tạo ra sản
phẩm kiểm soát tính năng và phạm vi chia sẻ của các sản
phẩm bằng hệ thống phân quyền và nhúng. Trong phạm vi
của cuốn sách này, nhóm tác giả sẽ đưa ra một quy trình xây
dựng sản phẩm số hoàn chỉnh và sau đó, hướng dẫn về việc
duy trì, chia sẻ và cách phân phối sản phẩm số tới người
dùng cuối cùng. Để thực hiện được quy trình theo hướng
dẫn của cuốn sách yêu cầu người dùng cần có license Power
BI Premium - cụ thể với nhóm tác giả là Premium Per User
(PPU).
Bên cạnh đó, một tính năng vượt trội của Power BI
Service là hỗ trợ tối ưu việc tự động hóa, qua đó duy trì kết
nối và cập nhật với các nguồn dữ liệu cũng như khả năng kết
44. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
42
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
hợp với Power Automate để xây dựng một chu trình báo cáo
tự động hoàn chỉnh hoặc ứng dụng người dùng. Cuốn sách
sẽ đề cập đến tính năng schedule refresh như một tính năng
chính để hoàn thiện chu trình báo cáo tự động cập nhật dữ
liệu (Tham khảo mục 4.5).
Tóm lại, Power BI Service được lựa chọn để giới thiệu
trong cuốn sách này bởi những ưu điểm sau:
- Hoàn toàn trên cloud (đối với người dùng có license
PPU): Người dùng có thể xây dựng, chỉnh sửa, chia sẻ sản
phẩm ở bất cứ đâu, không bị phụ thuộc vào máy của người
dùng nên trải nghiệm xây dựng sản phẩm tốt hơn mà không
cần cài đặt. Hoàn toàn thích hợp với những người dùng
không sử dụng hệ điều hành Windows nhưng vẫn muốn sử
dụng Power BI.
- Hỗ trợ tối ưu cộng tác giữa những người dùng xây
dựng sản phẩm và chia sẻ tới người dùng cuối cùng với hình
thức đa dạng (nhúng web, app…)
- Hỗ trợ tối ưu các thao tác tự động hóa (tự động cập
nhật dữ liệu, tạo app tương tác với người dùng cuối).
- Tận dụng triệt để tài nguyên được xây dựng đối với
Power BI: Khả năng lưu trữ dữ liệu lớn của datamart, tính
năng AutoML của dataflow…
4.2.CôngcụchotổchứcdữliệutrênnềntảngPowerBIService
4.2.1. Power Query
Power Query được xem như một công cụ vạn năng được
tích hợp cùng với Power BI, với những tính năng hỗ trợ
45. VIỆN DẦU KHÍ VIỆT NAM
43
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
người dùng làm sạch và chuẩn bị dữ liệu cho quá trình xây
dựng sản phẩm số, xử lý đối với định dạng dữ liệu, biến đổi
hoặc xoay chiều dữ liệu… và những thao tác nâng cao đối
với dữ liệu. Power Query như một cầu nối giữa sản phẩm
số của người dùng với đa dạng các nguồn dữ liệu trên máy
tính cá nhân (on-premise) và trên mây (on cloud). Sau khi
dữ liệu được chuẩn bị tốt, dữ liệu được tải vào sản phẩm số
dưới dạng bảng biểu. Sau đó, bất cứ khi nào dữ liệu được cập
nhật, người dùng có thể refresh và các thao tác xử lý dữ liệu
trước đó được áp dụng tự động trên cả dữ liệu mới.
Trong phạm vi cuốn sách này, nhóm tác giả giới thiệu
các tính năng của Power Query trong từng trường hợp cụ
thể cùng với một số nguồn dữ liệu phổ biến kết hợp với các
nền tảng lưu trữ dữ liệu như SharePoint Online, Dataverse
và Datamart. Các nguồn dữ liệu có đặc điểm chung là đều ở
trên Cloud để đảm bảo không phụ thuộc vào máy tính của
người dùng.
Người dùng sẽ được thao tác với Power Query trong tính
năng khởi tạo Datamart và Dataflow của Power BI Service.
Nhìn chung, quy trình thao tác làm việc với Power Query
trong các nền tảng Power BI tương tự nhau, bao gồm 4 bước
chính (Hình 4.2).
Các cấu phần chính của Power Query bao gồm:
- Lấy dữ liệu và các kết nối;
- Các bảng điều khiển trong Power Query Editor;
- Cài đặt với Power Query.
46. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
44
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Với Power Query trong Power BI Service, người dùng sẽ
thực hiện bước đầu tiên với phần lấy dữ liệu và kết nối. Ở
phần này, người dùng có quyền lựa chọn loại nguồn dữ liệu
(loại kết nối), khai báo địa chỉ dẫn tới dữ liệu, khai báo bảo
mật đối với nguồn dữ liệu và lựa chọn hình thức tải dữ liệu
(chi tiết các nguồn kết nối được thể hiện ở Hình 4.3). Độc
giả tham khảo ở Chương 7 (Mục 7.1 Hướng dẫn thực hiện
một số loại kết nối dữ liệu) để được hướng dẫn chi tiết các
cách kết nối nguồn dữ liệu khác nhau.
Hình4.3.CửasổlựachọnnguồndữliệucủaPowerQuery.
Hình4.2.CácbướccơbảnđểlàmviệcvớiPowerQuery.
Lựa chọn nguồn
dữ liệu và khai báo
bảo mật nguồn
dữ liệu
Lựa chọn dữ liệu
Xử lý và biến đổi
dữ liệu cho báo
cáo
Tải dữ liệu cuối
cho báo cáo
47. VIỆN DẦU KHÍ VIỆT NAM
45
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sau khi hoàn thành kết nối dữ liệu, người dùng sẽ làm
việc với các bảng điều khiển chính trong Power Query
Editor, được thể hiện ở Hình 4.4.
- Preview Pane (Khu vực xem trước): cho phép xem
trước kết quả của các bước thao tác với dữ liệu, đồng thời
cho phép thực hiện một số thao tác tắt đối với dữ liệu. Đối
với dữ liệu lớn, khu vực xem trước chỉ hiển thị một phần
giới hạn của bộ dữ liệu.
- Ribbons (Khu vực thao tác): Bao gồm các thao tác biến
đổi hoặc áp dụng với toàn bộ dữ liệu được lựa chọn. Trong
đó:
• Tab File: Các thao tác lưu dữ liệu vào báo cáo, đóng
Power Query Editor, mở Query Options hoặc mở cài đặt
Data Source Setting
• Tab Home: Một số bước chuyển đổi phổ biến nhất như:
Hình4.4.CácbảngđiềukhiểnchínhtrongPowerQueryEditor.
Query
Pane
Formular Bar
Preview Pane
Ribbons
Query
settings
Applied
Steps
48. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
46
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
chọn cột, xóa cột, giữ hàng và xóa hàng, đưa thêm nguồn dữ
liệu mới vào báo cáo
• Tab Transform: Cho phép sử dụng chuyển đổi trên các
cột đã chọn. Phụ thuộc vào kiểu dữ liệu của cột, một số lệnh
sẽ được bật hoặc tắt. Trong tab này, người dùng có thể sử
dụng một số phép biến đổi như nhóm hàng dữ liệu theo điều
kiện nhất định, xoay chiều bảng, định dạng hoặc làm sạch cột
dữ liệu, pitvot/unpivot bảng, một số bước tính toán cơ bản...
+ Tab Add Column: Cho phép người dùng thêm cột dữ
liệu mới vào bảng theo một số quy tắc nhất định như đặt
điều kiện, tính toán, trích xuất từ cột cũ…
+ Tab View: Lựa chọn hiển thị đối với Power Query
Editor
- Query Pane (Khu vực danh sách các query trong báo
cáo) bao gồm các bảng dữ liệu đang được làm việc trong báo
cáo. Ở khu vực này người dùng có thể chỉnh sửa, tạo bảng
mới bằng cách sao chép hoặc tham chiếu từ các bảng khác,
lựa chọn tải/không tải dữ liệu của bảng vào báo cáo…
- Query Settings: Khu vực đổi tên và một số cài đặt
chung đối với bảng truy vấn được lựa chọn
- Applied Steps: Khu vực xem lại các bước biến đổi đối
với bảng dữ liệu. Ở đây các thao tác tạo thành một chuỗi các
hành động có thứ tự trước sau. Bất cứ lúc nào người dùng
cũng có thể quay lại các bước trước đó và thay đổi thao tác.
Kết quả cuối cùng cũng sẽ thay đổi
- Formula Bar: Nơi hiển thị công thức tương đương với
49. VIỆN DẦU KHÍ VIỆT NAM
47
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
các bước biến đổi đối với dữ liệu. Công thức này cũng có
thể được xem tại Advanced Editor. Ngôn ngữ được sử dụng
trong Power Query là M Query
Các cài đặt chung đối với Power Query trong Power BI
được tìm thấy trong Query Option (Tab Home). Tại đây,
người dùng có thể lựa chọn Project options đối với những
báo cáo riêng biệt, hoặc Global options để áp dụng cho tất
cả các báo cáo.
4.2.2. Dataset
Dataset trong Power BI Service là một tập hợp các
bảng dữ liệu từ các nguồn (data sources) khác nhau như
Excel, Sharepoint, SQL Server... được import hoặc kết nối
(connect) với Power BI (Hình 4.7).
Đặc điểm chính của Dataset:
- Mỗi Dataset luôn được liên kết (associated) với ít nhất
1 workspace;
- Một Dataset có thể được sử dụng cho nhiều workspace
khác nhau;
Hình4.5.Tùychỉnhcàiđặtriêngcho
từngdựán.
Hình4.6.Tùychỉnhcàiđặtchung.
50. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
48
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Từ một Dataset, có thể tạo ra nhiều report/dashboard
có nội dung (content) khác nhau;
- Dataset có thể tự động cập nhật dữ liệu mới (refresh)
theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real-
time).
Cách tạo Dataset
Trong Power BI Service, có 5 cách để tạo 1 Dataset như sau:
- Upload 1 file Excel hoặc CSV;
- Upload 1 file Power BI Desktop (.pbix);
- Kết nối với một mô hình dữ liệu (data model) có sẵn từ
nguồn bên ngoài Power BI;
- Sử dụng API (push dataset);
- Kết nối với các dữ liệu thời gian thực (real-time data).
Hình4.7.GiaodiệnDatasettrongPowerBIService.
51. VIỆN DẦU KHÍ VIỆT NAM
49
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Các bước tạo Dataset độc giả tham khảo ở Chương 7 (Mục
7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
4.2.3. Dataflow
Dataflow là quá trình trích xuất dữ liệu từ một hoặc nhiều
nguồn khác nhau, sau đó làm sạch, biến đổi và lưu lại kết quả
thành một tập hợp các bảng dữ liệu trong Workspace của
Power BI Service. Các bảng dữ liệu này sau đó được dùng để
tạo các Dataset, Datamart hoặc sử dụng để xây dựng các mô
hình học máy trong Power BI (Hình 4.8).
Đặc điểm chính của Dataflow:
- Dataflow được thiết kế để có thể tái sử dụng nhiều
lần cho nhiều Dataset, người dùng chỉ cần tải dữ liệu từ
Dataflow mà không cần kết nối trực tiếp đến nguồn (Data
source), do đó giảm thiểu nhu cầu tạo các kết nối riêng biệt
tới nguồn dữ liệu và giảm tải cho hệ thống hạ tầng dữ liệu.
Hình4.8.Tổngquankiếntrúcdataflow.Nguồn:Microsoft,2023.
52. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
50
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Do người dùng có thể xây dựng Dataset/Datamart từ
Dataflow mà không cần kết nối trực tiếp với nguồn dữ liệu
(Data source), quản trị viên sẽ dễ dàng hơn trong việc quản
lý và tăng cường bảo mật cho hệ thống bằng cách chỉ cho
phép người dùng tải dữ liệu từ Dataflow thay vì trực tiếp từ
Data source. Khi đó quản trị viên chỉ cần kiểm soát quyền
truy cập của người dùng đối với Dataflow là đủ để bảo mật
cho hệ thống.
- Dataflow có thể tự động cập nhật dữ liệu mới (refresh)
theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real-
time).
Các bước tạo Dataflow độc giả tham khảo ở Chương 7
(Mục 7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
4.2.4. Datamart
Datamart là một công cụ lưu trữ dữ liệu trên nền tảng
Power BI Service dưới dạng SQL database. Trong phạm vi
cuốn sách này, nhóm tác giả sử dụng Datamart là nơi lưu
trữ dữ liệu cho tất cả các sản phẩm được xây dựng trên nền
tảng.
Như đã đề cập, Datamart trong Power BI là một cơ sở dữ
liệu quan hệ (relational database) gồm một tập hợp các bảng
dữ liệu phục vụ một nghiệp vụ (business) cụ thể, được xây
dựng bằng cách tổng hợp dữ liệu từ nhiều nguồn khác nhau,
sau đó được làm sạch, xử lý và biến đổi bằng Power Query
và tải lên Azure SQL Database - Là dịch vụ cơ sở dữ liệu
trên nền tảng đám mây (cloud database) của Microsoft. Trên
53. VIỆN DẦU KHÍ VIỆT NAM
51
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Datamart, ta có thể tạo quan hệ (relationship) giữa các bảng,
ta cũng có thể truy vấn (query) dữ liệu trong Datamart bằng
T-SQL.
Toàn bộ quá trình ETL để xây dựng Datamart được
thực hiện trên nền tảng đám mây và công cụ ETL được tích
hợp sẵn trong Power BI Service. Ngay sau khi được tạo,
Datamart sẽ tự động sinh ra một Dataset tương ứng, ta có
thể dùng Dataset này để tạo các Reports hoặc Dashboards
theo nhu cầu.
Ưu điểm của Datamart:
- Cách tạo đơn giản, dễ dàng, quen thuộc với người
dùng Excel và Power BI với công cụ Power Query;
- Tích hợp tính năng kết nối nhiều nguồn dữ liệu khác
nhau và xử lý dữ liệu với giao diện không cần sử dụng code;
- Dung lượng lưu trữ lớn, lên đến 100 GB/Datamart;
- Tích hợp tính năng schedule refresh hỗ trợ khả năng
tự động cập nhật dữ liệu;
- Được xây dựng hoàn toàn dựa trên nền tảng web,
không cần cài đặt thêm bất cứ phần mềm hay công cụ nào
trên máy tính của người dùng;
- Được lưu trữ trên Azure SQL Database - Dịch vụ cơ
sở dữ liệu đám mây của Microsoft trong đó Microsoft chịu
trách nhiệm quản lý, cài đặt, cấu hình, bảo mật và bảo trì hệ
thống, người dùng chỉ cần xây dựng và khai thác sử dụng
Database của mình mà không cần quan tâm đến các công
việc khác liên quan đến hạ tầng;
54. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
52
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Hỗ trợ truy vấn bằng T-SQL;
- Người dùng có thể tạo mối quan hệ (relationship) giữa
các bảng trực tiếp trên Datamart với các thao tác kéo - thả
mà không cần phải thực hiện thêm bất kỳ công cụ nào khác.
Phạm vi ứng dụng
Datamart được Microsoft đưa ra để phục vụ cho những
khách hàng cần quản lý dữ liệu theo kiểu kiến trúc phân
tán, theo đó dữ liệu được chia nhỏ và xây dựng thành các
Database tương ứng các lĩnh vực/nghiệp vụ của tổ chức (ví
dụ dữ liệu trong một tổ chức được chia và quản lý theo các
nghiệp vụ tương ứng với các bộ phận như: Nhân sự, kế toán,
kinh doanh,…) thay vì được đưa vào quản lý tập trung trong
một Data Warehouse duy nhất cho toàn bộ tổ chức. Mỗi
bộ phận (nhân sự, kế toán, kinh doanh,…) sẽ tự xây dựng
Database của riêng mình để khai thác và sử dụng và được
gọi là các Datamart.
Việc quản lý dữ liệu theo kiểu phân tán như trên sẽ giúp
các bộ phận nghiệp vụ chủ động trong việc tự xây dựng cơ
sở dữ liệu phù hợp với đặc thù hoạt động của mình, linh
hoạt và kịp thời, giúp giảm thiểu thời gian trong việc cập
nhật các dữ liệu mới cũng như điều chỉnh/thay đổi cơ sở
dữ liệu theo nhu cầu và thực tế công việc mà không phụ
thuộc vào Bộ phận khác (ở đây là Bộ phận IT quản lý Data
Warehouse chung nếu có).
Trong cuốn sách này, nhóm tác giả khuyến khích người
dùng sử dụng Datamart như là nơi tập hợp dữ liệu từ các
55. VIỆN DẦU KHÍ VIỆT NAM
53
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nguồn dữ liệu khác nhau và tổ chức thành bộ dữ liệu làm
nền tảng cho sản phẩm dữ liệu của mình.
Các bước tạo Datamart được thể hiện ở Chương 7 (Mục
7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
Một số điểm cần lưu ý:
- Để có thể tạo được Datamart, người dùng phải có tài
khoản Power BI Premium;
- Datamart là sản phẩm mới đang trong giai đoạn thử
nghiệm nên một số chính sách hiện tại có thể thay đổi.
4.3. Trực quan hóa dữ liệu
4.3.1. Khái niệm trực quan hóa dữ liệu
Trực quan hóa dữ liệu là quá trình sử dụng các công cụ
và kỹ thuật để biểu diễn dữ liệu dưới dạng hình ảnh, đồ
thị, bản đồ hoặc các hình dạng khác. Mục đích của việc
trực quan hóa dữ liệu là giúp người dùng dễ dàng hiểu
và phân tích dữ liệu, giúp cho việc đưa ra quyết định và
lựa chọn thông minh hơn. Có nhiều loại khác nhau của
trực quan hóa dữ liệu, chẳng hạn như biểu đồ cột, biểu
đồ đường, biểu đồ hình tròn, biểu đồ dạng lưới, bản đồ
vị trí, mỗi loại có ưu và nhược điểm khác nhau tùy thuộc
vào loại dữ liệu và những thông tin mà người dùng muốn
truy xuất.
4.3.2. Tầm quan trọng của trực quan hóa dữ liệu
Mục tiêu chính của việc biểu diễn dữ liệu là làm cho dữ
liệu phức tạp trở nên dễ hiểu hơn và dễ dàng truy cập hơn
56. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
54
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cho đối tượng rộng hơn, bằng cách nhấn mạnh xu hướng và
khám phá dữ liệu mà không cần phải nhìn vào dữ liệu gốc.
Trực quan hóa dữ liệu là cách nhanh chóng và dễ dàng để
truyền đạt các khái niệm cho người dùng cuối. Các nền tảng
thông minh như Power BI giúp xử lý các hình ảnh trực quan
khác nhau của các bộ dữ liệu một cách an toàn. Cụ thể hơn,
đối với Power BI:
- Khám phá dữ liệu: Power BI cho phép người dùng
khám phá dữ liệu từ nhiều nguồn và tạo ra các biểu đồ tương
tác, chẳng hạn như biểu đồ, bản đồ và bảng, giúp người dùng
xác định các mẫu, xu hướng và ngoại lệ trong dữ liệu.
- Phân tích dữ liệu: Power BI cung cấp một loạt các tùy
chọn biểu diễn dữ liệu, chẳng hạn như drill-through, lọc và
cắt, giúp người dùng thực hiện phân tích sâu hơn và nhận ra
các khám phá dữ liệu.
- Chia sẻ dữ liệu: Power BI cho phép người dùng tạo
các bảng điều khiển và báo cáo tương tác có thể chia sẻ với
người khác, giúp dễ dàng chia sẻ các kết quả, kết luận và dự
báo về dữ liệu.
4.3.3. Các dạng biểu diễn cơ bản trong Power BI
Trong Power BI, có nhiều dạng biểu diễn mà độc giả có
thể sử dụng để biểu diễn. Tuy nhiên, việc lựa chọn đúng biểu
đồ để biểu diễn dữ liệu cũng rất quan trọng để đáp ứng các
yêu cầu và chiến lược của doanh nghiệp. Độc giả cần biết
được cái mình muốn thể hiện là gì?
Trên nền tảng Power BI Service, độc giả có thể lựa chọn
57. VIỆN DẦU KHÍ VIỆT NAM
55
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nhiều dạng biểu đồ cơ bản ở tab “Visualizations” được thể
hiện ở Hình 4.9.
Các dạng biểu đồ cơ bản bao gồm Area Charts, Line
Charts, Bar Charts, Combo Charts, Pie Charts, Doughnut
Charts, Gauge Charts, Scatter Charts, Tables... Tham khảo
Chương 7 (Mục 7.3 để biết thêm thông tin chi tiết).
Để tạo biểu đồ trên Power BI, độc giả có thể thực hiện
theo các bước cơ bản sau:
- Bước 1: Mở và đăng nhập Power BI service theo đường
link sau: https://powerbi.microsoft.com;
- Bước 2: Tổ chức và Nhập bảng dữ liệu (độc giả tham
khảo mục 4.2);
- Bước 3: Trong phần "Visualizations" chọn loại Chart
phù hợp;
- Bước 4: Kéo và thả dữ liệu cần tạo biểu đồ vào tương
ứng các trục X,Y;
Hình4.9.CácdạngbiểuđồtrênnềntảngPowerBI.
58. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
56
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Bước 5: Sử dụng công cụ "Format" để thay đổi màu sắc,
kích thước... của biểu đồ;
- Bước 6: Sử dụng công cụ "View" để xem và chỉnh sửa
biểu đồ;
- Bước 7: Lưu và chia sẻ biểu đồ với người khác.
4.3.4. Trực quan hóa dữ liệu nâng cao
4.3.4.1. Biểu diễn bản đồ
Bên cạnh các biểu diễn mạnh mẽ về bảng biểu, cột,
đường, Power BI cũng được tích hợp nhiều giải pháp biểu
diễn thông tin trên bản đồ nhằm đáp ứng nhu cầu đa dạng
của người dùng. Các công cụ biểu diễn bản đồ tập trung làm
nổi bật đặc điểm, vị trí của đối tượng trên nền bản đồ khu
vực và thế giới. Power BI cung cấp rất nhiều công cụ biểu
Hình4.10.CáccôngcụbiểudiễnbảnđồtrongPowerBI.
59. VIỆN DẦU KHÍ VIỆT NAM
57
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
diễn dữ liệu lên bản đồ khác nhau. Mỗi công cụ có đặc điểm
riêng phù hợp với yêu cầu của người dùng. Các loại biểu
diễn bản đồ được thể hiện ở Hình 4.10.
Để tìm hiểu chi tiết cách thức xây dựng biểu đồ, bản đồ,
độc giả tham khảo Chương 7 (Mục 7.4. Cách triển khai áp
dụng biểu đồ bản đồ nâng cao).
4.3.4.2. Biểu diễn nâng cao với code Python
Bên cạnh các tác vụ biểu diễn được tích hợp sẵn hoặc cài
đặt từ thư viện mở rộng, Microsoft còn cho phép người dùng
tùy biến mạnh mẽ với code. Ngôn ngữ R và Python được hỗ
trợ trong nội dung này. Các biểu diễn với code nhằm đáp
ứng các biểu diễn nâng cao theo nhu cầu của người dùng.
Tính năng yêu cầu người dùng phải có khả năng làm
việc với code. Trong phạm vi bài viết, hướng dẫn chi tiết về
Hình4.11.BiểudiễnđườngđoghigiếngkhoanbằngtínhnăngcodePythonVisual.
60. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
58
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình4.12.Biểudiễncross-plotvàcodemẫu.
Hình4.13.Biểudiễndạngđườngvàcodemẫu.
Hình4.14.Biểudiễnnhiềutươngquanchéocùnglúc.
61. VIỆN DẦU KHÍ VIỆT NAM
59
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cách sử dụng ngôn ngữ Python để biểu diễn dữ liệu trong
dashboard Power BI tham khảo Chương 7 (Mục 7.5. Cách
triển khai áp dụng biểu diễn nâng cao kết hợp với Python).
Lưu ý, để sử dụng visual với code Python, người dùng phải
sử dụng Power BI Desktop. Power BI Service hiện chưa có
tính năng này. Một số mẫu sản phẩm biểu diễn nâng cao kết
hợp Python được thể hiện trong Hình 4.11 - 4.15.
4.4. Auto Machine Learning (AutoML) – Học máy tự động
4.4.1. Học máy/Học máy tự động là gì?
Học máy (Machine Learning)
Những năm gần đây khái niệm học máy đã dần trở nên
quen thuộc với cộng đồng công nghệ, với những lợi ích của
học máy đem lại trong việc giải quyết các bài toán trong thực
Hình4.15.Biểudiễnđườngđoghigiếngkhoanvàcodemẫu.
62. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
60
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
tế. Hiểu đơn giản Học máy (machine learning - ML) là một
lĩnh vực nhỏ của khoa học máy tính, có khả năng tự học
hỏi dựa trên dữ liệu được đưa vào mà không cần phụ thuộc
vào việc lập trình cụ thể và dựa trên đó đưa ra những quyết
định, dự báo và điều khiển.
Mô hình học máy có 2 loại chính là học có giám
sát (suppervised learning) và học không có giám sát
(unsupervised learning).
Học máy tự động (Automated Machine Learning)
Học máy tự động hay còn được sử dụng như là “AutoML”
là một quá trình tự động thực hiện các tác vụ mất nhiều thời
gian lặp đi lặp lại trong quá trình phát triển mô hình học
máy. Công cụ cho phép các nhà khoa học dữ liệu, phân tích
và các nhà phát triển xây dựng các mô hình học máy với
lượng dữ liệu lớn, hiệu suất và năng suất cao trong khi đó
vẫn duy trì được chất lượng mô hình. AutoML sẽ đơn giản
hóa các quy trình của việc phát triển các mô hình học máy,
không phụ thuộc quá nhiều vào kinh nghiệm của những
chuyên gia khoa học dữ liệu, để xác định bất kỳ những vấn
đề nào gặp phải xuyên suốt từ bước đầu đến bước cuối trong
quá trình xây dựng mô hình. AutoML được chia thành 4
loại chính theo nhu cầu sử dụng:
- Loại 1: Triển khai các giải pháp học máy không cần có
kiến thức sâu.
- Loại 2: Tiết kiệm thời gian và nguồn lực.
- Loại 3: Tận dụng các công nghệ mới nhất để phục vụ
công việc.
63. VIỆN DẦU KHÍ VIỆT NAM
61
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Loại 4: Khả năng giải quyết vấn đề nhanh chóng.
4.4.2. Automated Machine Learning (AutoML) trong Power BI
AutoML được xây dựng với mục đích giúp người dùng
Power BI, có hoặc không có chuyên môn về khoa học dữ
liệu có thể tạo ra các mô hình dự đoán hoặc phân loại dữ
liệu dễ dàng và nhanh chóng. Tính năng này giúp tự động
hóa quá trình xây dựng các mô hình Machine Learning trực
tuyến, cho phép thử nghiệm với số lượng lớn dữ liệu.
Bên cạnh các sản phẩm Machine Learning khác trong
Power BI được xây dựng trên nền tảng Azure, nhóm tác giả
tập trung giới thiệu công cụ Auto ML thông qua Dataflow
trong Power BI Service trên nền tảng đám mây. AutoML
trong Power BI được gắn kết với AutoML từ nền tảng học
máy Azure để khởi tạo các mô hình học máy do người dùng
yêu cầu. Tuy nhiên, người dùng sẽ không cần phải đăng
nhập Azure để có thể sử dụng AutoML trên Power BI. Quá
trình huấn luyện và lưu trữ các mô hình học máy được quản
lý hoàn toàn bởi nền tảng của Power BI.
AutoML cho phép người dùng tận dụng các dữ liệu sẵn
có hoặc bên ngoài để xây dựng các mô hình học máy, ngay
trên nền tảng Power BI Service. Với AutoML, việc tạo lập
các mô hình học máy rất trực quan và hiện hoàn toàn tự
động và được giám sát để có thể đảm bảo chất lượng mô
hình, người dùng hoàn toàn có thể hiểu và nắm được toàn
bộ các bước tạo ra mô hình học máy.
Các tính năng chính của AutoML trên Power BI Service
bao gồm:
64. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
62
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Tự động phát hiện các mẫu dữ liệu và loại bỏ các giá trị
bị khuyết hoặc không hợp lệ;
- Tự động chọn mô hình phù hợp nhất trong khoảng
thời gian cho phép để huấn luyện trên dữ liệu của bạn;
- Tự động tinh chỉnh các siêu tham số của mô hình để
tối ưu hóa hiệu suất dự đoán;
- Tự động chạy nhiều mô hình khác nhau và so sánh
hiệu suất của chúng để chọn ra mô hình tốt nhất;
- Tự động tạo ra các biểu đồ và báo cáo phân tích để
giúp người dùng dễ dàng hiểu kết quả của mô hình.
Quy trình xây dựng một mô hình học máy AutoML bắt
đầu bằng việc người dùng lựa chọn các dữ liệu mong muốn
đưa vào xây dựng mô hình học máy, sau đó AutoML sẽ thực
hiện tự động phân chia dữ liệu cho việc huấn luyện và đánh
Hình4.16.QuytrìnhthựchiệnxâydựngmôhìnhhọcmáytrongPowerBI.
65. VIỆN DẦU KHÍ VIỆT NAM
63
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
giá dữ liệu và lựa chọn thuật toán để xây dựng mô hình huấn
luyện. Trong quá trình huấn luyện, AutoML sẽ lựa chọn
những thuật toán phù hợp nhất, đồng thời tối ưu và đánh
giá mô hình học máy. Sau khi huấn luyện xong AutoML sẽ
tự động thành lập các báo cáo tự động, để giải thích và phân
tích kết quả. Ngoài ra, người dùng có thể cải thiện và thực
hiện lại việc huấn luyện mô hình thông qua dữ liệu ban đầu
hoặc dữ liệu mới được cập nhật thêm. Và cuối cùng, hoàn
toàn có thể áp dụng dễ dàng cho việc dự đoán đối với nhóm
dữ liệu mới. Quy trình thực hiện xây dựng mô hình học máy
được thể hiện ở Hình 4.16.
4.4.2.1. Khởi tạo tính năng AutoML trong Power BI
Để người dùng có thể sử dụng Auto ML trong Power BI
người dùng cần phải nâng cấp lên tài khoản cao cấp. Các tác
vụ từ các dự án khác nhau sẽ độc lập với nhau về tác vụ thực
hiện.
Người dùng cần phải được khởi tạo “Capacity workload”
trước khi có thể sử dụng bất kỳ tính năng nào của AutoML.
Cần chú ý rằng “Capacity workload” bao gồm luôn
“Congitive Services” và AutoML. Tuy nhiên, với tài khoản
“Premium Per User” thì việc tạo “Capacity workload” đã
được thực hiện sẵn và hạn chế sự can thiệp của người dùng.
4.4.2.2. Các bước tạo lập mô hình AutoML
Tạo lập mô hình AutoML bao gồm các bước chính sau
đây:
Bước 1: Chuẩn bị dữ liệu đầu vào
66. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
64
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Người dùng tạo lập dữ liệu từ các nguồn dữ liệu sẵn có
hoặc đăng tải mới từ bên ngoài vào. Và xác định đối tượng
cần dự báo và các thông tin đầu vào để xây dựng mô hình
học máy.
Bước 2: Tạo lập mô hình học máy
Người dùng cần tạo và đặt tên cho mô hình học máy cần
lập.
Bước 3: Huấn luyện mô hình học máy (ML Model Training)
Trongbướcnàyngườidùngcầnxácđịnhloạimôhìnhphù
hợp với bài toán ban đầu đặt ra là Phân loại (Classification)
hay Tuyến tính (Regression). Các bước xử lý dữ liệu và chạy
các vòng lập thuật toán khác nhau cũng được thực hiện tại
bước này.
Bước 4: Đánh giá, báo cáo kết quả mô hình huấn luyện
Sau khi mô hình học máy hoàn thành việc huấn luyện,
người dùng có thể sử dụng và tham vấn các báo cáo mà hệ
thống tạo lập sẵn để đánh giá mức độ chính xác, nhận định
những thông số đầu vào quan trọng ảnh hướng chính đến
độ chính xác của mô hình.
Bước 5: Áp dụng mô hình dự báo
Sau khi đã lựa chọn được mô hình học máy cuối cùng,
thỏa mãn toàn bộ điều kiện của người dùng, người dùng
hoàn toàn có thể sử dụng mô hình học máy đã luyện xong,
để dự đoán cho các tập hợp dữ liệu có thông tin nhãn/mục
tiêu bị thiếu, cần phải dự đoán.