SlideShare a Scribd company logo
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
VIỆN DẦU KHÍ VIỆT NAM
N À XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG
H
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
VIỆN DẦU KHÍ VIỆT NAM
NHÀ XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHỈ ĐẠO NỘI DUNG
VIỆN DẦU KHÍ VIỆT NAM
TÁC GIẢ
VŨ TUYẾT VY
TRƯƠNG VĂN NHÂN
NGUYỄN TRUNG SƠN
NGUYỄN ANH TUẤN
NHỮ ANH ĐỨC
ĐOÀN TIẾN QUYẾT
NGUYỄN THU HƯƠNG
ĐÀO HƯƠNG GIANG
NGUYỄN VĂN SỬ
LÊ NGỌC ANH
Bản quyền ©2023 củaViện Dầu khíViệt Nam
Đã đăng ký bản quyền. Không được sao chép bất kỳ phần nào của ấn phẩm này mà không có sự cho
phép bằng văn bản củaViện Dầu khíViệt Nam. Bất kỳ sự sao chép nào không được sự đồng ý củaViện
Dầu khíViệt Nam đều là bất hợp pháp và vi phạm Luật Xuất bản, Luật Sở hữuTrí tuệ.
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1. Thông điệp ...................................................................10
1.2. Ai sẽ đọc cuốn sách này?...........................................11
1.3. Nền tảng sử dụng ........................................................12
1.4. Người đọc nhận được những gì? ..............................13
1.5. Nội dung của cuốn sách ............................................14
CHƯƠNG 2: BUSINESS INTELLIGENCE
2.1. Tầm quan trọng của Business Intelligence ..............15
2.2. Phân tích Business Intelligence ................................15
CHƯƠNG 3: SẢN PHẨM SỐ
3.1. Hiểu rõ về dữ liệu .......................................................20
3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc
dữ liệu ......................................................................................20
3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu ......................24
3.2. Sản phẩm số ................................................................24
3.2.1. Khái niệm sản phẩm số ..........................................24
3.2.2. Phân loại sản phẩm số ............................................26
3.2.3. Quy trình xây dựng sản phẩm số ..........................29
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN
TẢNG POWER BI SERVICES
4.1. Tại sao sử dụng Power BI Service? ...........................40
4.2. Công cụ cho tổ chức dữ liệu trên nền tảng Power BI
Service. .....................................................................................42
4.2.1. Power Query ............................................................42
MỤC LỤC
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
4.2.2. Dataset ......................................................................47
4.2.3. Dataflow ....................................................................49
4.2.4. Datamart ...................................................................50
4.3. Trực quan hóa dữ liệu ................................................53
4.3.1. Khái niệm trực quan hóa dữ liệu ...........................53
4.3.2. Tầm quan trọng của trực quan hóa dữ liệu...........53
4.3.3. Các dạng biểu diễn cơ bản trong Power BI ..........54
4.3.4. Trực quan hóa dữ liệu nâng cao ............................56
4.4. Auto Machine Learning (AutoML) - Học máy tự
động .....................................................................................59
4.4.1. Học máy/Học máy tự động là gì? ..........................59
4.4.2. Automated Machine Learning (AutoML) trong
Power BI ..............................................................................61
4.5. Automation .................................................................65
4.5.1. Schedule Refresh .....................................................65
4.5.2. Quy trình xây dựng, duy trì và phân phối sản
phẩm số trên Power BI Service sử dụng Power BI
pipeline ................................................................................66
CHƯƠNG 5: CHIA SẺ SẢN PHẨM SỐ
5.1. Workspace.....................................................................73
5.1.1. Giới thiệu chung ......................................................73
5.1.2. Các chức năng của workspace ...............................73
5.1.3. Phân quyền và quản lý workspace .........................75
5.2. Power BI Embed .........................................................76
5.2.1. Giới thiệu chung ......................................................76
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
5.2.2. Publish to web ..........................................................77
5.2.3. Embed to Website or Portal (Secured Embed -
Nhúng an toàn) ..................................................................79
5.2.4. Embed to Sharepoint Online .................................80
5.3. Power BI App ..............................................................81
CHƯƠNG 6: CÁC SẢN PHẨM SỐ CHO LĨNH VỰC DẦU
VÀ KHÍ
6.1. Báo cáo số ...................................................................83
6.1.1. CCUS .......................................................................83
6.1.2. Chỉ số Hydrogen ....................................................95
6.1.3. Biostratigraphic Analysis .....................................104
6.2. Phân tích số ..............................................................114
6.2.1. Oil price forecast ..................................................114
6.2.2. Fracture prediction ...............................................121
CHƯƠNG 7: HƯỚNG DẪN SỬ DỤNG CÔNG CỤ
TRÊN NỀN TẢNG POWER BI SERVICE
7.1. Hướng dẫn thực hiện một số loại kết nối dữ liệu 130
7.1.1. Kết nối với SharePoint Online .............................130
7.1.2. Kết nối với SharePoint Online List ......................132
7.1.3. Kết nối với Dataverse ............................................135
7.1.4. Kết nối với Datamart ............................................138
7.2. Cách khởi tạo công cụ tổ chức dữ liệu ..................140
7.2.1. Cách khởi tạo Dataset ...........................................140
7.2.2. Cách khởi tạo Dataflow ........................................142
7.2.3. Cách khởi tạo Datamart .......................................149
7.3. Khái niệm các dạng biểu diễn cơ bản ....................154
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
7.4. Cách triển khai áp dụng biểu đồ bản đồ nâng cao .156
7.4.1. Biểu diễn bản đồ với công cụ IconMap ..............156
7.4.2. Cài đặt IconMap ....................................................157
7.4.3. Biểu diễn IconMap ................................................158
7.4.4. Tùy biến dữ liệu biểu tượng .................................162
7.4.5. Biểu diễn các đối tượng lớp thông tin địa lý. .....163
7.5. Cách triển khai áp dụng biểu diễn nâng cao kết hợp
với Python ........................................................................165
7.5.1. Cài đặt Python .......................................................165
7.5.2. Biểu diễn với Python trên Power BI ...................166
7.6. Các bước triển khai thực hiện mô hình AutoML
trên Power BI Service ......................................................167
7.7. Hướng dẫn thiết lập làm mới dữ liệu ....................178
CHƯƠNG 8: HƯỚNG DẪN CHIA SẺ SẢN PHẨM SỐ
TRÊN NỀN TẢNG POWER BI SERVICE
8.1. Hướng dẫn tạo mới, phân quyền và quản lý Work-
space ..................................................................................181
8.2. Hướng dẫn Power BI Embed ..................................184
8.2.1. Publish to web (Public) .........................................184
8.2.2. Embed to website or portal (Secured embed)....185
8.2.3. Embed to Sharepoint online ................................187
8.3. Các bước tạo, phân quyền và chia sẻ một Power BI
App ....................................................................................190
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
AI
AutoML
BI Tools
DA
DE
NLP
PPU
SQL
ETL
MVP
ERD
LLM
Giải thích
Artifical Intelligence
Trí tuệ nhân tạo
Auto Machine Learning
Học máy tự động
Business Intelligence Tools
Data Analyst
Data Engineer
Natural Language Processing
Premium Per User
Structured Query Language
Extract-Transform-Loading
Minimum Viable Product
Sản phẩm khả dụng tối thiểu
Entity Relational Diagram
Sơ đồ mối quan hệ
Large Language Model
Mô hình ngôn ngữ lớn
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
LỜI TỰA
"Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng
Power BI Service và AutoML trong lĩnh vực dầu khí" là cuốn
sách đầu tiên trong loạt sách "Ai cũng dùng AI" của Viện Dầu
khí Việt Nam. Đây là một cuốn sách cung cấp giá trị kiến thức
và nguồn cảm hứng cho những ai muốn tiến xa hơn trong thế
giới số.
Mục tiêu của nhóm tác giả khi viết cuốn sách này không chỉ
là truyền đạt kiến thức, mà còn là khơi dậy niềm đam mê sáng
tạo. Chúng tôi muốn quý vị, những nhà nghiên cứu, những
người làm việc trong ngành dầu khí, sẽ thấy được tiềm năng to
lớn của công nghệ số trong việc cải thiện công việc của mình.
Đặc biệt, cuốn sách này sẽ giúp bạn hiểu rõ hơn về công
nghệ AI, Power BI Service và AutoML - những công nghệ đang
thay đổi cách chúng ta làm việc, học hỏi và tạo ra giá trị. Đồng
thời, chúng tôi cũng muốn nhấn mạnh tầm quan trọng của việc
áp dụng công nghệ số trong ngành dầu khí. Trong suốt hơn 60
năm qua, ngành Dầu khí Việt Nam đã cung cấp nguồn năng
lượng cho đất nước, thúc đẩy sự phát triển không chỉ về kinh
tế mà còn đối với nhiều lĩnh vực khác. Những người làm việc
trong ngành Dầu khí đã cống hiến, đã chịu trách nhiệm với sứ
mệnh lớn lao này. Bây giờ, hãy tưởng tượng rằng, nếu bạn có
thêm một người đồng hành không biết mệt mỏi, luôn sẵn sàng
hỗ trợ, có khả năng học hỏi nhanh chóng và giúp cải thiện hiệu
suất công việc. Đó chính là AI, công nghệ trí tuệ nhân tạo.
Đến với "Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng
dụng Power BI Service và AutoML trong lĩnh vực dầu khí", bạn
sẽ thấy rõ hơn về sức mạnh của Power BI Service và AutoML -
những công cụ giúp bạn nhanh chóng tổ chức, biểu diễn và chia
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
sẻ dữ liệu cũng như sản phẩm của mình. Đây là những công cụ
tiện lợi, như một bước đệm để bạn tiếp cận và ứng dụng công
nghệ AI vào công việc nghiên cứu khoa học của mình.
Công nghệ AI không còn xa lạ nữa khi chúng ta có ChatGPT
và những công cụ AI khác dựa trên ngôn ngữ tự nhiên, giúp
bạn tạo ra các tri thức mới, đồng thời hỗ trợ cho phương pháp
làm việc truyền thống trong ngành dầu khí.
Điều thú vị nhất là, đây chỉ mới là khởi đầu. "Ai cũng dùng
AI" sẽ tiếp tục giới thiệu đến bạn những công cụ và kiến thức
cao cấp hơn thông qua ngôn ngữ lập trình Python, cùng với sự
áp dụng của các mô hình vật lý - địa chất từ các chuyên gia của
Viện Dầu khí Việt Nam.
Với cuốn sách này, Viện Dầu khí Việt Nam mong muốn
bạn không chỉ học hỏi kiến thức mới mà còn tìm thấy niềm
đam mê, sức mạnh sáng tạo từ bên trong, để cùng chúng tôi
khám phá và tạo ra những giá trị mới cho ngành dầu khí và đất
nước. Với AI, tất cả các cán bộ làm việc trong ngành dầu khí,
từ thượng nguồn tới hạ nguồn, từ kỹ thuật tới kinh tế, quản lý,
đều có thể tận dụng những công cụ mới mạnh mẽ này để tối ưu
hóa công việc, tạo ra các giải pháp mới và tiếp tục sứ mệnh tìm
kiếm, khai thác nguồn năng lượng cho đất nước.
Chúng ta đang ở trên con đường mới mà AI sẽ giúp chúng
ta đi nhanh hơn, xa hơn. "Sáng tạo sản phẩm số - Ai cũng
dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh
vực dầu khí" chính là bước khởi đầu, là cầu nối giữa con
người, dầu khí và thế giới của AI. Với sự hỗ trợ của AI, chúng
ta sẽ cùng nhau tiếp tục sứ mệnh cao cả, đảm bảo nguồn năng
lượng cho sự phát triển bền vững của đất nước.
10
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1. Thông điệp
AI (Artificial Intelligence) không chỉ đơn thuần là công cụ
cho các công ty công nghệ lớn, mà đang trở thành một yếu tố
không thể thiếu trong mọi lĩnh vực. Cùng với sự tiến bộ vượt
bậc trong những năm gần đây, khái niệm “trí tuệ nhân tạo”
không còn là những phát minh xa vời mà dần trở nên “bình
dân hóa” và từng bước thay đổi cách con người sống và làm
việc. Sự nở rộ của mô hình ngôn ngữ lớn (LLM) với đại diện
tiêu biểu là ChatGPT khiến cho việc con người giao tiếp, làm
việc và sáng tạo với sự hỗ trợ của AI đơn giản hơn bao giờ
hết. Các ông lớn trong ngành công nghệ chạy đua cùng xu
hướng low-code/no-code AI (AI không sử dụng ngôn ngữ
lập trình) càng giúp thu hẹp khoảng cách giữa con người với
trí tuệ nhân tạo. AI đã hiện diện ở mọi ngóc ngách của cuộc
sống.
Khi máy móc trở nên thông minh hơn, cùng với sự phát
triển về năng lực và tốc độ tính toán, năng suất công việc và
sự tự động hóa ngày càng gia tăng trong tất cả các lĩnh vực.
Không thể phủ nhận một phần công việc của con người sẽ
thay thế bằng máy móc. Đây sẽ là thách thức đối với những
lao động không nắm bắt được công nghệ và làm chủ được AI.
Tuy nhiên, chúng tôi tin rằng đây là một cơ hội hiếm có để
con người giảm bớt được những gánh nặng trong công việc
và đời sống hàng ngày để dành thời gian và tập trung làm
những việc mang lại giá trị khác biệt, vốn là thế mạnh của
con người, đó là sáng tạo và đồng cảm. Để làm được điều này,
mỗi cá nhân cần tiếp cận và hiểu về AI - “Ai cũng dùng AI”,
VIỆN DẦU KHÍ VIỆT NAM
11
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
hơn nữa là làm chủ công nghệ và tận dụng AI như là “trợ thủ”
để khám phá và vươn tới những tiềm năng mới. Đây cũng là
động lực để nhóm tác giả Viện Dầu khí Việt Nam xây dựng
tập sách “Ai cũng dùng AI”, mở đầu bằng cuốn sách “Sáng tạo
sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service
và AutoML trong lĩnh vực dầu khí”.
Cuốn sách sẽ giúp bạn mở khóa toàn bộ dữ liệu và chuyển
dữ liệu của bạn thành những sản phẩm số và xây dựng mô
hình học máy tự động mang lại giá trị hữu ích cho doanh
nghiệp. Độc giả sẽ được hướng dẫn sáng tạo một sản phẩm số
hoàn chỉnh: Từ kết nối các nguồn dữ liệu khác nhau, tổ chức,
quản lý và duy trì nguồn dữ liệu cho báo cáo, tạo các biểu đồ
bắt mắt với khả năng tương tác theo tùy chọn của người dùng
cuối. Độc giả sẽ có được những kiến thức nền tảng cơ bản đến
nâng cao để xây dựng sản phẩm số đầu tiên. Cùng với cuốn
sách này, tin rằng các cán bộ làm việc trong lĩnh vực dầu khí
“ai cũng có thể xây dựng sản phẩm số” với sự hỗ trợ của Power
BI Service - nền tảng tiêu biểu tích hợp vô vàn tính năng trí
tuệ nhân tạo.
1.2. Ai sẽ đọc cuốn sách này?
Cuốn sách này sẽ cung cấp nhiều giá trị kiến thức dành
cho tất cả độc giả đã có kiến thức nền tảng từ cơ bản đến nâng
cao hoặc chưa có nền tảng về lĩnh vực phân tích dữ liệu, học
máy hay trí tuệ nhân tạo nhưng có sự đam mê và nhu cầu
tìm hiểu đối với những lĩnh vực này. Để đạt được những kết
quả tốt nhất từ cuốn sách, độc giả nên tìm hiểu song song với
thực hành theo các bước để tạo ra sản phẩm số và mô hình
học máy tự động cho cá nhân. Cuốn sách này sẽ cung cấp
12
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cho độc giả những khái niệm đơn giản và dễ hiểu, hướng dẫn
thực hiện các thao tác chi tiết, cụ thể. Đặc biệt, nội dung giới
thiệu các sản phẩm tiêu biểu cũng đưa ra những hướng dẫn
để độc giả có thể tham khảo và mô phỏng lại trong sản phẩm
số của mình. Tất cả các sản phẩm tiêu biểu được giới thiệu
trong cuốn sách này đều được xây dựng với công cụ Power BI.
1.3. Nền tảng sử dụng
Power BI nằm trong mô hình kinh doanh của nhiều
doanh nghiệp với khả năng phân tích dữ liệu vô cùng hiệu
quả. Power BI có thể kết nối nhiều loại tệp, chuyển đổi và trực
quan hóa thành các sản phẩm số, cũng như tạo biểu đồ, đồ thị
để cung cấp hình ảnh trực quan và sự tương quan của dữ liệu.
Cho dù dữ liệu là một bảng làm việc đơn giản từ Microsoft
Excel hay các hệ cơ sở dữ liệu được lưu trữ trên điện toán đám
mây, Power BI cho phép bạn dễ dàng kết nối với các nguồn dữ
liệu này để xử lý và mô hình hóa dữ liệu của bạn mà không
ảnh hưởng đến nguồn dữ liệu ban đầu và chia sẻ điều đó với
bất kỳ ai. Sản phẩm số của người dùng có thể được chia sẻ với
VIỆN DẦU KHÍ VIỆT NAM
13
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
những người dùng Power BI khác trong tổ chức hoặc khách
hàng thông qua nền tảng Power BI Service. Nền tảng Power
BI Service hỗ trợ người dùng trong tổ chức có khả năng cộng
tác để cùng phát triển sản phẩm, đưa sản phẩm cuối hoàn
chỉnh đến với khách hàng ngoài tổ chức thông qua hình thức
nhúng vào các nền tảng khác hoặc một sản phẩm độc lập với
hình thức ứng dụng (Power BI app). Cuốn sách này hướng
dẫn phương pháp để khai thác triệt để tiềm năng của nền
tảng Power BI Service. Để làm được điều đó, một số tính năng
(xây dựng CSDL trên datamart, xây dựng mô hình học máy
tự động AutoML…) yêu cầu người dùng cần được trang bị
license Premium - Premium Per User (PPU).
1.4. Người đọc nhận được những gì?
Sau khi đọc xong cuốn sách, độc giả sẽ được trang bị
những kiến thức sau:
- Cách một công cụ Business Intelligence (BI) thay đổi
cách người dùng khai thác dữ liệu;
- Các loại phân tích dữ liệu trong Business Intelligence
(BI);
- Các khái niệm cơ bản về sản phẩm số;
- Hiểu được quy trình xây dựng các sản phẩm số cơ bản
hướng tới người dùng cuối;
- Nắm bắt cơ bản về mô hình học máy.
Độc giả có thể xây dựng, sáng tạo sản phẩm số từ những
kỹ năng sau:
- Sử dụng các công cụ lưu trữ trên nền tảng Power BI
14
CHƯƠNG 1: GIỚI THIỆU CHUNG
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Service cùng với sự hỗ trợ của Power Query để kết nối các
nguồn dữ liệu và tổ chức dữ liệu cho sản phẩm;
- Sử dụng các biểu đồ trong Power BI để trực quan hóa
và xây dựng các sản phẩm số;
- Ứng dụng tự động hóa cho quá trình cập nhật sản
phẩm;
- Sử dụng tính năng Auto-ML trên nền tảng Power BI
Service để xây dựng sản phẩm phân tích nâng cao có chứa
mô hình học máy;
- Cộng tác xây dựng sản phẩm và chia sẻ sản phẩm tới
những người dùng khác.
1.5. Nội dung của cuốn sách
Cuốn sách được chia thành 2 phần chính: Hướng dẫn
người dùng với nền tảng Power BI Service, áp dụng mô hình
học máy tự động và giới thiệu những sản phẩm số tiêu biểu
ứng dụng trong lĩnh vực dầu khí được các tác giả Bộ phận
Phân tích dữ liệu - Viện Dầu khí Việt Nam xây dựng. Phần 1
tập trung cung cấp cho độc giả các khái niệm lý thuyết, quy
trình thực hiện, các thao tác cơ bản để xây dựng sản phẩm
số và mô hình học máy tự động. Phần 2 đưa ra các ứng dụng
thực tế đã được xây dựng cụ thể để độc giả có thể hình dung
rõ hơn về các nội dung đã được giới thiệu trước đó.
VIỆN DẦU KHÍ VIỆT NAM
15
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
1
. https://blogs.gartner.com/jason-mcnellis/2019/11/05/youre-likely-invest-
ing-lot-marketing-analytics-getting-right-insights/
CHƯƠNG 2: BUSINESS INTELLIGENCE
2.1. Tầm quan trọng của Business Intelligence
Business Intelligence (BI) là sự kết hợp của các hoạt động
phân tích kinh doanh, khai thác dữ liệu, trực quan hóa dữ
liệu, công cụ và hạ tầng dữ liệu để hỗ trợ doanh nghiệp đưa
ra quyết định dựa trên dữ liệu (data-driven decision). BI lần
đầu tiên xuất hiện vào những năm 1960 dưới dạng một hệ
thống chia sẻ thông tin nội bộ. Vào những năm 1980, BI tiếp
tục được nâng cấp kết hợp với mô hình máy tính để giúp
doanh nghiệp đưa ra quyết định tốt hơn nhờ biến dữ liệu
thành “Insight” - những hiểu biết sâu sắc hơn. Giải pháp
BI hiện đại ưu tiên tính linh hoạt trong phân tích, quản lý
dữ liệu trên các nền tảng đáng tin cậy, cấp quyền cho người
dùng và nhanh chóng tìm ra “Insight”. BI có thể hỗ trợ doanh
nghiệp đưa ra những quyết định sáng suốt bằng cách so sánh
dữ liệu về hoạt động kinh doanh trong hiện tại và quá khứ.
Các nhà phân tích có thể tận dụng BI để đánh giá về hiệu
suất và đối thủ cạnh tranh, từ đó hỗ trợ doanh nghiệp hoạt
động thuận lợi và hiệu quả hơn; dễ dàng nắm bắt xu hướng
thị trường và thúc đẩy doanh thu. Nếu dữ liệu được sử dụng
hiệu quả, doanh nghiệp sẽ nhận được rất nhiều lợi ích.
2.2. Phân tích Business Intelligence
Để hiểu rõ hơn về BI có thể tận dụng AI như thế nào,
độc giả hãy tham khảo mô hình “Analytical insights model”
được xuất bản bởi Gartner (Hình 2.1)1
.
CHƯƠNG 2: BUSINESS INTELLIGENCE
16
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Trong một doanh nghiệp, “Insight” thường được chia
thành 3 nhóm, các nhóm sẽ mang lại những giá trị khác
nhau và tăng dần nhưng kèm theo đó là những yêu cầu
cao hơn về dữ liệu và độ khó. 3 nhóm bao gồm: Hindsight,
Insight, Foresight.
Chức năng cốt lõi của mỗi BI hoặc cơ sở hạ tầng báo cáo
thường theo hướng “Hindsight” và “Insight” bằng cách sử
dụng phương pháp phân tích mô tả (descriptive analytics)
và chẩn đoán (diagnostic analytics) dựa trên dữ liệu quá
khứ. Hai phương pháp này là tối quan trọng đối với tất cả
các phương pháp phân tích. Ngoài ra, còn có 2 phương pháp
phân tích nâng cao hơn là phân tích dự đoán (Predictive
analytics) và phân tích đề xuất (Prescriptive analytics). Các
độc giả tham khảo một số khái niệm cơ bản về các loại phân
tích sau đây để hiểu rõ hơn.
Hình2.1.Cácloại“Insight”vàcácphươngphápphântíchdữliệu.Nguồn:Gartner,2019.
Giá trị
Sự việc đã xảy ra
Sự việc sẽ xảy ra
Làm thế nào
để sự việc sẽ xảy ra
Tại sao xảy ra
Phân tích
mô tả
Phân tích
chẩn đoán
Phân tích
dự đoán
Phân tích
đề xuất
Hindsight Insight Foresight
Độ khó
VIỆN DẦU KHÍ VIỆT NAM
17
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Phân tích mô tả (Descriptive analytics)
Phân tích mô tả trả lời câu hỏi về những gì đã xảy ra.
Phân tích mô tả thu thập dữ liệu thô từ nhiều nguồn dữ
liệu để cung cấp chi tiết những thông tin trong quá khứ có
giá trị. Tuy nhiên, những phát hiện này chỉ đơn giản là báo
hiệu và cho biết có điều gì đó sai hoặc đúng mà không giải
thích tại sao. Vì lý do này, các công ty có dữ liệu lớn không
chỉ tự mình sử dụng phân tích mô tả mà còn kết hợp với các
phương pháp phân tích dữ liệu khác.
- Phân tích chẩn đoán (Diagnostic analytics)
Ở giai đoạn này, dữ liệu trong quá khứ có thể được đo
lường dựa trên các dữ liệu khác để trả lời/giải thích những
câu hỏi về lý do/tại sao điều gì đó đã xảy ra. Nhờ phân tích
chẩn đoán, có thể đi sâu vào chi tiết để tìm ra những yếu tố
phụ thuộc và xác định các mô hình.
- Phân tích dự đoán (Predictive analytics)
Phân tích dự đoán cho biết điều gì có khả năng xảy ra.
Nó sử dụng kết quả phân tích mô tả và chẩn đoán để phát
hiện xu hướng trong tương lai. Do đó, phân tích dự đoán trở
thành công cụ để dự báo. Mặc dù phân tích dự đoán mang
lại nhiều giá trị, nhưng cần phải hiểu rằng dự báo chỉ là
ước tính, độ chính xác tùy thuộc vào chất lượng dữ liệu và
tính ổn định của tình huống. Nhờ cách tiếp cận chủ động
của loại phân tích này, doanh nghiệp có thể xác định những
người mua hàng trong tháng tới để tiến hành kích hoạt các
hoạt động tiếp thị nhằm phát triển doanh thu. Hoặc một
CHƯƠNG 2: BUSINESS INTELLIGENCE
18
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nhóm quản lý có thể cân nhắc các rủi ro khi quyết định đầu
tư vào việc mở rộng của doanh nghiệp dựa trên phân tích
dòng tiền và dự báo dòng tiền thu được.
- Phân tích đề xuất (Prescriptive analytics)
Phân tích đề xuất là một bước tiến xa hơn phân tích mô
tả và phân tích dự đoán khi đưa ra đề xuất hành động thích
hợp và dự đoán những kết quả có thể xảy ra. Nó trả lời cho
câu hỏi: “Điều gì nên xảy ra?”
Loại phân tích dữ liệu hiện đại này không chỉ yêu cầu
dữ liệu lịch sử mà còn yêu cầu thông tin bên ngoài do bản
chất của thuật toán thống kê. Bên cạnh đó, phân tích đề
xuất sử dụng các công cụ và công nghệ tinh vi như học máy
(Machine Learning), các quy tắc kinh doanh và thuật toán.
Thông thường, có 3 cách để AI có thể tạo ra giá trị cho
BI:
- Tạo “Insight” tự động và thực hiện các phân tích thân
thiện với người dùng;
- Tính toán tốt hơn đối với các dự báo;
- Cho phép hệ thống BI thúc đẩy “Insight” thậm chí đối
với các database không có cấu trúc.
Hình 2.2 thể hiện bức tranh tổng quan về sự hỗ trợ của
AI theo các phương pháp phân tích.
AI hỗ trợ các phương pháp phân tích giúp cho:
• Tự động và dễ dàng sử dụng (Automation and Ease of
Use): Làm cho công cụ BI thông minh hơn và dễ sử dụng
hơn sẽ giúp người dùng dễ tiếp cận hơn, làm giảm khối
VIỆN DẦU KHÍ VIỆT NAM
19
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
lượng công việc của các nhà phân tích. Lợi ích này thường
đạt được thông qua quá trình tự động hóa. Ngoài ra, có thể
sử dụng các ngôn ngữ tự nhiên để tương tác với dữ liệu (AI-
powered natural language processing (NLP) technologies),
tổng hợp các kết quả phân tích, tự động tìm ra các dữ liệu
quan trọng, các điểm khó phát hiện trong cơ sở dữ liệu.
• Ứng dụng tốt hơn đối với các dự đoán và dự báo (Better
Forecasting and Predictions): Mặc dù các phân tích mô tả và
chẩn đoán là trung tâm của mọi hệ thống BI, nhưng mong
muốn biết được cái sắp xảy ra cũng là điều nhiều doanh
nghiệp hướng tới, khả năng được tăng cường bởi AI có thể
hỗ trợ người dùng cuối áp dụng các phương pháp phân tích
dự đoán mạnh mẽ để dự báo và dự đoán tốt hơn dựa trên
dữ liệu lịch sử.
Hình2.2. KhảnăngAIhỗtrợtheocácphươngphápphântích.Nguồn:Gartner,2019.
Giá trị
Dự đoán tốt hơn
Tự động và dễ sử dụng
Sự việc đã xảy ra
Phân tích
mô tả
Phân tích
chẩn
đoán
Phân tích
dự đoán
Phân tích
đề xuất
Hindsight Insight Foresight Độ khó
CHƯƠNG 3: SẢN PHẨM SỐ
20
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
CHƯƠNG 3: SẢN PHẨM SỐ
3.1. Hiểu rõ về dữ liệu
3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc dữ liệu
Ngày nay, dưới sự phát triển mạnh mẽ của khoa học công
nghệ, ứng dụng của công nghệ thông tin đã lan tỏa mạnh
mẽ vào từng khía cạnh công việc và cuộc sống. Năng lực
tính toán và sức mạnh phần cứng cũng được gia tăng nhanh
chóng. Trên cơ sở đó, việc khai thác cơ sở dữ liệu trong các
doanh nghiệp và hiệu quả mang lại gây ấn tượng không chỉ
với các nhà quản lý mà cả các nhà hoạch định. Các khái
niệm về khoa học dữ liệu, học máy, học sâu hay trí tuệ nhân
tạo ngày càng phổ biến và được ứng dụng rộng rãi trong
nhiều lĩnh vực khác nhau. Cụ thể, theo sau là các khái niệm
cơ bản mà độc giả nên nắm bắt để hiểu và áp dụng triển khai
các sản phẩm số.
3.1.1.1. Khái niệm cơ sở dữ liệu
Theo Từ điển Oxford, cơ sở dữ liệu là một tập hợp có cấu
trúc của dữ liệu được lưu trong máy tính, theo một cách đặc
biệt nào đó có thể được tiếp cận theo những cách khác nhau.
Cơ sở dữ liệu cũng được hiểu là một hệ thống các thông tin
có cấu trúc, được lưu trữ trên các thiết bị lưu trữ nhằm thỏa
mãn yêu cầu khai thác thông tin đồng thời của nhiều người
sử dụng hay nhiều chương trình ứng dụng chạy cùng một
lúc với những mục đích khác nhau.
Từ đó, có thể thấy một số điểm chung của cơ sở dữ liệu
là: Tập hợp thông tin có cấu trúc; được quản lý và duy trì
VIỆN DẦU KHÍ VIỆT NAM
21
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
phục vụ khai thác thông tin; có thể phục vụ nhiều đối tượng
khai thác với nhiều cách thức khác nhau; có nhiều giải pháp
khác nhau để xây dựng và quản lý cơ sở dữ liệu. Vì vậy, khi
nói về cơ sở dữ liệu thường trọng tâm nói về thông tin, dữ
liệu được quản lý, lưu trữ và khai thác mà không phải là vỏ
bọc chứa thông tin, dữ liệu.
3.1.1.2. Phân loại cơ sở dữ liệu
Phân loại dữ liệu được hiểu là cách tổ chức dữ liệu thành
các nhóm liên quan để có thể sử dụng và lưu trữ hiệu quả. Ở
mức độ cơ bản, quá trình phân loại dữ liệu chủ yếu đáp ứng
mục tiêu dễ dàng lưu trữ và truy xuất. Việc tổ chức, phân
loại dữ liệu hiệu quả đóng vai trò vô cùng quan trọng trong
công tác quản lý rủi ro, quản trị và bảo mật dữ liệu.
Tùy thuộc vào dạng dữ liệu và mục đích sử dụng mà có
thể áp dụng cách phân loại dữ liệu khác nhau, trong đó có 3
cách phân loại chính:
- Phân loại nội dung (content-based): Dựa vào nội dung
của dữ liệu để phân tách.
- Phân loại bối cảnh (context-based): Dựa vào mục đích
sử dụng dữ liệu.
- Phân loại theo người dùng (user-based): Dựa vào lựa
chọn và mong muốn của người dùng.
3.1.1.3. Mô hình cơ sở dữ liệu
Mô hình cơ sở dữ liệu là tập hợp các cấu trúc logic được
sử dụng để diễn tả cấu trúc dữ liệu và các mối quan hệ dữ
liệu được tìm thấy trong một cơ sở dữ liệu. Xuyên suốt lịch
CHƯƠNG 3: SẢN PHẨM SỐ
22
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
sử phát triển của khoa học máy tính, có rất nhiều khái niệm
về mô hình cơ sở dữ liệu. Mỗi mô hình có ưu, nhược điểm
và tính ứng dụng trong một thời điểm nhất định. Với cách
tiếp cận hiện tại, có thể đề cập đến hai mô hình dữ liệu được
ứng dụng phổ biến và rộng rãi là mô hình dữ liệu tập trung
và phi tập trung.
Mô hình dữ liệu tập trung (centralized data)
Hệ thống dữ liệu tập trung là hệ thống mà ở đó tất cả các
thành phần dữ liệu được lưu trữ và quản trị tại một chỗ. Hệ
thống còn được biết đến dưới tên hệ thống cơ sở dữ liệu máy
tính tập trung.
Hệ thống này thường được sử dụng trong các tổ chức,
doanh nghiệp với các nhiệm vụ tập trung, sử dụng kết nối
nội bộ (LAN). Giải pháp tập trung đã chứng minh được
nhiều điểm mạnh, tuy nhiên tồn tại nhiều điểm yếu, có thể
kể đến:
- Ưu điểm:
+ Dễ dàng chia sẻ dữ liệu, tập trung vào các vấn đề cụ
thể;
+ Khả năng bảo mật, tính toàn vẹn của dữ liệu cao;
+ Dung lượng lưu trữ lớn;
+ Dễ dàng truy cập, chỉnh sửa dữ liệu;
+ Chi phí thấp.
- Nhược điểm:
+ Khả năng tùy biến, linh động thấp;
VIỆN DẦU KHÍ VIỆT NAM
23
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
+ Xung đột cục bộ có thể dẫn đến gián đoạn toàn cục;
+ Do tất cả dữ liệu được lưu trữ tại một chỗ nên khi có
nhiều truy cập cùng một lúc, có thể xảy ra xung đột.
Mô hình dữ liệu phi tập trung (decentralized data)
Trái ngược với hệ thống cơ sở dữ liệu tập trung, hệ thống
cơ sở dữ liệu phi tập trung không gom dữ liệu về một chỗ
mà cho phép lưu trữ dữ liệu thành các phần khác khau tại
các trạm khác nhau và cung cấp kết nối giữa các trạm. Với
cách xây dựng hệ thống này, các điểm mạnh, yếu cũng được
thể hiện rõ ràng:
- Ưu điểm:
+ Phù hợp với bản chất phân tán của người dùng;
+ Dữ liệu được quản lý tại mỗi trạm địa phương mà
không phụ thuộc vào các trạm khác;
+ Dữ liệu có tính tin cậy cao, dễ dàng khắc phục sự cố
mà không ảnh hưởng đến hệ thống;
+ Hiệu năng cao;
+ Cho phép tổ chức và tùy biến linh hoạt mà không ảnh
hưởng đến các hoạt động sẵn có.
- Nhược điểm:
+ Hệ thống phức tạp;
+ Chi phí cao;
+ Khó khăn hơn trong công tác bảo mật;
+ Khó đảm bảo tính nhất quán của dữ liệu.
CHƯƠNG 3: SẢN PHẨM SỐ
24
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu
Dữ liệu dầu khí có tính chất đặc thù và yêu cầu khắt khe
về bảo mật. Do đó các ứng dụng, sản phẩm về dữ liệu cần
phải được trang bị chặt chẽ về việc phân quyền, quản lý truy
cập, xây dựng và quản trị kết nối.
3.2. Sản phẩm số
3.2.1. Khái niệm sản phẩm số
Nhiều công ty sử dụng dữ liệu như một dạng sản phẩm
giúp công ty rút ngắn thời gian làm việc khi áp dụng vào
một chu trình mới. Điều này có thể giúp giảm đến 90% thời
gian và 30% chi phí, đồng thời công tác quản trị rủi ro cũng
được cải thiện đáng kể.
Sản phẩm số cung cấp các giải pháp sẵn có với chất
lượng cao trên nền tảng cơ sở dữ liệu mà tất cả người dùng
trong cùng tổ chức có thể dễ dàng truy cập và sử dụng dễ
dàng.
Sản phẩm số thường nằm ở cuối chu trình lưu trữ, vận
hành dữ liệu, có thể kể đến Data Warehouses hay Data Lake.
Việc sử dụng các sản phẩm số giúp rút ngắn thời gian tìm
kiếm dữ liệu, xử lý định dạng và xây dựng các tập dữ liệu
riêng hay chu trình dữ liệu (data pipeline).
Trong cách tiếp cận truyền thống khi xây dựng giải pháp
dữ liệu, các nhóm phân tích sẽ xác định dữ liệu cần sử dụng
trong kho dữ liệu sau đó tạo ra khối dữ liệu riêng và áp dụng
nó để xây dựng sản phẩm. Phương pháp này tạo thành một
quy trình làm việc lặp đi lặp lại với mỗi sản phẩm và tạo ra
VIỆN DẦU KHÍ VIỆT NAM
25
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình3.2.Cấutrúctriểnkhaidạngsảnphẩmsố.Nguồn:HarvardBusinessReview,2022.
Hình3.1.Cấutrúctriểnkhaidữliệutruyềnthống.Nguồn:HarvardBusinessReview,2022.
Hệ thống
ghi nhận
Hệ thống lõi
xử lý
Kho dữ liệu
Hồ dữ
liệu gốc
Dữ liệu
ngoại vi
Dữ liệu không
cấu trúc
Lưu trữ dữ liệu
vận hành
Dữ liệu người dùng
Ứng dụng số
Mảnh ghép số
Báo cáo số
Dữ liệu số
Phân tích số
Nền tảng
dữ liệu
Dữliệuriêngcho
từngdạngsảnphẩm
Côngnghệriêngcho
từngdạngsảnphẩm
Sảnphẩm
số
Hệ thống
ghi nhận
Hệ thống lõi xử lý Kho dữ liệu
Hồ dữ liệu gốc
Dữ liệu ngoại vi
Dữ liệu không
cấu trúc
Lưu trữ dữ liệu
vận hành
Ứng dụng số
Mảnh ghép số
Báo cáo số
Dữ liệu số
Nhà cung cấp
Khách hàng
Lĩnh vực
Sản phẩm/Dịch vụ
Phân phối
Phân tích số
Nền tảng
dữ liệu
Sảnphẩm
số
CHƯƠNG 3: SẢN PHẨM SỐ
26
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cấu trúc dữ liệu phức tạp khó thể duy trì và tái sử dụng. Độc
giả có thể tham khảo thêm ở Hình 3.1.
Với cách tiếp cận dạng sản phẩm số, nhóm phát triển sẽ
xây dựng giải pháp nâng chuẩn sản phẩm và đóng gói các
công nghệ với nhau theo các mẫu (consumption archetype
patterns) nhằm tối ưu thời gian làm việc và đạt hiệu quả
cao, tinh giản cấu trúc dữ liệu của doanh nghiệp. Độc giả
có thể tham khảo Hình 3.2 để rõ hơn đối với phương pháp
này.
3.2.2. Phân loại sản phẩm số
Phương pháp tiếp cận dạng sản phẩm số được chia thành
5 dạng chính dựa vào mục đích cuối cùng của sản phẩm.
Bao gồm: Ứng dụng số, Mảnh ghép số, Phân tích số, Báo cáo
số, và Dữ liệu số. Thông tin mô tả các dạng sản phẩm được
thể hiện ở Bảng 3.1.
Trong số các sản phẩm số kể trên, sản phẩm phân tích
số và sản phẩm báo cáo số là những loại sản phẩm khai thác
tối ưu được những tính năng của Power BI Service. Dưới sự
hỗ trợ của API, người dùng cũng có thể xây dựng cho mình
sản phẩm chia sẻ dữ liệu đơn thuần. Ngoài ra, với tính năng
xuất bản ứng dụng cùng với sự kết hợp của công cụ Power
ứng dụng - một công cụ thuộc nền tảng Power Platform của
Microsoft, người dùng chuyên sâu hoàn toàn có thể xuất bản
một sản phẩm ứng dụng số. Độc giả có thể tìm hiểu thêm các
sản phẩm cụ thể theo các nhóm sản phẩm này ở Chương 6:
Các sản phẩm số cho lĩnh vực dầu và khí.
VIỆN DẦU KHÍ VIỆT NAM
27
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Bảng3.1.Thôngtincácdạngsảnphẩmsố
STT
Các dạng
sản phẩm
số
Miêu tả
1
Phân tích
số
Phân tích số là dạng sản phẩm hướng
đến cung cấp cho người dùng các
công cụ để tự phân tích, khai phá dữ
liệu hoặc dưới sự hỗ trợ của các nhà
phân tích. Áp dụng các tính năng về
học máy và trí tuệ nhân tạo có thể
được xây dựng và đính kèm sản
phẩm.
2 Báo cáo số
Dạng sản phẩm này yêu cầu dữ liệu
phải có sẵn và được tổng hợp cũng
như làm sạch và phân loại rõ ràng.
Nhà phân tích dữ liệu đóng vai trò
quan trọng trong việc truy xuất dữ
liệu, sử dụng kiến thức chuyên môn
để xây dựng các biểu diễn nhằm
truyền đạt thông tin hiệu quả đến
khách hàng. Bên cạnh đó, công tác
quản trị dữ liệu cần được đề cao với
các nhiệm vụ quản lý dữ liệu gốc, xây
Sản phẩm báo cáo số là một dạng
sản phẩm số đặc trưng cung cấp
thông tin được tổng hợp, phân tích
cho người dùng dưới dạng các bảng
điều khiển (dashboard) hoặc các bản
in (pdf).
CHƯƠNG 3: SẢN PHẨM SỐ
28
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
dựng nền tảng kết nối với khách hàng,
phân quyền và bảo mật.
Thông thường, dữ liệu phải được
truyền tải tự động đến khách hàng,
hiện nay các công ty đang hướng đến
xây dựng các mô hình tự phục vụ và
cập nhật dữ liệu liên tục theo thời gian
thực.
3
Mảnh
ghép số
4 Dữ liệu số
Dữ liệu và sản phẩm số trong lĩnh
vực dầu khí là vô cùng đa dạng và
đặc trưng. Để cung cấp giải pháp sử
dụng và kết nối dữ liệu, mảnh ghép
số được cung cấp với điểm mạnh có
thể sử dụng trên nhiều nền tảng, bảo
mật dữ liệu, tối đa hóa khả năng tái
sử dụng. Các sản phẩm mảnh ghép số
bao gồm: Biến đổi dữ liệu, Thuật toán
và Mô hình.
Sản phẩm số hướng đến cung cấp
thông tin về dữ liệu gốc, trong khi
khách hàng là người gửi yêu cầu và
nhận về dữ liệu không kèm với báo
cáo hay phân tích phía sau. Để duy
trì dạng sản phẩm này, nhà quản trị
dữ liệu đóng vai trò quan trọng với
các nhiệm vụ duy trì nền tảng quản lý
cơ sở dữ liệu, cập nhật cơ sở dữ liệu,
cung cấp cổng yêu cầu, tiếp nhận
thông tin truy xuất, lọc và gửi dữ liệu.
VIỆN DẦU KHÍ VIỆT NAM
29
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
3.2.3. Quy trình xây dựng sản phẩm số
3.2.3.1. Xác định sơ đồ mô tả vấn đề (Problem statement)
Sơ đồ mô tả vấn đề là miêu tả chính xác về vấn đề cần giải
quyết hay một điều kiện cần cải thiện. Miêu tả này xác định
rõ khoảng cách giữa vấn đề gặp phải với mục tiêu mong
muốn trong quá trình xây dựng sản phẩm. Mục đích chính
của Sơ đồ mô tả vấn đề là chỉ rõ và giải thích vấn đề.
Sơ đồ mô tả vấn đề được sử dụng rộng rãi bởi các doanh
nghiệp và tổ chức để cải thiện các dự án. Một yêu cầu cần
đạt đơn giản và đủ tốt sẽ được cả nhóm sử dụng như kim
chỉ nam để giải quyết các vấn đề gặp phải khi xây dựng sản
phẩm. Sơ đồ mô tả vấn đề cũng cho phép quản trị, làm rõ
Các chính sách về bảo mật và an toàn
dữ liệu cũng cần được đề cao trong
quy trình xây dựng dạng sản phẩm
này.
5
Ứng dụng
số
Sản phẩm ứng dụng số (digital
applications) là dạng sản phẩm cao
cấp nhất trong các sản phẩm số. Sản
phẩm được hoàn thiện, đóng gói và
triển khai đến người dùng cuối như
một ứng dụng thương mại hoàn
chỉnh với các tính năng hoàn chỉnh,
giao diện thân thiện, tối ưu tính toán
và vận hành. Quản lý dữ liệu và cung
cấp luồng dữ liệu cũng được hoàn
thiện chặt chẽ.
CHƯƠNG 3: SẢN PHẨM SỐ
30
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình3.4.Phươngpháp,cáchxâydựngsơđồmôtảvấnđề.
Hình3.3.Kháiniệmsơđồmôtảvấnđề.
A PROBLEM
STATEMENT IS A
CUIDING STAR FOR
YOUR CREATIVE
THINKING
Yêu cầu cần đạt của sản phẩm (Problem Statement) là gì?
Tài liệu ngắn gọn mô tả vấn đề và sản phẩm cần đạt
Đề bài toàn diện của bài toán mà dự án cần xử lý
Bước đầu tiên triển khai dự án
ĐẶT CÂU HỎI HIỆU QUẢ
Có thể áp dụng quy tắc 5W1H để tìm hiểu về vấn đề đang gặp phải:
What?Why?When?Where?Who? How?
ĐẶT GIỚI HẠN
Thời gian thực hiện dự án
Các chỉ tiêu cần đạt của sản phẩm
NGẮN GỌN
Cố gắng viết ngắn gọn, rõ ràng, cần chi tiết hơn có thể trao đổi trong các cuộc
họp hoặc trong những tài liệu khác đi kèm
CỐ ĐỊNH PROBLEM STATEMENT
Problem Statement sẽ thay đổi và hoàn thiện dần theo yêu cầu của khách hàng
và khả năng đáp ứng của nhóm phát triển sản phẩm
DÙNG NHIỀU NGÔN NGỮ CHUYÊN MÔN/KỸTHUẬT
Nên đảm bảo mọi nhân sự liên quan của dự án đều có thể hiểu được mà không
nhất thiết phải có hiểu biết sâu về chuyên môn/kỹ thuật
NÊN
KHÔNG NÊN
Cách viết Problem Statement hiệu quả
VIỆN DẦU KHÍ VIỆT NAM
31
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
trực diện vấn đề từ đó đưa ra giải pháp thực thi phù hợp cho
toàn bộ dự án. Một điều quan trọng nữa để đạt được điều
này là Sơ đồ mô tả vấn đề cần thật sự rõ ràng và được hiểu
rõ giữa các thành viên trong nhóm thực hiện.
Thông thường, cách tiếp cận sử dụng bộ câu hỏi 5W1H
(Cái gì - Khi nào - Ở đâu - Tại sao - Ai - Như thế nào) thường
được sử dụng trong quá trình xây dựng yêu cầu cần đạt của
sản phẩm. Độc giả tham khảo Hình 3.3, Hình 3.4 và Hình
3.5 để hiểu rõ hơn về khái niệm và cách thức xây dựng và
tiêu chí cần đạt.
3.2.3.2. Cấu trúc 3 lớp của một sản phẩm số (3 layers
architectures)
Một sản phẩm số được đóng gói hoàn thiện là thành quả
của một quá trình làm việc chặt chẽ với sự tham gia của
nhiều nhân sự. Để sản phẩm được dễ hiểu và rõ ràng hơn,
cấu trúc 3 lớp được chỉ ra với các vai trò của sản phẩm ở lớp
Hình3.5.Tiêuchíxâydựng,xácđịnhsơđồmôtảvấnđề.
SMART Problem Statement
SPECIFIC
Cụ thể vấn đề
cần giải quyết
một cách ngắn
gọn, dễ hiểu
MEASURABLE
Định lượng và
định tính đối
với yêu cầu sản
phẩm đầu ra
ACTION
Cần làm gì để
giải quyết vấn
đề?
RELEVANT
So sánh với các
giải pháp đang
có sẵn trên thị
trường
TIMEBOUND
Thời gian dự
kiến giải quyết
vấn đề
CHƯƠNG 3: SẢN PHẨM SỐ
32
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
người sử dụng, lớp khám phá, phân tích dữ liệu và lớp tổ
chức dữ liệu.
- Lớp người sử dụng (User layer): Người sử dụng là lớp
đầu tiên trong mô hình cấu trúc 3 lớp. Tại đây yêu cầu của
người dùng được định hình và sản phẩm hay giải pháp cuối
cùng cũng được chỉ ra. Đâu là đầu vào cần phải có để triển
khai được sản phẩm và đâu là sản phẩm mà người dùng hay
khách hàng nhận về sau khi đi qua các bước xử lý trung gian;
- Lớp phân tích (Analysis layer): Là lớp mà người xây
dựng lên sản phẩm số thực hiện các công việc, thao tác liên
quan đến: tạo lập bảng biểu, báo cáo, nghiên cứu insight và
các phân tích chuyên sâu như xây dựng các mô hình dự báo
với machine learning,… Đây là bước quan trọng nhất để tạo
nên sản phẩm số cuối cùng;
- Lớp dữ liệu (Data layer): Lớp dữ liệu đóng vai trò nền
tảng và kết nối giữa người sử dụng và nhà phân tích. Ở lớp
này, các nhiệm vụ liên quan đến luồng dữ liệu, xử lý số liệu
đầu vào, xây dựng cơ sở dữ liệu, lưu trữ dữ liệu, xây dựng
nền tảng, kết nối người dùng, quản lý quyền truy cập được
thực hiện để đảm bảo dữ liệu cho sản phẩm số.
Trên cơ sở các dạng sản phẩm chính được đề cập ở mục
3.2.2, một số biểu mẫu cấu trúc 3 lớp được chỉ ra dưới đây:
Sản phẩm Phân tích số
Sản phẩm phân tích số với mục đích cung cấp các giải
pháp, thông tin phân tích dữ liệu. Sản phẩm tích hợp các
bước xử lý, làm chuẩn và biến đổi dữ liệu theo hướng chuyên
môn để chỉ ra các tri thức cho khách hàng. Bên cạnh đó, sản
VIỆN DẦU KHÍ VIỆT NAM
33
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
phẩm áp dụng các ứng dụng của học máy và trí tuệ nhân tạo
để nâng cao chất lượng tri thức. Cấu trúc 3 lớp được mô tả
như sau:
+ Lớp người sử dụng: Lớp người sử dụng cung cấp yêu
cầu về phân tích dữ liệu và nhận về sản phẩm phân tích dữ
liệu đã được xử lý và trình bày, chỉ ra được các yếu tố tri
thức, đặc trưng của dữ liệu.
+ Lớp phân tích: Lớp phân tích đóng vai trò chính trong
việc xử lý, biến đổi dữ liệu, ứng dụng học máy và trí tuệ
nhân tạo để đưa ra kết quả mong muốn. Sản phẩm cuối
được trình bày dưới dạng các báo cáo với mức độ trực quan
hoá tốt, dễ dàng theo dõi và đáp ứng được yêu cầu đặt ra từ
lớp người dùng.
Hình3.6.MôhìnhcấutrúcsảnphẩmPhântíchsố.
Phân tích số
Người sử
dụng
Dữ liệu
Biểu diễn
dữ liệu
Phân tích dữ
liệu
Phân tích
Dự báo dữ liệu
Xây dựng bảng điều khiển
và biểu diễn tri thức,
hiện trạng, dự báo
và giải pháp
Kết quả
Phân tích số
Khai phá
dữ liệu
Dữ liệu hiện
trạng
Ứng dụng học
máy và trí tuệ
nhân tạo
CHƯƠNG 3: SẢN PHẨM SỐ
34
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
+ Lớp dữ liệu: Nơi triển khai cấu trúc dữ liệu và lưu trữ
dữ liệu phục vụ cho sản phẩm đến khách hàng.
Sản phẩm Báo cáo số
Báo cáo số cung cấp thông tin dữ liệu dưới các dạng báo
cáo. Với đặc trưng riêng của dạng sản phẩm báo cáo, vai trò
của 3 lớp cấu trúc cụ thể như sau:
+ Lớpngườisửdụng:Gửivàoyêucầucụthểvềdạngthông
tin mong muốn và dạng kết quả nhận về (dạng báo cáo).
+ Lớp phân tích: Tiếp nhận yêu cầu từ người dùng, thu
thập, xử lý dữ liệu và xây dựng sản phẩm cuối là các báo cáo
theo định dạng khách hàng đề nghị.
+ Lớp dữ liệu: Cung ứng các cổng kết nối để tiếp nhận
yêu cầu từ khách hàng, cấp quyền truy cập dữ liệu cho nhà
phân tích, tạo các kết nối của sản phẩm cuối cùng đến người
sử dụng.
Hình3.7.MôhìnhcấutrúcsảnphẩmBáocáosố.
Bảng phân tích
Báo cáo
Khung
sản phẩm
Nền tảng lưu trữ
Cấu trúc dữ liệu
Báo cáo số
Người sử dụng
Phân tích
Dữ liệu
VIỆN DẦU KHÍ VIỆT NAM
35
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm Mảnh ghép số
Mảnh ghép số cung cấp giải pháp kết nối mạnh mẽ dưới
sự quản lý hiệu quả. Thay vì xây dựng một sản phẩm với
giao diện hoàn thiện, mảnh ghép số đóng vai trò như một
thành phần của sản phẩm cuối. Các mảnh ghép có thể là dữ
liệu, khả năng phân tích, biểu diễn, thuật toán tối ưu hay các
mô hình chất lượng cao được xây dựng trước. Mỗi thành
phần này có thể được gọi và sử dụng trong các sản phẩm số
khác. Người dùng có thể gửi yêu cầu và nhận về các mảnh
ghép và sử dụng với mục đích riêng.
Mảnh ghép số được phân thành 3 loại chính bao gồm:
Biến đổi dữ liệu, Thuật toán và Mô hình.
Mảnh ghép số dạng Biến đổi dữ liệu: cung cấp công cụ
khai phá dữ liệu, cho phép người dùng có thể khám phá dữ
liệu, tìm hiểu đặc trưng, xử lý dữ liệu với các công cụ được
cung cấp, tích hợp trong mảnh ghép.
Hình3.8.MôhìnhcấutrúcsảnphẩmMảnhghépsố(dạngBiếnđổidữliệu).
Mảnh ghép số
Biến đổi dữ liệu
Người sử dụng
Phân tích
Dữ liệu
Biến đổi dữ liệu Mảnh ghép
số
Giải thích thuật toán,
phương pháp đo lường,
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu đầu vào
Kết quả biến đổi
CHƯƠNG 3: SẢN PHẨM SỐ
36
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Mảnh ghép số dạng Thuật toán: cung cấp giải pháp về
thuật toán để tối ưu và giải quyết các bài toán chuyên môn
đặc trưng. Các thuật toán được cung cấp cùng mô tả, giải
thích và cách hoạt động. Các thuật toán cho phép người
Hình3.9.MôhìnhcấutrúcsảnphẩmMảnhghépsố
(dạngthuậttoán).
Mảnh ghép số
Thuật toán
Người sử
dụng
Phân tích
Dữ liệu
Thuật toán Mảnh ghép
số
Giải thích thuật toán
phương pháp đo lường
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu đầu vào
Mô hình và
kết quả dự báo
Hình3.10.MôhìnhcấutrúcsảnphẩmMảnhghépsố
(dạngMôhình).
Mảnh ghép số
Mô hình
Người sử
dụng
Phân tích
Dữ liệu
Mô hình dự báo
Mô hình
huấn luyện trước
Mảnh ghép
số
Giải thích thuật toán
phương pháp đo lường
hiệu quả thử nghiệm
Mô tả vận hành
Mã nguồn
Dữ liệu
huấn luyện trước
Dữ liệu đầu vào
Kết quả dự báo
Dữ liệu đầu vào
VIỆN DẦU KHÍ VIỆT NAM
37
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
dùng xây dựng mô hình riêng dựa trên dữ liệu riêng. Mô
hình cuối cùng có thể được sử dụng để chuyên biệt và tối ưu
vấn đề riêng của khách hàng.
Mảnh ghép số dạng Mô hình: cung cấp các mô hình được
huấn luyện trước bởi tập dữ liệu mẫu với kết quả dự báo tốt,
có sự tin cậy cao. Việc thực hiện dự báo được tiếp tục trên
tập dữ liệu của người dùng sau khi người dùng ghép nối
mảnh ghép này vào sản phẩm của họ. Việc sử dụng mô hình
dự báo sẵn có giúp tối ưu thời gian và chi phí tuy nhiên cần
xem xét mức độ phù hợp của dữ liệu huấn luyện trước với
dữ liệu riêng của khách hàng.
Sản phẩm Dữ liệu số
Hình3.11.MôhìnhcấutrúcsảnphẩmDữliệusố.
Dữ liệu số
Người sử dụng
Phân tích
Dữ liệu
Nền tảng lưu trữ
Kiểm soát
chất lượng, cập nhật
dữ liệu
Danh mục
dữ liệu
Mô hình dữ liệu
Định nghĩa
dữ liệu
Mô tả dữ liệu
Sharepoint
& DataMart
CHƯƠNG 3: SẢN PHẨM SỐ
38
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm hệ thống chia sẻ dữ liệu tập trung vào tính
minh bạch, nguồn gốc của dữ liệu. Sản phẩm cung cấp dữ
liệu gốc, thô chưa qua xử lý.
Vai trò của các lớp trong sơ đồ cấu trúc sản phẩm được
làm rõ như Hình 3.11. Trong đó:
+ Lớp người sử dụng: Gửi yêu cầu dữ liệu theo bảng truy
vấn sẵn có. Thông tin sẽ được gửi đến người quản lý dữ liệu.
+ Lớp phân tích: Không đóng vai trò trong dạng sản
phẩm này do tập trung vào dữ liệu gốc.
+ Lớp dữ liệu: Tiếp nhận truy vấn, truy xuất dữ liệu, cung
cấp nền tảng kết nối và trả về kết quả dữ liệu theo yêu cầu.
Hình3.12.MôhìnhcấutrúcsảnphẩmỨngdụngsố.
Mô hình và
kết quả dự báo
Người sử dụng
Dữ liệu người dùng
Mô tả vận hành
Giải thích thuật toán,
phương pháp đo lường,
hiệu quả thử nghiệm
Mã nguồn
Mô hình
Dữ liệu thời gian thực
Nền tảng đám mây
Dữ liệu
Phân tích
Ứng dụng số Ứng dụng số
VIỆN DẦU KHÍ VIỆT NAM
39
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sản phẩm Ứng dụng số
Sản phẩm ứng dụng số (Hình 3.12) là sản phẩm đặc biệt
kết hợp các tính năng nâng cao. Các ứng dụng số được đóng
gói và phát hành như một phần mềm chuyên dụng, cung
cấp giải pháp tới một số lượng người dùng lớn, dữ liệu đa
dạng. Việc phát triển các ứng dụng số cũng có yêu cầu chặt
chẽ về mặt vận hành và lưu trữ như sử dụng nền tảng tính
toán đám mây, lưu trữ dữ liệu đám mây thời gian thực...
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
40
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình4.1.TổngthểcấutrúcnềntảngPowerBI.
Nguồn dữ liệu Power BI Service
Power BI
Truy cập
Power BI Gateways
Tổ chức dữ liệu
Kết nối
Publish
Power BI Desktop
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ
TRÊN NỀN TẢNG POWER BI SERVICE
4.1. Tại sao sử dụng Power BI Service?
Như đã đề cập ở phần mở đầu, cuốn sách chủ yếu tập
trung giới thiệu đến bạn đọc công cụ Power BI trên nền tảng
Power BI Service (https://app.powerbi.com), hoàn toàn nằm
trên cloud. Vậy Power BI có thể hoạt động trên những nền
tảng nào, và tại sao lựa chọn Power BI Service?
Power BI hoạt động trên 3 nền tảng cơ bản:
- Ứng dụng trên máy tính cá nhân, chỉ với hệ điều hành
Windows được gọi là Power BI Desktop.
- Dịch vụ phần mềm trực tuyến dưới dạng SaaS (phần
mềm dạng dịch vụ dựa trên đám mây) được gọi là Power BI
Service.
- Ứng dụng Power BI Mobile dành cho thiết bị di động
Windows, iOS và Android.
VIỆN DẦU KHÍ VIỆT NAM
41
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Trong quy trình làm việc Power BI điển hình, người dùng
bắt đầu bằng cách xây dựng sản phẩm số dưới dạng Power
BI Report trong Power BI Desktop, sau đó xuất bản báo cáo
đó lên Power BI Service. Tuy nhiên, nhờ có sự hỗ trợ của
datamart (Tham khảo mục 4.2.4) các tính năng của Power
BI Service đã dần tiệm cận đến Power BI Desktop và trở nên
mạnh hơn với tính năng cộng tác và chia sẻ mà phiên bản
trên máy tính không hỗ trợ.
Việc xây dựng, cộng tác và chia sẻ các sản phẩm số được
diễn ra trong không gian làm việc chung, gọi là workspace
(Tham khảo mục 5.1). Sau khi tạo report và dashboard,
người dùng có thể chia sẻ các sản phẩm số của mình. Người
dùng cuối trong Power BI Service và thiết bị di động thông
qua Power BI Mobile App có thể xem và tương tác với các
sản phẩm này. Power BI Service cho phép người tạo ra sản
phẩm kiểm soát tính năng và phạm vi chia sẻ của các sản
phẩm bằng hệ thống phân quyền và nhúng. Trong phạm vi
của cuốn sách này, nhóm tác giả sẽ đưa ra một quy trình xây
dựng sản phẩm số hoàn chỉnh và sau đó, hướng dẫn về việc
duy trì, chia sẻ và cách phân phối sản phẩm số tới người
dùng cuối cùng. Để thực hiện được quy trình theo hướng
dẫn của cuốn sách yêu cầu người dùng cần có license Power
BI Premium - cụ thể với nhóm tác giả là Premium Per User
(PPU).
Bên cạnh đó, một tính năng vượt trội của Power BI
Service là hỗ trợ tối ưu việc tự động hóa, qua đó duy trì kết
nối và cập nhật với các nguồn dữ liệu cũng như khả năng kết
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
42
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
hợp với Power Automate để xây dựng một chu trình báo cáo
tự động hoàn chỉnh hoặc ứng dụng người dùng. Cuốn sách
sẽ đề cập đến tính năng schedule refresh như một tính năng
chính để hoàn thiện chu trình báo cáo tự động cập nhật dữ
liệu (Tham khảo mục 4.5).
Tóm lại, Power BI Service được lựa chọn để giới thiệu
trong cuốn sách này bởi những ưu điểm sau:
- Hoàn toàn trên cloud (đối với người dùng có license
PPU): Người dùng có thể xây dựng, chỉnh sửa, chia sẻ sản
phẩm ở bất cứ đâu, không bị phụ thuộc vào máy của người
dùng nên trải nghiệm xây dựng sản phẩm tốt hơn mà không
cần cài đặt. Hoàn toàn thích hợp với những người dùng
không sử dụng hệ điều hành Windows nhưng vẫn muốn sử
dụng Power BI.
- Hỗ trợ tối ưu cộng tác giữa những người dùng xây
dựng sản phẩm và chia sẻ tới người dùng cuối cùng với hình
thức đa dạng (nhúng web, app…)
- Hỗ trợ tối ưu các thao tác tự động hóa (tự động cập
nhật dữ liệu, tạo app tương tác với người dùng cuối).
- Tận dụng triệt để tài nguyên được xây dựng đối với
Power BI: Khả năng lưu trữ dữ liệu lớn của datamart, tính
năng AutoML của dataflow…
4.2.CôngcụchotổchứcdữliệutrênnềntảngPowerBIService
4.2.1. Power Query
Power Query được xem như một công cụ vạn năng được
tích hợp cùng với Power BI, với những tính năng hỗ trợ
VIỆN DẦU KHÍ VIỆT NAM
43
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
người dùng làm sạch và chuẩn bị dữ liệu cho quá trình xây
dựng sản phẩm số, xử lý đối với định dạng dữ liệu, biến đổi
hoặc xoay chiều dữ liệu… và những thao tác nâng cao đối
với dữ liệu. Power Query như một cầu nối giữa sản phẩm
số của người dùng với đa dạng các nguồn dữ liệu trên máy
tính cá nhân (on-premise) và trên mây (on cloud). Sau khi
dữ liệu được chuẩn bị tốt, dữ liệu được tải vào sản phẩm số
dưới dạng bảng biểu. Sau đó, bất cứ khi nào dữ liệu được cập
nhật, người dùng có thể refresh và các thao tác xử lý dữ liệu
trước đó được áp dụng tự động trên cả dữ liệu mới.
Trong phạm vi cuốn sách này, nhóm tác giả giới thiệu
các tính năng của Power Query trong từng trường hợp cụ
thể cùng với một số nguồn dữ liệu phổ biến kết hợp với các
nền tảng lưu trữ dữ liệu như SharePoint Online, Dataverse
và Datamart. Các nguồn dữ liệu có đặc điểm chung là đều ở
trên Cloud để đảm bảo không phụ thuộc vào máy tính của
người dùng.
Người dùng sẽ được thao tác với Power Query trong tính
năng khởi tạo Datamart và Dataflow của Power BI Service.
Nhìn chung, quy trình thao tác làm việc với Power Query
trong các nền tảng Power BI tương tự nhau, bao gồm 4 bước
chính (Hình 4.2).
Các cấu phần chính của Power Query bao gồm:
- Lấy dữ liệu và các kết nối;
- Các bảng điều khiển trong Power Query Editor;
- Cài đặt với Power Query.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
44
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Với Power Query trong Power BI Service, người dùng sẽ
thực hiện bước đầu tiên với phần lấy dữ liệu và kết nối. Ở
phần này, người dùng có quyền lựa chọn loại nguồn dữ liệu
(loại kết nối), khai báo địa chỉ dẫn tới dữ liệu, khai báo bảo
mật đối với nguồn dữ liệu và lựa chọn hình thức tải dữ liệu
(chi tiết các nguồn kết nối được thể hiện ở Hình 4.3). Độc
giả tham khảo ở Chương 7 (Mục 7.1 Hướng dẫn thực hiện
một số loại kết nối dữ liệu) để được hướng dẫn chi tiết các
cách kết nối nguồn dữ liệu khác nhau.
Hình4.3.CửasổlựachọnnguồndữliệucủaPowerQuery.
Hình4.2.CácbướccơbảnđểlàmviệcvớiPowerQuery.
Lựa chọn nguồn
dữ liệu và khai báo
bảo mật nguồn
dữ liệu
Lựa chọn dữ liệu
Xử lý và biến đổi
dữ liệu cho báo
cáo
Tải dữ liệu cuối
cho báo cáo
VIỆN DẦU KHÍ VIỆT NAM
45
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Sau khi hoàn thành kết nối dữ liệu, người dùng sẽ làm
việc với các bảng điều khiển chính trong Power Query
Editor, được thể hiện ở Hình 4.4.
- Preview Pane (Khu vực xem trước): cho phép xem
trước kết quả của các bước thao tác với dữ liệu, đồng thời
cho phép thực hiện một số thao tác tắt đối với dữ liệu. Đối
với dữ liệu lớn, khu vực xem trước chỉ hiển thị một phần
giới hạn của bộ dữ liệu.
- Ribbons (Khu vực thao tác): Bao gồm các thao tác biến
đổi hoặc áp dụng với toàn bộ dữ liệu được lựa chọn. Trong
đó:
• Tab File: Các thao tác lưu dữ liệu vào báo cáo, đóng
Power Query Editor, mở Query Options hoặc mở cài đặt
Data Source Setting
• Tab Home: Một số bước chuyển đổi phổ biến nhất như:
Hình4.4.CácbảngđiềukhiểnchínhtrongPowerQueryEditor.
Query
Pane
Formular Bar
Preview Pane
Ribbons
Query
settings
Applied
Steps
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
46
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
chọn cột, xóa cột, giữ hàng và xóa hàng, đưa thêm nguồn dữ
liệu mới vào báo cáo
• Tab Transform: Cho phép sử dụng chuyển đổi trên các
cột đã chọn. Phụ thuộc vào kiểu dữ liệu của cột, một số lệnh
sẽ được bật hoặc tắt. Trong tab này, người dùng có thể sử
dụng một số phép biến đổi như nhóm hàng dữ liệu theo điều
kiện nhất định, xoay chiều bảng, định dạng hoặc làm sạch cột
dữ liệu, pitvot/unpivot bảng, một số bước tính toán cơ bản...
+ Tab Add Column: Cho phép người dùng thêm cột dữ
liệu mới vào bảng theo một số quy tắc nhất định như đặt
điều kiện, tính toán, trích xuất từ cột cũ…
+ Tab View: Lựa chọn hiển thị đối với Power Query
Editor
- Query Pane (Khu vực danh sách các query trong báo
cáo) bao gồm các bảng dữ liệu đang được làm việc trong báo
cáo. Ở khu vực này người dùng có thể chỉnh sửa, tạo bảng
mới bằng cách sao chép hoặc tham chiếu từ các bảng khác,
lựa chọn tải/không tải dữ liệu của bảng vào báo cáo…
- Query Settings: Khu vực đổi tên và một số cài đặt
chung đối với bảng truy vấn được lựa chọn
- Applied Steps: Khu vực xem lại các bước biến đổi đối
với bảng dữ liệu. Ở đây các thao tác tạo thành một chuỗi các
hành động có thứ tự trước sau. Bất cứ lúc nào người dùng
cũng có thể quay lại các bước trước đó và thay đổi thao tác.
Kết quả cuối cùng cũng sẽ thay đổi
- Formula Bar: Nơi hiển thị công thức tương đương với
VIỆN DẦU KHÍ VIỆT NAM
47
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
các bước biến đổi đối với dữ liệu. Công thức này cũng có
thể được xem tại Advanced Editor. Ngôn ngữ được sử dụng
trong Power Query là M Query
Các cài đặt chung đối với Power Query trong Power BI
được tìm thấy trong Query Option (Tab Home). Tại đây,
người dùng có thể lựa chọn Project options đối với những
báo cáo riêng biệt, hoặc Global options để áp dụng cho tất
cả các báo cáo.
4.2.2. Dataset
Dataset trong Power BI Service là một tập hợp các
bảng dữ liệu từ các nguồn (data sources) khác nhau như
Excel, Sharepoint, SQL Server... được import hoặc kết nối
(connect) với Power BI (Hình 4.7).
Đặc điểm chính của Dataset:
- Mỗi Dataset luôn được liên kết (associated) với ít nhất
1 workspace;
- Một Dataset có thể được sử dụng cho nhiều workspace
khác nhau;
Hình4.5.Tùychỉnhcàiđặtriêngcho
từngdựán.
Hình4.6.Tùychỉnhcàiđặtchung.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
48
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Từ một Dataset, có thể tạo ra nhiều report/dashboard
có nội dung (content) khác nhau;
- Dataset có thể tự động cập nhật dữ liệu mới (refresh)
theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real-
time).
Cách tạo Dataset
Trong Power BI Service, có 5 cách để tạo 1 Dataset như sau:
- Upload 1 file Excel hoặc CSV;
- Upload 1 file Power BI Desktop (.pbix);
- Kết nối với một mô hình dữ liệu (data model) có sẵn từ
nguồn bên ngoài Power BI;
- Sử dụng API (push dataset);
- Kết nối với các dữ liệu thời gian thực (real-time data).
Hình4.7.GiaodiệnDatasettrongPowerBIService.
VIỆN DẦU KHÍ VIỆT NAM
49
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Các bước tạo Dataset độc giả tham khảo ở Chương 7 (Mục
7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
4.2.3. Dataflow
Dataflow là quá trình trích xuất dữ liệu từ một hoặc nhiều
nguồn khác nhau, sau đó làm sạch, biến đổi và lưu lại kết quả
thành một tập hợp các bảng dữ liệu trong Workspace của
Power BI Service. Các bảng dữ liệu này sau đó được dùng để
tạo các Dataset, Datamart hoặc sử dụng để xây dựng các mô
hình học máy trong Power BI (Hình 4.8).
Đặc điểm chính của Dataflow:
- Dataflow được thiết kế để có thể tái sử dụng nhiều
lần cho nhiều Dataset, người dùng chỉ cần tải dữ liệu từ
Dataflow mà không cần kết nối trực tiếp đến nguồn (Data
source), do đó giảm thiểu nhu cầu tạo các kết nối riêng biệt
tới nguồn dữ liệu và giảm tải cho hệ thống hạ tầng dữ liệu.
Hình4.8.Tổngquankiếntrúcdataflow.Nguồn:Microsoft,2023.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
50
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Do người dùng có thể xây dựng Dataset/Datamart từ
Dataflow mà không cần kết nối trực tiếp với nguồn dữ liệu
(Data source), quản trị viên sẽ dễ dàng hơn trong việc quản
lý và tăng cường bảo mật cho hệ thống bằng cách chỉ cho
phép người dùng tải dữ liệu từ Dataflow thay vì trực tiếp từ
Data source. Khi đó quản trị viên chỉ cần kiểm soát quyền
truy cập của người dùng đối với Dataflow là đủ để bảo mật
cho hệ thống.
- Dataflow có thể tự động cập nhật dữ liệu mới (refresh)
theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real-
time).
Các bước tạo Dataflow độc giả tham khảo ở Chương 7
(Mục 7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
4.2.4. Datamart
Datamart là một công cụ lưu trữ dữ liệu trên nền tảng
Power BI Service dưới dạng SQL database. Trong phạm vi
cuốn sách này, nhóm tác giả sử dụng Datamart là nơi lưu
trữ dữ liệu cho tất cả các sản phẩm được xây dựng trên nền
tảng.
Như đã đề cập, Datamart trong Power BI là một cơ sở dữ
liệu quan hệ (relational database) gồm một tập hợp các bảng
dữ liệu phục vụ một nghiệp vụ (business) cụ thể, được xây
dựng bằng cách tổng hợp dữ liệu từ nhiều nguồn khác nhau,
sau đó được làm sạch, xử lý và biến đổi bằng Power Query
và tải lên Azure SQL Database - Là dịch vụ cơ sở dữ liệu
trên nền tảng đám mây (cloud database) của Microsoft. Trên
VIỆN DẦU KHÍ VIỆT NAM
51
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Datamart, ta có thể tạo quan hệ (relationship) giữa các bảng,
ta cũng có thể truy vấn (query) dữ liệu trong Datamart bằng
T-SQL.
Toàn bộ quá trình ETL để xây dựng Datamart được
thực hiện trên nền tảng đám mây và công cụ ETL được tích
hợp sẵn trong Power BI Service. Ngay sau khi được tạo,
Datamart sẽ tự động sinh ra một Dataset tương ứng, ta có
thể dùng Dataset này để tạo các Reports hoặc Dashboards
theo nhu cầu.
Ưu điểm của Datamart:
- Cách tạo đơn giản, dễ dàng, quen thuộc với người
dùng Excel và Power BI với công cụ Power Query;
- Tích hợp tính năng kết nối nhiều nguồn dữ liệu khác
nhau và xử lý dữ liệu với giao diện không cần sử dụng code;
- Dung lượng lưu trữ lớn, lên đến 100 GB/Datamart;
- Tích hợp tính năng schedule refresh hỗ trợ khả năng
tự động cập nhật dữ liệu;
- Được xây dựng hoàn toàn dựa trên nền tảng web,
không cần cài đặt thêm bất cứ phần mềm hay công cụ nào
trên máy tính của người dùng;
- Được lưu trữ trên Azure SQL Database - Dịch vụ cơ
sở dữ liệu đám mây của Microsoft trong đó Microsoft chịu
trách nhiệm quản lý, cài đặt, cấu hình, bảo mật và bảo trì hệ
thống, người dùng chỉ cần xây dựng và khai thác sử dụng
Database của mình mà không cần quan tâm đến các công
việc khác liên quan đến hạ tầng;
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
52
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Hỗ trợ truy vấn bằng T-SQL;
- Người dùng có thể tạo mối quan hệ (relationship) giữa
các bảng trực tiếp trên Datamart với các thao tác kéo - thả
mà không cần phải thực hiện thêm bất kỳ công cụ nào khác.
Phạm vi ứng dụng
Datamart được Microsoft đưa ra để phục vụ cho những
khách hàng cần quản lý dữ liệu theo kiểu kiến trúc phân
tán, theo đó dữ liệu được chia nhỏ và xây dựng thành các
Database tương ứng các lĩnh vực/nghiệp vụ của tổ chức (ví
dụ dữ liệu trong một tổ chức được chia và quản lý theo các
nghiệp vụ tương ứng với các bộ phận như: Nhân sự, kế toán,
kinh doanh,…) thay vì được đưa vào quản lý tập trung trong
một Data Warehouse duy nhất cho toàn bộ tổ chức. Mỗi
bộ phận (nhân sự, kế toán, kinh doanh,…) sẽ tự xây dựng
Database của riêng mình để khai thác và sử dụng và được
gọi là các Datamart.
Việc quản lý dữ liệu theo kiểu phân tán như trên sẽ giúp
các bộ phận nghiệp vụ chủ động trong việc tự xây dựng cơ
sở dữ liệu phù hợp với đặc thù hoạt động của mình, linh
hoạt và kịp thời, giúp giảm thiểu thời gian trong việc cập
nhật các dữ liệu mới cũng như điều chỉnh/thay đổi cơ sở
dữ liệu theo nhu cầu và thực tế công việc mà không phụ
thuộc vào Bộ phận khác (ở đây là Bộ phận IT quản lý Data
Warehouse chung nếu có).
Trong cuốn sách này, nhóm tác giả khuyến khích người
dùng sử dụng Datamart như là nơi tập hợp dữ liệu từ các
VIỆN DẦU KHÍ VIỆT NAM
53
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nguồn dữ liệu khác nhau và tổ chức thành bộ dữ liệu làm
nền tảng cho sản phẩm dữ liệu của mình.
Các bước tạo Datamart được thể hiện ở Chương 7 (Mục
7.2. Cách khởi tạo công cụ tổ chức dữ liệu).
Một số điểm cần lưu ý:
- Để có thể tạo được Datamart, người dùng phải có tài
khoản Power BI Premium;
- Datamart là sản phẩm mới đang trong giai đoạn thử
nghiệm nên một số chính sách hiện tại có thể thay đổi.
4.3. Trực quan hóa dữ liệu
4.3.1. Khái niệm trực quan hóa dữ liệu
Trực quan hóa dữ liệu là quá trình sử dụng các công cụ
và kỹ thuật để biểu diễn dữ liệu dưới dạng hình ảnh, đồ
thị, bản đồ hoặc các hình dạng khác. Mục đích của việc
trực quan hóa dữ liệu là giúp người dùng dễ dàng hiểu
và phân tích dữ liệu, giúp cho việc đưa ra quyết định và
lựa chọn thông minh hơn. Có nhiều loại khác nhau của
trực quan hóa dữ liệu, chẳng hạn như biểu đồ cột, biểu
đồ đường, biểu đồ hình tròn, biểu đồ dạng lưới, bản đồ
vị trí, mỗi loại có ưu và nhược điểm khác nhau tùy thuộc
vào loại dữ liệu và những thông tin mà người dùng muốn
truy xuất.
4.3.2. Tầm quan trọng của trực quan hóa dữ liệu
Mục tiêu chính của việc biểu diễn dữ liệu là làm cho dữ
liệu phức tạp trở nên dễ hiểu hơn và dễ dàng truy cập hơn
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
54
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cho đối tượng rộng hơn, bằng cách nhấn mạnh xu hướng và
khám phá dữ liệu mà không cần phải nhìn vào dữ liệu gốc.
Trực quan hóa dữ liệu là cách nhanh chóng và dễ dàng để
truyền đạt các khái niệm cho người dùng cuối. Các nền tảng
thông minh như Power BI giúp xử lý các hình ảnh trực quan
khác nhau của các bộ dữ liệu một cách an toàn. Cụ thể hơn,
đối với Power BI:
- Khám phá dữ liệu: Power BI cho phép người dùng
khám phá dữ liệu từ nhiều nguồn và tạo ra các biểu đồ tương
tác, chẳng hạn như biểu đồ, bản đồ và bảng, giúp người dùng
xác định các mẫu, xu hướng và ngoại lệ trong dữ liệu.
- Phân tích dữ liệu: Power BI cung cấp một loạt các tùy
chọn biểu diễn dữ liệu, chẳng hạn như drill-through, lọc và
cắt, giúp người dùng thực hiện phân tích sâu hơn và nhận ra
các khám phá dữ liệu.
- Chia sẻ dữ liệu: Power BI cho phép người dùng tạo
các bảng điều khiển và báo cáo tương tác có thể chia sẻ với
người khác, giúp dễ dàng chia sẻ các kết quả, kết luận và dự
báo về dữ liệu.
4.3.3. Các dạng biểu diễn cơ bản trong Power BI
Trong Power BI, có nhiều dạng biểu diễn mà độc giả có
thể sử dụng để biểu diễn. Tuy nhiên, việc lựa chọn đúng biểu
đồ để biểu diễn dữ liệu cũng rất quan trọng để đáp ứng các
yêu cầu và chiến lược của doanh nghiệp. Độc giả cần biết
được cái mình muốn thể hiện là gì?
Trên nền tảng Power BI Service, độc giả có thể lựa chọn
VIỆN DẦU KHÍ VIỆT NAM
55
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
nhiều dạng biểu đồ cơ bản ở tab “Visualizations” được thể
hiện ở Hình 4.9.
Các dạng biểu đồ cơ bản bao gồm Area Charts, Line
Charts, Bar Charts, Combo Charts, Pie Charts, Doughnut
Charts, Gauge Charts, Scatter Charts, Tables... Tham khảo
Chương 7 (Mục 7.3 để biết thêm thông tin chi tiết).
Để tạo biểu đồ trên Power BI, độc giả có thể thực hiện
theo các bước cơ bản sau:
- Bước 1: Mở và đăng nhập Power BI service theo đường
link sau: https://powerbi.microsoft.com;
- Bước 2: Tổ chức và Nhập bảng dữ liệu (độc giả tham
khảo mục 4.2);
- Bước 3: Trong phần "Visualizations" chọn loại Chart
phù hợp;
- Bước 4: Kéo và thả dữ liệu cần tạo biểu đồ vào tương
ứng các trục X,Y;
Hình4.9.CácdạngbiểuđồtrênnềntảngPowerBI.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
56
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Bước 5: Sử dụng công cụ "Format" để thay đổi màu sắc,
kích thước... của biểu đồ;
- Bước 6: Sử dụng công cụ "View" để xem và chỉnh sửa
biểu đồ;
- Bước 7: Lưu và chia sẻ biểu đồ với người khác.
4.3.4. Trực quan hóa dữ liệu nâng cao
4.3.4.1. Biểu diễn bản đồ
Bên cạnh các biểu diễn mạnh mẽ về bảng biểu, cột,
đường, Power BI cũng được tích hợp nhiều giải pháp biểu
diễn thông tin trên bản đồ nhằm đáp ứng nhu cầu đa dạng
của người dùng. Các công cụ biểu diễn bản đồ tập trung làm
nổi bật đặc điểm, vị trí của đối tượng trên nền bản đồ khu
vực và thế giới. Power BI cung cấp rất nhiều công cụ biểu
Hình4.10.CáccôngcụbiểudiễnbảnđồtrongPowerBI.
VIỆN DẦU KHÍ VIỆT NAM
57
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
diễn dữ liệu lên bản đồ khác nhau. Mỗi công cụ có đặc điểm
riêng phù hợp với yêu cầu của người dùng. Các loại biểu
diễn bản đồ được thể hiện ở Hình 4.10.
Để tìm hiểu chi tiết cách thức xây dựng biểu đồ, bản đồ,
độc giả tham khảo Chương 7 (Mục 7.4. Cách triển khai áp
dụng biểu đồ bản đồ nâng cao).
4.3.4.2. Biểu diễn nâng cao với code Python
Bên cạnh các tác vụ biểu diễn được tích hợp sẵn hoặc cài
đặt từ thư viện mở rộng, Microsoft còn cho phép người dùng
tùy biến mạnh mẽ với code. Ngôn ngữ R và Python được hỗ
trợ trong nội dung này. Các biểu diễn với code nhằm đáp
ứng các biểu diễn nâng cao theo nhu cầu của người dùng.
Tính năng yêu cầu người dùng phải có khả năng làm
việc với code. Trong phạm vi bài viết, hướng dẫn chi tiết về
Hình4.11.BiểudiễnđườngđoghigiếngkhoanbằngtínhnăngcodePythonVisual.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
58
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Hình4.12.Biểudiễncross-plotvàcodemẫu.
Hình4.13.Biểudiễndạngđườngvàcodemẫu.
Hình4.14.Biểudiễnnhiềutươngquanchéocùnglúc.
VIỆN DẦU KHÍ VIỆT NAM
59
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
cách sử dụng ngôn ngữ Python để biểu diễn dữ liệu trong
dashboard Power BI tham khảo Chương 7 (Mục 7.5. Cách
triển khai áp dụng biểu diễn nâng cao kết hợp với Python).
Lưu ý, để sử dụng visual với code Python, người dùng phải
sử dụng Power BI Desktop. Power BI Service hiện chưa có
tính năng này. Một số mẫu sản phẩm biểu diễn nâng cao kết
hợp Python được thể hiện trong Hình 4.11 - 4.15.
4.4. Auto Machine Learning (AutoML) – Học máy tự động
4.4.1. Học máy/Học máy tự động là gì?
Học máy (Machine Learning)
Những năm gần đây khái niệm học máy đã dần trở nên
quen thuộc với cộng đồng công nghệ, với những lợi ích của
học máy đem lại trong việc giải quyết các bài toán trong thực
Hình4.15.Biểudiễnđườngđoghigiếngkhoanvàcodemẫu.
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
60
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
tế. Hiểu đơn giản Học máy (machine learning - ML) là một
lĩnh vực nhỏ của khoa học máy tính, có khả năng tự học
hỏi dựa trên dữ liệu được đưa vào mà không cần phụ thuộc
vào việc lập trình cụ thể và dựa trên đó đưa ra những quyết
định, dự báo và điều khiển.
Mô hình học máy có 2 loại chính là học có giám
sát (suppervised learning) và học không có giám sát
(unsupervised learning).
Học máy tự động (Automated Machine Learning)
Học máy tự động hay còn được sử dụng như là “AutoML”
là một quá trình tự động thực hiện các tác vụ mất nhiều thời
gian lặp đi lặp lại trong quá trình phát triển mô hình học
máy. Công cụ cho phép các nhà khoa học dữ liệu, phân tích
và các nhà phát triển xây dựng các mô hình học máy với
lượng dữ liệu lớn, hiệu suất và năng suất cao trong khi đó
vẫn duy trì được chất lượng mô hình. AutoML sẽ đơn giản
hóa các quy trình của việc phát triển các mô hình học máy,
không phụ thuộc quá nhiều vào kinh nghiệm của những
chuyên gia khoa học dữ liệu, để xác định bất kỳ những vấn
đề nào gặp phải xuyên suốt từ bước đầu đến bước cuối trong
quá trình xây dựng mô hình. AutoML được chia thành 4
loại chính theo nhu cầu sử dụng:
- Loại 1: Triển khai các giải pháp học máy không cần có
kiến thức sâu.
- Loại 2: Tiết kiệm thời gian và nguồn lực.
- Loại 3: Tận dụng các công nghệ mới nhất để phục vụ
công việc.
VIỆN DẦU KHÍ VIỆT NAM
61
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Loại 4: Khả năng giải quyết vấn đề nhanh chóng.
4.4.2. Automated Machine Learning (AutoML) trong Power BI
AutoML được xây dựng với mục đích giúp người dùng
Power BI, có hoặc không có chuyên môn về khoa học dữ
liệu có thể tạo ra các mô hình dự đoán hoặc phân loại dữ
liệu dễ dàng và nhanh chóng. Tính năng này giúp tự động
hóa quá trình xây dựng các mô hình Machine Learning trực
tuyến, cho phép thử nghiệm với số lượng lớn dữ liệu.
Bên cạnh các sản phẩm Machine Learning khác trong
Power BI được xây dựng trên nền tảng Azure, nhóm tác giả
tập trung giới thiệu công cụ Auto ML thông qua Dataflow
trong Power BI Service trên nền tảng đám mây. AutoML
trong Power BI được gắn kết với AutoML từ nền tảng học
máy Azure để khởi tạo các mô hình học máy do người dùng
yêu cầu. Tuy nhiên, người dùng sẽ không cần phải đăng
nhập Azure để có thể sử dụng AutoML trên Power BI. Quá
trình huấn luyện và lưu trữ các mô hình học máy được quản
lý hoàn toàn bởi nền tảng của Power BI.
AutoML cho phép người dùng tận dụng các dữ liệu sẵn
có hoặc bên ngoài để xây dựng các mô hình học máy, ngay
trên nền tảng Power BI Service. Với AutoML, việc tạo lập
các mô hình học máy rất trực quan và hiện hoàn toàn tự
động và được giám sát để có thể đảm bảo chất lượng mô
hình, người dùng hoàn toàn có thể hiểu và nắm được toàn
bộ các bước tạo ra mô hình học máy.
Các tính năng chính của AutoML trên Power BI Service
bao gồm:
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
62
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
- Tự động phát hiện các mẫu dữ liệu và loại bỏ các giá trị
bị khuyết hoặc không hợp lệ;
- Tự động chọn mô hình phù hợp nhất trong khoảng
thời gian cho phép để huấn luyện trên dữ liệu của bạn;
- Tự động tinh chỉnh các siêu tham số của mô hình để
tối ưu hóa hiệu suất dự đoán;
- Tự động chạy nhiều mô hình khác nhau và so sánh
hiệu suất của chúng để chọn ra mô hình tốt nhất;
- Tự động tạo ra các biểu đồ và báo cáo phân tích để
giúp người dùng dễ dàng hiểu kết quả của mô hình.
Quy trình xây dựng một mô hình học máy AutoML bắt
đầu bằng việc người dùng lựa chọn các dữ liệu mong muốn
đưa vào xây dựng mô hình học máy, sau đó AutoML sẽ thực
hiện tự động phân chia dữ liệu cho việc huấn luyện và đánh
Hình4.16.QuytrìnhthựchiệnxâydựngmôhìnhhọcmáytrongPowerBI.
VIỆN DẦU KHÍ VIỆT NAM
63
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
giá dữ liệu và lựa chọn thuật toán để xây dựng mô hình huấn
luyện. Trong quá trình huấn luyện, AutoML sẽ lựa chọn
những thuật toán phù hợp nhất, đồng thời tối ưu và đánh
giá mô hình học máy. Sau khi huấn luyện xong AutoML sẽ
tự động thành lập các báo cáo tự động, để giải thích và phân
tích kết quả. Ngoài ra, người dùng có thể cải thiện và thực
hiện lại việc huấn luyện mô hình thông qua dữ liệu ban đầu
hoặc dữ liệu mới được cập nhật thêm. Và cuối cùng, hoàn
toàn có thể áp dụng dễ dàng cho việc dự đoán đối với nhóm
dữ liệu mới. Quy trình thực hiện xây dựng mô hình học máy
được thể hiện ở Hình 4.16.
4.4.2.1. Khởi tạo tính năng AutoML trong Power BI
Để người dùng có thể sử dụng Auto ML trong Power BI
người dùng cần phải nâng cấp lên tài khoản cao cấp. Các tác
vụ từ các dự án khác nhau sẽ độc lập với nhau về tác vụ thực
hiện.
Người dùng cần phải được khởi tạo “Capacity workload”
trước khi có thể sử dụng bất kỳ tính năng nào của AutoML.
Cần chú ý rằng “Capacity workload” bao gồm luôn
“Congitive Services” và AutoML. Tuy nhiên, với tài khoản
“Premium Per User” thì việc tạo “Capacity workload” đã
được thực hiện sẵn và hạn chế sự can thiệp của người dùng.
4.4.2.2. Các bước tạo lập mô hình AutoML
Tạo lập mô hình AutoML bao gồm các bước chính sau
đây:
Bước 1: Chuẩn bị dữ liệu đầu vào
CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES
64
SÁNG TẠO SẢN PHẨM SỐ
Ai cũng dùng AI
ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
Người dùng tạo lập dữ liệu từ các nguồn dữ liệu sẵn có
hoặc đăng tải mới từ bên ngoài vào. Và xác định đối tượng
cần dự báo và các thông tin đầu vào để xây dựng mô hình
học máy.
Bước 2: Tạo lập mô hình học máy
Người dùng cần tạo và đặt tên cho mô hình học máy cần
lập.
Bước 3: Huấn luyện mô hình học máy (ML Model Training)
Trongbướcnàyngườidùngcầnxácđịnhloạimôhìnhphù
hợp với bài toán ban đầu đặt ra là Phân loại (Classification)
hay Tuyến tính (Regression). Các bước xử lý dữ liệu và chạy
các vòng lập thuật toán khác nhau cũng được thực hiện tại
bước này.
Bước 4: Đánh giá, báo cáo kết quả mô hình huấn luyện
Sau khi mô hình học máy hoàn thành việc huấn luyện,
người dùng có thể sử dụng và tham vấn các báo cáo mà hệ
thống tạo lập sẵn để đánh giá mức độ chính xác, nhận định
những thông số đầu vào quan trọng ảnh hướng chính đến
độ chính xác của mô hình.
Bước 5: Áp dụng mô hình dự báo
Sau khi đã lựa chọn được mô hình học máy cuối cùng,
thỏa mãn toàn bộ điều kiện của người dùng, người dùng
hoàn toàn có thể sử dụng mô hình học máy đã luyện xong,
để dự đoán cho các tập hợp dữ liệu có thông tin nhãn/mục
tiêu bị thiếu, cần phải dự đoán.
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf
Power-BI book.pdf

More Related Content

What's hot

Phân tích đối thủ cạnh tranh
Phân tích đối thủ cạnh tranhPhân tích đối thủ cạnh tranh
Phân tích đối thủ cạnh tranh
luanvantrust
 
Báo cáo tốt nghiệp
Báo cáo tốt nghiệpBáo cáo tốt nghiệp
Báo cáo tốt nghiệp
My Đá
 
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
nataliej4
 
Chuong 3. cnpm
Chuong 3. cnpmChuong 3. cnpm
Chuong 3. cnpm
caolanphuong
 
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAYTài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Viết thuê trọn gói ZALO 0934573149
 
Bao cao UML phan tich he thong nha cho thue
Bao cao UML phan tich he thong nha cho thueBao cao UML phan tich he thong nha cho thue
Bao cao UML phan tich he thong nha cho thue
Kali Back Tracker
 
Những ưu và nhược điểm của Kênh phân phối Vinfast
Những ưu và nhược điểm của Kênh phân phối VinfastNhững ưu và nhược điểm của Kênh phân phối Vinfast
Những ưu và nhược điểm của Kênh phân phối Vinfast
HuengMar
 
He thong thong tin quan ly
He thong thong tin quan lyHe thong thong tin quan ly
He thong thong tin quan lyvuthanhtien
 
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đĐề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Quản trị Marketing: tình huống 8
Quản trị Marketing: tình huống 8Quản trị Marketing: tình huống 8
Quản trị Marketing: tình huống 8
Tuan Kiet Doan Minh
 
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOTĐề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
Dịch vụ viết bài trọn gói ZALO: 0909232620
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
Võ Phúc
 
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
https://www.facebook.com/garmentspace
 
Đề tài: Xây dựng website bán hàng trực tuyến, HAY
Đề tài: Xây dựng website bán hàng trực tuyến, HAYĐề tài: Xây dựng website bán hàng trực tuyến, HAY
Đề tài: Xây dựng website bán hàng trực tuyến, HAY
Dịch vụ viết thuê Khóa Luận - ZALO 0932091562
 
Nhập môn công nghệ thông tin
Nhập môn công nghệ thông tinNhập môn công nghệ thông tin
Nhập môn công nghệ thông tin
Thanh Lee
 
Giáo trình Quản trị mạng
Giáo trình Quản trị mạngGiáo trình Quản trị mạng
Giáo trình Quản trị mạngTran Tien
 
Chiến lược xúc tiến hỗn hợp
Chiến lược xúc tiến hỗn hợpChiến lược xúc tiến hỗn hợp
Chiến lược xúc tiến hỗn hợp
bookbooming1
 
Bài giảng kiến trúc máy tính
Bài giảng kiến trúc máy tínhBài giảng kiến trúc máy tính
Bài giảng kiến trúc máy tínhCao Toa
 
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAOĐề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864
 

What's hot (20)

Phân tích đối thủ cạnh tranh
Phân tích đối thủ cạnh tranhPhân tích đối thủ cạnh tranh
Phân tích đối thủ cạnh tranh
 
Báo cáo tốt nghiệp
Báo cáo tốt nghiệpBáo cáo tốt nghiệp
Báo cáo tốt nghiệp
 
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
BÁO CÁO ĐỒ ÁN MÔN HỌC ĐIỆN TOÁN ĐÁM MÂY ĐỀ TÀI: TÌM HIỂU VÀ SỬ DỤNG AMAZON WE...
 
Chuong 3. cnpm
Chuong 3. cnpmChuong 3. cnpm
Chuong 3. cnpm
 
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAYTài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
Tài liệu Xây dựng chương trình quản lý bán hàng FREE RẤT HAY
 
Bao cao UML phan tich he thong nha cho thue
Bao cao UML phan tich he thong nha cho thueBao cao UML phan tich he thong nha cho thue
Bao cao UML phan tich he thong nha cho thue
 
Những ưu và nhược điểm của Kênh phân phối Vinfast
Những ưu và nhược điểm của Kênh phân phối VinfastNhững ưu và nhược điểm của Kênh phân phối Vinfast
Những ưu và nhược điểm của Kênh phân phối Vinfast
 
He thong thong tin quan ly
He thong thong tin quan lyHe thong thong tin quan ly
He thong thong tin quan ly
 
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đĐề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
Đề tài: Chương trình dự báo doanh thu bán hàng cho siêu thị, 9đ
 
Quản trị Marketing: tình huống 8
Quản trị Marketing: tình huống 8Quản trị Marketing: tình huống 8
Quản trị Marketing: tình huống 8
 
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOTĐề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
Đề tài: Thiết kế hệ thống thông tin quản lý phân phối Gas, HOT
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
 
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
Khóa luận tốt nghiệp Phân tích, thiết kế hệ thống thông tin quản lý nhân sự t...
 
Đề tài: Xây dựng website bán hàng trực tuyến, HAY
Đề tài: Xây dựng website bán hàng trực tuyến, HAYĐề tài: Xây dựng website bán hàng trực tuyến, HAY
Đề tài: Xây dựng website bán hàng trực tuyến, HAY
 
Nhập môn công nghệ thông tin
Nhập môn công nghệ thông tinNhập môn công nghệ thông tin
Nhập môn công nghệ thông tin
 
Qtcl
QtclQtcl
Qtcl
 
Giáo trình Quản trị mạng
Giáo trình Quản trị mạngGiáo trình Quản trị mạng
Giáo trình Quản trị mạng
 
Chiến lược xúc tiến hỗn hợp
Chiến lược xúc tiến hỗn hợpChiến lược xúc tiến hỗn hợp
Chiến lược xúc tiến hỗn hợp
 
Bài giảng kiến trúc máy tính
Bài giảng kiến trúc máy tínhBài giảng kiến trúc máy tính
Bài giảng kiến trúc máy tính
 
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAOĐề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
Đề tài hoàn thiện kênh phân phối hàng, ĐIỂM CAO
 

Similar to Power-BI book.pdf

Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOTLuận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đĐề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864
 
Giao trinh tdhtkcd__tong_hop__draft
Giao trinh tdhtkcd__tong_hop__draftGiao trinh tdhtkcd__tong_hop__draft
Giao trinh tdhtkcd__tong_hop__draftTrinh Nguyen
 
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
lamluanvan.net Viết thuê luận văn
 
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAYĐề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAYĐề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giớiLuận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864
 
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đChi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
Dịch vụ viết thuê Khóa Luận - ZALO 0932091562
 
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đLuận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864
 
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAMMÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
lamluanvan.net Viết thuê luận văn
 
Qlns_hdsd
Qlns_hdsdQlns_hdsd
Qlns_hdsd
kisshs
 
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất Nghệ
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất NghệGiáo trình asp net 3.5 sử dụng VS 2008 - Nhất Nghệ
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất NghệMasterCode.vn
 
Giao trình asp-net w2008
Giao trình asp-net w2008 Giao trình asp-net w2008
Giao trình asp-net w2008 Tùng Trần
 
Giáo trình ASP.NET - Trung tâm Nhất Nghệ
Giáo trình ASP.NET - Trung tâm Nhất NghệGiáo trình ASP.NET - Trung tâm Nhất Nghệ
Giáo trình ASP.NET - Trung tâm Nhất Nghệ
Trung Thanh Nguyen
 
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
lamluanvan.net Viết thuê luận văn
 
Bai giang asp.net full
Bai giang asp.net fullBai giang asp.net full
Bai giang asp.net fullBoom Su
 
Bai giang asp.net full
Bai giang asp.net full Bai giang asp.net full
Bai giang asp.net full
Đỗ Đức Hiển
 
Bai giang asp.net full
Bai giang asp.net fullBai giang asp.net full
Bai giang asp.net full
Ly hai
 

Similar to Power-BI book.pdf (20)

Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOTLuận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
Luận văn: Tìm hiểu giải pháp ảo hóa docker và ứng dụng, HOT
 
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đĐề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
Đề tài: Tìm hiểu giải pháp ảo hóa docker, HAY, 9đ
 
Quantriweb moi
Quantriweb moiQuantriweb moi
Quantriweb moi
 
Giao trinh tdhtkcd__tong_hop__draft
Giao trinh tdhtkcd__tong_hop__draftGiao trinh tdhtkcd__tong_hop__draft
Giao trinh tdhtkcd__tong_hop__draft
 
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
KINH NGHIỆM XÂY DỰNG VÀ PHÁT TRIỂN CÁC SÀN THƯƠNG MẠI ĐIỆN TỬ B2B VÀ BÀI HỌC ...
 
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAYĐề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
Đề tài: Chương trình quản lý tài sản cố định ở khách sạn, HAY
 
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAYĐề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
Đề tài: Xây dựng chương trình quản lý tài sản ở khách sạn, HAY
 
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giớiLuận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
Luận văn: Kế toán chi phí sản xuất tại công ty thi công cơ giới
 
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đChi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
Chi phí sản xuất và giá thành sản phẩm tại Công ty hoạch toán, 9đ
 
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
Luận văn: Kế toán chi phí sản xuất và tính giá thành sản phẩm tại Công ty Cổ ...
 
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đLuận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
Luận văn: Kế toán chi phí sản xuất tại Công ty sản xuất nhựa, 9đ
 
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAMMÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
MÔ HÌNH THƯƠNG MẠI ĐIỆN TỬ CỦA ALIBABA VÀ BÀI HỌC CHO DOANH NGHIỆP VIỆT NAM
 
Qlns_hdsd
Qlns_hdsdQlns_hdsd
Qlns_hdsd
 
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất Nghệ
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất NghệGiáo trình asp net 3.5 sử dụng VS 2008 - Nhất Nghệ
Giáo trình asp net 3.5 sử dụng VS 2008 - Nhất Nghệ
 
Giao trình asp-net w2008
Giao trình asp-net w2008 Giao trình asp-net w2008
Giao trình asp-net w2008
 
Giáo trình ASP.NET - Trung tâm Nhất Nghệ
Giáo trình ASP.NET - Trung tâm Nhất NghệGiáo trình ASP.NET - Trung tâm Nhất Nghệ
Giáo trình ASP.NET - Trung tâm Nhất Nghệ
 
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
Hoàn thiện công tác kế toán nguyên vật liệu, công cụ dụng cụ tại Công ty Cổ p...
 
Bai giang asp.net full
Bai giang asp.net fullBai giang asp.net full
Bai giang asp.net full
 
Bai giang asp.net full
Bai giang asp.net full Bai giang asp.net full
Bai giang asp.net full
 
Bai giang asp.net full
Bai giang asp.net fullBai giang asp.net full
Bai giang asp.net full
 

Power-BI book.pdf

  • 1. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí VIỆN DẦU KHÍ VIỆT NAM N À XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG H SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí
  • 2.
  • 3. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí VIỆN DẦU KHÍ VIỆT NAM NHÀ XUẤT BẢNTHÔNGTINVÀTRUYỀNTHÔNG
  • 4. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí CHỈ ĐẠO NỘI DUNG VIỆN DẦU KHÍ VIỆT NAM TÁC GIẢ VŨ TUYẾT VY TRƯƠNG VĂN NHÂN NGUYỄN TRUNG SƠN NGUYỄN ANH TUẤN NHỮ ANH ĐỨC ĐOÀN TIẾN QUYẾT NGUYỄN THU HƯƠNG ĐÀO HƯƠNG GIANG NGUYỄN VĂN SỬ LÊ NGỌC ANH Bản quyền ©2023 củaViện Dầu khíViệt Nam Đã đăng ký bản quyền. Không được sao chép bất kỳ phần nào của ấn phẩm này mà không có sự cho phép bằng văn bản củaViện Dầu khíViệt Nam. Bất kỳ sự sao chép nào không được sự đồng ý củaViện Dầu khíViệt Nam đều là bất hợp pháp và vi phạm Luật Xuất bản, Luật Sở hữuTrí tuệ.
  • 5. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1. Thông điệp ...................................................................10 1.2. Ai sẽ đọc cuốn sách này?...........................................11 1.3. Nền tảng sử dụng ........................................................12 1.4. Người đọc nhận được những gì? ..............................13 1.5. Nội dung của cuốn sách ............................................14 CHƯƠNG 2: BUSINESS INTELLIGENCE 2.1. Tầm quan trọng của Business Intelligence ..............15 2.2. Phân tích Business Intelligence ................................15 CHƯƠNG 3: SẢN PHẨM SỐ 3.1. Hiểu rõ về dữ liệu .......................................................20 3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc dữ liệu ......................................................................................20 3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu ......................24 3.2. Sản phẩm số ................................................................24 3.2.1. Khái niệm sản phẩm số ..........................................24 3.2.2. Phân loại sản phẩm số ............................................26 3.2.3. Quy trình xây dựng sản phẩm số ..........................29 CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 4.1. Tại sao sử dụng Power BI Service? ...........................40 4.2. Công cụ cho tổ chức dữ liệu trên nền tảng Power BI Service. .....................................................................................42 4.2.1. Power Query ............................................................42 MỤC LỤC
  • 6. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 4.2.2. Dataset ......................................................................47 4.2.3. Dataflow ....................................................................49 4.2.4. Datamart ...................................................................50 4.3. Trực quan hóa dữ liệu ................................................53 4.3.1. Khái niệm trực quan hóa dữ liệu ...........................53 4.3.2. Tầm quan trọng của trực quan hóa dữ liệu...........53 4.3.3. Các dạng biểu diễn cơ bản trong Power BI ..........54 4.3.4. Trực quan hóa dữ liệu nâng cao ............................56 4.4. Auto Machine Learning (AutoML) - Học máy tự động .....................................................................................59 4.4.1. Học máy/Học máy tự động là gì? ..........................59 4.4.2. Automated Machine Learning (AutoML) trong Power BI ..............................................................................61 4.5. Automation .................................................................65 4.5.1. Schedule Refresh .....................................................65 4.5.2. Quy trình xây dựng, duy trì và phân phối sản phẩm số trên Power BI Service sử dụng Power BI pipeline ................................................................................66 CHƯƠNG 5: CHIA SẺ SẢN PHẨM SỐ 5.1. Workspace.....................................................................73 5.1.1. Giới thiệu chung ......................................................73 5.1.2. Các chức năng của workspace ...............................73 5.1.3. Phân quyền và quản lý workspace .........................75 5.2. Power BI Embed .........................................................76 5.2.1. Giới thiệu chung ......................................................76
  • 7. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 5.2.2. Publish to web ..........................................................77 5.2.3. Embed to Website or Portal (Secured Embed - Nhúng an toàn) ..................................................................79 5.2.4. Embed to Sharepoint Online .................................80 5.3. Power BI App ..............................................................81 CHƯƠNG 6: CÁC SẢN PHẨM SỐ CHO LĨNH VỰC DẦU VÀ KHÍ 6.1. Báo cáo số ...................................................................83 6.1.1. CCUS .......................................................................83 6.1.2. Chỉ số Hydrogen ....................................................95 6.1.3. Biostratigraphic Analysis .....................................104 6.2. Phân tích số ..............................................................114 6.2.1. Oil price forecast ..................................................114 6.2.2. Fracture prediction ...............................................121 CHƯƠNG 7: HƯỚNG DẪN SỬ DỤNG CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICE 7.1. Hướng dẫn thực hiện một số loại kết nối dữ liệu 130 7.1.1. Kết nối với SharePoint Online .............................130 7.1.2. Kết nối với SharePoint Online List ......................132 7.1.3. Kết nối với Dataverse ............................................135 7.1.4. Kết nối với Datamart ............................................138 7.2. Cách khởi tạo công cụ tổ chức dữ liệu ..................140 7.2.1. Cách khởi tạo Dataset ...........................................140 7.2.2. Cách khởi tạo Dataflow ........................................142 7.2.3. Cách khởi tạo Datamart .......................................149 7.3. Khái niệm các dạng biểu diễn cơ bản ....................154
  • 8. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 7.4. Cách triển khai áp dụng biểu đồ bản đồ nâng cao .156 7.4.1. Biểu diễn bản đồ với công cụ IconMap ..............156 7.4.2. Cài đặt IconMap ....................................................157 7.4.3. Biểu diễn IconMap ................................................158 7.4.4. Tùy biến dữ liệu biểu tượng .................................162 7.4.5. Biểu diễn các đối tượng lớp thông tin địa lý. .....163 7.5. Cách triển khai áp dụng biểu diễn nâng cao kết hợp với Python ........................................................................165 7.5.1. Cài đặt Python .......................................................165 7.5.2. Biểu diễn với Python trên Power BI ...................166 7.6. Các bước triển khai thực hiện mô hình AutoML trên Power BI Service ......................................................167 7.7. Hướng dẫn thiết lập làm mới dữ liệu ....................178 CHƯƠNG 8: HƯỚNG DẪN CHIA SẺ SẢN PHẨM SỐ TRÊN NỀN TẢNG POWER BI SERVICE 8.1. Hướng dẫn tạo mới, phân quyền và quản lý Work- space ..................................................................................181 8.2. Hướng dẫn Power BI Embed ..................................184 8.2.1. Publish to web (Public) .........................................184 8.2.2. Embed to website or portal (Secured embed)....185 8.2.3. Embed to Sharepoint online ................................187 8.3. Các bước tạo, phân quyền và chia sẻ một Power BI App ....................................................................................190
  • 9. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt AI AutoML BI Tools DA DE NLP PPU SQL ETL MVP ERD LLM Giải thích Artifical Intelligence Trí tuệ nhân tạo Auto Machine Learning Học máy tự động Business Intelligence Tools Data Analyst Data Engineer Natural Language Processing Premium Per User Structured Query Language Extract-Transform-Loading Minimum Viable Product Sản phẩm khả dụng tối thiểu Entity Relational Diagram Sơ đồ mối quan hệ Large Language Model Mô hình ngôn ngữ lớn
  • 10. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí LỜI TỰA "Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh vực dầu khí" là cuốn sách đầu tiên trong loạt sách "Ai cũng dùng AI" của Viện Dầu khí Việt Nam. Đây là một cuốn sách cung cấp giá trị kiến thức và nguồn cảm hứng cho những ai muốn tiến xa hơn trong thế giới số. Mục tiêu của nhóm tác giả khi viết cuốn sách này không chỉ là truyền đạt kiến thức, mà còn là khơi dậy niềm đam mê sáng tạo. Chúng tôi muốn quý vị, những nhà nghiên cứu, những người làm việc trong ngành dầu khí, sẽ thấy được tiềm năng to lớn của công nghệ số trong việc cải thiện công việc của mình. Đặc biệt, cuốn sách này sẽ giúp bạn hiểu rõ hơn về công nghệ AI, Power BI Service và AutoML - những công nghệ đang thay đổi cách chúng ta làm việc, học hỏi và tạo ra giá trị. Đồng thời, chúng tôi cũng muốn nhấn mạnh tầm quan trọng của việc áp dụng công nghệ số trong ngành dầu khí. Trong suốt hơn 60 năm qua, ngành Dầu khí Việt Nam đã cung cấp nguồn năng lượng cho đất nước, thúc đẩy sự phát triển không chỉ về kinh tế mà còn đối với nhiều lĩnh vực khác. Những người làm việc trong ngành Dầu khí đã cống hiến, đã chịu trách nhiệm với sứ mệnh lớn lao này. Bây giờ, hãy tưởng tượng rằng, nếu bạn có thêm một người đồng hành không biết mệt mỏi, luôn sẵn sàng hỗ trợ, có khả năng học hỏi nhanh chóng và giúp cải thiện hiệu suất công việc. Đó chính là AI, công nghệ trí tuệ nhân tạo. Đến với "Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh vực dầu khí", bạn sẽ thấy rõ hơn về sức mạnh của Power BI Service và AutoML - những công cụ giúp bạn nhanh chóng tổ chức, biểu diễn và chia
  • 11. SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí sẻ dữ liệu cũng như sản phẩm của mình. Đây là những công cụ tiện lợi, như một bước đệm để bạn tiếp cận và ứng dụng công nghệ AI vào công việc nghiên cứu khoa học của mình. Công nghệ AI không còn xa lạ nữa khi chúng ta có ChatGPT và những công cụ AI khác dựa trên ngôn ngữ tự nhiên, giúp bạn tạo ra các tri thức mới, đồng thời hỗ trợ cho phương pháp làm việc truyền thống trong ngành dầu khí. Điều thú vị nhất là, đây chỉ mới là khởi đầu. "Ai cũng dùng AI" sẽ tiếp tục giới thiệu đến bạn những công cụ và kiến thức cao cấp hơn thông qua ngôn ngữ lập trình Python, cùng với sự áp dụng của các mô hình vật lý - địa chất từ các chuyên gia của Viện Dầu khí Việt Nam. Với cuốn sách này, Viện Dầu khí Việt Nam mong muốn bạn không chỉ học hỏi kiến thức mới mà còn tìm thấy niềm đam mê, sức mạnh sáng tạo từ bên trong, để cùng chúng tôi khám phá và tạo ra những giá trị mới cho ngành dầu khí và đất nước. Với AI, tất cả các cán bộ làm việc trong ngành dầu khí, từ thượng nguồn tới hạ nguồn, từ kỹ thuật tới kinh tế, quản lý, đều có thể tận dụng những công cụ mới mạnh mẽ này để tối ưu hóa công việc, tạo ra các giải pháp mới và tiếp tục sứ mệnh tìm kiếm, khai thác nguồn năng lượng cho đất nước. Chúng ta đang ở trên con đường mới mà AI sẽ giúp chúng ta đi nhanh hơn, xa hơn. "Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh vực dầu khí" chính là bước khởi đầu, là cầu nối giữa con người, dầu khí và thế giới của AI. Với sự hỗ trợ của AI, chúng ta sẽ cùng nhau tiếp tục sứ mệnh cao cả, đảm bảo nguồn năng lượng cho sự phát triển bền vững của đất nước.
  • 12. 10 CHƯƠNG 1: GIỚI THIỆU CHUNG SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí CHƯƠNG 1: GIỚI THIỆU CHUNG 1.1. Thông điệp AI (Artificial Intelligence) không chỉ đơn thuần là công cụ cho các công ty công nghệ lớn, mà đang trở thành một yếu tố không thể thiếu trong mọi lĩnh vực. Cùng với sự tiến bộ vượt bậc trong những năm gần đây, khái niệm “trí tuệ nhân tạo” không còn là những phát minh xa vời mà dần trở nên “bình dân hóa” và từng bước thay đổi cách con người sống và làm việc. Sự nở rộ của mô hình ngôn ngữ lớn (LLM) với đại diện tiêu biểu là ChatGPT khiến cho việc con người giao tiếp, làm việc và sáng tạo với sự hỗ trợ của AI đơn giản hơn bao giờ hết. Các ông lớn trong ngành công nghệ chạy đua cùng xu hướng low-code/no-code AI (AI không sử dụng ngôn ngữ lập trình) càng giúp thu hẹp khoảng cách giữa con người với trí tuệ nhân tạo. AI đã hiện diện ở mọi ngóc ngách của cuộc sống. Khi máy móc trở nên thông minh hơn, cùng với sự phát triển về năng lực và tốc độ tính toán, năng suất công việc và sự tự động hóa ngày càng gia tăng trong tất cả các lĩnh vực. Không thể phủ nhận một phần công việc của con người sẽ thay thế bằng máy móc. Đây sẽ là thách thức đối với những lao động không nắm bắt được công nghệ và làm chủ được AI. Tuy nhiên, chúng tôi tin rằng đây là một cơ hội hiếm có để con người giảm bớt được những gánh nặng trong công việc và đời sống hàng ngày để dành thời gian và tập trung làm những việc mang lại giá trị khác biệt, vốn là thế mạnh của con người, đó là sáng tạo và đồng cảm. Để làm được điều này, mỗi cá nhân cần tiếp cận và hiểu về AI - “Ai cũng dùng AI”,
  • 13. VIỆN DẦU KHÍ VIỆT NAM 11 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí hơn nữa là làm chủ công nghệ và tận dụng AI như là “trợ thủ” để khám phá và vươn tới những tiềm năng mới. Đây cũng là động lực để nhóm tác giả Viện Dầu khí Việt Nam xây dựng tập sách “Ai cũng dùng AI”, mở đầu bằng cuốn sách “Sáng tạo sản phẩm số - Ai cũng dùng AI - Ứng dụng Power BI Service và AutoML trong lĩnh vực dầu khí”. Cuốn sách sẽ giúp bạn mở khóa toàn bộ dữ liệu và chuyển dữ liệu của bạn thành những sản phẩm số và xây dựng mô hình học máy tự động mang lại giá trị hữu ích cho doanh nghiệp. Độc giả sẽ được hướng dẫn sáng tạo một sản phẩm số hoàn chỉnh: Từ kết nối các nguồn dữ liệu khác nhau, tổ chức, quản lý và duy trì nguồn dữ liệu cho báo cáo, tạo các biểu đồ bắt mắt với khả năng tương tác theo tùy chọn của người dùng cuối. Độc giả sẽ có được những kiến thức nền tảng cơ bản đến nâng cao để xây dựng sản phẩm số đầu tiên. Cùng với cuốn sách này, tin rằng các cán bộ làm việc trong lĩnh vực dầu khí “ai cũng có thể xây dựng sản phẩm số” với sự hỗ trợ của Power BI Service - nền tảng tiêu biểu tích hợp vô vàn tính năng trí tuệ nhân tạo. 1.2. Ai sẽ đọc cuốn sách này? Cuốn sách này sẽ cung cấp nhiều giá trị kiến thức dành cho tất cả độc giả đã có kiến thức nền tảng từ cơ bản đến nâng cao hoặc chưa có nền tảng về lĩnh vực phân tích dữ liệu, học máy hay trí tuệ nhân tạo nhưng có sự đam mê và nhu cầu tìm hiểu đối với những lĩnh vực này. Để đạt được những kết quả tốt nhất từ cuốn sách, độc giả nên tìm hiểu song song với thực hành theo các bước để tạo ra sản phẩm số và mô hình học máy tự động cho cá nhân. Cuốn sách này sẽ cung cấp
  • 14. 12 CHƯƠNG 1: GIỚI THIỆU CHUNG SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí cho độc giả những khái niệm đơn giản và dễ hiểu, hướng dẫn thực hiện các thao tác chi tiết, cụ thể. Đặc biệt, nội dung giới thiệu các sản phẩm tiêu biểu cũng đưa ra những hướng dẫn để độc giả có thể tham khảo và mô phỏng lại trong sản phẩm số của mình. Tất cả các sản phẩm tiêu biểu được giới thiệu trong cuốn sách này đều được xây dựng với công cụ Power BI. 1.3. Nền tảng sử dụng Power BI nằm trong mô hình kinh doanh của nhiều doanh nghiệp với khả năng phân tích dữ liệu vô cùng hiệu quả. Power BI có thể kết nối nhiều loại tệp, chuyển đổi và trực quan hóa thành các sản phẩm số, cũng như tạo biểu đồ, đồ thị để cung cấp hình ảnh trực quan và sự tương quan của dữ liệu. Cho dù dữ liệu là một bảng làm việc đơn giản từ Microsoft Excel hay các hệ cơ sở dữ liệu được lưu trữ trên điện toán đám mây, Power BI cho phép bạn dễ dàng kết nối với các nguồn dữ liệu này để xử lý và mô hình hóa dữ liệu của bạn mà không ảnh hưởng đến nguồn dữ liệu ban đầu và chia sẻ điều đó với bất kỳ ai. Sản phẩm số của người dùng có thể được chia sẻ với
  • 15. VIỆN DẦU KHÍ VIỆT NAM 13 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí những người dùng Power BI khác trong tổ chức hoặc khách hàng thông qua nền tảng Power BI Service. Nền tảng Power BI Service hỗ trợ người dùng trong tổ chức có khả năng cộng tác để cùng phát triển sản phẩm, đưa sản phẩm cuối hoàn chỉnh đến với khách hàng ngoài tổ chức thông qua hình thức nhúng vào các nền tảng khác hoặc một sản phẩm độc lập với hình thức ứng dụng (Power BI app). Cuốn sách này hướng dẫn phương pháp để khai thác triệt để tiềm năng của nền tảng Power BI Service. Để làm được điều đó, một số tính năng (xây dựng CSDL trên datamart, xây dựng mô hình học máy tự động AutoML…) yêu cầu người dùng cần được trang bị license Premium - Premium Per User (PPU). 1.4. Người đọc nhận được những gì? Sau khi đọc xong cuốn sách, độc giả sẽ được trang bị những kiến thức sau: - Cách một công cụ Business Intelligence (BI) thay đổi cách người dùng khai thác dữ liệu; - Các loại phân tích dữ liệu trong Business Intelligence (BI); - Các khái niệm cơ bản về sản phẩm số; - Hiểu được quy trình xây dựng các sản phẩm số cơ bản hướng tới người dùng cuối; - Nắm bắt cơ bản về mô hình học máy. Độc giả có thể xây dựng, sáng tạo sản phẩm số từ những kỹ năng sau: - Sử dụng các công cụ lưu trữ trên nền tảng Power BI
  • 16. 14 CHƯƠNG 1: GIỚI THIỆU CHUNG SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Service cùng với sự hỗ trợ của Power Query để kết nối các nguồn dữ liệu và tổ chức dữ liệu cho sản phẩm; - Sử dụng các biểu đồ trong Power BI để trực quan hóa và xây dựng các sản phẩm số; - Ứng dụng tự động hóa cho quá trình cập nhật sản phẩm; - Sử dụng tính năng Auto-ML trên nền tảng Power BI Service để xây dựng sản phẩm phân tích nâng cao có chứa mô hình học máy; - Cộng tác xây dựng sản phẩm và chia sẻ sản phẩm tới những người dùng khác. 1.5. Nội dung của cuốn sách Cuốn sách được chia thành 2 phần chính: Hướng dẫn người dùng với nền tảng Power BI Service, áp dụng mô hình học máy tự động và giới thiệu những sản phẩm số tiêu biểu ứng dụng trong lĩnh vực dầu khí được các tác giả Bộ phận Phân tích dữ liệu - Viện Dầu khí Việt Nam xây dựng. Phần 1 tập trung cung cấp cho độc giả các khái niệm lý thuyết, quy trình thực hiện, các thao tác cơ bản để xây dựng sản phẩm số và mô hình học máy tự động. Phần 2 đưa ra các ứng dụng thực tế đã được xây dựng cụ thể để độc giả có thể hình dung rõ hơn về các nội dung đã được giới thiệu trước đó.
  • 17. VIỆN DẦU KHÍ VIỆT NAM 15 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 1 . https://blogs.gartner.com/jason-mcnellis/2019/11/05/youre-likely-invest- ing-lot-marketing-analytics-getting-right-insights/ CHƯƠNG 2: BUSINESS INTELLIGENCE 2.1. Tầm quan trọng của Business Intelligence Business Intelligence (BI) là sự kết hợp của các hoạt động phân tích kinh doanh, khai thác dữ liệu, trực quan hóa dữ liệu, công cụ và hạ tầng dữ liệu để hỗ trợ doanh nghiệp đưa ra quyết định dựa trên dữ liệu (data-driven decision). BI lần đầu tiên xuất hiện vào những năm 1960 dưới dạng một hệ thống chia sẻ thông tin nội bộ. Vào những năm 1980, BI tiếp tục được nâng cấp kết hợp với mô hình máy tính để giúp doanh nghiệp đưa ra quyết định tốt hơn nhờ biến dữ liệu thành “Insight” - những hiểu biết sâu sắc hơn. Giải pháp BI hiện đại ưu tiên tính linh hoạt trong phân tích, quản lý dữ liệu trên các nền tảng đáng tin cậy, cấp quyền cho người dùng và nhanh chóng tìm ra “Insight”. BI có thể hỗ trợ doanh nghiệp đưa ra những quyết định sáng suốt bằng cách so sánh dữ liệu về hoạt động kinh doanh trong hiện tại và quá khứ. Các nhà phân tích có thể tận dụng BI để đánh giá về hiệu suất và đối thủ cạnh tranh, từ đó hỗ trợ doanh nghiệp hoạt động thuận lợi và hiệu quả hơn; dễ dàng nắm bắt xu hướng thị trường và thúc đẩy doanh thu. Nếu dữ liệu được sử dụng hiệu quả, doanh nghiệp sẽ nhận được rất nhiều lợi ích. 2.2. Phân tích Business Intelligence Để hiểu rõ hơn về BI có thể tận dụng AI như thế nào, độc giả hãy tham khảo mô hình “Analytical insights model” được xuất bản bởi Gartner (Hình 2.1)1 .
  • 18. CHƯƠNG 2: BUSINESS INTELLIGENCE 16 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Trong một doanh nghiệp, “Insight” thường được chia thành 3 nhóm, các nhóm sẽ mang lại những giá trị khác nhau và tăng dần nhưng kèm theo đó là những yêu cầu cao hơn về dữ liệu và độ khó. 3 nhóm bao gồm: Hindsight, Insight, Foresight. Chức năng cốt lõi của mỗi BI hoặc cơ sở hạ tầng báo cáo thường theo hướng “Hindsight” và “Insight” bằng cách sử dụng phương pháp phân tích mô tả (descriptive analytics) và chẩn đoán (diagnostic analytics) dựa trên dữ liệu quá khứ. Hai phương pháp này là tối quan trọng đối với tất cả các phương pháp phân tích. Ngoài ra, còn có 2 phương pháp phân tích nâng cao hơn là phân tích dự đoán (Predictive analytics) và phân tích đề xuất (Prescriptive analytics). Các độc giả tham khảo một số khái niệm cơ bản về các loại phân tích sau đây để hiểu rõ hơn. Hình2.1.Cácloại“Insight”vàcácphươngphápphântíchdữliệu.Nguồn:Gartner,2019. Giá trị Sự việc đã xảy ra Sự việc sẽ xảy ra Làm thế nào để sự việc sẽ xảy ra Tại sao xảy ra Phân tích mô tả Phân tích chẩn đoán Phân tích dự đoán Phân tích đề xuất Hindsight Insight Foresight Độ khó
  • 19. VIỆN DẦU KHÍ VIỆT NAM 17 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Phân tích mô tả (Descriptive analytics) Phân tích mô tả trả lời câu hỏi về những gì đã xảy ra. Phân tích mô tả thu thập dữ liệu thô từ nhiều nguồn dữ liệu để cung cấp chi tiết những thông tin trong quá khứ có giá trị. Tuy nhiên, những phát hiện này chỉ đơn giản là báo hiệu và cho biết có điều gì đó sai hoặc đúng mà không giải thích tại sao. Vì lý do này, các công ty có dữ liệu lớn không chỉ tự mình sử dụng phân tích mô tả mà còn kết hợp với các phương pháp phân tích dữ liệu khác. - Phân tích chẩn đoán (Diagnostic analytics) Ở giai đoạn này, dữ liệu trong quá khứ có thể được đo lường dựa trên các dữ liệu khác để trả lời/giải thích những câu hỏi về lý do/tại sao điều gì đó đã xảy ra. Nhờ phân tích chẩn đoán, có thể đi sâu vào chi tiết để tìm ra những yếu tố phụ thuộc và xác định các mô hình. - Phân tích dự đoán (Predictive analytics) Phân tích dự đoán cho biết điều gì có khả năng xảy ra. Nó sử dụng kết quả phân tích mô tả và chẩn đoán để phát hiện xu hướng trong tương lai. Do đó, phân tích dự đoán trở thành công cụ để dự báo. Mặc dù phân tích dự đoán mang lại nhiều giá trị, nhưng cần phải hiểu rằng dự báo chỉ là ước tính, độ chính xác tùy thuộc vào chất lượng dữ liệu và tính ổn định của tình huống. Nhờ cách tiếp cận chủ động của loại phân tích này, doanh nghiệp có thể xác định những người mua hàng trong tháng tới để tiến hành kích hoạt các hoạt động tiếp thị nhằm phát triển doanh thu. Hoặc một
  • 20. CHƯƠNG 2: BUSINESS INTELLIGENCE 18 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí nhóm quản lý có thể cân nhắc các rủi ro khi quyết định đầu tư vào việc mở rộng của doanh nghiệp dựa trên phân tích dòng tiền và dự báo dòng tiền thu được. - Phân tích đề xuất (Prescriptive analytics) Phân tích đề xuất là một bước tiến xa hơn phân tích mô tả và phân tích dự đoán khi đưa ra đề xuất hành động thích hợp và dự đoán những kết quả có thể xảy ra. Nó trả lời cho câu hỏi: “Điều gì nên xảy ra?” Loại phân tích dữ liệu hiện đại này không chỉ yêu cầu dữ liệu lịch sử mà còn yêu cầu thông tin bên ngoài do bản chất của thuật toán thống kê. Bên cạnh đó, phân tích đề xuất sử dụng các công cụ và công nghệ tinh vi như học máy (Machine Learning), các quy tắc kinh doanh và thuật toán. Thông thường, có 3 cách để AI có thể tạo ra giá trị cho BI: - Tạo “Insight” tự động và thực hiện các phân tích thân thiện với người dùng; - Tính toán tốt hơn đối với các dự báo; - Cho phép hệ thống BI thúc đẩy “Insight” thậm chí đối với các database không có cấu trúc. Hình 2.2 thể hiện bức tranh tổng quan về sự hỗ trợ của AI theo các phương pháp phân tích. AI hỗ trợ các phương pháp phân tích giúp cho: • Tự động và dễ dàng sử dụng (Automation and Ease of Use): Làm cho công cụ BI thông minh hơn và dễ sử dụng hơn sẽ giúp người dùng dễ tiếp cận hơn, làm giảm khối
  • 21. VIỆN DẦU KHÍ VIỆT NAM 19 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí lượng công việc của các nhà phân tích. Lợi ích này thường đạt được thông qua quá trình tự động hóa. Ngoài ra, có thể sử dụng các ngôn ngữ tự nhiên để tương tác với dữ liệu (AI- powered natural language processing (NLP) technologies), tổng hợp các kết quả phân tích, tự động tìm ra các dữ liệu quan trọng, các điểm khó phát hiện trong cơ sở dữ liệu. • Ứng dụng tốt hơn đối với các dự đoán và dự báo (Better Forecasting and Predictions): Mặc dù các phân tích mô tả và chẩn đoán là trung tâm của mọi hệ thống BI, nhưng mong muốn biết được cái sắp xảy ra cũng là điều nhiều doanh nghiệp hướng tới, khả năng được tăng cường bởi AI có thể hỗ trợ người dùng cuối áp dụng các phương pháp phân tích dự đoán mạnh mẽ để dự báo và dự đoán tốt hơn dựa trên dữ liệu lịch sử. Hình2.2. KhảnăngAIhỗtrợtheocácphươngphápphântích.Nguồn:Gartner,2019. Giá trị Dự đoán tốt hơn Tự động và dễ sử dụng Sự việc đã xảy ra Phân tích mô tả Phân tích chẩn đoán Phân tích dự đoán Phân tích đề xuất Hindsight Insight Foresight Độ khó
  • 22. CHƯƠNG 3: SẢN PHẨM SỐ 20 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí CHƯƠNG 3: SẢN PHẨM SỐ 3.1. Hiểu rõ về dữ liệu 3.1.1. Khái niệm về dữ liệu, các dạng dữ liệu và cấu trúc dữ liệu Ngày nay, dưới sự phát triển mạnh mẽ của khoa học công nghệ, ứng dụng của công nghệ thông tin đã lan tỏa mạnh mẽ vào từng khía cạnh công việc và cuộc sống. Năng lực tính toán và sức mạnh phần cứng cũng được gia tăng nhanh chóng. Trên cơ sở đó, việc khai thác cơ sở dữ liệu trong các doanh nghiệp và hiệu quả mang lại gây ấn tượng không chỉ với các nhà quản lý mà cả các nhà hoạch định. Các khái niệm về khoa học dữ liệu, học máy, học sâu hay trí tuệ nhân tạo ngày càng phổ biến và được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau. Cụ thể, theo sau là các khái niệm cơ bản mà độc giả nên nắm bắt để hiểu và áp dụng triển khai các sản phẩm số. 3.1.1.1. Khái niệm cơ sở dữ liệu Theo Từ điển Oxford, cơ sở dữ liệu là một tập hợp có cấu trúc của dữ liệu được lưu trong máy tính, theo một cách đặc biệt nào đó có thể được tiếp cận theo những cách khác nhau. Cơ sở dữ liệu cũng được hiểu là một hệ thống các thông tin có cấu trúc, được lưu trữ trên các thiết bị lưu trữ nhằm thỏa mãn yêu cầu khai thác thông tin đồng thời của nhiều người sử dụng hay nhiều chương trình ứng dụng chạy cùng một lúc với những mục đích khác nhau. Từ đó, có thể thấy một số điểm chung của cơ sở dữ liệu là: Tập hợp thông tin có cấu trúc; được quản lý và duy trì
  • 23. VIỆN DẦU KHÍ VIỆT NAM 21 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí phục vụ khai thác thông tin; có thể phục vụ nhiều đối tượng khai thác với nhiều cách thức khác nhau; có nhiều giải pháp khác nhau để xây dựng và quản lý cơ sở dữ liệu. Vì vậy, khi nói về cơ sở dữ liệu thường trọng tâm nói về thông tin, dữ liệu được quản lý, lưu trữ và khai thác mà không phải là vỏ bọc chứa thông tin, dữ liệu. 3.1.1.2. Phân loại cơ sở dữ liệu Phân loại dữ liệu được hiểu là cách tổ chức dữ liệu thành các nhóm liên quan để có thể sử dụng và lưu trữ hiệu quả. Ở mức độ cơ bản, quá trình phân loại dữ liệu chủ yếu đáp ứng mục tiêu dễ dàng lưu trữ và truy xuất. Việc tổ chức, phân loại dữ liệu hiệu quả đóng vai trò vô cùng quan trọng trong công tác quản lý rủi ro, quản trị và bảo mật dữ liệu. Tùy thuộc vào dạng dữ liệu và mục đích sử dụng mà có thể áp dụng cách phân loại dữ liệu khác nhau, trong đó có 3 cách phân loại chính: - Phân loại nội dung (content-based): Dựa vào nội dung của dữ liệu để phân tách. - Phân loại bối cảnh (context-based): Dựa vào mục đích sử dụng dữ liệu. - Phân loại theo người dùng (user-based): Dựa vào lựa chọn và mong muốn của người dùng. 3.1.1.3. Mô hình cơ sở dữ liệu Mô hình cơ sở dữ liệu là tập hợp các cấu trúc logic được sử dụng để diễn tả cấu trúc dữ liệu và các mối quan hệ dữ liệu được tìm thấy trong một cơ sở dữ liệu. Xuyên suốt lịch
  • 24. CHƯƠNG 3: SẢN PHẨM SỐ 22 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí sử phát triển của khoa học máy tính, có rất nhiều khái niệm về mô hình cơ sở dữ liệu. Mỗi mô hình có ưu, nhược điểm và tính ứng dụng trong một thời điểm nhất định. Với cách tiếp cận hiện tại, có thể đề cập đến hai mô hình dữ liệu được ứng dụng phổ biến và rộng rãi là mô hình dữ liệu tập trung và phi tập trung. Mô hình dữ liệu tập trung (centralized data) Hệ thống dữ liệu tập trung là hệ thống mà ở đó tất cả các thành phần dữ liệu được lưu trữ và quản trị tại một chỗ. Hệ thống còn được biết đến dưới tên hệ thống cơ sở dữ liệu máy tính tập trung. Hệ thống này thường được sử dụng trong các tổ chức, doanh nghiệp với các nhiệm vụ tập trung, sử dụng kết nối nội bộ (LAN). Giải pháp tập trung đã chứng minh được nhiều điểm mạnh, tuy nhiên tồn tại nhiều điểm yếu, có thể kể đến: - Ưu điểm: + Dễ dàng chia sẻ dữ liệu, tập trung vào các vấn đề cụ thể; + Khả năng bảo mật, tính toàn vẹn của dữ liệu cao; + Dung lượng lưu trữ lớn; + Dễ dàng truy cập, chỉnh sửa dữ liệu; + Chi phí thấp. - Nhược điểm: + Khả năng tùy biến, linh động thấp;
  • 25. VIỆN DẦU KHÍ VIỆT NAM 23 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí + Xung đột cục bộ có thể dẫn đến gián đoạn toàn cục; + Do tất cả dữ liệu được lưu trữ tại một chỗ nên khi có nhiều truy cập cùng một lúc, có thể xảy ra xung đột. Mô hình dữ liệu phi tập trung (decentralized data) Trái ngược với hệ thống cơ sở dữ liệu tập trung, hệ thống cơ sở dữ liệu phi tập trung không gom dữ liệu về một chỗ mà cho phép lưu trữ dữ liệu thành các phần khác khau tại các trạm khác nhau và cung cấp kết nối giữa các trạm. Với cách xây dựng hệ thống này, các điểm mạnh, yếu cũng được thể hiện rõ ràng: - Ưu điểm: + Phù hợp với bản chất phân tán của người dùng; + Dữ liệu được quản lý tại mỗi trạm địa phương mà không phụ thuộc vào các trạm khác; + Dữ liệu có tính tin cậy cao, dễ dàng khắc phục sự cố mà không ảnh hưởng đến hệ thống; + Hiệu năng cao; + Cho phép tổ chức và tùy biến linh hoạt mà không ảnh hưởng đến các hoạt động sẵn có. - Nhược điểm: + Hệ thống phức tạp; + Chi phí cao; + Khó khăn hơn trong công tác bảo mật; + Khó đảm bảo tính nhất quán của dữ liệu.
  • 26. CHƯƠNG 3: SẢN PHẨM SỐ 24 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 3.1.2. Lưu trữ, an toàn và bảo mật dữ liệu Dữ liệu dầu khí có tính chất đặc thù và yêu cầu khắt khe về bảo mật. Do đó các ứng dụng, sản phẩm về dữ liệu cần phải được trang bị chặt chẽ về việc phân quyền, quản lý truy cập, xây dựng và quản trị kết nối. 3.2. Sản phẩm số 3.2.1. Khái niệm sản phẩm số Nhiều công ty sử dụng dữ liệu như một dạng sản phẩm giúp công ty rút ngắn thời gian làm việc khi áp dụng vào một chu trình mới. Điều này có thể giúp giảm đến 90% thời gian và 30% chi phí, đồng thời công tác quản trị rủi ro cũng được cải thiện đáng kể. Sản phẩm số cung cấp các giải pháp sẵn có với chất lượng cao trên nền tảng cơ sở dữ liệu mà tất cả người dùng trong cùng tổ chức có thể dễ dàng truy cập và sử dụng dễ dàng. Sản phẩm số thường nằm ở cuối chu trình lưu trữ, vận hành dữ liệu, có thể kể đến Data Warehouses hay Data Lake. Việc sử dụng các sản phẩm số giúp rút ngắn thời gian tìm kiếm dữ liệu, xử lý định dạng và xây dựng các tập dữ liệu riêng hay chu trình dữ liệu (data pipeline). Trong cách tiếp cận truyền thống khi xây dựng giải pháp dữ liệu, các nhóm phân tích sẽ xác định dữ liệu cần sử dụng trong kho dữ liệu sau đó tạo ra khối dữ liệu riêng và áp dụng nó để xây dựng sản phẩm. Phương pháp này tạo thành một quy trình làm việc lặp đi lặp lại với mỗi sản phẩm và tạo ra
  • 27. VIỆN DẦU KHÍ VIỆT NAM 25 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Hình3.2.Cấutrúctriểnkhaidạngsảnphẩmsố.Nguồn:HarvardBusinessReview,2022. Hình3.1.Cấutrúctriểnkhaidữliệutruyềnthống.Nguồn:HarvardBusinessReview,2022. Hệ thống ghi nhận Hệ thống lõi xử lý Kho dữ liệu Hồ dữ liệu gốc Dữ liệu ngoại vi Dữ liệu không cấu trúc Lưu trữ dữ liệu vận hành Dữ liệu người dùng Ứng dụng số Mảnh ghép số Báo cáo số Dữ liệu số Phân tích số Nền tảng dữ liệu Dữliệuriêngcho từngdạngsảnphẩm Côngnghệriêngcho từngdạngsảnphẩm Sảnphẩm số Hệ thống ghi nhận Hệ thống lõi xử lý Kho dữ liệu Hồ dữ liệu gốc Dữ liệu ngoại vi Dữ liệu không cấu trúc Lưu trữ dữ liệu vận hành Ứng dụng số Mảnh ghép số Báo cáo số Dữ liệu số Nhà cung cấp Khách hàng Lĩnh vực Sản phẩm/Dịch vụ Phân phối Phân tích số Nền tảng dữ liệu Sảnphẩm số
  • 28. CHƯƠNG 3: SẢN PHẨM SỐ 26 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí cấu trúc dữ liệu phức tạp khó thể duy trì và tái sử dụng. Độc giả có thể tham khảo thêm ở Hình 3.1. Với cách tiếp cận dạng sản phẩm số, nhóm phát triển sẽ xây dựng giải pháp nâng chuẩn sản phẩm và đóng gói các công nghệ với nhau theo các mẫu (consumption archetype patterns) nhằm tối ưu thời gian làm việc và đạt hiệu quả cao, tinh giản cấu trúc dữ liệu của doanh nghiệp. Độc giả có thể tham khảo Hình 3.2 để rõ hơn đối với phương pháp này. 3.2.2. Phân loại sản phẩm số Phương pháp tiếp cận dạng sản phẩm số được chia thành 5 dạng chính dựa vào mục đích cuối cùng của sản phẩm. Bao gồm: Ứng dụng số, Mảnh ghép số, Phân tích số, Báo cáo số, và Dữ liệu số. Thông tin mô tả các dạng sản phẩm được thể hiện ở Bảng 3.1. Trong số các sản phẩm số kể trên, sản phẩm phân tích số và sản phẩm báo cáo số là những loại sản phẩm khai thác tối ưu được những tính năng của Power BI Service. Dưới sự hỗ trợ của API, người dùng cũng có thể xây dựng cho mình sản phẩm chia sẻ dữ liệu đơn thuần. Ngoài ra, với tính năng xuất bản ứng dụng cùng với sự kết hợp của công cụ Power ứng dụng - một công cụ thuộc nền tảng Power Platform của Microsoft, người dùng chuyên sâu hoàn toàn có thể xuất bản một sản phẩm ứng dụng số. Độc giả có thể tìm hiểu thêm các sản phẩm cụ thể theo các nhóm sản phẩm này ở Chương 6: Các sản phẩm số cho lĩnh vực dầu và khí.
  • 29. VIỆN DẦU KHÍ VIỆT NAM 27 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Bảng3.1.Thôngtincácdạngsảnphẩmsố STT Các dạng sản phẩm số Miêu tả 1 Phân tích số Phân tích số là dạng sản phẩm hướng đến cung cấp cho người dùng các công cụ để tự phân tích, khai phá dữ liệu hoặc dưới sự hỗ trợ của các nhà phân tích. Áp dụng các tính năng về học máy và trí tuệ nhân tạo có thể được xây dựng và đính kèm sản phẩm. 2 Báo cáo số Dạng sản phẩm này yêu cầu dữ liệu phải có sẵn và được tổng hợp cũng như làm sạch và phân loại rõ ràng. Nhà phân tích dữ liệu đóng vai trò quan trọng trong việc truy xuất dữ liệu, sử dụng kiến thức chuyên môn để xây dựng các biểu diễn nhằm truyền đạt thông tin hiệu quả đến khách hàng. Bên cạnh đó, công tác quản trị dữ liệu cần được đề cao với các nhiệm vụ quản lý dữ liệu gốc, xây Sản phẩm báo cáo số là một dạng sản phẩm số đặc trưng cung cấp thông tin được tổng hợp, phân tích cho người dùng dưới dạng các bảng điều khiển (dashboard) hoặc các bản in (pdf).
  • 30. CHƯƠNG 3: SẢN PHẨM SỐ 28 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí dựng nền tảng kết nối với khách hàng, phân quyền và bảo mật. Thông thường, dữ liệu phải được truyền tải tự động đến khách hàng, hiện nay các công ty đang hướng đến xây dựng các mô hình tự phục vụ và cập nhật dữ liệu liên tục theo thời gian thực. 3 Mảnh ghép số 4 Dữ liệu số Dữ liệu và sản phẩm số trong lĩnh vực dầu khí là vô cùng đa dạng và đặc trưng. Để cung cấp giải pháp sử dụng và kết nối dữ liệu, mảnh ghép số được cung cấp với điểm mạnh có thể sử dụng trên nhiều nền tảng, bảo mật dữ liệu, tối đa hóa khả năng tái sử dụng. Các sản phẩm mảnh ghép số bao gồm: Biến đổi dữ liệu, Thuật toán và Mô hình. Sản phẩm số hướng đến cung cấp thông tin về dữ liệu gốc, trong khi khách hàng là người gửi yêu cầu và nhận về dữ liệu không kèm với báo cáo hay phân tích phía sau. Để duy trì dạng sản phẩm này, nhà quản trị dữ liệu đóng vai trò quan trọng với các nhiệm vụ duy trì nền tảng quản lý cơ sở dữ liệu, cập nhật cơ sở dữ liệu, cung cấp cổng yêu cầu, tiếp nhận thông tin truy xuất, lọc và gửi dữ liệu.
  • 31. VIỆN DẦU KHÍ VIỆT NAM 29 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí 3.2.3. Quy trình xây dựng sản phẩm số 3.2.3.1. Xác định sơ đồ mô tả vấn đề (Problem statement) Sơ đồ mô tả vấn đề là miêu tả chính xác về vấn đề cần giải quyết hay một điều kiện cần cải thiện. Miêu tả này xác định rõ khoảng cách giữa vấn đề gặp phải với mục tiêu mong muốn trong quá trình xây dựng sản phẩm. Mục đích chính của Sơ đồ mô tả vấn đề là chỉ rõ và giải thích vấn đề. Sơ đồ mô tả vấn đề được sử dụng rộng rãi bởi các doanh nghiệp và tổ chức để cải thiện các dự án. Một yêu cầu cần đạt đơn giản và đủ tốt sẽ được cả nhóm sử dụng như kim chỉ nam để giải quyết các vấn đề gặp phải khi xây dựng sản phẩm. Sơ đồ mô tả vấn đề cũng cho phép quản trị, làm rõ Các chính sách về bảo mật và an toàn dữ liệu cũng cần được đề cao trong quy trình xây dựng dạng sản phẩm này. 5 Ứng dụng số Sản phẩm ứng dụng số (digital applications) là dạng sản phẩm cao cấp nhất trong các sản phẩm số. Sản phẩm được hoàn thiện, đóng gói và triển khai đến người dùng cuối như một ứng dụng thương mại hoàn chỉnh với các tính năng hoàn chỉnh, giao diện thân thiện, tối ưu tính toán và vận hành. Quản lý dữ liệu và cung cấp luồng dữ liệu cũng được hoàn thiện chặt chẽ.
  • 32. CHƯƠNG 3: SẢN PHẨM SỐ 30 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Hình3.4.Phươngpháp,cáchxâydựngsơđồmôtảvấnđề. Hình3.3.Kháiniệmsơđồmôtảvấnđề. A PROBLEM STATEMENT IS A CUIDING STAR FOR YOUR CREATIVE THINKING Yêu cầu cần đạt của sản phẩm (Problem Statement) là gì? Tài liệu ngắn gọn mô tả vấn đề và sản phẩm cần đạt Đề bài toàn diện của bài toán mà dự án cần xử lý Bước đầu tiên triển khai dự án ĐẶT CÂU HỎI HIỆU QUẢ Có thể áp dụng quy tắc 5W1H để tìm hiểu về vấn đề đang gặp phải: What?Why?When?Where?Who? How? ĐẶT GIỚI HẠN Thời gian thực hiện dự án Các chỉ tiêu cần đạt của sản phẩm NGẮN GỌN Cố gắng viết ngắn gọn, rõ ràng, cần chi tiết hơn có thể trao đổi trong các cuộc họp hoặc trong những tài liệu khác đi kèm CỐ ĐỊNH PROBLEM STATEMENT Problem Statement sẽ thay đổi và hoàn thiện dần theo yêu cầu của khách hàng và khả năng đáp ứng của nhóm phát triển sản phẩm DÙNG NHIỀU NGÔN NGỮ CHUYÊN MÔN/KỸTHUẬT Nên đảm bảo mọi nhân sự liên quan của dự án đều có thể hiểu được mà không nhất thiết phải có hiểu biết sâu về chuyên môn/kỹ thuật NÊN KHÔNG NÊN Cách viết Problem Statement hiệu quả
  • 33. VIỆN DẦU KHÍ VIỆT NAM 31 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí trực diện vấn đề từ đó đưa ra giải pháp thực thi phù hợp cho toàn bộ dự án. Một điều quan trọng nữa để đạt được điều này là Sơ đồ mô tả vấn đề cần thật sự rõ ràng và được hiểu rõ giữa các thành viên trong nhóm thực hiện. Thông thường, cách tiếp cận sử dụng bộ câu hỏi 5W1H (Cái gì - Khi nào - Ở đâu - Tại sao - Ai - Như thế nào) thường được sử dụng trong quá trình xây dựng yêu cầu cần đạt của sản phẩm. Độc giả tham khảo Hình 3.3, Hình 3.4 và Hình 3.5 để hiểu rõ hơn về khái niệm và cách thức xây dựng và tiêu chí cần đạt. 3.2.3.2. Cấu trúc 3 lớp của một sản phẩm số (3 layers architectures) Một sản phẩm số được đóng gói hoàn thiện là thành quả của một quá trình làm việc chặt chẽ với sự tham gia của nhiều nhân sự. Để sản phẩm được dễ hiểu và rõ ràng hơn, cấu trúc 3 lớp được chỉ ra với các vai trò của sản phẩm ở lớp Hình3.5.Tiêuchíxâydựng,xácđịnhsơđồmôtảvấnđề. SMART Problem Statement SPECIFIC Cụ thể vấn đề cần giải quyết một cách ngắn gọn, dễ hiểu MEASURABLE Định lượng và định tính đối với yêu cầu sản phẩm đầu ra ACTION Cần làm gì để giải quyết vấn đề? RELEVANT So sánh với các giải pháp đang có sẵn trên thị trường TIMEBOUND Thời gian dự kiến giải quyết vấn đề
  • 34. CHƯƠNG 3: SẢN PHẨM SỐ 32 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí người sử dụng, lớp khám phá, phân tích dữ liệu và lớp tổ chức dữ liệu. - Lớp người sử dụng (User layer): Người sử dụng là lớp đầu tiên trong mô hình cấu trúc 3 lớp. Tại đây yêu cầu của người dùng được định hình và sản phẩm hay giải pháp cuối cùng cũng được chỉ ra. Đâu là đầu vào cần phải có để triển khai được sản phẩm và đâu là sản phẩm mà người dùng hay khách hàng nhận về sau khi đi qua các bước xử lý trung gian; - Lớp phân tích (Analysis layer): Là lớp mà người xây dựng lên sản phẩm số thực hiện các công việc, thao tác liên quan đến: tạo lập bảng biểu, báo cáo, nghiên cứu insight và các phân tích chuyên sâu như xây dựng các mô hình dự báo với machine learning,… Đây là bước quan trọng nhất để tạo nên sản phẩm số cuối cùng; - Lớp dữ liệu (Data layer): Lớp dữ liệu đóng vai trò nền tảng và kết nối giữa người sử dụng và nhà phân tích. Ở lớp này, các nhiệm vụ liên quan đến luồng dữ liệu, xử lý số liệu đầu vào, xây dựng cơ sở dữ liệu, lưu trữ dữ liệu, xây dựng nền tảng, kết nối người dùng, quản lý quyền truy cập được thực hiện để đảm bảo dữ liệu cho sản phẩm số. Trên cơ sở các dạng sản phẩm chính được đề cập ở mục 3.2.2, một số biểu mẫu cấu trúc 3 lớp được chỉ ra dưới đây: Sản phẩm Phân tích số Sản phẩm phân tích số với mục đích cung cấp các giải pháp, thông tin phân tích dữ liệu. Sản phẩm tích hợp các bước xử lý, làm chuẩn và biến đổi dữ liệu theo hướng chuyên môn để chỉ ra các tri thức cho khách hàng. Bên cạnh đó, sản
  • 35. VIỆN DẦU KHÍ VIỆT NAM 33 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí phẩm áp dụng các ứng dụng của học máy và trí tuệ nhân tạo để nâng cao chất lượng tri thức. Cấu trúc 3 lớp được mô tả như sau: + Lớp người sử dụng: Lớp người sử dụng cung cấp yêu cầu về phân tích dữ liệu và nhận về sản phẩm phân tích dữ liệu đã được xử lý và trình bày, chỉ ra được các yếu tố tri thức, đặc trưng của dữ liệu. + Lớp phân tích: Lớp phân tích đóng vai trò chính trong việc xử lý, biến đổi dữ liệu, ứng dụng học máy và trí tuệ nhân tạo để đưa ra kết quả mong muốn. Sản phẩm cuối được trình bày dưới dạng các báo cáo với mức độ trực quan hoá tốt, dễ dàng theo dõi và đáp ứng được yêu cầu đặt ra từ lớp người dùng. Hình3.6.MôhìnhcấutrúcsảnphẩmPhântíchsố. Phân tích số Người sử dụng Dữ liệu Biểu diễn dữ liệu Phân tích dữ liệu Phân tích Dự báo dữ liệu Xây dựng bảng điều khiển và biểu diễn tri thức, hiện trạng, dự báo và giải pháp Kết quả Phân tích số Khai phá dữ liệu Dữ liệu hiện trạng Ứng dụng học máy và trí tuệ nhân tạo
  • 36. CHƯƠNG 3: SẢN PHẨM SỐ 34 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí + Lớp dữ liệu: Nơi triển khai cấu trúc dữ liệu và lưu trữ dữ liệu phục vụ cho sản phẩm đến khách hàng. Sản phẩm Báo cáo số Báo cáo số cung cấp thông tin dữ liệu dưới các dạng báo cáo. Với đặc trưng riêng của dạng sản phẩm báo cáo, vai trò của 3 lớp cấu trúc cụ thể như sau: + Lớpngườisửdụng:Gửivàoyêucầucụthểvềdạngthông tin mong muốn và dạng kết quả nhận về (dạng báo cáo). + Lớp phân tích: Tiếp nhận yêu cầu từ người dùng, thu thập, xử lý dữ liệu và xây dựng sản phẩm cuối là các báo cáo theo định dạng khách hàng đề nghị. + Lớp dữ liệu: Cung ứng các cổng kết nối để tiếp nhận yêu cầu từ khách hàng, cấp quyền truy cập dữ liệu cho nhà phân tích, tạo các kết nối của sản phẩm cuối cùng đến người sử dụng. Hình3.7.MôhìnhcấutrúcsảnphẩmBáocáosố. Bảng phân tích Báo cáo Khung sản phẩm Nền tảng lưu trữ Cấu trúc dữ liệu Báo cáo số Người sử dụng Phân tích Dữ liệu
  • 37. VIỆN DẦU KHÍ VIỆT NAM 35 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Sản phẩm Mảnh ghép số Mảnh ghép số cung cấp giải pháp kết nối mạnh mẽ dưới sự quản lý hiệu quả. Thay vì xây dựng một sản phẩm với giao diện hoàn thiện, mảnh ghép số đóng vai trò như một thành phần của sản phẩm cuối. Các mảnh ghép có thể là dữ liệu, khả năng phân tích, biểu diễn, thuật toán tối ưu hay các mô hình chất lượng cao được xây dựng trước. Mỗi thành phần này có thể được gọi và sử dụng trong các sản phẩm số khác. Người dùng có thể gửi yêu cầu và nhận về các mảnh ghép và sử dụng với mục đích riêng. Mảnh ghép số được phân thành 3 loại chính bao gồm: Biến đổi dữ liệu, Thuật toán và Mô hình. Mảnh ghép số dạng Biến đổi dữ liệu: cung cấp công cụ khai phá dữ liệu, cho phép người dùng có thể khám phá dữ liệu, tìm hiểu đặc trưng, xử lý dữ liệu với các công cụ được cung cấp, tích hợp trong mảnh ghép. Hình3.8.MôhìnhcấutrúcsảnphẩmMảnhghépsố(dạngBiếnđổidữliệu). Mảnh ghép số Biến đổi dữ liệu Người sử dụng Phân tích Dữ liệu Biến đổi dữ liệu Mảnh ghép số Giải thích thuật toán, phương pháp đo lường, hiệu quả thử nghiệm Mô tả vận hành Mã nguồn Dữ liệu đầu vào Kết quả biến đổi
  • 38. CHƯƠNG 3: SẢN PHẨM SỐ 36 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Mảnh ghép số dạng Thuật toán: cung cấp giải pháp về thuật toán để tối ưu và giải quyết các bài toán chuyên môn đặc trưng. Các thuật toán được cung cấp cùng mô tả, giải thích và cách hoạt động. Các thuật toán cho phép người Hình3.9.MôhìnhcấutrúcsảnphẩmMảnhghépsố (dạngthuậttoán). Mảnh ghép số Thuật toán Người sử dụng Phân tích Dữ liệu Thuật toán Mảnh ghép số Giải thích thuật toán phương pháp đo lường hiệu quả thử nghiệm Mô tả vận hành Mã nguồn Dữ liệu đầu vào Mô hình và kết quả dự báo Hình3.10.MôhìnhcấutrúcsảnphẩmMảnhghépsố (dạngMôhình). Mảnh ghép số Mô hình Người sử dụng Phân tích Dữ liệu Mô hình dự báo Mô hình huấn luyện trước Mảnh ghép số Giải thích thuật toán phương pháp đo lường hiệu quả thử nghiệm Mô tả vận hành Mã nguồn Dữ liệu huấn luyện trước Dữ liệu đầu vào Kết quả dự báo Dữ liệu đầu vào
  • 39. VIỆN DẦU KHÍ VIỆT NAM 37 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí dùng xây dựng mô hình riêng dựa trên dữ liệu riêng. Mô hình cuối cùng có thể được sử dụng để chuyên biệt và tối ưu vấn đề riêng của khách hàng. Mảnh ghép số dạng Mô hình: cung cấp các mô hình được huấn luyện trước bởi tập dữ liệu mẫu với kết quả dự báo tốt, có sự tin cậy cao. Việc thực hiện dự báo được tiếp tục trên tập dữ liệu của người dùng sau khi người dùng ghép nối mảnh ghép này vào sản phẩm của họ. Việc sử dụng mô hình dự báo sẵn có giúp tối ưu thời gian và chi phí tuy nhiên cần xem xét mức độ phù hợp của dữ liệu huấn luyện trước với dữ liệu riêng của khách hàng. Sản phẩm Dữ liệu số Hình3.11.MôhìnhcấutrúcsảnphẩmDữliệusố. Dữ liệu số Người sử dụng Phân tích Dữ liệu Nền tảng lưu trữ Kiểm soát chất lượng, cập nhật dữ liệu Danh mục dữ liệu Mô hình dữ liệu Định nghĩa dữ liệu Mô tả dữ liệu Sharepoint & DataMart
  • 40. CHƯƠNG 3: SẢN PHẨM SỐ 38 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Sản phẩm hệ thống chia sẻ dữ liệu tập trung vào tính minh bạch, nguồn gốc của dữ liệu. Sản phẩm cung cấp dữ liệu gốc, thô chưa qua xử lý. Vai trò của các lớp trong sơ đồ cấu trúc sản phẩm được làm rõ như Hình 3.11. Trong đó: + Lớp người sử dụng: Gửi yêu cầu dữ liệu theo bảng truy vấn sẵn có. Thông tin sẽ được gửi đến người quản lý dữ liệu. + Lớp phân tích: Không đóng vai trò trong dạng sản phẩm này do tập trung vào dữ liệu gốc. + Lớp dữ liệu: Tiếp nhận truy vấn, truy xuất dữ liệu, cung cấp nền tảng kết nối và trả về kết quả dữ liệu theo yêu cầu. Hình3.12.MôhìnhcấutrúcsảnphẩmỨngdụngsố. Mô hình và kết quả dự báo Người sử dụng Dữ liệu người dùng Mô tả vận hành Giải thích thuật toán, phương pháp đo lường, hiệu quả thử nghiệm Mã nguồn Mô hình Dữ liệu thời gian thực Nền tảng đám mây Dữ liệu Phân tích Ứng dụng số Ứng dụng số
  • 41. VIỆN DẦU KHÍ VIỆT NAM 39 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Sản phẩm Ứng dụng số Sản phẩm ứng dụng số (Hình 3.12) là sản phẩm đặc biệt kết hợp các tính năng nâng cao. Các ứng dụng số được đóng gói và phát hành như một phần mềm chuyên dụng, cung cấp giải pháp tới một số lượng người dùng lớn, dữ liệu đa dạng. Việc phát triển các ứng dụng số cũng có yêu cầu chặt chẽ về mặt vận hành và lưu trữ như sử dụng nền tảng tính toán đám mây, lưu trữ dữ liệu đám mây thời gian thực...
  • 42. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 40 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Hình4.1.TổngthểcấutrúcnềntảngPowerBI. Nguồn dữ liệu Power BI Service Power BI Truy cập Power BI Gateways Tổ chức dữ liệu Kết nối Publish Power BI Desktop CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICE 4.1. Tại sao sử dụng Power BI Service? Như đã đề cập ở phần mở đầu, cuốn sách chủ yếu tập trung giới thiệu đến bạn đọc công cụ Power BI trên nền tảng Power BI Service (https://app.powerbi.com), hoàn toàn nằm trên cloud. Vậy Power BI có thể hoạt động trên những nền tảng nào, và tại sao lựa chọn Power BI Service? Power BI hoạt động trên 3 nền tảng cơ bản: - Ứng dụng trên máy tính cá nhân, chỉ với hệ điều hành Windows được gọi là Power BI Desktop. - Dịch vụ phần mềm trực tuyến dưới dạng SaaS (phần mềm dạng dịch vụ dựa trên đám mây) được gọi là Power BI Service. - Ứng dụng Power BI Mobile dành cho thiết bị di động Windows, iOS và Android.
  • 43. VIỆN DẦU KHÍ VIỆT NAM 41 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Trong quy trình làm việc Power BI điển hình, người dùng bắt đầu bằng cách xây dựng sản phẩm số dưới dạng Power BI Report trong Power BI Desktop, sau đó xuất bản báo cáo đó lên Power BI Service. Tuy nhiên, nhờ có sự hỗ trợ của datamart (Tham khảo mục 4.2.4) các tính năng của Power BI Service đã dần tiệm cận đến Power BI Desktop và trở nên mạnh hơn với tính năng cộng tác và chia sẻ mà phiên bản trên máy tính không hỗ trợ. Việc xây dựng, cộng tác và chia sẻ các sản phẩm số được diễn ra trong không gian làm việc chung, gọi là workspace (Tham khảo mục 5.1). Sau khi tạo report và dashboard, người dùng có thể chia sẻ các sản phẩm số của mình. Người dùng cuối trong Power BI Service và thiết bị di động thông qua Power BI Mobile App có thể xem và tương tác với các sản phẩm này. Power BI Service cho phép người tạo ra sản phẩm kiểm soát tính năng và phạm vi chia sẻ của các sản phẩm bằng hệ thống phân quyền và nhúng. Trong phạm vi của cuốn sách này, nhóm tác giả sẽ đưa ra một quy trình xây dựng sản phẩm số hoàn chỉnh và sau đó, hướng dẫn về việc duy trì, chia sẻ và cách phân phối sản phẩm số tới người dùng cuối cùng. Để thực hiện được quy trình theo hướng dẫn của cuốn sách yêu cầu người dùng cần có license Power BI Premium - cụ thể với nhóm tác giả là Premium Per User (PPU). Bên cạnh đó, một tính năng vượt trội của Power BI Service là hỗ trợ tối ưu việc tự động hóa, qua đó duy trì kết nối và cập nhật với các nguồn dữ liệu cũng như khả năng kết
  • 44. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 42 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí hợp với Power Automate để xây dựng một chu trình báo cáo tự động hoàn chỉnh hoặc ứng dụng người dùng. Cuốn sách sẽ đề cập đến tính năng schedule refresh như một tính năng chính để hoàn thiện chu trình báo cáo tự động cập nhật dữ liệu (Tham khảo mục 4.5). Tóm lại, Power BI Service được lựa chọn để giới thiệu trong cuốn sách này bởi những ưu điểm sau: - Hoàn toàn trên cloud (đối với người dùng có license PPU): Người dùng có thể xây dựng, chỉnh sửa, chia sẻ sản phẩm ở bất cứ đâu, không bị phụ thuộc vào máy của người dùng nên trải nghiệm xây dựng sản phẩm tốt hơn mà không cần cài đặt. Hoàn toàn thích hợp với những người dùng không sử dụng hệ điều hành Windows nhưng vẫn muốn sử dụng Power BI. - Hỗ trợ tối ưu cộng tác giữa những người dùng xây dựng sản phẩm và chia sẻ tới người dùng cuối cùng với hình thức đa dạng (nhúng web, app…) - Hỗ trợ tối ưu các thao tác tự động hóa (tự động cập nhật dữ liệu, tạo app tương tác với người dùng cuối). - Tận dụng triệt để tài nguyên được xây dựng đối với Power BI: Khả năng lưu trữ dữ liệu lớn của datamart, tính năng AutoML của dataflow… 4.2.CôngcụchotổchứcdữliệutrênnềntảngPowerBIService 4.2.1. Power Query Power Query được xem như một công cụ vạn năng được tích hợp cùng với Power BI, với những tính năng hỗ trợ
  • 45. VIỆN DẦU KHÍ VIỆT NAM 43 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí người dùng làm sạch và chuẩn bị dữ liệu cho quá trình xây dựng sản phẩm số, xử lý đối với định dạng dữ liệu, biến đổi hoặc xoay chiều dữ liệu… và những thao tác nâng cao đối với dữ liệu. Power Query như một cầu nối giữa sản phẩm số của người dùng với đa dạng các nguồn dữ liệu trên máy tính cá nhân (on-premise) và trên mây (on cloud). Sau khi dữ liệu được chuẩn bị tốt, dữ liệu được tải vào sản phẩm số dưới dạng bảng biểu. Sau đó, bất cứ khi nào dữ liệu được cập nhật, người dùng có thể refresh và các thao tác xử lý dữ liệu trước đó được áp dụng tự động trên cả dữ liệu mới. Trong phạm vi cuốn sách này, nhóm tác giả giới thiệu các tính năng của Power Query trong từng trường hợp cụ thể cùng với một số nguồn dữ liệu phổ biến kết hợp với các nền tảng lưu trữ dữ liệu như SharePoint Online, Dataverse và Datamart. Các nguồn dữ liệu có đặc điểm chung là đều ở trên Cloud để đảm bảo không phụ thuộc vào máy tính của người dùng. Người dùng sẽ được thao tác với Power Query trong tính năng khởi tạo Datamart và Dataflow của Power BI Service. Nhìn chung, quy trình thao tác làm việc với Power Query trong các nền tảng Power BI tương tự nhau, bao gồm 4 bước chính (Hình 4.2). Các cấu phần chính của Power Query bao gồm: - Lấy dữ liệu và các kết nối; - Các bảng điều khiển trong Power Query Editor; - Cài đặt với Power Query.
  • 46. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 44 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Với Power Query trong Power BI Service, người dùng sẽ thực hiện bước đầu tiên với phần lấy dữ liệu và kết nối. Ở phần này, người dùng có quyền lựa chọn loại nguồn dữ liệu (loại kết nối), khai báo địa chỉ dẫn tới dữ liệu, khai báo bảo mật đối với nguồn dữ liệu và lựa chọn hình thức tải dữ liệu (chi tiết các nguồn kết nối được thể hiện ở Hình 4.3). Độc giả tham khảo ở Chương 7 (Mục 7.1 Hướng dẫn thực hiện một số loại kết nối dữ liệu) để được hướng dẫn chi tiết các cách kết nối nguồn dữ liệu khác nhau. Hình4.3.CửasổlựachọnnguồndữliệucủaPowerQuery. Hình4.2.CácbướccơbảnđểlàmviệcvớiPowerQuery. Lựa chọn nguồn dữ liệu và khai báo bảo mật nguồn dữ liệu Lựa chọn dữ liệu Xử lý và biến đổi dữ liệu cho báo cáo Tải dữ liệu cuối cho báo cáo
  • 47. VIỆN DẦU KHÍ VIỆT NAM 45 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Sau khi hoàn thành kết nối dữ liệu, người dùng sẽ làm việc với các bảng điều khiển chính trong Power Query Editor, được thể hiện ở Hình 4.4. - Preview Pane (Khu vực xem trước): cho phép xem trước kết quả của các bước thao tác với dữ liệu, đồng thời cho phép thực hiện một số thao tác tắt đối với dữ liệu. Đối với dữ liệu lớn, khu vực xem trước chỉ hiển thị một phần giới hạn của bộ dữ liệu. - Ribbons (Khu vực thao tác): Bao gồm các thao tác biến đổi hoặc áp dụng với toàn bộ dữ liệu được lựa chọn. Trong đó: • Tab File: Các thao tác lưu dữ liệu vào báo cáo, đóng Power Query Editor, mở Query Options hoặc mở cài đặt Data Source Setting • Tab Home: Một số bước chuyển đổi phổ biến nhất như: Hình4.4.CácbảngđiềukhiểnchínhtrongPowerQueryEditor. Query Pane Formular Bar Preview Pane Ribbons Query settings Applied Steps
  • 48. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 46 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí chọn cột, xóa cột, giữ hàng và xóa hàng, đưa thêm nguồn dữ liệu mới vào báo cáo • Tab Transform: Cho phép sử dụng chuyển đổi trên các cột đã chọn. Phụ thuộc vào kiểu dữ liệu của cột, một số lệnh sẽ được bật hoặc tắt. Trong tab này, người dùng có thể sử dụng một số phép biến đổi như nhóm hàng dữ liệu theo điều kiện nhất định, xoay chiều bảng, định dạng hoặc làm sạch cột dữ liệu, pitvot/unpivot bảng, một số bước tính toán cơ bản... + Tab Add Column: Cho phép người dùng thêm cột dữ liệu mới vào bảng theo một số quy tắc nhất định như đặt điều kiện, tính toán, trích xuất từ cột cũ… + Tab View: Lựa chọn hiển thị đối với Power Query Editor - Query Pane (Khu vực danh sách các query trong báo cáo) bao gồm các bảng dữ liệu đang được làm việc trong báo cáo. Ở khu vực này người dùng có thể chỉnh sửa, tạo bảng mới bằng cách sao chép hoặc tham chiếu từ các bảng khác, lựa chọn tải/không tải dữ liệu của bảng vào báo cáo… - Query Settings: Khu vực đổi tên và một số cài đặt chung đối với bảng truy vấn được lựa chọn - Applied Steps: Khu vực xem lại các bước biến đổi đối với bảng dữ liệu. Ở đây các thao tác tạo thành một chuỗi các hành động có thứ tự trước sau. Bất cứ lúc nào người dùng cũng có thể quay lại các bước trước đó và thay đổi thao tác. Kết quả cuối cùng cũng sẽ thay đổi - Formula Bar: Nơi hiển thị công thức tương đương với
  • 49. VIỆN DẦU KHÍ VIỆT NAM 47 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí các bước biến đổi đối với dữ liệu. Công thức này cũng có thể được xem tại Advanced Editor. Ngôn ngữ được sử dụng trong Power Query là M Query Các cài đặt chung đối với Power Query trong Power BI được tìm thấy trong Query Option (Tab Home). Tại đây, người dùng có thể lựa chọn Project options đối với những báo cáo riêng biệt, hoặc Global options để áp dụng cho tất cả các báo cáo. 4.2.2. Dataset Dataset trong Power BI Service là một tập hợp các bảng dữ liệu từ các nguồn (data sources) khác nhau như Excel, Sharepoint, SQL Server... được import hoặc kết nối (connect) với Power BI (Hình 4.7). Đặc điểm chính của Dataset: - Mỗi Dataset luôn được liên kết (associated) với ít nhất 1 workspace; - Một Dataset có thể được sử dụng cho nhiều workspace khác nhau; Hình4.5.Tùychỉnhcàiđặtriêngcho từngdựán. Hình4.6.Tùychỉnhcàiđặtchung.
  • 50. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 48 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Từ một Dataset, có thể tạo ra nhiều report/dashboard có nội dung (content) khác nhau; - Dataset có thể tự động cập nhật dữ liệu mới (refresh) theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real- time). Cách tạo Dataset Trong Power BI Service, có 5 cách để tạo 1 Dataset như sau: - Upload 1 file Excel hoặc CSV; - Upload 1 file Power BI Desktop (.pbix); - Kết nối với một mô hình dữ liệu (data model) có sẵn từ nguồn bên ngoài Power BI; - Sử dụng API (push dataset); - Kết nối với các dữ liệu thời gian thực (real-time data). Hình4.7.GiaodiệnDatasettrongPowerBIService.
  • 51. VIỆN DẦU KHÍ VIỆT NAM 49 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Các bước tạo Dataset độc giả tham khảo ở Chương 7 (Mục 7.2. Cách khởi tạo công cụ tổ chức dữ liệu). 4.2.3. Dataflow Dataflow là quá trình trích xuất dữ liệu từ một hoặc nhiều nguồn khác nhau, sau đó làm sạch, biến đổi và lưu lại kết quả thành một tập hợp các bảng dữ liệu trong Workspace của Power BI Service. Các bảng dữ liệu này sau đó được dùng để tạo các Dataset, Datamart hoặc sử dụng để xây dựng các mô hình học máy trong Power BI (Hình 4.8). Đặc điểm chính của Dataflow: - Dataflow được thiết kế để có thể tái sử dụng nhiều lần cho nhiều Dataset, người dùng chỉ cần tải dữ liệu từ Dataflow mà không cần kết nối trực tiếp đến nguồn (Data source), do đó giảm thiểu nhu cầu tạo các kết nối riêng biệt tới nguồn dữ liệu và giảm tải cho hệ thống hạ tầng dữ liệu. Hình4.8.Tổngquankiếntrúcdataflow.Nguồn:Microsoft,2023.
  • 52. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 50 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Do người dùng có thể xây dựng Dataset/Datamart từ Dataflow mà không cần kết nối trực tiếp với nguồn dữ liệu (Data source), quản trị viên sẽ dễ dàng hơn trong việc quản lý và tăng cường bảo mật cho hệ thống bằng cách chỉ cho phép người dùng tải dữ liệu từ Dataflow thay vì trực tiếp từ Data source. Khi đó quản trị viên chỉ cần kiểm soát quyền truy cập của người dùng đối với Dataflow là đủ để bảo mật cho hệ thống. - Dataflow có thể tự động cập nhật dữ liệu mới (refresh) theo lịch trình thiết lập sẵn hoặc theo thời gian thực (real- time). Các bước tạo Dataflow độc giả tham khảo ở Chương 7 (Mục 7.2. Cách khởi tạo công cụ tổ chức dữ liệu). 4.2.4. Datamart Datamart là một công cụ lưu trữ dữ liệu trên nền tảng Power BI Service dưới dạng SQL database. Trong phạm vi cuốn sách này, nhóm tác giả sử dụng Datamart là nơi lưu trữ dữ liệu cho tất cả các sản phẩm được xây dựng trên nền tảng. Như đã đề cập, Datamart trong Power BI là một cơ sở dữ liệu quan hệ (relational database) gồm một tập hợp các bảng dữ liệu phục vụ một nghiệp vụ (business) cụ thể, được xây dựng bằng cách tổng hợp dữ liệu từ nhiều nguồn khác nhau, sau đó được làm sạch, xử lý và biến đổi bằng Power Query và tải lên Azure SQL Database - Là dịch vụ cơ sở dữ liệu trên nền tảng đám mây (cloud database) của Microsoft. Trên
  • 53. VIỆN DẦU KHÍ VIỆT NAM 51 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Datamart, ta có thể tạo quan hệ (relationship) giữa các bảng, ta cũng có thể truy vấn (query) dữ liệu trong Datamart bằng T-SQL. Toàn bộ quá trình ETL để xây dựng Datamart được thực hiện trên nền tảng đám mây và công cụ ETL được tích hợp sẵn trong Power BI Service. Ngay sau khi được tạo, Datamart sẽ tự động sinh ra một Dataset tương ứng, ta có thể dùng Dataset này để tạo các Reports hoặc Dashboards theo nhu cầu. Ưu điểm của Datamart: - Cách tạo đơn giản, dễ dàng, quen thuộc với người dùng Excel và Power BI với công cụ Power Query; - Tích hợp tính năng kết nối nhiều nguồn dữ liệu khác nhau và xử lý dữ liệu với giao diện không cần sử dụng code; - Dung lượng lưu trữ lớn, lên đến 100 GB/Datamart; - Tích hợp tính năng schedule refresh hỗ trợ khả năng tự động cập nhật dữ liệu; - Được xây dựng hoàn toàn dựa trên nền tảng web, không cần cài đặt thêm bất cứ phần mềm hay công cụ nào trên máy tính của người dùng; - Được lưu trữ trên Azure SQL Database - Dịch vụ cơ sở dữ liệu đám mây của Microsoft trong đó Microsoft chịu trách nhiệm quản lý, cài đặt, cấu hình, bảo mật và bảo trì hệ thống, người dùng chỉ cần xây dựng và khai thác sử dụng Database của mình mà không cần quan tâm đến các công việc khác liên quan đến hạ tầng;
  • 54. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 52 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Hỗ trợ truy vấn bằng T-SQL; - Người dùng có thể tạo mối quan hệ (relationship) giữa các bảng trực tiếp trên Datamart với các thao tác kéo - thả mà không cần phải thực hiện thêm bất kỳ công cụ nào khác. Phạm vi ứng dụng Datamart được Microsoft đưa ra để phục vụ cho những khách hàng cần quản lý dữ liệu theo kiểu kiến trúc phân tán, theo đó dữ liệu được chia nhỏ và xây dựng thành các Database tương ứng các lĩnh vực/nghiệp vụ của tổ chức (ví dụ dữ liệu trong một tổ chức được chia và quản lý theo các nghiệp vụ tương ứng với các bộ phận như: Nhân sự, kế toán, kinh doanh,…) thay vì được đưa vào quản lý tập trung trong một Data Warehouse duy nhất cho toàn bộ tổ chức. Mỗi bộ phận (nhân sự, kế toán, kinh doanh,…) sẽ tự xây dựng Database của riêng mình để khai thác và sử dụng và được gọi là các Datamart. Việc quản lý dữ liệu theo kiểu phân tán như trên sẽ giúp các bộ phận nghiệp vụ chủ động trong việc tự xây dựng cơ sở dữ liệu phù hợp với đặc thù hoạt động của mình, linh hoạt và kịp thời, giúp giảm thiểu thời gian trong việc cập nhật các dữ liệu mới cũng như điều chỉnh/thay đổi cơ sở dữ liệu theo nhu cầu và thực tế công việc mà không phụ thuộc vào Bộ phận khác (ở đây là Bộ phận IT quản lý Data Warehouse chung nếu có). Trong cuốn sách này, nhóm tác giả khuyến khích người dùng sử dụng Datamart như là nơi tập hợp dữ liệu từ các
  • 55. VIỆN DẦU KHÍ VIỆT NAM 53 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí nguồn dữ liệu khác nhau và tổ chức thành bộ dữ liệu làm nền tảng cho sản phẩm dữ liệu của mình. Các bước tạo Datamart được thể hiện ở Chương 7 (Mục 7.2. Cách khởi tạo công cụ tổ chức dữ liệu). Một số điểm cần lưu ý: - Để có thể tạo được Datamart, người dùng phải có tài khoản Power BI Premium; - Datamart là sản phẩm mới đang trong giai đoạn thử nghiệm nên một số chính sách hiện tại có thể thay đổi. 4.3. Trực quan hóa dữ liệu 4.3.1. Khái niệm trực quan hóa dữ liệu Trực quan hóa dữ liệu là quá trình sử dụng các công cụ và kỹ thuật để biểu diễn dữ liệu dưới dạng hình ảnh, đồ thị, bản đồ hoặc các hình dạng khác. Mục đích của việc trực quan hóa dữ liệu là giúp người dùng dễ dàng hiểu và phân tích dữ liệu, giúp cho việc đưa ra quyết định và lựa chọn thông minh hơn. Có nhiều loại khác nhau của trực quan hóa dữ liệu, chẳng hạn như biểu đồ cột, biểu đồ đường, biểu đồ hình tròn, biểu đồ dạng lưới, bản đồ vị trí, mỗi loại có ưu và nhược điểm khác nhau tùy thuộc vào loại dữ liệu và những thông tin mà người dùng muốn truy xuất. 4.3.2. Tầm quan trọng của trực quan hóa dữ liệu Mục tiêu chính của việc biểu diễn dữ liệu là làm cho dữ liệu phức tạp trở nên dễ hiểu hơn và dễ dàng truy cập hơn
  • 56. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 54 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí cho đối tượng rộng hơn, bằng cách nhấn mạnh xu hướng và khám phá dữ liệu mà không cần phải nhìn vào dữ liệu gốc. Trực quan hóa dữ liệu là cách nhanh chóng và dễ dàng để truyền đạt các khái niệm cho người dùng cuối. Các nền tảng thông minh như Power BI giúp xử lý các hình ảnh trực quan khác nhau của các bộ dữ liệu một cách an toàn. Cụ thể hơn, đối với Power BI: - Khám phá dữ liệu: Power BI cho phép người dùng khám phá dữ liệu từ nhiều nguồn và tạo ra các biểu đồ tương tác, chẳng hạn như biểu đồ, bản đồ và bảng, giúp người dùng xác định các mẫu, xu hướng và ngoại lệ trong dữ liệu. - Phân tích dữ liệu: Power BI cung cấp một loạt các tùy chọn biểu diễn dữ liệu, chẳng hạn như drill-through, lọc và cắt, giúp người dùng thực hiện phân tích sâu hơn và nhận ra các khám phá dữ liệu. - Chia sẻ dữ liệu: Power BI cho phép người dùng tạo các bảng điều khiển và báo cáo tương tác có thể chia sẻ với người khác, giúp dễ dàng chia sẻ các kết quả, kết luận và dự báo về dữ liệu. 4.3.3. Các dạng biểu diễn cơ bản trong Power BI Trong Power BI, có nhiều dạng biểu diễn mà độc giả có thể sử dụng để biểu diễn. Tuy nhiên, việc lựa chọn đúng biểu đồ để biểu diễn dữ liệu cũng rất quan trọng để đáp ứng các yêu cầu và chiến lược của doanh nghiệp. Độc giả cần biết được cái mình muốn thể hiện là gì? Trên nền tảng Power BI Service, độc giả có thể lựa chọn
  • 57. VIỆN DẦU KHÍ VIỆT NAM 55 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí nhiều dạng biểu đồ cơ bản ở tab “Visualizations” được thể hiện ở Hình 4.9. Các dạng biểu đồ cơ bản bao gồm Area Charts, Line Charts, Bar Charts, Combo Charts, Pie Charts, Doughnut Charts, Gauge Charts, Scatter Charts, Tables... Tham khảo Chương 7 (Mục 7.3 để biết thêm thông tin chi tiết). Để tạo biểu đồ trên Power BI, độc giả có thể thực hiện theo các bước cơ bản sau: - Bước 1: Mở và đăng nhập Power BI service theo đường link sau: https://powerbi.microsoft.com; - Bước 2: Tổ chức và Nhập bảng dữ liệu (độc giả tham khảo mục 4.2); - Bước 3: Trong phần "Visualizations" chọn loại Chart phù hợp; - Bước 4: Kéo và thả dữ liệu cần tạo biểu đồ vào tương ứng các trục X,Y; Hình4.9.CácdạngbiểuđồtrênnềntảngPowerBI.
  • 58. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 56 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Bước 5: Sử dụng công cụ "Format" để thay đổi màu sắc, kích thước... của biểu đồ; - Bước 6: Sử dụng công cụ "View" để xem và chỉnh sửa biểu đồ; - Bước 7: Lưu và chia sẻ biểu đồ với người khác. 4.3.4. Trực quan hóa dữ liệu nâng cao 4.3.4.1. Biểu diễn bản đồ Bên cạnh các biểu diễn mạnh mẽ về bảng biểu, cột, đường, Power BI cũng được tích hợp nhiều giải pháp biểu diễn thông tin trên bản đồ nhằm đáp ứng nhu cầu đa dạng của người dùng. Các công cụ biểu diễn bản đồ tập trung làm nổi bật đặc điểm, vị trí của đối tượng trên nền bản đồ khu vực và thế giới. Power BI cung cấp rất nhiều công cụ biểu Hình4.10.CáccôngcụbiểudiễnbảnđồtrongPowerBI.
  • 59. VIỆN DẦU KHÍ VIỆT NAM 57 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí diễn dữ liệu lên bản đồ khác nhau. Mỗi công cụ có đặc điểm riêng phù hợp với yêu cầu của người dùng. Các loại biểu diễn bản đồ được thể hiện ở Hình 4.10. Để tìm hiểu chi tiết cách thức xây dựng biểu đồ, bản đồ, độc giả tham khảo Chương 7 (Mục 7.4. Cách triển khai áp dụng biểu đồ bản đồ nâng cao). 4.3.4.2. Biểu diễn nâng cao với code Python Bên cạnh các tác vụ biểu diễn được tích hợp sẵn hoặc cài đặt từ thư viện mở rộng, Microsoft còn cho phép người dùng tùy biến mạnh mẽ với code. Ngôn ngữ R và Python được hỗ trợ trong nội dung này. Các biểu diễn với code nhằm đáp ứng các biểu diễn nâng cao theo nhu cầu của người dùng. Tính năng yêu cầu người dùng phải có khả năng làm việc với code. Trong phạm vi bài viết, hướng dẫn chi tiết về Hình4.11.BiểudiễnđườngđoghigiếngkhoanbằngtínhnăngcodePythonVisual.
  • 60. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 58 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Hình4.12.Biểudiễncross-plotvàcodemẫu. Hình4.13.Biểudiễndạngđườngvàcodemẫu. Hình4.14.Biểudiễnnhiềutươngquanchéocùnglúc.
  • 61. VIỆN DẦU KHÍ VIỆT NAM 59 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí cách sử dụng ngôn ngữ Python để biểu diễn dữ liệu trong dashboard Power BI tham khảo Chương 7 (Mục 7.5. Cách triển khai áp dụng biểu diễn nâng cao kết hợp với Python). Lưu ý, để sử dụng visual với code Python, người dùng phải sử dụng Power BI Desktop. Power BI Service hiện chưa có tính năng này. Một số mẫu sản phẩm biểu diễn nâng cao kết hợp Python được thể hiện trong Hình 4.11 - 4.15. 4.4. Auto Machine Learning (AutoML) – Học máy tự động 4.4.1. Học máy/Học máy tự động là gì? Học máy (Machine Learning) Những năm gần đây khái niệm học máy đã dần trở nên quen thuộc với cộng đồng công nghệ, với những lợi ích của học máy đem lại trong việc giải quyết các bài toán trong thực Hình4.15.Biểudiễnđườngđoghigiếngkhoanvàcodemẫu.
  • 62. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 60 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí tế. Hiểu đơn giản Học máy (machine learning - ML) là một lĩnh vực nhỏ của khoa học máy tính, có khả năng tự học hỏi dựa trên dữ liệu được đưa vào mà không cần phụ thuộc vào việc lập trình cụ thể và dựa trên đó đưa ra những quyết định, dự báo và điều khiển. Mô hình học máy có 2 loại chính là học có giám sát (suppervised learning) và học không có giám sát (unsupervised learning). Học máy tự động (Automated Machine Learning) Học máy tự động hay còn được sử dụng như là “AutoML” là một quá trình tự động thực hiện các tác vụ mất nhiều thời gian lặp đi lặp lại trong quá trình phát triển mô hình học máy. Công cụ cho phép các nhà khoa học dữ liệu, phân tích và các nhà phát triển xây dựng các mô hình học máy với lượng dữ liệu lớn, hiệu suất và năng suất cao trong khi đó vẫn duy trì được chất lượng mô hình. AutoML sẽ đơn giản hóa các quy trình của việc phát triển các mô hình học máy, không phụ thuộc quá nhiều vào kinh nghiệm của những chuyên gia khoa học dữ liệu, để xác định bất kỳ những vấn đề nào gặp phải xuyên suốt từ bước đầu đến bước cuối trong quá trình xây dựng mô hình. AutoML được chia thành 4 loại chính theo nhu cầu sử dụng: - Loại 1: Triển khai các giải pháp học máy không cần có kiến thức sâu. - Loại 2: Tiết kiệm thời gian và nguồn lực. - Loại 3: Tận dụng các công nghệ mới nhất để phục vụ công việc.
  • 63. VIỆN DẦU KHÍ VIỆT NAM 61 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Loại 4: Khả năng giải quyết vấn đề nhanh chóng. 4.4.2. Automated Machine Learning (AutoML) trong Power BI AutoML được xây dựng với mục đích giúp người dùng Power BI, có hoặc không có chuyên môn về khoa học dữ liệu có thể tạo ra các mô hình dự đoán hoặc phân loại dữ liệu dễ dàng và nhanh chóng. Tính năng này giúp tự động hóa quá trình xây dựng các mô hình Machine Learning trực tuyến, cho phép thử nghiệm với số lượng lớn dữ liệu. Bên cạnh các sản phẩm Machine Learning khác trong Power BI được xây dựng trên nền tảng Azure, nhóm tác giả tập trung giới thiệu công cụ Auto ML thông qua Dataflow trong Power BI Service trên nền tảng đám mây. AutoML trong Power BI được gắn kết với AutoML từ nền tảng học máy Azure để khởi tạo các mô hình học máy do người dùng yêu cầu. Tuy nhiên, người dùng sẽ không cần phải đăng nhập Azure để có thể sử dụng AutoML trên Power BI. Quá trình huấn luyện và lưu trữ các mô hình học máy được quản lý hoàn toàn bởi nền tảng của Power BI. AutoML cho phép người dùng tận dụng các dữ liệu sẵn có hoặc bên ngoài để xây dựng các mô hình học máy, ngay trên nền tảng Power BI Service. Với AutoML, việc tạo lập các mô hình học máy rất trực quan và hiện hoàn toàn tự động và được giám sát để có thể đảm bảo chất lượng mô hình, người dùng hoàn toàn có thể hiểu và nắm được toàn bộ các bước tạo ra mô hình học máy. Các tính năng chính của AutoML trên Power BI Service bao gồm:
  • 64. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 62 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí - Tự động phát hiện các mẫu dữ liệu và loại bỏ các giá trị bị khuyết hoặc không hợp lệ; - Tự động chọn mô hình phù hợp nhất trong khoảng thời gian cho phép để huấn luyện trên dữ liệu của bạn; - Tự động tinh chỉnh các siêu tham số của mô hình để tối ưu hóa hiệu suất dự đoán; - Tự động chạy nhiều mô hình khác nhau và so sánh hiệu suất của chúng để chọn ra mô hình tốt nhất; - Tự động tạo ra các biểu đồ và báo cáo phân tích để giúp người dùng dễ dàng hiểu kết quả của mô hình. Quy trình xây dựng một mô hình học máy AutoML bắt đầu bằng việc người dùng lựa chọn các dữ liệu mong muốn đưa vào xây dựng mô hình học máy, sau đó AutoML sẽ thực hiện tự động phân chia dữ liệu cho việc huấn luyện và đánh Hình4.16.QuytrìnhthựchiệnxâydựngmôhìnhhọcmáytrongPowerBI.
  • 65. VIỆN DẦU KHÍ VIỆT NAM 63 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí giá dữ liệu và lựa chọn thuật toán để xây dựng mô hình huấn luyện. Trong quá trình huấn luyện, AutoML sẽ lựa chọn những thuật toán phù hợp nhất, đồng thời tối ưu và đánh giá mô hình học máy. Sau khi huấn luyện xong AutoML sẽ tự động thành lập các báo cáo tự động, để giải thích và phân tích kết quả. Ngoài ra, người dùng có thể cải thiện và thực hiện lại việc huấn luyện mô hình thông qua dữ liệu ban đầu hoặc dữ liệu mới được cập nhật thêm. Và cuối cùng, hoàn toàn có thể áp dụng dễ dàng cho việc dự đoán đối với nhóm dữ liệu mới. Quy trình thực hiện xây dựng mô hình học máy được thể hiện ở Hình 4.16. 4.4.2.1. Khởi tạo tính năng AutoML trong Power BI Để người dùng có thể sử dụng Auto ML trong Power BI người dùng cần phải nâng cấp lên tài khoản cao cấp. Các tác vụ từ các dự án khác nhau sẽ độc lập với nhau về tác vụ thực hiện. Người dùng cần phải được khởi tạo “Capacity workload” trước khi có thể sử dụng bất kỳ tính năng nào của AutoML. Cần chú ý rằng “Capacity workload” bao gồm luôn “Congitive Services” và AutoML. Tuy nhiên, với tài khoản “Premium Per User” thì việc tạo “Capacity workload” đã được thực hiện sẵn và hạn chế sự can thiệp của người dùng. 4.4.2.2. Các bước tạo lập mô hình AutoML Tạo lập mô hình AutoML bao gồm các bước chính sau đây: Bước 1: Chuẩn bị dữ liệu đầu vào
  • 66. CHƯƠNG 4: CÁC TÍNH NĂNG, CÔNG CỤ TRÊN NỀN TẢNG POWER BI SERVICES 64 SÁNG TẠO SẢN PHẨM SỐ Ai cũng dùng AI ỨngdụngPowerBIServicevàAutoMLtronglĩnhvựcdầukhí Người dùng tạo lập dữ liệu từ các nguồn dữ liệu sẵn có hoặc đăng tải mới từ bên ngoài vào. Và xác định đối tượng cần dự báo và các thông tin đầu vào để xây dựng mô hình học máy. Bước 2: Tạo lập mô hình học máy Người dùng cần tạo và đặt tên cho mô hình học máy cần lập. Bước 3: Huấn luyện mô hình học máy (ML Model Training) Trongbướcnàyngườidùngcầnxácđịnhloạimôhìnhphù hợp với bài toán ban đầu đặt ra là Phân loại (Classification) hay Tuyến tính (Regression). Các bước xử lý dữ liệu và chạy các vòng lập thuật toán khác nhau cũng được thực hiện tại bước này. Bước 4: Đánh giá, báo cáo kết quả mô hình huấn luyện Sau khi mô hình học máy hoàn thành việc huấn luyện, người dùng có thể sử dụng và tham vấn các báo cáo mà hệ thống tạo lập sẵn để đánh giá mức độ chính xác, nhận định những thông số đầu vào quan trọng ảnh hướng chính đến độ chính xác của mô hình. Bước 5: Áp dụng mô hình dự báo Sau khi đã lựa chọn được mô hình học máy cuối cùng, thỏa mãn toàn bộ điều kiện của người dùng, người dùng hoàn toàn có thể sử dụng mô hình học máy đã luyện xong, để dự đoán cho các tập hợp dữ liệu có thông tin nhãn/mục tiêu bị thiếu, cần phải dự đoán.