SlideShare a Scribd company logo
1 of 55
Download to read offline
Trí Tuệ Nhân Tạo
(Artificial Intelligence)
Viện Công nghệ thông tin và Truyền thông
Trường Đại học Bách Khoa Hà Nội
Năm 2016
Thân Quang Khoát
khoattq@soict.hust.edu.vn
Nội dung môn học:
n  Giới thiệu về Trí tuệ nhân tạo
n  Tác tử
n  Giải quyết vấn đề: Tìm kiếm, Thỏa mãn ràng buộc
n  Logic và suy diễn
n  Biểu diễn tri thức
n  Biểu diễn tri thức không chắc chắn
n  Học máy
q  Giới thiệu về học máy
q  Phân lớp Naïve Bayes
q  Học dựa trên các láng giềng gần nhất
Trí Tuệ Nhân Tạo
2
Giới thiệu về Học máy
n  Học máy (ML - Machine Learning) là một lĩnh vực nghiên cứu của Trí
tuệ nhân tạo (Artificial Intelligence)
n  Câu hỏi trung tâm của ML:
→  “How can we build computer systems that automatically improve with
experience, and what are the fundamental laws that govern all learning
processes?” [Mitchell, 2006]
n  Vài quan điểm về học máy:
→  Một quá trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạt
động) của nó [Simon, 1983]
→  Việc lập trình các máy tính để tối ưu hóa một tiêu chí hiệu suất dựa trên
các dữ liệu hoặc kinh nghiệm trong quá khứ [Alpaydin, 2010]
Trí Tuệ Nhân Tạo
Một máy học
n  Ta nói một máy tính có khả năng học nếu nó tự cải thiện hiệu suất
hoạt động P cho một công việc T cụ thể, dựa vào kinh nghiệm E của
nó.
n  Như vậy một bài toán học máy có thể biểu diễn bằng 1 bộ (T, P, E)
•  T: một công việc (nhiệm vụ)
•  P: tiêu chí đánh giá hiệu năng
•  E: kinh nghiệm
Trí Tuệ Nhân Tạo
Ví dụ bài toán học máy (1)
Lọc thư rác (email spam filtering)
• T: Dự đoán (để lọc) những thư điện tử
nào là thư rác (spam email)
• P: số lượng thư điện tử gửi đến được
phân loại chính xác
• E: Một tập các thư điện tử (emails)
mẫu, mỗi thư điện tử được biểu diễn
bằng một tập thuộc tính (vd: tập từ
khóa) và nhãn lớp (thư thường/thư rác)
tương ứng
Thư rác?
Thư
thường
Thư
rác
5Trí Tuệ Nhân Tạo
Ví dụ bài toán học máy (2)
Nhận dạng chữ viết tay
n T: Nhận dạng và phân loại các
từ trong các ảnh chữ viết
n P: Tỷ lệ (%) các từ được nhận
dạng và phân loại đúng
n E: Một tập các ảnh chữ viết,
trong đó mỗi ảnh được gắn với
một định danh của một từ
Từ nào?
rightdo in waywe the
6Trí Tuệ Nhân Tạo
Ví dụ bài toán học máy (3)
Gán nhãn ảnh
n  T: đưa ra một vài mô tả ý nghĩa của
1 bức ảnh
n  P: ?
n  E: Một tập các bức ảnh, trong đó mỗi ảnh
đã được gán một tập các từ mô tả ý nghĩa của chúng
Máy học (1)
n  Học một ánh xạ (hàm): f
•  x: quan sát (dữ liệu), kinh nghiệm
•  y: phán đoán, tri thức mới, kinh nghiệm mới, …
n  Học một mô hình:
q  Dữ liệu (được giả thuyết) tuân theo một mô hình.
q  Học mô hình là học những tham số của mô hình đó từ dữ liệu
quan sát được và kinh nghiệm đang có.
n  Hồi quy (regression): nếu y là một số thực
n  Phân loại (classification): nếu y thuộc một tập rời rạc (tập nhãn lớp)
8Trí Tuệ Nhân Tạo
f : x 7! y
Máy học (2)
n  Học từ đâu?
q  Từ các quan sát trong quá khứ (tập học).
{x1, x2, …, xN}; {y1, y2,…, yM}
n  Sau khi đã học:
q  Thu được một mô hình, kinh nghiệm, tri thức mới.
q  Dùng nó để suy diễn (phán đoán) cho quan sát trong tương lai.
Y = f(x)
9Trí Tuệ Nhân Tạo
Hai bài toán học cơ bản
n  Học có giám sát (supervised learning): cần học một hàm
y = f(x) từ tập học {{x1, x2, …, xN}; {y1, y2,…, yN}} sao cho
yi ≅	f(xi).
q  Phân loại (phân lớp): nếu y chỉ nhận giá trị từ một tập rời rạc,
chẳng hạn {cá, cây, quả, mèo}
q  Hồi quy: nếu y nhận giá trị số thực
n  Học không giám sát (unsupervised learning): cần học
một hàm y = f(x) từ tập học cho trước {x1, x2, …, xN}.
q  Y có thể là các cụm dữ liệu.
q  Y có thể là các cấu trúc ẩn.
10Trí Tuệ Nhân Tạo
Học có giám sát: ví dụ
n  Lọc thư rác
n  Phân loại trang web
n  Dự đoán rủi ro tài chính
n  Dự đoán biến động chỉ số chứng khoán
n  Phát hiện tấn công mạng
11Trí Tuệ Nhân Tạo
Học không giám sát: ví dụ (1)
n  Phân cụm (clustering)
q  Phát hiện các cụm dữ liệu, cụm tính chất,…
n  Community detection
n  Phát hiện các cộng đồng trong mạng xã hội
12
Fig. 1. Learning problems: dots correspond to points without any labels. Points with labels are denoted by plus signs, asterisks, and crosses. In (c), the must-link and cannot-
link constraints are denoted by solid and dashed lines, respectively (figure taken from Lange et al. (2005).
Fig. 2. Diversity of clusters. The seven clusters in (a) (denoted by seven different colors in 1(b)) differ in shape, size, and density. Although these clusters are apparent to a data
analyst, none of the available clustering algorithms can detect all these clusters.
Trí Tuệ Nhân Tạo
Học không giám sát: ví dụ (2)
n  Trends detection
q  Phát hiện xu hướng, thị yếu,…
n  Entity-interaction analysis
13Trí Tuệ Nhân Tạo
Quá trình học máy: cơ bản
14
Tập dữ liệu
(Dataset)
Tập học
(Training set)
Tập thử nghiệm
(Test set)
Huấn luyện
hệ thống
Thử nghiệm
hệ thống
đã học
Trí Tuệ Nhân Tạo
Quá trình học máy: toàn diện
15
Tập dữ liệu
(Dataset)
Tập học
(Training set)
Tập thử nghiệm
(Test set)
Tập tối ưu
(Validation set)
Huấn luyện
hệ thống
Tối ưu hóa
các tham số
(nếu có)
Thử nghiệm
hệ thống
đã học
Trí Tuệ Nhân Tạo
Thiết kế một hệ thống học (1)
n  Lựa chọn các ví dụ học (training/learning examples)
•  Các thông tin hướng dẫn quá trình học (training feedback) được chứa
ngay trong các ví dụ học, hay là được cung cấp gián tiếp (vd: từ môi
trường hoạt động)
•  Các ví dụ học theo kiểu có giám sát (supervised) hay không có giám sát
(unsupervised)
•  Các ví dụ học nên tương thích với (đại diện cho) các ví dụ sẽ được làm
việc bởi hệ thống trong tương lai (future test examples)
n  Xác định hàm mục tiêu (giả thiết, khái niệm) cần học
•  F: X → {0,1}
•  F: X → Một tập các nhãn lớp
•  F: X → R+ (miền các giá trị số thực dương)
•  …
16Trí Tuệ Nhân Tạo
Thiết kế một hệ thống học (2)
n  Lựa chọn cách biểu diễn cho hàm mục tiêu cần học
•  Hàm đa thức (a polynomial function)
•  Một tập các luật (a set of rules)
•  Một cây quyết định (a decision tree)
•  Một mạng nơ-ron nhân tạo (an artificial neural network)
•  …
n  Lựa chọn một giải thuật học máy có thể học (xấp xỉ) được
hàm mục tiêu
•  Phương pháp học hồi quy (Regression-based)
•  Phương pháp học quy nạp luật (Rule induction)
•  Phương pháp học cây quyết định (ID3 hoặc C4.5)
•  Phương pháp học lan truyền ngược (Back-propagation)
•  …
17Trí Tuệ Nhân Tạo
Các vấn đề trong Học máy (1)
18
n  Giải thuật học máy (Learning algorithm)
•  Những giải thuật học máy nào có thể học (xấp xỉ) một hàm
mục tiêu cần học?
•  Với những điều kiện nào, một giải thuật học máy đã chọn
sẽ hội tụ (tiệm cận) hàm mục tiêu cần học?
•  Đối với một lĩnh vực bài toán cụ thể và đối với một cách
biểu diễn các ví dụ (đối tượng) cụ thể, giải thuật học máy
nào thực hiện tốt nhất?
Trí Tuệ Nhân Tạo
Các vấn đề trong Học máy (2)
19
n  Các ví dụ học (Training examples)
•  Bao nhiêu ví dụ học là đủ?
•  Kích thước của tập học (tập huấn luyện) ảnh hưởng thế
nào đối với độ chính xác của hàm mục tiêu học được?
•  Các ví dụ lỗi (nhiễu) và/hoặc các ví dụ thiếu giá trị thuộc
tính (missing-value) ảnh hưởng thế nào đối với độ chính
xác?
Trí Tuệ Nhân Tạo
Các vấn đề trong Học máy (3)
20
n  Quá trình học (Learning process)
•  Chiến lược tối ưu cho việc lựa chọn thứ tự sử dụng (khai
thác) các ví dụ học?
•  Các chiến lược lựa chọn này làm thay đổi mức độ phức tạp
của bài toán học máy như thế nào?
•  Các tri thức cụ thể của bài toán (ngoài các ví dụ học) có
thể đóng góp thế nào đối với quá trình học?
Trí Tuệ Nhân Tạo
Các vấn đề trong Học máy (4)
21
n  Khả năng/giới hạn học (Learnability)
•  Hàm mục tiêu nào mà hệ thống cần học?
q  Biểu diễn hàm mục tiêu: Khả năng biểu diễn (vd: hàm tuyến
tính / hàm phi tuyến) vs. Độ phức tạp của giải thuật và quá
trình học
•  Các giới hạn (trên lý thuyết) đối với khả năng học của các giải thuật
học máy?
•  Khả năng khái quát hóa (generalization) của hệ thống?
q  Để tránh vấn đề “over-fitting” (đạt độ chính xác cao trên tập học,
nhưng đạt độ chính xác thấp trên tập thử nghiệm)
•  Khả năng hệ thống tự động thay đổi (thích nghi) biểu diễn (cấu trúc)
bên trong của nó?
q  Để cải thiện khả năng (của hệ thống đối với việc) biểu diễn và học
hàm mục tiêu
Trí Tuệ Nhân Tạo
22
Phương pháp phân loại
Các bạn phân loại thế nào?
23
??
Class a
Class b
Class b
Class a
Class a
Class a
Trí Tuệ Nhân Tạo
KNN: phương pháp láng giềng gần nhất
24
n  Một số tên gọi khác của phương pháp học dựa trên các láng
giềng gần nhất (Nearest neighbors learning)
•  Instance-based learning
•  Lazy learning
•  Memory-based learning
n  Ý tưởng của phương pháp
•  Quá trình học
─  (Đơn giản là) lưu lại các ví dụ học
─  Không xây dựng một mô hình (mô tả) rõ ràng và tổng quát của
hàm mục tiêu cần học
•  Đối với một ví dụ cần phân loại/dự đoán
─  Giá trị của hàm mục tiêu (một nhãn lớp, hoặc một giá trị thực)
được suy ra từ các hàng xóm của nó.
Trí Tuệ Nhân Tạo
KNN: phương pháp láng giềng gần nhất
25
n  Biểu diễn đầu vào của bài toán
•  Mỗi ví dụ x được biểu diễn là một vectơ n chiều trong không gian
các vectơ x∈Rn
•  x = (x1, x2, …, xn) trong đó xi∈R là một số thực
n  Có thể áp dụng được với cả 2 kiểu bài toán
•  Bài toán phân lớp (classification)
─  Hàm mục tiêu có giá trị rời rạc
─  Đầu ra của hệ thống là một trong số các giá trị rời rạc đã xác định
trước (một trong các nhãn lớp)
•  Bài toán hồi quy (regression)
─  Hàm mục tiêu có giá trị liên tục
─  Đầu ra của hệ thống là một giá trị số thực
Trí Tuệ Nhân Tạo
Ví dụ: bài toán phân lớp
Ví dụ cần
phân lớp z
Lớp c1 Lớp c2
26
n  Xét 1 láng giềng gần
nhất
→ Gán z vào lớp c2
n  Xét 3 láng giềng gần
nhất
→ Gán z vào lớp c1
n  Xét 5 láng giềng gần
nhất
→ Gán z vào lớp c1
Trí Tuệ Nhân Tạo
Giải thuật k-NN cho phân lớp
27
n  Mỗi ví dụ học x được biểu diễn bởi 2 thành phần:
• Mô tả của ví dụ: x = (x1, x2, …, xn) trong đó xi∈R
• Nhãn lớp: c∈C, với C là tập các nhãn lớp được xác định trước
n  Giai đoạn học
• Đơn giản là lưu lại các ví dụ học trong tập học: D
n  Giai đoạn phân lớp: Để phân lớp cho một ví dụ (mới) z
• Với mỗi ví dụ học x∈D, tính khoảng cách giữa x và z
• Xác định tập NB(z) – các láng giềng gần nhất của z
→ Gồm k ví dụ học trong D gần nhất với z tính theo một hàm
khoảng cách d
• Phân z vào lớp chiếm số đông (the majority class) trong số các lớp
của các ví dụ trong NB(z)
Trí Tuệ Nhân Tạo
Giải thuật k-NN cho hồi quy
28
n  Mỗi ví dụ học x được biểu diễn bởi 2 thành phần:
• Mô tả của ví dụ: x = (x1, x2, …, xn) trong đó xi∈R
• Giá trị đầu ra mong muốn: yx∈R (là một số thực)
n  Giai đoạn học
• Đơn giản là lưu lại các ví dụ học trong tập học: D
n  Giai đoạn phán đoán: để dự đoán giá trị đầu ra cho z
• Với mỗi ví dụ học x∈D, tính khoảng cách giữa x và z
• Xác định tập NB(z) – các láng giềng gần nhất của z
→ Gồm k ví dụ học trong D gần nhất với z tính theo một hàm
khoảng cách d
• Dự đoán giá trị đầu ra cho z: yz =
1
k
yxx∈NB(z)
∑
Trí Tuệ Nhân Tạo
29
k-NN: Các vấn đề cốt lõi
29
Suy
nghĩ
khác
nhau
Trí Tuệ Nhân Tạo
30
k-NN: Các vấn đề cốt lõi
30
n  Hàm khoảng cách
q  Mỗi hàm sẽ tương ứng với một cách nhìn về dữ liệu.
q  Vô hạn hàm!!!
q  Chọn hàm nào?
Trí Tuệ Nhân Tạo
31
k-NN: Các vấn đề cốt lõi
31
n  Chọn tập láng giềng NB(z)
q  Chọn bao nhiêu láng giềng?
q  Giới hạn chọn theo vùng?
Trí Tuệ Nhân Tạo
Một hay nhiều láng giềng gần nhất?
32
n  Việc phân lớp (hay dự đoán) chỉ dựa trên duy nhất một láng
giềng gần nhất (là ví dụ học gần nhất với ví dụ cần phân lớp/
dự đoán) thường không chính xác
•  Nếu ví dụ học này là một ví dụ bất thường, không điển hình (an
outlier) – rất khác so với các ví dụ khác
•  Nếu ví dụ học này có nhãn lớp (giá trị đầu ra) sai – do lỗi trong
quá trình thu thập (xây dựng) tập dữ liệu
n  Thường xét 𝑘 (>1) các ví dụ học (các láng giềng) gần nhất với
ví dụ cần phân lớp/dự đoán
n  Đối với bài toán phân lớp có 2 lớp, 𝑘 thường được chọn là
một số lẻ, để tránh cân bằng về tỷ lệ các ví dụ giữa 2 lớp
•  Ví dụ: 𝑘= 3, 5, 7,…
Trí Tuệ Nhân Tạo
Hàm tính khoảng cách (1)
33
n  Hàm tính khoảng cách d
•  Đóng vai trò rất quan trọng trong phương pháp học dựa trên các
láng giềng gần nhất
•  Thường được xác định trước, và không thay đổi trong suốt quá
trình học và phân loại/dự đoán
n  Lựa chọn hàm khoảng cách d
•  Các hàm khoảng cách hình học: Dành cho các bài toán có các
thuộc tính đầu vào là kiểu số thực (xi∈R)
•  Hàm khoảng cách Hamming: Dành cho các bài toán có các
thuộc tính đầu vào là kiểu nhị phân (xi∈{0, 1})
Trí Tuệ Nhân Tạo
Hàm tính khoảng cách (2)
∑=
−=
n
i
ii zxzxd
1
),(
( )∑=
−=
n
i
ii zxzxd
1
2
),(
pn
i
p
ii zxzxd
/1
1
),( ⎟
⎠
⎞
⎜
⎝
⎛
−= ∑=
ii
i
zx −= max
pn
i
p
ii
p
zxzxd
/1
1
lim),( ⎟
⎠
⎞
⎜
⎝
⎛
−= ∑=
∞→
34
n  Các hàm tính khoảng cách
hình học (Geometry distance
functions)
•  Hàm Minkowski ( 𝑝-norm):
•  Hàm Manhattan ( 𝑝=1):
•  Hàm Euclid ( 𝑝=2):
•  Hàm Chebyshev ( 𝑝=∞):
Trí Tuệ Nhân Tạo
Hàm tính khoảng cách (3)
∑
=
=
n
i
ii zxDifferencezxd
1
),(),(
⎩
⎨
⎧
=
≠
=
)(,0
)(,1
),(
baif
baif
baDifference
35
n  Hàm khoảng cách
Hamming
•  Đối với các thuộc tính đầu
vào là kiểu nhị phân ()
Trí Tuệ Nhân Tạo
k-NN: Ưu nhược điểm
n  Các ưu điểm
• Chi phí thấp cho quá trình huấn luyện (chỉ việc lưu lại các ví dụ học)
• Hoạt động tốt với các bài toán phân loại gồm nhiều lớp
→ Không cần phải học c bộ phân loại cho c lớp
• Phương pháp học k-NN (k>>1) có khả năng xử lý nhiễu cao
→ Phân loại/dự đoán được thực hiện dựa trên k láng giềng gần nhất
•  Rất Linh động trong việc chọn hàm khoảng cách.
→ Có thể dùng độ tương tự (similarity): cosine
→ Có thể dùng độ đo khác, chẳng hạn Kullback-Leibler divergence,
Bregman divergence, …
n  Các nhược điểm
• Phải lựa chọn hàm tính khoảng cách (sự khác biệt) thích hợp với bài toán
• Chi phí tính toán (thời gian, bộ nhớ) cao tại thời điểm phân loại/dự đoán
• Có thể cho kết quả kém/sai với các thuộc tính không liên quan
36
Trí Tuệ Nhân Tạo
Phân lớp Naïve Bayes
n  Là các phương pháp học phân lớp có giám sát và dựa
trên xác suất
n  Dựa trên một mô hình (hàm) xác suất
n  Việc phân loại dựa trên các giá trị xác suất của các khả
năng xảy ra của các giả thiết
n  Là một trong các phương pháp học máy thường được
sử dụng trong các bài toán thực tế
n  Dựa trên định lý Bayes (Bayes theorem)
Trí Tuệ Nhân Tạo
37
Định lý Bayes
• P(h): Xác suất trước (tiên nghiệm) của giả thiết h
• P(D): Xác suất trước (tiên nghiệm) của việc quan sát được
dữ liệu D
• P(D|h): Xác suất (có điều kiện) của việc quan sát được dữ
liệu D, nếu biết giả thiết h là đúng. (likelihood)
• P(h|D): Xác suất (hậu nghiệm) của giả thiết h là đúng, nếu
quan sát được dữ liệu D
Ø Nhiều phương pháp phân loại dựa trên xác suất sẽ sử
dụng xác suất hậu nghiệm (posterior probability) này!
)(
)().|(
)|(
DP
hPhDP
DhP =
38
Trí Tuệ Nhân Tạo
Định lý Bayes: Ví dụ (1)
Giả sử chúng ta có tập dữ liệu sau (dự đoán 1 người có chơi tennis)?
Ngày Ngoài trời Nhiệt độ Độ ẩm Gió Chơi tennis
N1 Nắng Nóng Cao Yếu Không
N2 Nắng Nóng Cao Mạnh Không
N3 Âm u Nóng Cao Yếu Có
N4 Mưa Bình thường Cao Yếu Có
N5 Mưa Mát mẻ Bình thường Yếu Có
N6 Mưa Mát mẻ Bình thường Mạnh Không
N7 Âm u Mát mẻ Bình thường Mạnh Có
N8 Nắng Bình thường Cao Yếu Không
N9 Nắng Mát mẻ Bình thường Yếu Có
N10 Mưa Bình thường Bình thường Yếu Có
N11 Nắng Bình thường Bình thường Mạnh Có
N12 Âm u Bình thường Cao Mạnh Có
[Mitchell, 1997]
39
Trí Tuệ Nhân Tạo
Định lý Bayes: Ví dụ (2)
n  Dữ liệu D. Ngoài trời là nắng và Gió là mạnh
n  Giả thiết (phân loại) h. Anh ta chơi tennis
n  Xác suất trước P(h). Xác suất rằng anh ta chơi tennis (bất kể
Ngoài trời như thế nào và Gió ra sao)
n  Xác suất trước P(D). Xác suất rằng Ngoài trời là nắng và Gió
là mạnh
n  P(D|h). Xác suất Ngoài trời là nắng và Gió là mạnh, nếu biết
rằng anh ta chơi tennis
n  P(h|D). Xác suất anh ta chơi tennis, nếu biết rằng Ngoài trời
là nắng và Gió là mạnh
40
Trí Tuệ Nhân Tạo
Xác suất hậu nghiệm cực đại (MAP)
n  Với một tập các giả thiết (các phân lớp) có thể H, hệ thống học
sẽ tìm giả thiết có thể xảy ra nhất (the most probable
hypothesis) h(∈H) đối với các dữ liệu quan sát được D
n  Giả thiết h này được gọi là giả thiết có xác suất hậu nghiệm
cực đại (Maximum a posteriori – MAP)
)|(maxarg DhPh
Hh
MAP
∈
=
)(
)().|(
maxarg
DP
hPhDP
h
Hh
MAP
∈
=
)().|(maxarg hPhDPh
Hh
MAP
∈
=
(bởi định lý Bayes)
(P(D) là như nhau
đối với các giả thiết h)
41
Trí Tuệ Nhân Tạo
MAP: Ví dụ
n  Tập H bao gồm 2 giả thiết (có thể)
•  h1: Anh ta chơi tennis
•  h2: Anh ta không chơi tennis
n  Tính giá trị của 2 xác xuất có điều kiện: P(h1|D), P(h2|D)
n  Giả thiết có thể nhất hMAP=h1 nếu P(h1|D) ≥ P(h2|D); ngược
lại thì hMAP=h2
n  Vì vậy, cần tính 2 biểu thức: P(D|h1).P(h1) và
P(D|h2).P(h2), và đưa ra quyết định tương ứng
•  Nếu P(D|h1).P(h1) ≥ P(D|h2).P(h2), thì kết luận là anh ta chơi
tennis
•  Ngược lại, thì kết luận là anh ta không chơi tennis
42
Trí Tuệ Nhân Tạo
Đánh giá khả năng có thể nhất (MLE)
n  Phương pháp MAP: Với một tập các giả thiết có thể H, cần tìm
một giả thiết cực đại hóa giá trị: P(D|h).P(h)
n  Giả sử (assumption) trong phương pháp đánh giá khả năng có
thể nhất (Maximum likelihood estimation – MLE): Tất cả các
giả thiết đều có giá trị xác suất trước như nhau: P(hi)=P(hj),
∀hi,hj∈H
n  Phương pháp MLE tìm giả thiết cực đại hóa giá trị P(D|h);
trong đó P(D|h) được gọi là khả năng có thể (likelihood) của
dữ liệu D đối với h
n  Giả thiết có khả năng nhất (maximum likelihood hypothesis)
)|(maxarg hDPh
Hh
ML
∈
=
43
Trí Tuệ Nhân Tạo
MLE: Ví dụ
n  Tập H bao gồm 2 giả thiết có thể
•  h1: Anh ta chơi tennis
•  h2: Anh ta không chơi tennis
D: Tập dữ liệu (các ngày) mà trong đó thuộc tính Outlook có giá trị Sunny
và thuộc tính Wind có giá trị Strong
n  Tính 2 giá trị khả năng xảy ra (likelihood values) của dữ liệu D
đối với 2 giả thiết: P(D|h1) và P(D|h2)
•  P(Outlook=Sunny, Wind=Strong|h1)= 1/8
•  P(Outlook=Sunny, Wind=Strong|h2)= 1/4
n  Giả thiết MLE hMLE=h1 nếu P(D|h1) ≥ P(D|h2); và ngược lại
thì hMLE=h2
→ Bởi vì P(Outlook=Sunny, Wind=Strong|h1) <
P(Outlook=Sunny, Wind=Strong|h2), hệ thống kết luận rằng:
Anh ta sẽ không chơi tennis!
44
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes (1)
n  Biểu diễn bài toán phân loại (classification problem)
•  Một tập học D_train, trong đó mỗi ví dụ học x được biểu diễn
là một vectơ n chiều: (x1, x2, ..., xn)
•  Một tập xác định các nhãn lớp: C={c1, c2, ..., cm}
•  Với một ví dụ (mới) z, thì z sẽ được phân vào lớp nào?
n  Mục tiêu: Xác định phân lớp có thể (phù hợp) nhất đối với z
)|(maxarg zcPc i
Cc
MAP
i∈
=
),...,,|(maxarg 21 ni
Cc
MAP zzzcPc
i∈
=
),...,,(
)().|,...,,(
maxarg
21
21
n
iin
Cc
MAP
zzzP
cPczzzP
c
i∈
= (bởi định lý Bayes)
45
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes (2)
n  Để tìm được phân lớp có thể nhất đối với z…
)().|,...,,(maxarg 21 iin
Cc
MAP cPczzzPc
i∈
= (P(z1,z2,...,zn) là
như nhau với các lớp)
n  Giả sử (assumption) trong phương pháp phân loại
Naïve Bayes. Các thuộc tính là độc lập có điều kiện
(conditionally independent) đối với các lớp
∏
=
=
n
j
ijin czPczzzP
1
21 )|()|,...,,(
n  Phân loại Naïve Bayes tìm phân lớp có thể nhất đối với z
∏
=∈
=
n
j
iji
Cc
NB czPcPc
i 1
)|().(maxarg
46
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Giải thuật
n  Giai đoạn học (training phase), sử dụng một tập học
Đối với mỗi phân lớp có thể (mỗi nhãn lớp) ci∈C
•  Tính giá trị xác suất trước: P(ci)
•  Đối với mỗi giá trị thuộc tính xj, tính giá trị xác suất xảy ra
của giá trị thuộc tính đó đối với một phân lớp ci: P(xj|ci)
n  Giai đoạn phân lớp (classification phase), đối với một ví dụ mới
•  Đối với mỗi phân lớp ci∈C, tính giá trị của biểu thức:
∏=
n
j
iji cxPcP
1
)|().(
•  Xác định phân lớp của z là lớp có thể nhất c*
∏=∈
=
n
j
iji
Cc
cxPcPc
i 1
*
)|().(maxarg
47
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Ví dụ (1)
Một sinh viên trẻ với thu nhập trung bình và mức đánh giá tín dụng bình thường sẽ mua một cái máy tính?
Rec. ID Age Income Student Credit_Rating Buy_Computer
1 Young High No Fair No
2 Young High No Excellent No
3 Medium High No Fair Yes
4 Old Medium No Fair Yes
5 Old Low Yes Fair Yes
6 Old Low Yes Excellent No
7 Medium Low Yes Excellent Yes
8 Young Medium No Fair No
9 Young Low Yes Fair Yes
10 Old Medium Yes Fair Yes
11 Young Medium Yes Excellent Yes
12 Medium Medium No Excellent Yes
13 Medium High Yes Fair Yes
14 Old Medium No Excellent No
http://www.cs.sunysb.edu/~cse634/lecture_notes/07classification.pdf
48
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Ví dụ (2)
n  Biểu diễn bài toán phân loại
• z = (Age=Young,Income=Medium,Student=Yes,Credit_Rating=Fair)
•  Có 2 phân lớp có thể: c1 (“Mua máy tính”) và c2 (“Không mua máy tính”)
n  Tính giá trị xác suất trước cho mỗi phân lớp
•  P(c1) = 9/14
•  P(c2) = 5/14
n  Tính giá trị xác suất của mỗi giá trị thuộc tính đối với mỗi phân lớp
•  P(Age=Young|c1) = 2/9; P(Age=Young|c2) = 3/5
•  P(Income=Medium|c1) = 4/9; P(Income=Medium|c2) = 2/5
•  P(Student=Yes|c1) = 6/9; P(Student=Yes|c2) = 1/5
•  P(Credit_Rating=Fair|c1) = 6/9; P(Credit_Rating=Fair|c2) = 2/5
49
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Ví dụ (3)
n  Tính toán xác suất có thể xảy ra (likelihood) của ví dụ z đối với mỗi
phân lớp
•  Đối với phân lớp c1
P(z|c1) = P(Age=Young|c1).P(Income=Medium|c1).P(Student=Yes|c1).
P(Credit_Rating=Fair|c1) = (2/9).(4/9).(6/9).(6/9) = 0.044
•  Đối với phân lớp c2
P(z|c2) = P(Age=Young|c2).P(Income=Medium|c2).P(Student=Yes|c2).
P(Credit_Rating=Fair|c2) = (3/5).(2/5).(1/5).(2/5) = 0.019
n  Xác định phân lớp có thể nhất (the most probable class)
•  Đối với phân lớp c1
P(c1).P(z|c1) = (9/14).(0.044) = 0.028
•  Đối với phân lớp c2
P(c2).P(z|c2) = (5/14).(0.019) = 0.007
→ Kết luận: Anh ta (z) sẽ mua một máy tính!
50
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Vấn đề (1)
n  Nếu không có ví dụ nào gắn với phân lớp ci có giá trị thuộc tính xj…
P(xj|ci)=0 , và vì vậy:
n  Giải pháp: Sử dụng phương pháp Bayes để ước lượng P(xj|ci)
• n(ci): số lượng các ví dụ học gắn với phân lớp ci
• n(ci,xj): số lượng các ví dụ học gắn với phân lớp ci có giá trị thuộc
tính xj
• p: ước lượng đối với giá trị xác suất P(xj|ci)
→ Các ước lượng đồng mức: p=1/k, nếu thuộc tính fj có k giá trị
• m: một hệ số (trọng số)
→ Để bổ sung cho n(ci) các ví dụ thực sự được quan sát với thêm m
mẫu ví dụ với ước lượng p
0)|().(
1
=∏=
n
j
iji cxPcP
mcn
mpxcn
cxP
i
ji
ij
+
+
=
)(
),(
)|(
51
Trí Tuệ Nhân Tạo
Phân loại Naïve Bayes: Vấn đề (2)
n  Giới hạn về độ chính xác trong tính toán của máy tính
•  P(xj|ci)<1, đối với mọi giá trị thuộc tính xj và phân lớp ci
•  Vì vậy, khi số lượng các giá trị thuộc tính là rất lớn, thì:
0)|(lim
1
=⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
∏=
∞→
n
j
ij
n
cxP
n  Giải pháp: Sử dụng hàm lôgarit cho các giá trị xác suất
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎥
⎦
⎤
⎢
⎣
⎡
= ∏=∈
n
j
iji
Cc
NB cxPcPc
i 1
)|().(logmaxarg
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+= ∑=∈
n
j
iji
Cc
NB cxPcPc
i 1
)|(log)(logmaxarg
52
Trí Tuệ Nhân Tạo
Phân loại văn bản bằng NB (1)
n  Biểu diễn bài toán phân loại văn bản
•  Tập học D, trong đó mỗi ví dụ học là một biểu diễn văn bản gắn với một
nhãn lớp: D = {(dk, ci)}
•  Một tập các nhãn lớp xác định: C = {ci}
n  Giai đoạn học
•  Từ tập các văn bản trong D, trích ra tập các từ khóa T = {tj}
•  Gọi là tập các văn bản trong D có nhãn lớp ci
•  Đối với mỗi phân lớp ci
- Tính giá trị xác suất trước của phân lớp ci:
- Đối với mỗi từ khóa tj, tính xác suất từ khóa tj xuất hiện đối với lớp ci
D
D
cP ic
i =)(
Ttdn
tdn
ctP
ick m
ick
Dd Tt mk
Dd jk
ij
+⎟
⎠
⎞⎜
⎝
⎛
+⎟
⎠
⎞⎜
⎝
⎛
=
∑ ∑
∑
∈ ∈
∈
),(
1),(
)|( (n(dk,tj): số lần xuất hiện của từ
khóa tj trong văn bản dk)
53
Trí Tuệ Nhân Tạo
Dci
Phân loại văn bản bằng NB (2)
n  Giai đoạn phân lớp đối với một văn bản mới d
•  Từ văn bản d, trích ra tập Td gồm các từ khóa (keywords) tj đã
được định nghĩa trong tập T
•  Giả sử (assumption). Xác suất từ khóa tj xuất hiện đối với lớp
ci là độc lập đối với vị trí của từ khóa đó trong văn bản
P(tj ở vị trí k|ci) = P(tj ở vị trí m|ci), ∀k,m
•  Đối với mỗi phân lớp ci, tính xác suất hậu nghiệm của văn bản d
đối với ci
∏∈ dj Tt
iji ctPcP )|().(
•  Phân lớp văn bản d thuộc vào lớp c*
∏∈∈
=
dji Tt
iji
Cc
ctPcPc )|().(maxarg*
54
Trí Tuệ Nhân Tạo
Tài liệu tham khảo
•  E. Alpaydin. Introduction to Machine Learning. The MIT
Press, 2010.
•  T. M. Mitchell. Machine Learning. McGraw-Hill, 1997.
•  T. M. Mitchell. The discipline of machine learning. CMU
technical report, 2006.
•  H. A. Simon. Why Should Machines Learn? In R. S.
Michalski, J. Carbonell, and T. M. Mitchell (Eds.):
Machine learning: An artificial intelligence approach,
chapter 2, pp. 25-38. Morgan Kaufmann, 1983.
Trí Tuệ Nhân Tạo
55

More Related Content

What's hot

Giáo trình xử lý ảnh
Giáo trình xử lý ảnhGiáo trình xử lý ảnh
Giáo trình xử lý ảnhTùng Trần
 
Xu lý tín hiệu số
Xu lý tín hiệu sốXu lý tín hiệu số
Xu lý tín hiệu sốHao Truong
 
biến đổi ma trận ( Transformation matrix)
biến đổi ma trận ( Transformation matrix)biến đổi ma trận ( Transformation matrix)
biến đổi ma trận ( Transformation matrix)Bui Loi
 
Bài giảng Trí Tuệ Nhân Tạo
Bài giảng Trí Tuệ Nhân TạoBài giảng Trí Tuệ Nhân Tạo
Bài giảng Trí Tuệ Nhân TạoDự Nguyễn Quang
 
Các loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptuneCác loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptune給与 クレジット
 
Phương pháp nhánh cận
Phương pháp nhánh cậnPhương pháp nhánh cận
Phương pháp nhánh cậnDiên Vĩ
 
Artificial intelligence ai l5-thoa man-rang_buoc
Artificial intelligence ai l5-thoa man-rang_buocArtificial intelligence ai l5-thoa man-rang_buoc
Artificial intelligence ai l5-thoa man-rang_buocTráng Hà Viết
 
Cac ky thuat_dieu_che_4543
Cac ky thuat_dieu_che_4543Cac ky thuat_dieu_che_4543
Cac ky thuat_dieu_che_4543PTIT HCM
 
Hệ phương trình vi phân tuyến tính
Hệ phương trình vi phân tuyến tínhHệ phương trình vi phân tuyến tính
Hệ phương trình vi phân tuyến tínhThế Giới Tinh Hoa
 
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐ
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐNGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐ
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐnataliej4
 
Nhập môn công nghệ phần mềm
Nhập môn công nghệ phần mềmNhập môn công nghệ phần mềm
Nhập môn công nghệ phần mềmTrần Gia Bảo
 
Công thức truyền tin
Công thức truyền tinCông thức truyền tin
Công thức truyền tinakprovip
 

What's hot (20)

Đệ Quy, Quay Lui, Nhánh Cận
Đệ Quy, Quay Lui, Nhánh CậnĐệ Quy, Quay Lui, Nhánh Cận
Đệ Quy, Quay Lui, Nhánh Cận
 
Giáo trình xử lý ảnh
Giáo trình xử lý ảnhGiáo trình xử lý ảnh
Giáo trình xử lý ảnh
 
Xu lý tín hiệu số
Xu lý tín hiệu sốXu lý tín hiệu số
Xu lý tín hiệu số
 
biến đổi ma trận ( Transformation matrix)
biến đổi ma trận ( Transformation matrix)biến đổi ma trận ( Transformation matrix)
biến đổi ma trận ( Transformation matrix)
 
Hệ thống thông tin
Hệ thống thông tinHệ thống thông tin
Hệ thống thông tin
 
Bài giảng Trí Tuệ Nhân Tạo
Bài giảng Trí Tuệ Nhân TạoBài giảng Trí Tuệ Nhân Tạo
Bài giảng Trí Tuệ Nhân Tạo
 
Các loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptuneCác loại mã đường truyền và ứng dụng neptune
Các loại mã đường truyền và ứng dụng neptune
 
Đệ quy và quay lui
Đệ quy và quay luiĐệ quy và quay lui
Đệ quy và quay lui
 
Phương pháp nhánh cận
Phương pháp nhánh cậnPhương pháp nhánh cận
Phương pháp nhánh cận
 
Lttt b11
Lttt b11Lttt b11
Lttt b11
 
Artificial intelligence ai l5-thoa man-rang_buoc
Artificial intelligence ai l5-thoa man-rang_buocArtificial intelligence ai l5-thoa man-rang_buoc
Artificial intelligence ai l5-thoa man-rang_buoc
 
Cay quyetdinh
Cay quyetdinhCay quyetdinh
Cay quyetdinh
 
Cac ky thuat_dieu_che_4543
Cac ky thuat_dieu_che_4543Cac ky thuat_dieu_che_4543
Cac ky thuat_dieu_che_4543
 
Tichchap
TichchapTichchap
Tichchap
 
Hệ phương trình vi phân tuyến tính
Hệ phương trình vi phân tuyến tínhHệ phương trình vi phân tuyến tính
Hệ phương trình vi phân tuyến tính
 
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐ
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐNGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐ
NGÂN HÀNG TRẮC NGHIỆM XỬ LÝ TÍN HIỆU SỐ
 
Chuong03
Chuong03Chuong03
Chuong03
 
Nhập môn công nghệ phần mềm
Nhập môn công nghệ phần mềmNhập môn công nghệ phần mềm
Nhập môn công nghệ phần mềm
 
Công thức truyền tin
Công thức truyền tinCông thức truyền tin
Công thức truyền tin
 
Bài giảng về phương pháp luận nghiên cứu khoa học
Bài giảng về phương pháp luận nghiên cứu khoa họcBài giảng về phương pháp luận nghiên cứu khoa học
Bài giảng về phương pháp luận nghiên cứu khoa học
 

Viewers also liked

Diluted, but is thought leadership dead, dying or dynamic
Diluted, but is thought leadership dead, dying or dynamicDiluted, but is thought leadership dead, dying or dynamic
Diluted, but is thought leadership dead, dying or dynamicFidoly Rangel
 
Oop unit 11 input và output
Oop unit 11 input và outputOop unit 11 input và output
Oop unit 11 input và outputTráng Hà Viết
 
REVE ANTIVIRUS Introducing REVE AV Dashboard
REVE ANTIVIRUS Introducing REVE AV DashboardREVE ANTIVIRUS Introducing REVE AV Dashboard
REVE ANTIVIRUS Introducing REVE AV Dashboardtechexpert2345
 
2016_HMK Portfolio_JHumphries
2016_HMK Portfolio_JHumphries2016_HMK Portfolio_JHumphries
2016_HMK Portfolio_JHumphriesJoseph Humphries
 
Oop unit 12 đồ họa và xử lý sự kiện
Oop unit 12 đồ họa và xử lý sự kiệnOop unit 12 đồ họa và xử lý sự kiện
Oop unit 12 đồ họa và xử lý sự kiệnTráng Hà Viết
 
Jerett_Jara_Resume_2016
Jerett_Jara_Resume_2016Jerett_Jara_Resume_2016
Jerett_Jara_Resume_2016Jerett Jara
 
Tips to make your computer happy
Tips to make your computer happyTips to make your computer happy
Tips to make your computer happytechexpert2345
 

Viewers also liked (10)

Diluted, but is thought leadership dead, dying or dynamic
Diluted, but is thought leadership dead, dying or dynamicDiluted, but is thought leadership dead, dying or dynamic
Diluted, but is thought leadership dead, dying or dynamic
 
Oop unit 11 input và output
Oop unit 11 input và outputOop unit 11 input và output
Oop unit 11 input và output
 
AwardWinningStory
AwardWinningStoryAwardWinningStory
AwardWinningStory
 
REVE ANTIVIRUS Introducing REVE AV Dashboard
REVE ANTIVIRUS Introducing REVE AV DashboardREVE ANTIVIRUS Introducing REVE AV Dashboard
REVE ANTIVIRUS Introducing REVE AV Dashboard
 
2016_HMK Portfolio_JHumphries
2016_HMK Portfolio_JHumphries2016_HMK Portfolio_JHumphries
2016_HMK Portfolio_JHumphries
 
Oop unit 12 đồ họa và xử lý sự kiện
Oop unit 12 đồ họa và xử lý sự kiệnOop unit 12 đồ họa và xử lý sự kiện
Oop unit 12 đồ họa và xử lý sự kiện
 
Jerett_Jara_Resume_2016
Jerett_Jara_Resume_2016Jerett_Jara_Resume_2016
Jerett_Jara_Resume_2016
 
Oop unit 08 đa hình
Oop unit 08 đa hìnhOop unit 08 đa hình
Oop unit 08 đa hình
 
Tips to make your computer happy
Tips to make your computer happyTips to make your computer happy
Tips to make your computer happy
 
Uniforme moderno
Uniforme modernoUniforme moderno
Uniforme moderno
 

Similar to Artificial intelligence ai l9-hoc may

L1-introduction.pptx.pdf
L1-introduction.pptx.pdfL1-introduction.pptx.pdf
L1-introduction.pptx.pdfvinhlyquoc
 
De cuong may hoc
De cuong may hocDe cuong may hoc
De cuong may hocLê Khoa
 
May hoc 012012
May hoc   012012May hoc   012012
May hoc 012012Freelancer
 
Hoatdongbaiday-HaNgoc
Hoatdongbaiday-HaNgocHoatdongbaiday-HaNgoc
Hoatdongbaiday-HaNgocSP Tin K34
 
Nguyen thi tuyet sang k33103262-kichbangiangday
Nguyen thi tuyet sang   k33103262-kichbangiangdayNguyen thi tuyet sang   k33103262-kichbangiangday
Nguyen thi tuyet sang k33103262-kichbangiangdayTIN D BÌNH THUẬN
 
4 - Phan lop du lieu-Final.pptx
4 - Phan lop du lieu-Final.pptx4 - Phan lop du lieu-Final.pptx
4 - Phan lop du lieu-Final.pptxMUyn25
 
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222vinhduchanh
 
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...TrnNgcSn23
 
KHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptxKHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptxPhanAnhNht
 
Kỹ thuật lập trình (khoa toán tin học)
Kỹ thuật lập trình (khoa toán tin học)Kỹ thuật lập trình (khoa toán tin học)
Kỹ thuật lập trình (khoa toán tin học)nhok_lovely
 
on-tap-khai-thac-du-lieu-va-ung-dung.pdf
on-tap-khai-thac-du-lieu-va-ung-dung.pdfon-tap-khai-thac-du-lieu-va-ung-dung.pdf
on-tap-khai-thac-du-lieu-va-ung-dung.pdfMan_Ebook
 
Artificial intelligence ai gioi thieu-mon_hoc_it4040
Artificial intelligence ai gioi thieu-mon_hoc_it4040Artificial intelligence ai gioi thieu-mon_hoc_it4040
Artificial intelligence ai gioi thieu-mon_hoc_it4040Tráng Hà Viết
 
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdf
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdfKết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdf
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdfMan_Ebook
 
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiên
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiênMạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiên
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiênMinh Pham
 

Similar to Artificial intelligence ai l9-hoc may (20)

L1-introduction.pptx.pdf
L1-introduction.pptx.pdfL1-introduction.pptx.pdf
L1-introduction.pptx.pdf
 
Bai 4 Phanlop
Bai 4 PhanlopBai 4 Phanlop
Bai 4 Phanlop
 
Bai 4 Phan Lop
Bai 4 Phan LopBai 4 Phan Lop
Bai 4 Phan Lop
 
2. LTND.pdf
2. LTND.pdf2. LTND.pdf
2. LTND.pdf
 
De cuong may hoc
De cuong may hocDe cuong may hoc
De cuong may hoc
 
May hoc 012012
May hoc   012012May hoc   012012
May hoc 012012
 
Hoatdongbaiday-HaNgoc
Hoatdongbaiday-HaNgocHoatdongbaiday-HaNgoc
Hoatdongbaiday-HaNgoc
 
Nguyen thi tuyet sang k33103262-kichbangiangday
Nguyen thi tuyet sang   k33103262-kichbangiangdayNguyen thi tuyet sang   k33103262-kichbangiangday
Nguyen thi tuyet sang k33103262-kichbangiangday
 
4 - Phan lop du lieu-Final.pptx
4 - Phan lop du lieu-Final.pptx4 - Phan lop du lieu-Final.pptx
4 - Phan lop du lieu-Final.pptx
 
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222
ĐỀ CƯƠNG CHI TIẾT CTDL&GT TINH.222
 
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...
LLDH mon Tin hoc - Chuong 3 - Mot so hoat dong dien hinh trong day hoc Tin ho...
 
Hệ Cơ Sở Dữ Liệu Đa Phương Tiện PTIT
Hệ Cơ Sở Dữ Liệu Đa Phương Tiện PTITHệ Cơ Sở Dữ Liệu Đa Phương Tiện PTIT
Hệ Cơ Sở Dữ Liệu Đa Phương Tiện PTIT
 
SLIDE CAU TRUC DL_GT.pptx
SLIDE CAU TRUC DL_GT.pptxSLIDE CAU TRUC DL_GT.pptx
SLIDE CAU TRUC DL_GT.pptx
 
KHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptxKHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptx
 
Kỹ thuật lập trình (khoa toán tin học)
Kỹ thuật lập trình (khoa toán tin học)Kỹ thuật lập trình (khoa toán tin học)
Kỹ thuật lập trình (khoa toán tin học)
 
on-tap-khai-thac-du-lieu-va-ung-dung.pdf
on-tap-khai-thac-du-lieu-va-ung-dung.pdfon-tap-khai-thac-du-lieu-va-ung-dung.pdf
on-tap-khai-thac-du-lieu-va-ung-dung.pdf
 
Ch4.phan tich(1)
Ch4.phan tich(1)Ch4.phan tich(1)
Ch4.phan tich(1)
 
Artificial intelligence ai gioi thieu-mon_hoc_it4040
Artificial intelligence ai gioi thieu-mon_hoc_it4040Artificial intelligence ai gioi thieu-mon_hoc_it4040
Artificial intelligence ai gioi thieu-mon_hoc_it4040
 
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdf
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdfKết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdf
Kết hợp giải thuật di truyền và logic mờ giải bài toán tối ưu đa mục tiêu.pdf
 
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiên
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiênMạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiên
Mạng neural nhân tạo và ứng dụng trong xử lý ngôn ngữ tự nhiên
 

More from Tráng Hà Viết

Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh tài liệu, ebook
Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh   tài liệu, ebookTài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh   tài liệu, ebook
Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh tài liệu, ebookTráng Hà Viết
 
Artificial intelligence ai l1-gioi thieu
Artificial intelligence ai l1-gioi thieuArtificial intelligence ai l1-gioi thieu
Artificial intelligence ai l1-gioi thieuTráng Hà Viết
 
Oop unit 13 tổng quan về uml
Oop unit 13 tổng quan về umlOop unit 13 tổng quan về uml
Oop unit 13 tổng quan về umlTráng Hà Viết
 
Oop unit 09 lập trình tổng quát
Oop unit 09 lập trình tổng quátOop unit 09 lập trình tổng quát
Oop unit 09 lập trình tổng quátTráng Hà Viết
 
Oop unit 07 các kỹ thuật kế thừa
Oop unit 07 các kỹ thuật kế thừaOop unit 07 các kỹ thuật kế thừa
Oop unit 07 các kỹ thuật kế thừaTráng Hà Viết
 
Oop unit 05 một số kỹ thuật java nâng cao
Oop unit 05 một số kỹ thuật java nâng caoOop unit 05 một số kỹ thuật java nâng cao
Oop unit 05 một số kỹ thuật java nâng caoTráng Hà Viết
 
Oop unit 04 các kỹ thuật xây dựng lớp
Oop unit 04 các kỹ thuật xây dựng lớpOop unit 04 các kỹ thuật xây dựng lớp
Oop unit 04 các kỹ thuật xây dựng lớpTráng Hà Viết
 
Oop unit 03 xây dựng lớp
Oop unit 03 xây dựng lớpOop unit 03 xây dựng lớp
Oop unit 03 xây dựng lớpTráng Hà Viết
 
Oop unit 01 tổng quan lập trình hướng đối tượng
Oop unit 01 tổng quan lập trình hướng đối tượngOop unit 01 tổng quan lập trình hướng đối tượng
Oop unit 01 tổng quan lập trình hướng đối tượngTráng Hà Viết
 
Công cụ mã nguồn mở BlueFish
Công cụ mã nguồn mở BlueFishCông cụ mã nguồn mở BlueFish
Công cụ mã nguồn mở BlueFishTráng Hà Viết
 

More from Tráng Hà Viết (13)

Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh tài liệu, ebook
Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh   tài liệu, ebookTài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh   tài liệu, ebook
Tài liệu môn trí tuệ nhân tạo đh bách khoa tp hồ chí minh tài liệu, ebook
 
Artificial intelligence ai l1-gioi thieu
Artificial intelligence ai l1-gioi thieuArtificial intelligence ai l1-gioi thieu
Artificial intelligence ai l1-gioi thieu
 
Oop unit 13 tổng quan về uml
Oop unit 13 tổng quan về umlOop unit 13 tổng quan về uml
Oop unit 13 tổng quan về uml
 
Oop unit 10 ngoại lệ
Oop unit 10 ngoại lệOop unit 10 ngoại lệ
Oop unit 10 ngoại lệ
 
Oop unit 09 lập trình tổng quát
Oop unit 09 lập trình tổng quátOop unit 09 lập trình tổng quát
Oop unit 09 lập trình tổng quát
 
Oop unit 07 các kỹ thuật kế thừa
Oop unit 07 các kỹ thuật kế thừaOop unit 07 các kỹ thuật kế thừa
Oop unit 07 các kỹ thuật kế thừa
 
Oop unit 06 kế thừa
Oop unit 06 kế thừaOop unit 06 kế thừa
Oop unit 06 kế thừa
 
Oop unit 05 một số kỹ thuật java nâng cao
Oop unit 05 một số kỹ thuật java nâng caoOop unit 05 một số kỹ thuật java nâng cao
Oop unit 05 một số kỹ thuật java nâng cao
 
Oop unit 04 các kỹ thuật xây dựng lớp
Oop unit 04 các kỹ thuật xây dựng lớpOop unit 04 các kỹ thuật xây dựng lớp
Oop unit 04 các kỹ thuật xây dựng lớp
 
Oop unit 03 xây dựng lớp
Oop unit 03 xây dựng lớpOop unit 03 xây dựng lớp
Oop unit 03 xây dựng lớp
 
Oop unit 01 tổng quan lập trình hướng đối tượng
Oop unit 01 tổng quan lập trình hướng đối tượngOop unit 01 tổng quan lập trình hướng đối tượng
Oop unit 01 tổng quan lập trình hướng đối tượng
 
Oop unit 02 java cơ bản
Oop unit 02 java cơ bảnOop unit 02 java cơ bản
Oop unit 02 java cơ bản
 
Công cụ mã nguồn mở BlueFish
Công cụ mã nguồn mở BlueFishCông cụ mã nguồn mở BlueFish
Công cụ mã nguồn mở BlueFish
 

Recently uploaded

NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdf
NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdfNQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdf
NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdfNguyễn Đăng Quang
 
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...Nguyen Thanh Tu Collection
 
Trích dẫn trắc nghiệm tư tưởng HCM5.docx
Trích dẫn trắc nghiệm tư tưởng HCM5.docxTrích dẫn trắc nghiệm tư tưởng HCM5.docx
Trích dẫn trắc nghiệm tư tưởng HCM5.docxnhungdt08102004
 
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptx
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptxChàm - Bệnh án (da liễu - bvdlct ctump) .pptx
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptxendkay31
 
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...ThunTrn734461
 
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Nguyen Thanh Tu Collection
 
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...Nguyen Thanh Tu Collection
 
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhh
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhhôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhh
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhhvanhathvc
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...Nguyen Thanh Tu Collection
 
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...hoangtuansinh1
 
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh lí
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh líKiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh lí
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh líDr K-OGN
 
Sơ đồ tư duy môn sinh học bậc THPT.pdf
Sơ đồ tư duy môn sinh học bậc THPT.pdfSơ đồ tư duy môn sinh học bậc THPT.pdf
Sơ đồ tư duy môn sinh học bậc THPT.pdftohoanggiabao81
 
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfhoangtuansinh1
 
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoabài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa2353020138
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...Nguyen Thanh Tu Collection
 
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Nguyen Thanh Tu Collection
 

Recently uploaded (19)

NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdf
NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdfNQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdf
NQA Lợi ích Từ ISO và ESG Tăng Trưởng và Bền Vững ver01.pdf
 
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...
SÁNG KIẾN “THIẾT KẾ VÀ SỬ DỤNG INFOGRAPHIC TRONG DẠY HỌC ĐỊA LÍ 11 (BỘ SÁCH K...
 
Trích dẫn trắc nghiệm tư tưởng HCM5.docx
Trích dẫn trắc nghiệm tư tưởng HCM5.docxTrích dẫn trắc nghiệm tư tưởng HCM5.docx
Trích dẫn trắc nghiệm tư tưởng HCM5.docx
 
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptx
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptxChàm - Bệnh án (da liễu - bvdlct ctump) .pptx
Chàm - Bệnh án (da liễu - bvdlct ctump) .pptx
 
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
QUẢN LÝ HOẠT ĐỘNG GIÁO DỤC KỸ NĂNG SỐNG CHO HỌC SINH CÁC TRƯỜNG TRUNG HỌC CƠ ...
 
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
Sáng kiến “Sử dụng ứng dụng Quizizz nhằm nâng cao chất lượng ôn thi tốt nghiệ...
 
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...
BỘ ĐỀ KIỂM TRA CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO CẤU TRÚC ĐỀ MIN...
 
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhh
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhhôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhh
ôn tập lịch sử hhhhhhhhhhhhhhhhhhhhhhhhhh
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...
10 ĐỀ KIỂM TRA + 6 ĐỀ ÔN TẬP CUỐI KÌ 2 VẬT LÝ 11 - KẾT NỐI TRI THỨC - THEO C...
 
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...
Thong bao 337-DHPY (24.4.2024) thi sat hach Ngoai ngu dap ung Chuan dau ra do...
 
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh lí
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh líKiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh lí
Kiểm tra chạy trạm lí thuyết giữa kì giải phẫu sinh lí
 
Sơ đồ tư duy môn sinh học bậc THPT.pdf
Sơ đồ tư duy môn sinh học bậc THPT.pdfSơ đồ tư duy môn sinh học bậc THPT.pdf
Sơ đồ tư duy môn sinh học bậc THPT.pdf
 
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
BỘ ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
 
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoabài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa
bài 5.1.docx Sinh học di truyền đại cương năm nhất của học sinh y đa khoa
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
TỔNG HỢP ĐỀ THI CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN NĂM ...
 
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
Sáng kiến Dạy học theo định hướng STEM một số chủ đề phần “vật sống”, Khoa họ...
 

Artificial intelligence ai l9-hoc may

  • 1. Trí Tuệ Nhân Tạo (Artificial Intelligence) Viện Công nghệ thông tin và Truyền thông Trường Đại học Bách Khoa Hà Nội Năm 2016 Thân Quang Khoát khoattq@soict.hust.edu.vn
  • 2. Nội dung môn học: n  Giới thiệu về Trí tuệ nhân tạo n  Tác tử n  Giải quyết vấn đề: Tìm kiếm, Thỏa mãn ràng buộc n  Logic và suy diễn n  Biểu diễn tri thức n  Biểu diễn tri thức không chắc chắn n  Học máy q  Giới thiệu về học máy q  Phân lớp Naïve Bayes q  Học dựa trên các láng giềng gần nhất Trí Tuệ Nhân Tạo 2
  • 3. Giới thiệu về Học máy n  Học máy (ML - Machine Learning) là một lĩnh vực nghiên cứu của Trí tuệ nhân tạo (Artificial Intelligence) n  Câu hỏi trung tâm của ML: →  “How can we build computer systems that automatically improve with experience, and what are the fundamental laws that govern all learning processes?” [Mitchell, 2006] n  Vài quan điểm về học máy: →  Một quá trình nhờ đó một hệ thống cải thiện hiệu suất (hiệu quả hoạt động) của nó [Simon, 1983] →  Việc lập trình các máy tính để tối ưu hóa một tiêu chí hiệu suất dựa trên các dữ liệu hoặc kinh nghiệm trong quá khứ [Alpaydin, 2010] Trí Tuệ Nhân Tạo
  • 4. Một máy học n  Ta nói một máy tính có khả năng học nếu nó tự cải thiện hiệu suất hoạt động P cho một công việc T cụ thể, dựa vào kinh nghiệm E của nó. n  Như vậy một bài toán học máy có thể biểu diễn bằng 1 bộ (T, P, E) •  T: một công việc (nhiệm vụ) •  P: tiêu chí đánh giá hiệu năng •  E: kinh nghiệm Trí Tuệ Nhân Tạo
  • 5. Ví dụ bài toán học máy (1) Lọc thư rác (email spam filtering) • T: Dự đoán (để lọc) những thư điện tử nào là thư rác (spam email) • P: số lượng thư điện tử gửi đến được phân loại chính xác • E: Một tập các thư điện tử (emails) mẫu, mỗi thư điện tử được biểu diễn bằng một tập thuộc tính (vd: tập từ khóa) và nhãn lớp (thư thường/thư rác) tương ứng Thư rác? Thư thường Thư rác 5Trí Tuệ Nhân Tạo
  • 6. Ví dụ bài toán học máy (2) Nhận dạng chữ viết tay n T: Nhận dạng và phân loại các từ trong các ảnh chữ viết n P: Tỷ lệ (%) các từ được nhận dạng và phân loại đúng n E: Một tập các ảnh chữ viết, trong đó mỗi ảnh được gắn với một định danh của một từ Từ nào? rightdo in waywe the 6Trí Tuệ Nhân Tạo
  • 7. Ví dụ bài toán học máy (3) Gán nhãn ảnh n  T: đưa ra một vài mô tả ý nghĩa của 1 bức ảnh n  P: ? n  E: Một tập các bức ảnh, trong đó mỗi ảnh đã được gán một tập các từ mô tả ý nghĩa của chúng
  • 8. Máy học (1) n  Học một ánh xạ (hàm): f •  x: quan sát (dữ liệu), kinh nghiệm •  y: phán đoán, tri thức mới, kinh nghiệm mới, … n  Học một mô hình: q  Dữ liệu (được giả thuyết) tuân theo một mô hình. q  Học mô hình là học những tham số của mô hình đó từ dữ liệu quan sát được và kinh nghiệm đang có. n  Hồi quy (regression): nếu y là một số thực n  Phân loại (classification): nếu y thuộc một tập rời rạc (tập nhãn lớp) 8Trí Tuệ Nhân Tạo f : x 7! y
  • 9. Máy học (2) n  Học từ đâu? q  Từ các quan sát trong quá khứ (tập học). {x1, x2, …, xN}; {y1, y2,…, yM} n  Sau khi đã học: q  Thu được một mô hình, kinh nghiệm, tri thức mới. q  Dùng nó để suy diễn (phán đoán) cho quan sát trong tương lai. Y = f(x) 9Trí Tuệ Nhân Tạo
  • 10. Hai bài toán học cơ bản n  Học có giám sát (supervised learning): cần học một hàm y = f(x) từ tập học {{x1, x2, …, xN}; {y1, y2,…, yN}} sao cho yi ≅ f(xi). q  Phân loại (phân lớp): nếu y chỉ nhận giá trị từ một tập rời rạc, chẳng hạn {cá, cây, quả, mèo} q  Hồi quy: nếu y nhận giá trị số thực n  Học không giám sát (unsupervised learning): cần học một hàm y = f(x) từ tập học cho trước {x1, x2, …, xN}. q  Y có thể là các cụm dữ liệu. q  Y có thể là các cấu trúc ẩn. 10Trí Tuệ Nhân Tạo
  • 11. Học có giám sát: ví dụ n  Lọc thư rác n  Phân loại trang web n  Dự đoán rủi ro tài chính n  Dự đoán biến động chỉ số chứng khoán n  Phát hiện tấn công mạng 11Trí Tuệ Nhân Tạo
  • 12. Học không giám sát: ví dụ (1) n  Phân cụm (clustering) q  Phát hiện các cụm dữ liệu, cụm tính chất,… n  Community detection n  Phát hiện các cộng đồng trong mạng xã hội 12 Fig. 1. Learning problems: dots correspond to points without any labels. Points with labels are denoted by plus signs, asterisks, and crosses. In (c), the must-link and cannot- link constraints are denoted by solid and dashed lines, respectively (figure taken from Lange et al. (2005). Fig. 2. Diversity of clusters. The seven clusters in (a) (denoted by seven different colors in 1(b)) differ in shape, size, and density. Although these clusters are apparent to a data analyst, none of the available clustering algorithms can detect all these clusters. Trí Tuệ Nhân Tạo
  • 13. Học không giám sát: ví dụ (2) n  Trends detection q  Phát hiện xu hướng, thị yếu,… n  Entity-interaction analysis 13Trí Tuệ Nhân Tạo
  • 14. Quá trình học máy: cơ bản 14 Tập dữ liệu (Dataset) Tập học (Training set) Tập thử nghiệm (Test set) Huấn luyện hệ thống Thử nghiệm hệ thống đã học Trí Tuệ Nhân Tạo
  • 15. Quá trình học máy: toàn diện 15 Tập dữ liệu (Dataset) Tập học (Training set) Tập thử nghiệm (Test set) Tập tối ưu (Validation set) Huấn luyện hệ thống Tối ưu hóa các tham số (nếu có) Thử nghiệm hệ thống đã học Trí Tuệ Nhân Tạo
  • 16. Thiết kế một hệ thống học (1) n  Lựa chọn các ví dụ học (training/learning examples) •  Các thông tin hướng dẫn quá trình học (training feedback) được chứa ngay trong các ví dụ học, hay là được cung cấp gián tiếp (vd: từ môi trường hoạt động) •  Các ví dụ học theo kiểu có giám sát (supervised) hay không có giám sát (unsupervised) •  Các ví dụ học nên tương thích với (đại diện cho) các ví dụ sẽ được làm việc bởi hệ thống trong tương lai (future test examples) n  Xác định hàm mục tiêu (giả thiết, khái niệm) cần học •  F: X → {0,1} •  F: X → Một tập các nhãn lớp •  F: X → R+ (miền các giá trị số thực dương) •  … 16Trí Tuệ Nhân Tạo
  • 17. Thiết kế một hệ thống học (2) n  Lựa chọn cách biểu diễn cho hàm mục tiêu cần học •  Hàm đa thức (a polynomial function) •  Một tập các luật (a set of rules) •  Một cây quyết định (a decision tree) •  Một mạng nơ-ron nhân tạo (an artificial neural network) •  … n  Lựa chọn một giải thuật học máy có thể học (xấp xỉ) được hàm mục tiêu •  Phương pháp học hồi quy (Regression-based) •  Phương pháp học quy nạp luật (Rule induction) •  Phương pháp học cây quyết định (ID3 hoặc C4.5) •  Phương pháp học lan truyền ngược (Back-propagation) •  … 17Trí Tuệ Nhân Tạo
  • 18. Các vấn đề trong Học máy (1) 18 n  Giải thuật học máy (Learning algorithm) •  Những giải thuật học máy nào có thể học (xấp xỉ) một hàm mục tiêu cần học? •  Với những điều kiện nào, một giải thuật học máy đã chọn sẽ hội tụ (tiệm cận) hàm mục tiêu cần học? •  Đối với một lĩnh vực bài toán cụ thể và đối với một cách biểu diễn các ví dụ (đối tượng) cụ thể, giải thuật học máy nào thực hiện tốt nhất? Trí Tuệ Nhân Tạo
  • 19. Các vấn đề trong Học máy (2) 19 n  Các ví dụ học (Training examples) •  Bao nhiêu ví dụ học là đủ? •  Kích thước của tập học (tập huấn luyện) ảnh hưởng thế nào đối với độ chính xác của hàm mục tiêu học được? •  Các ví dụ lỗi (nhiễu) và/hoặc các ví dụ thiếu giá trị thuộc tính (missing-value) ảnh hưởng thế nào đối với độ chính xác? Trí Tuệ Nhân Tạo
  • 20. Các vấn đề trong Học máy (3) 20 n  Quá trình học (Learning process) •  Chiến lược tối ưu cho việc lựa chọn thứ tự sử dụng (khai thác) các ví dụ học? •  Các chiến lược lựa chọn này làm thay đổi mức độ phức tạp của bài toán học máy như thế nào? •  Các tri thức cụ thể của bài toán (ngoài các ví dụ học) có thể đóng góp thế nào đối với quá trình học? Trí Tuệ Nhân Tạo
  • 21. Các vấn đề trong Học máy (4) 21 n  Khả năng/giới hạn học (Learnability) •  Hàm mục tiêu nào mà hệ thống cần học? q  Biểu diễn hàm mục tiêu: Khả năng biểu diễn (vd: hàm tuyến tính / hàm phi tuyến) vs. Độ phức tạp của giải thuật và quá trình học •  Các giới hạn (trên lý thuyết) đối với khả năng học của các giải thuật học máy? •  Khả năng khái quát hóa (generalization) của hệ thống? q  Để tránh vấn đề “over-fitting” (đạt độ chính xác cao trên tập học, nhưng đạt độ chính xác thấp trên tập thử nghiệm) •  Khả năng hệ thống tự động thay đổi (thích nghi) biểu diễn (cấu trúc) bên trong của nó? q  Để cải thiện khả năng (của hệ thống đối với việc) biểu diễn và học hàm mục tiêu Trí Tuệ Nhân Tạo
  • 23. Các bạn phân loại thế nào? 23 ?? Class a Class b Class b Class a Class a Class a Trí Tuệ Nhân Tạo
  • 24. KNN: phương pháp láng giềng gần nhất 24 n  Một số tên gọi khác của phương pháp học dựa trên các láng giềng gần nhất (Nearest neighbors learning) •  Instance-based learning •  Lazy learning •  Memory-based learning n  Ý tưởng của phương pháp •  Quá trình học ─  (Đơn giản là) lưu lại các ví dụ học ─  Không xây dựng một mô hình (mô tả) rõ ràng và tổng quát của hàm mục tiêu cần học •  Đối với một ví dụ cần phân loại/dự đoán ─  Giá trị của hàm mục tiêu (một nhãn lớp, hoặc một giá trị thực) được suy ra từ các hàng xóm của nó. Trí Tuệ Nhân Tạo
  • 25. KNN: phương pháp láng giềng gần nhất 25 n  Biểu diễn đầu vào của bài toán •  Mỗi ví dụ x được biểu diễn là một vectơ n chiều trong không gian các vectơ x∈Rn •  x = (x1, x2, …, xn) trong đó xi∈R là một số thực n  Có thể áp dụng được với cả 2 kiểu bài toán •  Bài toán phân lớp (classification) ─  Hàm mục tiêu có giá trị rời rạc ─  Đầu ra của hệ thống là một trong số các giá trị rời rạc đã xác định trước (một trong các nhãn lớp) •  Bài toán hồi quy (regression) ─  Hàm mục tiêu có giá trị liên tục ─  Đầu ra của hệ thống là một giá trị số thực Trí Tuệ Nhân Tạo
  • 26. Ví dụ: bài toán phân lớp Ví dụ cần phân lớp z Lớp c1 Lớp c2 26 n  Xét 1 láng giềng gần nhất → Gán z vào lớp c2 n  Xét 3 láng giềng gần nhất → Gán z vào lớp c1 n  Xét 5 láng giềng gần nhất → Gán z vào lớp c1 Trí Tuệ Nhân Tạo
  • 27. Giải thuật k-NN cho phân lớp 27 n  Mỗi ví dụ học x được biểu diễn bởi 2 thành phần: • Mô tả của ví dụ: x = (x1, x2, …, xn) trong đó xi∈R • Nhãn lớp: c∈C, với C là tập các nhãn lớp được xác định trước n  Giai đoạn học • Đơn giản là lưu lại các ví dụ học trong tập học: D n  Giai đoạn phân lớp: Để phân lớp cho một ví dụ (mới) z • Với mỗi ví dụ học x∈D, tính khoảng cách giữa x và z • Xác định tập NB(z) – các láng giềng gần nhất của z → Gồm k ví dụ học trong D gần nhất với z tính theo một hàm khoảng cách d • Phân z vào lớp chiếm số đông (the majority class) trong số các lớp của các ví dụ trong NB(z) Trí Tuệ Nhân Tạo
  • 28. Giải thuật k-NN cho hồi quy 28 n  Mỗi ví dụ học x được biểu diễn bởi 2 thành phần: • Mô tả của ví dụ: x = (x1, x2, …, xn) trong đó xi∈R • Giá trị đầu ra mong muốn: yx∈R (là một số thực) n  Giai đoạn học • Đơn giản là lưu lại các ví dụ học trong tập học: D n  Giai đoạn phán đoán: để dự đoán giá trị đầu ra cho z • Với mỗi ví dụ học x∈D, tính khoảng cách giữa x và z • Xác định tập NB(z) – các láng giềng gần nhất của z → Gồm k ví dụ học trong D gần nhất với z tính theo một hàm khoảng cách d • Dự đoán giá trị đầu ra cho z: yz = 1 k yxx∈NB(z) ∑ Trí Tuệ Nhân Tạo
  • 29. 29 k-NN: Các vấn đề cốt lõi 29 Suy nghĩ khác nhau Trí Tuệ Nhân Tạo
  • 30. 30 k-NN: Các vấn đề cốt lõi 30 n  Hàm khoảng cách q  Mỗi hàm sẽ tương ứng với một cách nhìn về dữ liệu. q  Vô hạn hàm!!! q  Chọn hàm nào? Trí Tuệ Nhân Tạo
  • 31. 31 k-NN: Các vấn đề cốt lõi 31 n  Chọn tập láng giềng NB(z) q  Chọn bao nhiêu láng giềng? q  Giới hạn chọn theo vùng? Trí Tuệ Nhân Tạo
  • 32. Một hay nhiều láng giềng gần nhất? 32 n  Việc phân lớp (hay dự đoán) chỉ dựa trên duy nhất một láng giềng gần nhất (là ví dụ học gần nhất với ví dụ cần phân lớp/ dự đoán) thường không chính xác •  Nếu ví dụ học này là một ví dụ bất thường, không điển hình (an outlier) – rất khác so với các ví dụ khác •  Nếu ví dụ học này có nhãn lớp (giá trị đầu ra) sai – do lỗi trong quá trình thu thập (xây dựng) tập dữ liệu n  Thường xét 𝑘 (>1) các ví dụ học (các láng giềng) gần nhất với ví dụ cần phân lớp/dự đoán n  Đối với bài toán phân lớp có 2 lớp, 𝑘 thường được chọn là một số lẻ, để tránh cân bằng về tỷ lệ các ví dụ giữa 2 lớp •  Ví dụ: 𝑘= 3, 5, 7,… Trí Tuệ Nhân Tạo
  • 33. Hàm tính khoảng cách (1) 33 n  Hàm tính khoảng cách d •  Đóng vai trò rất quan trọng trong phương pháp học dựa trên các láng giềng gần nhất •  Thường được xác định trước, và không thay đổi trong suốt quá trình học và phân loại/dự đoán n  Lựa chọn hàm khoảng cách d •  Các hàm khoảng cách hình học: Dành cho các bài toán có các thuộc tính đầu vào là kiểu số thực (xi∈R) •  Hàm khoảng cách Hamming: Dành cho các bài toán có các thuộc tính đầu vào là kiểu nhị phân (xi∈{0, 1}) Trí Tuệ Nhân Tạo
  • 34. Hàm tính khoảng cách (2) ∑= −= n i ii zxzxd 1 ),( ( )∑= −= n i ii zxzxd 1 2 ),( pn i p ii zxzxd /1 1 ),( ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= ∑= ii i zx −= max pn i p ii p zxzxd /1 1 lim),( ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −= ∑= ∞→ 34 n  Các hàm tính khoảng cách hình học (Geometry distance functions) •  Hàm Minkowski ( 𝑝-norm): •  Hàm Manhattan ( 𝑝=1): •  Hàm Euclid ( 𝑝=2): •  Hàm Chebyshev ( 𝑝=∞): Trí Tuệ Nhân Tạo
  • 35. Hàm tính khoảng cách (3) ∑ = = n i ii zxDifferencezxd 1 ),(),( ⎩ ⎨ ⎧ = ≠ = )(,0 )(,1 ),( baif baif baDifference 35 n  Hàm khoảng cách Hamming •  Đối với các thuộc tính đầu vào là kiểu nhị phân () Trí Tuệ Nhân Tạo
  • 36. k-NN: Ưu nhược điểm n  Các ưu điểm • Chi phí thấp cho quá trình huấn luyện (chỉ việc lưu lại các ví dụ học) • Hoạt động tốt với các bài toán phân loại gồm nhiều lớp → Không cần phải học c bộ phân loại cho c lớp • Phương pháp học k-NN (k>>1) có khả năng xử lý nhiễu cao → Phân loại/dự đoán được thực hiện dựa trên k láng giềng gần nhất •  Rất Linh động trong việc chọn hàm khoảng cách. → Có thể dùng độ tương tự (similarity): cosine → Có thể dùng độ đo khác, chẳng hạn Kullback-Leibler divergence, Bregman divergence, … n  Các nhược điểm • Phải lựa chọn hàm tính khoảng cách (sự khác biệt) thích hợp với bài toán • Chi phí tính toán (thời gian, bộ nhớ) cao tại thời điểm phân loại/dự đoán • Có thể cho kết quả kém/sai với các thuộc tính không liên quan 36 Trí Tuệ Nhân Tạo
  • 37. Phân lớp Naïve Bayes n  Là các phương pháp học phân lớp có giám sát và dựa trên xác suất n  Dựa trên một mô hình (hàm) xác suất n  Việc phân loại dựa trên các giá trị xác suất của các khả năng xảy ra của các giả thiết n  Là một trong các phương pháp học máy thường được sử dụng trong các bài toán thực tế n  Dựa trên định lý Bayes (Bayes theorem) Trí Tuệ Nhân Tạo 37
  • 38. Định lý Bayes • P(h): Xác suất trước (tiên nghiệm) của giả thiết h • P(D): Xác suất trước (tiên nghiệm) của việc quan sát được dữ liệu D • P(D|h): Xác suất (có điều kiện) của việc quan sát được dữ liệu D, nếu biết giả thiết h là đúng. (likelihood) • P(h|D): Xác suất (hậu nghiệm) của giả thiết h là đúng, nếu quan sát được dữ liệu D Ø Nhiều phương pháp phân loại dựa trên xác suất sẽ sử dụng xác suất hậu nghiệm (posterior probability) này! )( )().|( )|( DP hPhDP DhP = 38 Trí Tuệ Nhân Tạo
  • 39. Định lý Bayes: Ví dụ (1) Giả sử chúng ta có tập dữ liệu sau (dự đoán 1 người có chơi tennis)? Ngày Ngoài trời Nhiệt độ Độ ẩm Gió Chơi tennis N1 Nắng Nóng Cao Yếu Không N2 Nắng Nóng Cao Mạnh Không N3 Âm u Nóng Cao Yếu Có N4 Mưa Bình thường Cao Yếu Có N5 Mưa Mát mẻ Bình thường Yếu Có N6 Mưa Mát mẻ Bình thường Mạnh Không N7 Âm u Mát mẻ Bình thường Mạnh Có N8 Nắng Bình thường Cao Yếu Không N9 Nắng Mát mẻ Bình thường Yếu Có N10 Mưa Bình thường Bình thường Yếu Có N11 Nắng Bình thường Bình thường Mạnh Có N12 Âm u Bình thường Cao Mạnh Có [Mitchell, 1997] 39 Trí Tuệ Nhân Tạo
  • 40. Định lý Bayes: Ví dụ (2) n  Dữ liệu D. Ngoài trời là nắng và Gió là mạnh n  Giả thiết (phân loại) h. Anh ta chơi tennis n  Xác suất trước P(h). Xác suất rằng anh ta chơi tennis (bất kể Ngoài trời như thế nào và Gió ra sao) n  Xác suất trước P(D). Xác suất rằng Ngoài trời là nắng và Gió là mạnh n  P(D|h). Xác suất Ngoài trời là nắng và Gió là mạnh, nếu biết rằng anh ta chơi tennis n  P(h|D). Xác suất anh ta chơi tennis, nếu biết rằng Ngoài trời là nắng và Gió là mạnh 40 Trí Tuệ Nhân Tạo
  • 41. Xác suất hậu nghiệm cực đại (MAP) n  Với một tập các giả thiết (các phân lớp) có thể H, hệ thống học sẽ tìm giả thiết có thể xảy ra nhất (the most probable hypothesis) h(∈H) đối với các dữ liệu quan sát được D n  Giả thiết h này được gọi là giả thiết có xác suất hậu nghiệm cực đại (Maximum a posteriori – MAP) )|(maxarg DhPh Hh MAP ∈ = )( )().|( maxarg DP hPhDP h Hh MAP ∈ = )().|(maxarg hPhDPh Hh MAP ∈ = (bởi định lý Bayes) (P(D) là như nhau đối với các giả thiết h) 41 Trí Tuệ Nhân Tạo
  • 42. MAP: Ví dụ n  Tập H bao gồm 2 giả thiết (có thể) •  h1: Anh ta chơi tennis •  h2: Anh ta không chơi tennis n  Tính giá trị của 2 xác xuất có điều kiện: P(h1|D), P(h2|D) n  Giả thiết có thể nhất hMAP=h1 nếu P(h1|D) ≥ P(h2|D); ngược lại thì hMAP=h2 n  Vì vậy, cần tính 2 biểu thức: P(D|h1).P(h1) và P(D|h2).P(h2), và đưa ra quyết định tương ứng •  Nếu P(D|h1).P(h1) ≥ P(D|h2).P(h2), thì kết luận là anh ta chơi tennis •  Ngược lại, thì kết luận là anh ta không chơi tennis 42 Trí Tuệ Nhân Tạo
  • 43. Đánh giá khả năng có thể nhất (MLE) n  Phương pháp MAP: Với một tập các giả thiết có thể H, cần tìm một giả thiết cực đại hóa giá trị: P(D|h).P(h) n  Giả sử (assumption) trong phương pháp đánh giá khả năng có thể nhất (Maximum likelihood estimation – MLE): Tất cả các giả thiết đều có giá trị xác suất trước như nhau: P(hi)=P(hj), ∀hi,hj∈H n  Phương pháp MLE tìm giả thiết cực đại hóa giá trị P(D|h); trong đó P(D|h) được gọi là khả năng có thể (likelihood) của dữ liệu D đối với h n  Giả thiết có khả năng nhất (maximum likelihood hypothesis) )|(maxarg hDPh Hh ML ∈ = 43 Trí Tuệ Nhân Tạo
  • 44. MLE: Ví dụ n  Tập H bao gồm 2 giả thiết có thể •  h1: Anh ta chơi tennis •  h2: Anh ta không chơi tennis D: Tập dữ liệu (các ngày) mà trong đó thuộc tính Outlook có giá trị Sunny và thuộc tính Wind có giá trị Strong n  Tính 2 giá trị khả năng xảy ra (likelihood values) của dữ liệu D đối với 2 giả thiết: P(D|h1) và P(D|h2) •  P(Outlook=Sunny, Wind=Strong|h1)= 1/8 •  P(Outlook=Sunny, Wind=Strong|h2)= 1/4 n  Giả thiết MLE hMLE=h1 nếu P(D|h1) ≥ P(D|h2); và ngược lại thì hMLE=h2 → Bởi vì P(Outlook=Sunny, Wind=Strong|h1) < P(Outlook=Sunny, Wind=Strong|h2), hệ thống kết luận rằng: Anh ta sẽ không chơi tennis! 44 Trí Tuệ Nhân Tạo
  • 45. Phân loại Naïve Bayes (1) n  Biểu diễn bài toán phân loại (classification problem) •  Một tập học D_train, trong đó mỗi ví dụ học x được biểu diễn là một vectơ n chiều: (x1, x2, ..., xn) •  Một tập xác định các nhãn lớp: C={c1, c2, ..., cm} •  Với một ví dụ (mới) z, thì z sẽ được phân vào lớp nào? n  Mục tiêu: Xác định phân lớp có thể (phù hợp) nhất đối với z )|(maxarg zcPc i Cc MAP i∈ = ),...,,|(maxarg 21 ni Cc MAP zzzcPc i∈ = ),...,,( )().|,...,,( maxarg 21 21 n iin Cc MAP zzzP cPczzzP c i∈ = (bởi định lý Bayes) 45 Trí Tuệ Nhân Tạo
  • 46. Phân loại Naïve Bayes (2) n  Để tìm được phân lớp có thể nhất đối với z… )().|,...,,(maxarg 21 iin Cc MAP cPczzzPc i∈ = (P(z1,z2,...,zn) là như nhau với các lớp) n  Giả sử (assumption) trong phương pháp phân loại Naïve Bayes. Các thuộc tính là độc lập có điều kiện (conditionally independent) đối với các lớp ∏ = = n j ijin czPczzzP 1 21 )|()|,...,,( n  Phân loại Naïve Bayes tìm phân lớp có thể nhất đối với z ∏ =∈ = n j iji Cc NB czPcPc i 1 )|().(maxarg 46 Trí Tuệ Nhân Tạo
  • 47. Phân loại Naïve Bayes: Giải thuật n  Giai đoạn học (training phase), sử dụng một tập học Đối với mỗi phân lớp có thể (mỗi nhãn lớp) ci∈C •  Tính giá trị xác suất trước: P(ci) •  Đối với mỗi giá trị thuộc tính xj, tính giá trị xác suất xảy ra của giá trị thuộc tính đó đối với một phân lớp ci: P(xj|ci) n  Giai đoạn phân lớp (classification phase), đối với một ví dụ mới •  Đối với mỗi phân lớp ci∈C, tính giá trị của biểu thức: ∏= n j iji cxPcP 1 )|().( •  Xác định phân lớp của z là lớp có thể nhất c* ∏=∈ = n j iji Cc cxPcPc i 1 * )|().(maxarg 47 Trí Tuệ Nhân Tạo
  • 48. Phân loại Naïve Bayes: Ví dụ (1) Một sinh viên trẻ với thu nhập trung bình và mức đánh giá tín dụng bình thường sẽ mua một cái máy tính? Rec. ID Age Income Student Credit_Rating Buy_Computer 1 Young High No Fair No 2 Young High No Excellent No 3 Medium High No Fair Yes 4 Old Medium No Fair Yes 5 Old Low Yes Fair Yes 6 Old Low Yes Excellent No 7 Medium Low Yes Excellent Yes 8 Young Medium No Fair No 9 Young Low Yes Fair Yes 10 Old Medium Yes Fair Yes 11 Young Medium Yes Excellent Yes 12 Medium Medium No Excellent Yes 13 Medium High Yes Fair Yes 14 Old Medium No Excellent No http://www.cs.sunysb.edu/~cse634/lecture_notes/07classification.pdf 48 Trí Tuệ Nhân Tạo
  • 49. Phân loại Naïve Bayes: Ví dụ (2) n  Biểu diễn bài toán phân loại • z = (Age=Young,Income=Medium,Student=Yes,Credit_Rating=Fair) •  Có 2 phân lớp có thể: c1 (“Mua máy tính”) và c2 (“Không mua máy tính”) n  Tính giá trị xác suất trước cho mỗi phân lớp •  P(c1) = 9/14 •  P(c2) = 5/14 n  Tính giá trị xác suất của mỗi giá trị thuộc tính đối với mỗi phân lớp •  P(Age=Young|c1) = 2/9; P(Age=Young|c2) = 3/5 •  P(Income=Medium|c1) = 4/9; P(Income=Medium|c2) = 2/5 •  P(Student=Yes|c1) = 6/9; P(Student=Yes|c2) = 1/5 •  P(Credit_Rating=Fair|c1) = 6/9; P(Credit_Rating=Fair|c2) = 2/5 49 Trí Tuệ Nhân Tạo
  • 50. Phân loại Naïve Bayes: Ví dụ (3) n  Tính toán xác suất có thể xảy ra (likelihood) của ví dụ z đối với mỗi phân lớp •  Đối với phân lớp c1 P(z|c1) = P(Age=Young|c1).P(Income=Medium|c1).P(Student=Yes|c1). P(Credit_Rating=Fair|c1) = (2/9).(4/9).(6/9).(6/9) = 0.044 •  Đối với phân lớp c2 P(z|c2) = P(Age=Young|c2).P(Income=Medium|c2).P(Student=Yes|c2). P(Credit_Rating=Fair|c2) = (3/5).(2/5).(1/5).(2/5) = 0.019 n  Xác định phân lớp có thể nhất (the most probable class) •  Đối với phân lớp c1 P(c1).P(z|c1) = (9/14).(0.044) = 0.028 •  Đối với phân lớp c2 P(c2).P(z|c2) = (5/14).(0.019) = 0.007 → Kết luận: Anh ta (z) sẽ mua một máy tính! 50 Trí Tuệ Nhân Tạo
  • 51. Phân loại Naïve Bayes: Vấn đề (1) n  Nếu không có ví dụ nào gắn với phân lớp ci có giá trị thuộc tính xj… P(xj|ci)=0 , và vì vậy: n  Giải pháp: Sử dụng phương pháp Bayes để ước lượng P(xj|ci) • n(ci): số lượng các ví dụ học gắn với phân lớp ci • n(ci,xj): số lượng các ví dụ học gắn với phân lớp ci có giá trị thuộc tính xj • p: ước lượng đối với giá trị xác suất P(xj|ci) → Các ước lượng đồng mức: p=1/k, nếu thuộc tính fj có k giá trị • m: một hệ số (trọng số) → Để bổ sung cho n(ci) các ví dụ thực sự được quan sát với thêm m mẫu ví dụ với ước lượng p 0)|().( 1 =∏= n j iji cxPcP mcn mpxcn cxP i ji ij + + = )( ),( )|( 51 Trí Tuệ Nhân Tạo
  • 52. Phân loại Naïve Bayes: Vấn đề (2) n  Giới hạn về độ chính xác trong tính toán của máy tính •  P(xj|ci)<1, đối với mọi giá trị thuộc tính xj và phân lớp ci •  Vì vậy, khi số lượng các giá trị thuộc tính là rất lớn, thì: 0)|(lim 1 =⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∏= ∞→ n j ij n cxP n  Giải pháp: Sử dụng hàm lôgarit cho các giá trị xác suất ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = ∏=∈ n j iji Cc NB cxPcPc i 1 )|().(logmaxarg ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ += ∑=∈ n j iji Cc NB cxPcPc i 1 )|(log)(logmaxarg 52 Trí Tuệ Nhân Tạo
  • 53. Phân loại văn bản bằng NB (1) n  Biểu diễn bài toán phân loại văn bản •  Tập học D, trong đó mỗi ví dụ học là một biểu diễn văn bản gắn với một nhãn lớp: D = {(dk, ci)} •  Một tập các nhãn lớp xác định: C = {ci} n  Giai đoạn học •  Từ tập các văn bản trong D, trích ra tập các từ khóa T = {tj} •  Gọi là tập các văn bản trong D có nhãn lớp ci •  Đối với mỗi phân lớp ci - Tính giá trị xác suất trước của phân lớp ci: - Đối với mỗi từ khóa tj, tính xác suất từ khóa tj xuất hiện đối với lớp ci D D cP ic i =)( Ttdn tdn ctP ick m ick Dd Tt mk Dd jk ij +⎟ ⎠ ⎞⎜ ⎝ ⎛ +⎟ ⎠ ⎞⎜ ⎝ ⎛ = ∑ ∑ ∑ ∈ ∈ ∈ ),( 1),( )|( (n(dk,tj): số lần xuất hiện của từ khóa tj trong văn bản dk) 53 Trí Tuệ Nhân Tạo Dci
  • 54. Phân loại văn bản bằng NB (2) n  Giai đoạn phân lớp đối với một văn bản mới d •  Từ văn bản d, trích ra tập Td gồm các từ khóa (keywords) tj đã được định nghĩa trong tập T •  Giả sử (assumption). Xác suất từ khóa tj xuất hiện đối với lớp ci là độc lập đối với vị trí của từ khóa đó trong văn bản P(tj ở vị trí k|ci) = P(tj ở vị trí m|ci), ∀k,m •  Đối với mỗi phân lớp ci, tính xác suất hậu nghiệm của văn bản d đối với ci ∏∈ dj Tt iji ctPcP )|().( •  Phân lớp văn bản d thuộc vào lớp c* ∏∈∈ = dji Tt iji Cc ctPcPc )|().(maxarg* 54 Trí Tuệ Nhân Tạo
  • 55. Tài liệu tham khảo •  E. Alpaydin. Introduction to Machine Learning. The MIT Press, 2010. •  T. M. Mitchell. Machine Learning. McGraw-Hill, 1997. •  T. M. Mitchell. The discipline of machine learning. CMU technical report, 2006. •  H. A. Simon. Why Should Machines Learn? In R. S. Michalski, J. Carbonell, and T. M. Mitchell (Eds.): Machine learning: An artificial intelligence approach, chapter 2, pp. 25-38. Morgan Kaufmann, 1983. Trí Tuệ Nhân Tạo 55