SlideShare a Scribd company logo
evalution
Các giai đoạn của Học máy
 Dữ liệu đào tạo được dán nhãn
 Giả sử mỗi
 Huấn luyện mô hình:
 Áp dụng mô hình cho dữ liệu mới:
Bộ dữ liệu
 Giả định rằng chúng ta đang xây dựng một mô hình phân loại nợ xấu. Nhãn của các quan sát sẽ
bao gồm GOOD (thông thường) và BAD (nợ xấu). Kích thước của các tập dữ liệu như sau:
 Tập train: 1000 hồ sơ bao gồm 900 hồ sơ GOOD và 100 hồ sơ BAD.
 tập test: 100 hồ sơ bao gồm 85 hồ sơ GOOD và 15 hồ sơ BAD.
 Để thuận tiện cho diễn giải và đồng nhất với những tài liệu tham khảo khác về ký hiệu thì biến
mục tiêu nhãn BAD có giá trị 1 và GOOD giá trị 0. Đồng thời trong các công thức diễn giải và
bảng thống kê, nhãn BAD là positive và GOOD là negative. Positive và Negative ở đây chỉ là qui
ước tương ứng với giá trị 1 và 0 chứ không nên hiểu theo nghĩa đen là tích cực và tiêu cực.
 Một mô hình phân loại đưa ra kết quả dự báo trên tập train được thống kê trên bảng chéo như
sau:
Các chỉ số TP, FP, TN, FN lần lượt có ý nghĩa là :
TP (True Positive): Tổng số trường hợp dự báo khớp Positive.
TN (True Negative): Tổng số trường hợp dự báo khớp Negative.
FP (False Positive): Tổng số trường hợp dự báo các quan sát thuộc nhãn Negative thành Positive.
FN (False Negative): Tổng số trường hợp dự báo các quan sát thuộc nhãn Positive thành Negative.
Những chỉ số trên sẽ là cơ sở để tính toán những metric như accuracy, precision, recall, f1 score mà ta
sẽ tìm hiểu bên dưới.
Confusion Matrix
 Confusion Matrix ma trận nhầm lẫn hay ma trận lỗi là một bố cục
bảng cụ thể cho phép hình dung hiệu suất của một thuật toán.
Độ chính xác (accuracy)
Khi xây dựng mô hình phân loại chúng ta sẽ muốn biết một cách khái quát tỷ lệ các
trường hợp được dự báo đúng trên tổng số các trường hợp là bao nhiêu. Tỷ lệ đó được
gọi là độ chính xác. Độ chính xác giúp ta đánh giá hiệu quả dự báo của mô hình trên
một bộ dữ liệu. Độ chính xác càng cao thì mô hình của chúng ta càng chuẩn xác. Khi
một ai đó nói mô hình của họ dự báo chính xác 90.5% thì chúng ta hiểu rằng họ đang
đề cập tới độ chính xác được tính theo công thức :
Trong đó y_label là nhãn của dữ liệu và y_pred là nhãn dự báo.
Trong các metrics đánh giá mô hình phân loại thì độ chính xác là metric khá được ưa chuộng vì nó có công
thức tường minh và dễ diễn giải ý nghĩa. Tuy nhiên hạn chế của nó là đo lường trên tất cả các nhãn mà
không quan tâm đến độ chính xác trên từng nhãn. Do đó nó không phù hợp để đánh giá những tác vụ mà
tầm quan trọng của việc dự báo các nhãn không còn như nhau. Hay nói cách khác, như trong ví dụ phân
loại nợ xấu, việc chúng ta phát hiện đúng một hồ sơ nợ xấu quan trọng hơn việc chúng ta phát hiện đúng
một hồ sơ thông thường.
Khi đó chúng ta sẽ quan tâm hơn tới độ chính xác được đo lường chỉ trên nhãn BAD hơn và sẽ cần những
metrics như precision, recall đánh giá chuyên biệt trên nhóm này. Cùng tìm hiểu về các metrics này bên
dưới.
Precision
 Precision trả lời cho câu hỏi trong các trường hợp được dự báo là positive thì có bao
nhiêu trường hợp là đúng ? Và tất nhiên precision càng cao thì mô hình của chúng ta
càng tốt trong việc phân loại hồ sơ BAD (BAD chính là nhóm positive). Công thức của
precision như sau:
 Precision sẽ cho chúng ta biết mức độ chuẩn xác của mô hình đối với các hồ sơ được
dự báo là BAD. Ví dụ khi precision = 52.4%, chúng ta tin rằng trong các hồ sơ được dự
báo là BAD thì có 52.4% tỷ lệ các hồ sơ được phân loại đúng.
 Cũng có ý nghĩa gần tương tự như precision, có cùng tử số nhưng có một chút khác biệt
về mẫu số trong công thức tính toán, và cũng là một chỉ số giúp đo lường hiệu suất dự
báo trên nhóm positive, đó là recall.
Recall
 Recall đo lường tỷ lệ dự báo chính xác các trường hợp positive trên toàn bộ các mẫu
thuộc nhóm positive. Công thức của recall như sau:
 Để tính được recall thì chúng ta phải biết trước nhãn của dữ liệu. Do đó recall có thể
được dùng để đánh gía trên tập train và validation vì chúng ta đã biết trước nhãn. Trên
tập test khi dữ liệu được coi như mới hoàn toàn và chưa biết nhãn thì chúng ta sẽ sử
dụng precision.
Training Data and Test Data
 Tập dữ liệu huấn luyện (Training dataset): là một tập dữ liệu dùng để
huấn luyện cho mô hình của thuật toán Máy học. Nói một cách khác, thuật
toán Máy học sẽ học từ tập dữ liệu này.
 Tập dữ liệu kiểm tra (Testing dataset): là một tập dữ liệu dùng để kiểm
chứng độ chính xác của mô hình của thuật toán Máy học.
 Hiệu suất đào tạo là một chỉ số kém về tổng thể và về hiệu suất
 sự khái quát là những gì chúng tôi thật sự quan tâm đến ML
 Dễ dàng trang bị quá nhiều dữ liệu đào tạo
 Hiệu suất trên dữ liệu thử nghiệm là một chỉ báo tốt về tổng thể và về hiệu suất
 độ chính xác của bài kiểm tra quan trọng hơn độ chính xác của quá trình đào tạo
Ví dụ về hiện tượng overfitting
Overfitting ảnh hưởng thế nào đến dự
đoán
Overfitting ảnh hưởng thế nào đến dự
đoán
Overfitting ảnh hưởng thế nào đến dự
đoán
so sánh classifiers
 Giả sử chúng ta có hai bộ phân loại: C1 và C2, và muốn chọn cái tốt nhất để sử
dụng cho các dự đoán và khởi động trong tương lai
 Chúng ta có thể sử dụng độ chính xác đào tạo để lựa chọn giữa chúng
không?
 • Không!
 Thay vào đó, hãy chọn dựa trên độ chính xác của bài kiểm tra
k-Fold Cross-Validation
 Cross validation là một kỹ thuật lấy mẫu để đánh giá mô hình học máy trong
trường hợp dữ liệu không được dồi dào cho lắm.
 Tham số quan trọng trong kỹ thuật này là k, đại diện cho số nhóm mà dữ liệu sẽ
được chia ra. Vì lý do đó, nó được mang tên k-fold cross-validation. Khi giá trị
của k được lựa chọn, người ta sử dụng trực tiếp giá trị đó trong tên của phương
pháp đánh giá. Ví dụ với k=10, phương pháp sẽ mang tên 10-fold cross-validation.
Kỹ thuật này thường bao gồm các bước như sau:
1.Xáo trộn dataset một cách ngẫu nhiên
2.Chia dataset thành k nhóm
3.Với mỗi nhóm:
1.Sử dụng nhóm hiện tại để đánh giá hiệu quả mô
hình
2.Các nhóm còn lại được sử dụng để huấn luyện mô
hình
3.Huấn luyện mô hình
4.Đánh giá và sau đó hủy mô hình
thông số mô hình optimizing
Wk3_evalution.pptx
Wk3_evalution.pptx
Wk3_evalution.pptx
Wk3_evalution.pptx
Wk3_evalution.pptx

More Related Content

Similar to Wk3_evalution.pptx

Ung dung excel trong phan tich hoi quy va tuong quan
Ung dung excel trong phan tich hoi quy va tuong quanUng dung excel trong phan tich hoi quy va tuong quan
Ung dung excel trong phan tich hoi quy va tuong quan
Nghịch Ngợm Rồng Con
 
Excel_SV2022_Ngan.pdf
Excel_SV2022_Ngan.pdfExcel_SV2022_Ngan.pdf
Excel_SV2022_Ngan.pdf
TiepDinh3
 
Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
 Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
Dịch vụ viết bài trọn gói ZALO: 0936 885 877
 
Giới thiệu về SPSS
Giới thiệu về SPSSGiới thiệu về SPSS
Giới thiệu về SPSS
kudos21
 
Một số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSSMột số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSS
BeriDang
 
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.org
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.orgTap 1 ly thuyet chung ve mo phong mang-vntelecom.org
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.orgHate To Love
 
Huong dan spss_co_ban_nhung
Huong dan spss_co_ban_nhungHuong dan spss_co_ban_nhung
Huong dan spss_co_ban_nhung
Duy Vọng
 
Biz Forecasting Lecture8
Biz Forecasting Lecture8Biz Forecasting Lecture8
Biz Forecasting Lecture8Chuong Nguyen
 
KHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptxKHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptx
PhanAnhNht
 
Chương 1: Giới thiệu chung về dự báo
Chương 1: Giới thiệu chung về dự báoChương 1: Giới thiệu chung về dự báo
Chương 1: Giới thiệu chung về dự báo
Le Nguyen Truong Giang
 
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tảSuy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
Tài Tài
 
Java Core (Vietnamese)
Java Core (Vietnamese)Java Core (Vietnamese)
Java Core (Vietnamese)
Đông Lương
 
Tin học lớp 8
Tin học lớp 8Tin học lớp 8
Tin học lớp 8
Học Tập Long An
 
Thiết lập KPI
Thiết lập KPIThiết lập KPI
Thiết lập KPI
Getfly CRM
 
Nhom14-_Full.pptx
Nhom14-_Full.pptxNhom14-_Full.pptx
Nhom14-_Full.pptx
HuyNguyn743842
 
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
Dịch vụ viết đề tài trọn gói 0934.573.149
 
Document
DocumentDocument
Document
Ho Nam
 

Similar to Wk3_evalution.pptx (20)

Ung dung excel trong phan tich hoi quy va tuong quan
Ung dung excel trong phan tich hoi quy va tuong quanUng dung excel trong phan tich hoi quy va tuong quan
Ung dung excel trong phan tich hoi quy va tuong quan
 
Excel_SV2022_Ngan.pdf
Excel_SV2022_Ngan.pdfExcel_SV2022_Ngan.pdf
Excel_SV2022_Ngan.pdf
 
Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
 Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
Phương pháp nghiên cứu luận văn khả năng thanh toán của doanh nghiệp
 
Giới thiệu về SPSS
Giới thiệu về SPSSGiới thiệu về SPSS
Giới thiệu về SPSS
 
Một số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSSMột số ứng dụng thống kê trong SPSS
Một số ứng dụng thống kê trong SPSS
 
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.org
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.orgTap 1 ly thuyet chung ve mo phong mang-vntelecom.org
Tap 1 ly thuyet chung ve mo phong mang-vntelecom.org
 
Huong dan spss_co_ban_nhung
Huong dan spss_co_ban_nhungHuong dan spss_co_ban_nhung
Huong dan spss_co_ban_nhung
 
Biz Forecasting Lecture8
Biz Forecasting Lecture8Biz Forecasting Lecture8
Biz Forecasting Lecture8
 
KHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptxKHAI PHÁ DỮ LIỆU - C5.pptx
KHAI PHÁ DỮ LIỆU - C5.pptx
 
Chương 1: Giới thiệu chung về dự báo
Chương 1: Giới thiệu chung về dự báoChương 1: Giới thiệu chung về dự báo
Chương 1: Giới thiệu chung về dự báo
 
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tảSuy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
Suy diễn thống kê và ngôn ngữ R (3): Thống kê mô tả
 
Java Core (Vietnamese)
Java Core (Vietnamese)Java Core (Vietnamese)
Java Core (Vietnamese)
 
Tin học lớp 8
Tin học lớp 8Tin học lớp 8
Tin học lớp 8
 
Java core
Java coreJava core
Java core
 
Thiết lập KPI
Thiết lập KPIThiết lập KPI
Thiết lập KPI
 
Chapter 9
Chapter 9Chapter 9
Chapter 9
 
Nhom14-_Full.pptx
Nhom14-_Full.pptxNhom14-_Full.pptx
Nhom14-_Full.pptx
 
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
Luận Văn Đồ Án Tốt NghiệpTìm Hiểu Về Học Máy Và Phương Pháp Học Khái Niệm.Xây...
 
Chapter 7
Chapter 7Chapter 7
Chapter 7
 
Document
DocumentDocument
Document
 

Wk3_evalution.pptx

  • 2. Các giai đoạn của Học máy  Dữ liệu đào tạo được dán nhãn  Giả sử mỗi  Huấn luyện mô hình:
  • 3.  Áp dụng mô hình cho dữ liệu mới:
  • 4. Bộ dữ liệu  Giả định rằng chúng ta đang xây dựng một mô hình phân loại nợ xấu. Nhãn của các quan sát sẽ bao gồm GOOD (thông thường) và BAD (nợ xấu). Kích thước của các tập dữ liệu như sau:  Tập train: 1000 hồ sơ bao gồm 900 hồ sơ GOOD và 100 hồ sơ BAD.  tập test: 100 hồ sơ bao gồm 85 hồ sơ GOOD và 15 hồ sơ BAD.  Để thuận tiện cho diễn giải và đồng nhất với những tài liệu tham khảo khác về ký hiệu thì biến mục tiêu nhãn BAD có giá trị 1 và GOOD giá trị 0. Đồng thời trong các công thức diễn giải và bảng thống kê, nhãn BAD là positive và GOOD là negative. Positive và Negative ở đây chỉ là qui ước tương ứng với giá trị 1 và 0 chứ không nên hiểu theo nghĩa đen là tích cực và tiêu cực.  Một mô hình phân loại đưa ra kết quả dự báo trên tập train được thống kê trên bảng chéo như sau:
  • 5. Các chỉ số TP, FP, TN, FN lần lượt có ý nghĩa là : TP (True Positive): Tổng số trường hợp dự báo khớp Positive. TN (True Negative): Tổng số trường hợp dự báo khớp Negative. FP (False Positive): Tổng số trường hợp dự báo các quan sát thuộc nhãn Negative thành Positive. FN (False Negative): Tổng số trường hợp dự báo các quan sát thuộc nhãn Positive thành Negative. Những chỉ số trên sẽ là cơ sở để tính toán những metric như accuracy, precision, recall, f1 score mà ta sẽ tìm hiểu bên dưới.
  • 6. Confusion Matrix  Confusion Matrix ma trận nhầm lẫn hay ma trận lỗi là một bố cục bảng cụ thể cho phép hình dung hiệu suất của một thuật toán. Độ chính xác (accuracy) Khi xây dựng mô hình phân loại chúng ta sẽ muốn biết một cách khái quát tỷ lệ các trường hợp được dự báo đúng trên tổng số các trường hợp là bao nhiêu. Tỷ lệ đó được gọi là độ chính xác. Độ chính xác giúp ta đánh giá hiệu quả dự báo của mô hình trên một bộ dữ liệu. Độ chính xác càng cao thì mô hình của chúng ta càng chuẩn xác. Khi một ai đó nói mô hình của họ dự báo chính xác 90.5% thì chúng ta hiểu rằng họ đang đề cập tới độ chính xác được tính theo công thức :
  • 7. Trong đó y_label là nhãn của dữ liệu và y_pred là nhãn dự báo. Trong các metrics đánh giá mô hình phân loại thì độ chính xác là metric khá được ưa chuộng vì nó có công thức tường minh và dễ diễn giải ý nghĩa. Tuy nhiên hạn chế của nó là đo lường trên tất cả các nhãn mà không quan tâm đến độ chính xác trên từng nhãn. Do đó nó không phù hợp để đánh giá những tác vụ mà tầm quan trọng của việc dự báo các nhãn không còn như nhau. Hay nói cách khác, như trong ví dụ phân loại nợ xấu, việc chúng ta phát hiện đúng một hồ sơ nợ xấu quan trọng hơn việc chúng ta phát hiện đúng một hồ sơ thông thường. Khi đó chúng ta sẽ quan tâm hơn tới độ chính xác được đo lường chỉ trên nhãn BAD hơn và sẽ cần những metrics như precision, recall đánh giá chuyên biệt trên nhóm này. Cùng tìm hiểu về các metrics này bên dưới.
  • 8. Precision  Precision trả lời cho câu hỏi trong các trường hợp được dự báo là positive thì có bao nhiêu trường hợp là đúng ? Và tất nhiên precision càng cao thì mô hình của chúng ta càng tốt trong việc phân loại hồ sơ BAD (BAD chính là nhóm positive). Công thức của precision như sau:  Precision sẽ cho chúng ta biết mức độ chuẩn xác của mô hình đối với các hồ sơ được dự báo là BAD. Ví dụ khi precision = 52.4%, chúng ta tin rằng trong các hồ sơ được dự báo là BAD thì có 52.4% tỷ lệ các hồ sơ được phân loại đúng.  Cũng có ý nghĩa gần tương tự như precision, có cùng tử số nhưng có một chút khác biệt về mẫu số trong công thức tính toán, và cũng là một chỉ số giúp đo lường hiệu suất dự báo trên nhóm positive, đó là recall.
  • 9. Recall  Recall đo lường tỷ lệ dự báo chính xác các trường hợp positive trên toàn bộ các mẫu thuộc nhóm positive. Công thức của recall như sau:  Để tính được recall thì chúng ta phải biết trước nhãn của dữ liệu. Do đó recall có thể được dùng để đánh gía trên tập train và validation vì chúng ta đã biết trước nhãn. Trên tập test khi dữ liệu được coi như mới hoàn toàn và chưa biết nhãn thì chúng ta sẽ sử dụng precision.
  • 10. Training Data and Test Data  Tập dữ liệu huấn luyện (Training dataset): là một tập dữ liệu dùng để huấn luyện cho mô hình của thuật toán Máy học. Nói một cách khác, thuật toán Máy học sẽ học từ tập dữ liệu này.  Tập dữ liệu kiểm tra (Testing dataset): là một tập dữ liệu dùng để kiểm chứng độ chính xác của mô hình của thuật toán Máy học.
  • 11.  Hiệu suất đào tạo là một chỉ số kém về tổng thể và về hiệu suất  sự khái quát là những gì chúng tôi thật sự quan tâm đến ML  Dễ dàng trang bị quá nhiều dữ liệu đào tạo  Hiệu suất trên dữ liệu thử nghiệm là một chỉ báo tốt về tổng thể và về hiệu suất  độ chính xác của bài kiểm tra quan trọng hơn độ chính xác của quá trình đào tạo
  • 12.
  • 13.
  • 14. Ví dụ về hiện tượng overfitting
  • 15.
  • 16.
  • 17. Overfitting ảnh hưởng thế nào đến dự đoán
  • 18. Overfitting ảnh hưởng thế nào đến dự đoán
  • 19. Overfitting ảnh hưởng thế nào đến dự đoán
  • 20. so sánh classifiers  Giả sử chúng ta có hai bộ phân loại: C1 và C2, và muốn chọn cái tốt nhất để sử dụng cho các dự đoán và khởi động trong tương lai  Chúng ta có thể sử dụng độ chính xác đào tạo để lựa chọn giữa chúng không?  • Không!  Thay vào đó, hãy chọn dựa trên độ chính xác của bài kiểm tra
  • 21.
  • 22. k-Fold Cross-Validation  Cross validation là một kỹ thuật lấy mẫu để đánh giá mô hình học máy trong trường hợp dữ liệu không được dồi dào cho lắm.  Tham số quan trọng trong kỹ thuật này là k, đại diện cho số nhóm mà dữ liệu sẽ được chia ra. Vì lý do đó, nó được mang tên k-fold cross-validation. Khi giá trị của k được lựa chọn, người ta sử dụng trực tiếp giá trị đó trong tên của phương pháp đánh giá. Ví dụ với k=10, phương pháp sẽ mang tên 10-fold cross-validation.
  • 23. Kỹ thuật này thường bao gồm các bước như sau: 1.Xáo trộn dataset một cách ngẫu nhiên 2.Chia dataset thành k nhóm 3.Với mỗi nhóm: 1.Sử dụng nhóm hiện tại để đánh giá hiệu quả mô hình 2.Các nhóm còn lại được sử dụng để huấn luyện mô hình 3.Huấn luyện mô hình 4.Đánh giá và sau đó hủy mô hình
  • 24.
  • 25. thông số mô hình optimizing