SlideShare a Scribd company logo
Course: Data Mining
Exercises
Chapter 1 and Chapter 2
Multi-choice questions:
1. Trường hợp nào sau đây không phải là một thí dụ về khai phá dữ liệu.
A. Khám phá một số tên nào đó nổi bật hơn những tên khác trong sổ điện thoại điện
tử.
B. Gom nhóm những tài liệu tương tự được trả về bởi một search engine dựa vào ngữ
cảnh của tài liệu
C. Truy vấn một search engine để biết thông tin về “Amazon”.
D. Dự báo những trường hợp trốn thuế trong tương lai căn cứ vào thông tin thuế quá
khứ.
2. Khai phá dữ liệu vận dụng những kỹ thuật từ các lãnh vực nào sau đây:
A. nhận dạng và xác xuất.
B. thiết kế thử nghiệm và thống kê
C. học máy, trí tuệ nhân tạo, nhận dạng và xác xuất.
D. mạch điện và đồ họa máy tính.
3. (Đúng/sai) Khai phá dữ liệu không thể đem lại những thông tin hỗ trợ các nhà quản
lý ra quyết định.
4. Công tác nào sau đây không phải là một công tác khai phá dữ liệu
A. gom cụm dữ liệu
B. khám phá luật kết hợp
C. phân lớp dữ liệu
D. truy vấn dữ liệu (từ một cơ sở dữ liệu tác nghiệp)
5. Số đo về độ đáng quan tâm (interestingness) của mẫu thức khai phá được từ dữ liệu
được dùng trong giai đoạn nào của quá trình khai phá dữ liệu:
A. Tích hợp dữ liệu
B. Biến đổi dữ liệu
C. Khai phá dữ liệu
D. Đánh giá kết quả khai phá
6. (Đúng/sai) Kỹ thuật lập chỉ mục (indexing technique) không phải là một yếu tố quan
trọng khi hệ thống khai phá dữ liệu ghép chặt với cơ sở dữ liệu hoặc kho dữ liệu.
7. Các tài liệu văn bản (text document) thuộc loại tri thức nào sau đây:
A. có cấu trúc
B. phi cấu trúc
C. bán cấu trúc
D. cả ba câu trên đều sai
8. Dữ liệu trong một quan hệ của cơ sở dữ liệu quan hệ thuộc loại tri thức nào sau đây:
A. có cấu trúc
B. phi cấu trúc
C. bán cấu trúc
D. cả ba câu trên đều sai
9. Thuật ngữ tiếng Anh nào sau đây liên quan đến tính thích nghi của một giải thuật
khai phá dữ liệu theo qui mô dữ liệu:
A. effectiveness
B. consistency
C. scalability
D. adaptivity
10. Trong khai phá dữ liệu, tri thức nền (background knowledge), tức tri thức miền
ứng dụng có vai trò
A. hướng dẫn quá trình khai phá tri thức
B. giúp đánh giá các mẫu thức tìm được
C. giúp mô tả tóm tắt dữ liệu
D. cả A và B đều đúng
11. Nếu chiều cao của một người được đo bằng cm, thì đó là loại dữ liệu gì.
A. dữ liệu phân loại (categorical data)
B. dữ liệu số (numerical data)
C. dữ liệu phi số
D. cả ba câu trên đều sai
12. Huy chương đồng, vàng, bạc được trao ở thi đấu Olympic thì thuộc loại dữ liệu gì.
A. dữ liệu phân loại (categorical data)
B. dữ liệu số (numerical data)
C. dữ liệu liên tục
D. cả ba câu trên đều sai
13. Chất lượng dữ liệu bao gồm các tính chất: tính chính xác, tính hiện hành, tính đầy
đủ và _______________.
14. Nếu giá trị trung bình của dữ liệu lớn hơn giá trị số trung vị (mean), thì đó là dấu
hiệu chỉ dữ liệu thuộc loại:
A. rời rạc
B. liên tục
C. lệch sang phải (positively skewed)
D. lệch sang trái (negatively skewed)
15. (Đúng/sai) Một giải thuật khai phá dữ liệu thường bao gồm trong nó một phương
pháp tìm kiếm và tối ưu hóa.
16. Tính độ lệch chuẩn của các số 23, 25, 30.
17. (Đúng/sai) Nhiễu thì có ích và đáng quan tâm.
18. (Đúng/sai) Những điểm ngoài biên (outlier) thì có ích và đáng quan tâm.
19. (Đúng/sai) Nhiễu có thể là những điểm ngoại biên.
20. (Đúng/sai) Nhiễu thường là điểm ngoại biên.
21. (Đúng/sai) Nhiễu có thể làm cho một giá trị thông thường trở thành một giá trị
khác thường và ngược lại.
22. (Đúng/sai) Các điểm tứ phân vị (quartile) là các độ đo về xu hướng chính của dữ
liệu.
23. (Đúng/sai) Số trung bình, số trung vị là các độ đo về xu hướng chính của dữ liệu.
24. (Đúng/sai) Phương sai (variance) độ đo về sự phân tán của dữ liệu.
25. (Đúng/sai) Ta có thể dùng các độ đo về sự phân tán để nhận dạng nhiễu hoặc điểm
ngoại biên.
26. Thuật ngữ nào sau đây chỉ hiệu số giữa trị tứ phân vị thứ ba và trị tứ phân vị thứ
nhất:
A. interrange
B. midrange
C. interquartile range
D. mode
27. Khối dữ liệu (data cube) là thuật ngữ dùng trong ngữ cảnh:
A. cơ sở dữ liệu
B. các tập tin phẳng
C. kho dữ liệu
D. cơ sở tri thức
28. Giải pháp nào sau đây không phải là kỹ thuật giảm thiểu nhiễu
A. binning
B. hồi qui
C. gom cụm
D. dùng giao diện thân thiện với người dùng
29. Tích hợp lược đồ (schema integration) diễn ra trong giai đoạn:
A. làm sạch dữ liệu
B. biến đổi dữ liệu
C. tích hợp dữ liệu
D. trực quan hóa kết quả khai phá dữ liệu
30. Phân tích mối tương quan (corelation analysis) giữa hai thuộc tính, là một kỹ thuật
thống kê có thể được dùng khi:
A. làm sạch dữ liệu
B. nhận diện sự dư thừa dữ liệu
C. giảm thiểu nhiễu
D. giải quyết vấn đề dữ liệu bị thiếu
31. Làm trơn dữ liệu (smoothing) là một kỹ thuật dùng để _______________
32. Hai kỹ thuật thu giảm dữ liệu là gộp dữ liệu (data aggregation) và thu giảm số
chiều khác nhau như thế nào.
33. Giả sử thuộc tính tuổi có các giá trị sau đây: 13, 15, 16, 16, 19, 20, 20, 21, 22, 22,
25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70.
a. Số trung vị của dãy giá trị trên là gì?
b. Mode của dãy giá trị trên là gì?
c. Midrange của dãy giá trị trên là gì?
d. Dùng chuẩn hóa min-max để biến đổi giá trị 35 về tầm trị [0, 1]
e. Dùng chuẩn hóa z-score để biến đổi giá trị 35, giả sử độ lệch chuẩn của dãy giá trị
chuỗi là 12.94.
f. Dùng chuẩn hóa decimal scaling biến đổi giá trị 35.
g. Thực hiện kỹ thuật làm trơn binning by means tập dữ liệu nêu trên với kích thước
của bin là 3.
34. Kỹ thuật nào sau đây không phải là kỹ thuật thu giảm số chiều.
A. Biến đổi Fourier rời rạc
B. Biến đổi wavelet rởi rạc
C. Biến đổi phân tích thành phần chính (PCA)
D. Hồi quy.
35. (Đúng/sai) Biểu đồ tần số (histogram) là một phương pháp để thu giảm lượng số
(numerosity reduction) dữ liệu.
36. Điểm ngắt (cut point) là thuật ngữ dùng trong ngữ cảnh:
A. thu giảm số chiều
B. rời rạc hóa dữ liệu số
C. thu giảm lượng số dữ liệu
D. chọn một số thuộc tính
37. Gom cụm dữ liệu là một kỹ thuật có thể dùng trong công việc nào sau đây:
A. thu giảm lượng số (numerosity reduction) dữ liệu
B. nhận diện các điểm ngoại biên
C. rời rạc hóa dữ liệu
D. tất cả các câu trên đều đúng
38. Chi-square là một kỹ thuật phân tích tương quan giữa hai thuộc tính là
A. dữ liệu phân loại (categorical data)
B. dữ liệu số (numerical data)
C. dữ liệu liên tục
D. cả ba câu trên đều sai
39. (Đúng/sai) Hồi quy là một phương pháp để thu giảm lượng số (numerosity
reduction) dữ liệu.
40. Potter’s Wheel là tên của công cụ thương mại dùng để:
A. làm sạch dữ liệu
B. tích hợp dữ liệu
C. biến đổi dữ liệu
D. khai phá dữ liệu
41. Weka là tên của công cụ phần mềm dùng để:
A. làm sạch dữ liệu
B. tích hợp dữ liệu
C. biến đổi dữ liệu
D. khai phá dữ liệu
42. Độ lợi thông tin (information gain) được dùng trong ngữ cảnh nào sau đây:
A. thu giảm số chiều
B. chọn một số thuộc tính từ một tập thuộc tính (attribute subset selection)
C. thu giảm lượng số dữ liệu
D. gộp khối dữ liệu (data cube aggregation)
43. Các điểm ngoại biên (outlier) có thể phát hiện được nhờ phương pháp nào sau đây:
A. Dùng trị trung bình và độ lệch chuẩn
B. Dùng giá trị IQR (interquartile range), Q1 và Q3
C. Dùng biểu đồ tần số.
D. Cả ba phương pháp trên
44. CRISP-DM là tên
A. một ngôn ngữ truy vấn chuyên dụng để khai phá dữ liệu.
B. một phần mềm chuyên dụng để khai phá dữ liệu.
C. một quá trình chuẩn để khai phá dữ liệu.
D. cả ba câu trên đều sai.
B. chọn một số thuộc tính từ một tập thuộc tính (attribute subset selection)
C. thu giảm lượng số dữ liệu
D. gộp khối dữ liệu (data cube aggregation)
43. Các điểm ngoại biên (outlier) có thể phát hiện được nhờ phương pháp nào sau đây:
A. Dùng trị trung bình và độ lệch chuẩn
B. Dùng giá trị IQR (interquartile range), Q1 và Q3
C. Dùng biểu đồ tần số.
D. Cả ba phương pháp trên
44. CRISP-DM là tên
A. một ngôn ngữ truy vấn chuyên dụng để khai phá dữ liệu.
B. một phần mềm chuyên dụng để khai phá dữ liệu.
C. một quá trình chuẩn để khai phá dữ liệu.
D. cả ba câu trên đều sai.

More Related Content

Similar to Exercises 1 2

Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
mait53606
 
Bai tap-mon-phan-tich-thiet-ke-he-thong-1
Bai tap-mon-phan-tich-thiet-ke-he-thong-1Bai tap-mon-phan-tich-thiet-ke-he-thong-1
Bai tap-mon-phan-tich-thiet-ke-he-thong-1
giang nguyen le
 
Đề thi trắc nghiệm httt kế toán
Đề thi trắc nghiệm httt kế toánĐề thi trắc nghiệm httt kế toán
Đề thi trắc nghiệm httt kế toán
leemindinh
 
Đề thi hệ thống thông tin quản lý
Đề thi hệ thống thông tin quản lýĐề thi hệ thống thông tin quản lý
Đề thi hệ thống thông tin quản lý
dlmonline24h
 
Kiểm tra 1 tiết môn CTDL
Kiểm tra 1 tiết môn CTDLKiểm tra 1 tiết môn CTDL
Kiểm tra 1 tiết môn CTDL
lam04dt
 
Ca u hoi_t_rac_nghiem_tin_hoc_10
Ca u hoi_t_rac_nghiem_tin_hoc_10Ca u hoi_t_rac_nghiem_tin_hoc_10
Ca u hoi_t_rac_nghiem_tin_hoc_10
Hà Nguyễn
 
Bai 1 tong quan ve ctdl&gt
Bai 1   tong quan ve ctdl&gtBai 1   tong quan ve ctdl&gt
Bai 1 tong quan ve ctdl&gt
TrangThu251076
 
Phân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanhPhân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanh
Tuấn Trần Quốc
 
Giáo án tin học 6
Giáo án tin học 6Giáo án tin học 6
Giáo án tin học 6
Vien Luc Van
 
qdoc.tips_huong-dan-su-dung-wekapdf.pdf
qdoc.tips_huong-dan-su-dung-wekapdf.pdfqdoc.tips_huong-dan-su-dung-wekapdf.pdf
qdoc.tips_huong-dan-su-dung-wekapdf.pdf
minhtd9a
 
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG  DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdfCÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG  DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
Man_Ebook
 
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
nataliej4
 
Cau hoi trac nghiem THCB_ 3.pdf
Cau hoi trac nghiem THCB_ 3.pdfCau hoi trac nghiem THCB_ 3.pdf
Cau hoi trac nghiem THCB_ 3.pdf
LMaiNhHong
 
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqwBD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
trantrunghieu200411
 
Lớp 12: Đề KT 1T lần 1
Lớp 12: Đề KT 1T lần 1Lớp 12: Đề KT 1T lần 1
Lớp 12: Đề KT 1T lần 1Heo_Con049
 
Tong hop cau hoi trac nghiem hdh
Tong hop cau hoi trac nghiem hdhTong hop cau hoi trac nghiem hdh
Tong hop cau hoi trac nghiem hdhHoat Thai Van
 
De kiem tra tin hoc 10 lan 1
De kiem tra tin hoc 10 lan 1De kiem tra tin hoc 10 lan 1
De kiem tra tin hoc 10 lan 1Bich Tuyen
 
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thámPhân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Dm -chapter_4_-_classification
Dm  -chapter_4_-_classificationDm  -chapter_4_-_classification
Dm -chapter_4_-_classification
Duy Vọng
 

Similar to Exercises 1 2 (20)

Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
Đề-cương-giua-ki-2-tin-11 (1).docx tin 111111
 
Bai tap-mon-phan-tich-thiet-ke-he-thong-1
Bai tap-mon-phan-tich-thiet-ke-he-thong-1Bai tap-mon-phan-tich-thiet-ke-he-thong-1
Bai tap-mon-phan-tich-thiet-ke-he-thong-1
 
De12
De12De12
De12
 
Đề thi trắc nghiệm httt kế toán
Đề thi trắc nghiệm httt kế toánĐề thi trắc nghiệm httt kế toán
Đề thi trắc nghiệm httt kế toán
 
Đề thi hệ thống thông tin quản lý
Đề thi hệ thống thông tin quản lýĐề thi hệ thống thông tin quản lý
Đề thi hệ thống thông tin quản lý
 
Kiểm tra 1 tiết môn CTDL
Kiểm tra 1 tiết môn CTDLKiểm tra 1 tiết môn CTDL
Kiểm tra 1 tiết môn CTDL
 
Ca u hoi_t_rac_nghiem_tin_hoc_10
Ca u hoi_t_rac_nghiem_tin_hoc_10Ca u hoi_t_rac_nghiem_tin_hoc_10
Ca u hoi_t_rac_nghiem_tin_hoc_10
 
Bai 1 tong quan ve ctdl&gt
Bai 1   tong quan ve ctdl&gtBai 1   tong quan ve ctdl&gt
Bai 1 tong quan ve ctdl&gt
 
Phân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanhPhân tích dữ liệu kinh doanh
Phân tích dữ liệu kinh doanh
 
Giáo án tin học 6
Giáo án tin học 6Giáo án tin học 6
Giáo án tin học 6
 
qdoc.tips_huong-dan-su-dung-wekapdf.pdf
qdoc.tips_huong-dan-su-dung-wekapdf.pdfqdoc.tips_huong-dan-su-dung-wekapdf.pdf
qdoc.tips_huong-dan-su-dung-wekapdf.pdf
 
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG  DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdfCÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG  DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
CÁC BÀI TOÁN KHAI PHÁ DỮ LIỆU VÀ ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆU.pdf
 
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
Hệ thống bài tập THỐNG KÊ ỨNG DỤNG TRONG KINH TẾ
 
Cau hoi trac nghiem THCB_ 3.pdf
Cau hoi trac nghiem THCB_ 3.pdfCau hoi trac nghiem THCB_ 3.pdf
Cau hoi trac nghiem THCB_ 3.pdf
 
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqwBD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
BD_Tin_hoc.pptqewqe2qewqe2qewq2ewq2ewqweqw
 
Lớp 12: Đề KT 1T lần 1
Lớp 12: Đề KT 1T lần 1Lớp 12: Đề KT 1T lần 1
Lớp 12: Đề KT 1T lần 1
 
Tong hop cau hoi trac nghiem hdh
Tong hop cau hoi trac nghiem hdhTong hop cau hoi trac nghiem hdh
Tong hop cau hoi trac nghiem hdh
 
De kiem tra tin hoc 10 lan 1
De kiem tra tin hoc 10 lan 1De kiem tra tin hoc 10 lan 1
De kiem tra tin hoc 10 lan 1
 
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thámPhân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
Phân cụm đa mô hình và ứng dụng trong phân đoạn ảnh viễn thám
 
Dm -chapter_4_-_classification
Dm  -chapter_4_-_classificationDm  -chapter_4_-_classification
Dm -chapter_4_-_classification
 

Recently uploaded

Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
williamminerva131
 
Diễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
Diễn giải Tâm lý - Chiêm tinh Thầy Minh TuệDiễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
Diễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
Little Daisy
 
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
lamluanvan.net Viết thuê luận văn
 
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdfDANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
thanhluan21
 
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦNNHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
lamluanvan.net Viết thuê luận văn
 
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
lamluanvan.net Viết thuê luận văn
 
tiếng việt dành cho sinh viên ngoại ngữ h
tiếng việt dành cho sinh viên ngoại ngữ htiếng việt dành cho sinh viên ngoại ngữ h
tiếng việt dành cho sinh viên ngoại ngữ h
huynhanhthu082007
 
Các bình diện Ngôn ngữ học đối chiếu.pdf
Các bình diện Ngôn ngữ học đối chiếu.pdfCác bình diện Ngôn ngữ học đối chiếu.pdf
Các bình diện Ngôn ngữ học đối chiếu.pdf
linhlevietdav
 
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptxNgon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
linhlevietdav
 
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang ThiềuBiểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
lamluanvan.net Viết thuê luận văn
 
Tóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
Tóm tắt Tư tưởng Hồ Chí MinhhhhhhhhhhhhhTóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
Tóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
nnguyenthao204
 
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
lamluanvan.net Viết thuê luận văn
 
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
Luận Văn Uy Tín
 
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
Man_Ebook
 
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
Nguyen Thanh Tu Collection
 
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdfCD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
Nguyntrnhnganh
 
Bài 4. Khảo sát mạch dao động điện từ.doc
Bài 4. Khảo sát mạch dao động điện từ.docBài 4. Khảo sát mạch dao động điện từ.doc
Bài 4. Khảo sát mạch dao động điện từ.doc
phamvanchinhlqd
 
Bài tập chương 5. Năng lượng phản ứng.docx
Bài tập chương 5. Năng lượng phản ứng.docxBài tập chương 5. Năng lượng phản ứng.docx
Bài tập chương 5. Năng lượng phản ứng.docx
gorse871
 
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
HngNguyn2390
 
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
Nguyen Thanh Tu Collection
 

Recently uploaded (20)

Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
Atomic Habits - Thay Đổi Tí Hon, Hiệu Quả Bất Ngờ - James Clear & L...
 
Diễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
Diễn giải Tâm lý - Chiêm tinh Thầy Minh TuệDiễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
Diễn giải Tâm lý - Chiêm tinh Thầy Minh Tuệ
 
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
CHỮ “TRÍ” THEO TƯ TƯỞNG NHO GIÁO VÀ Ý NGHĨA TRONG ĐỔI MỚI GIAÓ DỤC Ở VIỆT NAM...
 
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdfDANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
DANH SÁCH XÉT TUYỂN SỚM_NĂM 2023_học ba DPY.pdf
 
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦNNHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
NHO GIÁO VÀ ẢNH HƯỞNG ĐẾN ĐỜI SỐNG TINH THẦN
 
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
GƯƠNG ĐIỂN HÌNH NGƯỜI TỐT - VIỆC TỐT DƯƠNG THU NGA - NỮ KỸ THUẬT VIÊN PHỤC HỒ...
 
tiếng việt dành cho sinh viên ngoại ngữ h
tiếng việt dành cho sinh viên ngoại ngữ htiếng việt dành cho sinh viên ngoại ngữ h
tiếng việt dành cho sinh viên ngoại ngữ h
 
Các bình diện Ngôn ngữ học đối chiếu.pdf
Các bình diện Ngôn ngữ học đối chiếu.pdfCác bình diện Ngôn ngữ học đối chiếu.pdf
Các bình diện Ngôn ngữ học đối chiếu.pdf
 
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptxNgon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
Ngon_ngu_hoc_doi_chieu Các phạm trù cơ bản.pptx
 
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang ThiềuBiểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
Biểu tượng trăng và bầu trời trong tác phẩm của Nguyễn Quang Thiều
 
Tóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
Tóm tắt Tư tưởng Hồ Chí MinhhhhhhhhhhhhhTóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
Tóm tắt Tư tưởng Hồ Chí Minhhhhhhhhhhhhh
 
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
CHIẾN LƯỢC DẠY TIẾNG ANH THEO CHƯƠNG TRÌNH GD 2018 CHO HỌC SINH TRUNG BÌNH YẾ...
 
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
khoaluan_Chính Sách Tiền Lương Tại Công Ty Cổ Phần Đầu Tư Hải Đường, Tỉnh Nam...
 
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
Hành vi tình dục không an toàn và các yếu tố liên quan trong nhóm nam quan hệ...
 
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
BÀI TẬP DẠY THÊM HÓA HỌC LỚP 12 - CẢ NĂM - THEO FORM THI MỚI BGD 2025 (DÙNG C...
 
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdfCD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
CD6_DAI_CUONG_KIMLOAI_12CB218LTTTHU5.pdf
 
Bài 4. Khảo sát mạch dao động điện từ.doc
Bài 4. Khảo sát mạch dao động điện từ.docBài 4. Khảo sát mạch dao động điện từ.doc
Bài 4. Khảo sát mạch dao động điện từ.doc
 
Bài tập chương 5. Năng lượng phản ứng.docx
Bài tập chương 5. Năng lượng phản ứng.docxBài tập chương 5. Năng lượng phản ứng.docx
Bài tập chương 5. Năng lượng phản ứng.docx
 
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
thuvienhoclieu.com-De-thi-thu-TN-THPT-2024-Tieng-Anh-phat-trien-tu-de-minh-ho...
 
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
TỔNG HỢP 135 CÂU HỎI DI TRUYỀN PHÂN TỬ LUYỆN THI HỌC SINH GIỎI THPT MÔN SINH ...
 

Exercises 1 2

  • 1. Course: Data Mining Exercises Chapter 1 and Chapter 2 Multi-choice questions: 1. Trường hợp nào sau đây không phải là một thí dụ về khai phá dữ liệu. A. Khám phá một số tên nào đó nổi bật hơn những tên khác trong sổ điện thoại điện tử. B. Gom nhóm những tài liệu tương tự được trả về bởi một search engine dựa vào ngữ cảnh của tài liệu C. Truy vấn một search engine để biết thông tin về “Amazon”. D. Dự báo những trường hợp trốn thuế trong tương lai căn cứ vào thông tin thuế quá khứ. 2. Khai phá dữ liệu vận dụng những kỹ thuật từ các lãnh vực nào sau đây: A. nhận dạng và xác xuất. B. thiết kế thử nghiệm và thống kê C. học máy, trí tuệ nhân tạo, nhận dạng và xác xuất. D. mạch điện và đồ họa máy tính. 3. (Đúng/sai) Khai phá dữ liệu không thể đem lại những thông tin hỗ trợ các nhà quản lý ra quyết định. 4. Công tác nào sau đây không phải là một công tác khai phá dữ liệu A. gom cụm dữ liệu B. khám phá luật kết hợp C. phân lớp dữ liệu D. truy vấn dữ liệu (từ một cơ sở dữ liệu tác nghiệp) 5. Số đo về độ đáng quan tâm (interestingness) của mẫu thức khai phá được từ dữ liệu được dùng trong giai đoạn nào của quá trình khai phá dữ liệu: A. Tích hợp dữ liệu B. Biến đổi dữ liệu C. Khai phá dữ liệu D. Đánh giá kết quả khai phá 6. (Đúng/sai) Kỹ thuật lập chỉ mục (indexing technique) không phải là một yếu tố quan trọng khi hệ thống khai phá dữ liệu ghép chặt với cơ sở dữ liệu hoặc kho dữ liệu. 7. Các tài liệu văn bản (text document) thuộc loại tri thức nào sau đây: A. có cấu trúc B. phi cấu trúc C. bán cấu trúc D. cả ba câu trên đều sai 8. Dữ liệu trong một quan hệ của cơ sở dữ liệu quan hệ thuộc loại tri thức nào sau đây: A. có cấu trúc B. phi cấu trúc
  • 2. C. bán cấu trúc D. cả ba câu trên đều sai 9. Thuật ngữ tiếng Anh nào sau đây liên quan đến tính thích nghi của một giải thuật khai phá dữ liệu theo qui mô dữ liệu: A. effectiveness B. consistency C. scalability D. adaptivity 10. Trong khai phá dữ liệu, tri thức nền (background knowledge), tức tri thức miền ứng dụng có vai trò A. hướng dẫn quá trình khai phá tri thức B. giúp đánh giá các mẫu thức tìm được C. giúp mô tả tóm tắt dữ liệu D. cả A và B đều đúng 11. Nếu chiều cao của một người được đo bằng cm, thì đó là loại dữ liệu gì. A. dữ liệu phân loại (categorical data) B. dữ liệu số (numerical data) C. dữ liệu phi số D. cả ba câu trên đều sai 12. Huy chương đồng, vàng, bạc được trao ở thi đấu Olympic thì thuộc loại dữ liệu gì. A. dữ liệu phân loại (categorical data) B. dữ liệu số (numerical data) C. dữ liệu liên tục D. cả ba câu trên đều sai 13. Chất lượng dữ liệu bao gồm các tính chất: tính chính xác, tính hiện hành, tính đầy đủ và _______________. 14. Nếu giá trị trung bình của dữ liệu lớn hơn giá trị số trung vị (mean), thì đó là dấu hiệu chỉ dữ liệu thuộc loại: A. rời rạc B. liên tục C. lệch sang phải (positively skewed) D. lệch sang trái (negatively skewed) 15. (Đúng/sai) Một giải thuật khai phá dữ liệu thường bao gồm trong nó một phương pháp tìm kiếm và tối ưu hóa. 16. Tính độ lệch chuẩn của các số 23, 25, 30. 17. (Đúng/sai) Nhiễu thì có ích và đáng quan tâm. 18. (Đúng/sai) Những điểm ngoài biên (outlier) thì có ích và đáng quan tâm. 19. (Đúng/sai) Nhiễu có thể là những điểm ngoại biên. 20. (Đúng/sai) Nhiễu thường là điểm ngoại biên. 21. (Đúng/sai) Nhiễu có thể làm cho một giá trị thông thường trở thành một giá trị khác thường và ngược lại.
  • 3. 22. (Đúng/sai) Các điểm tứ phân vị (quartile) là các độ đo về xu hướng chính của dữ liệu. 23. (Đúng/sai) Số trung bình, số trung vị là các độ đo về xu hướng chính của dữ liệu. 24. (Đúng/sai) Phương sai (variance) độ đo về sự phân tán của dữ liệu. 25. (Đúng/sai) Ta có thể dùng các độ đo về sự phân tán để nhận dạng nhiễu hoặc điểm ngoại biên. 26. Thuật ngữ nào sau đây chỉ hiệu số giữa trị tứ phân vị thứ ba và trị tứ phân vị thứ nhất: A. interrange B. midrange C. interquartile range D. mode 27. Khối dữ liệu (data cube) là thuật ngữ dùng trong ngữ cảnh: A. cơ sở dữ liệu B. các tập tin phẳng C. kho dữ liệu D. cơ sở tri thức 28. Giải pháp nào sau đây không phải là kỹ thuật giảm thiểu nhiễu A. binning B. hồi qui C. gom cụm D. dùng giao diện thân thiện với người dùng 29. Tích hợp lược đồ (schema integration) diễn ra trong giai đoạn: A. làm sạch dữ liệu B. biến đổi dữ liệu C. tích hợp dữ liệu D. trực quan hóa kết quả khai phá dữ liệu 30. Phân tích mối tương quan (corelation analysis) giữa hai thuộc tính, là một kỹ thuật thống kê có thể được dùng khi: A. làm sạch dữ liệu B. nhận diện sự dư thừa dữ liệu C. giảm thiểu nhiễu D. giải quyết vấn đề dữ liệu bị thiếu 31. Làm trơn dữ liệu (smoothing) là một kỹ thuật dùng để _______________ 32. Hai kỹ thuật thu giảm dữ liệu là gộp dữ liệu (data aggregation) và thu giảm số chiều khác nhau như thế nào. 33. Giả sử thuộc tính tuổi có các giá trị sau đây: 13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70. a. Số trung vị của dãy giá trị trên là gì? b. Mode của dãy giá trị trên là gì? c. Midrange của dãy giá trị trên là gì? d. Dùng chuẩn hóa min-max để biến đổi giá trị 35 về tầm trị [0, 1]
  • 4. e. Dùng chuẩn hóa z-score để biến đổi giá trị 35, giả sử độ lệch chuẩn của dãy giá trị chuỗi là 12.94. f. Dùng chuẩn hóa decimal scaling biến đổi giá trị 35. g. Thực hiện kỹ thuật làm trơn binning by means tập dữ liệu nêu trên với kích thước của bin là 3. 34. Kỹ thuật nào sau đây không phải là kỹ thuật thu giảm số chiều. A. Biến đổi Fourier rời rạc B. Biến đổi wavelet rởi rạc C. Biến đổi phân tích thành phần chính (PCA) D. Hồi quy. 35. (Đúng/sai) Biểu đồ tần số (histogram) là một phương pháp để thu giảm lượng số (numerosity reduction) dữ liệu. 36. Điểm ngắt (cut point) là thuật ngữ dùng trong ngữ cảnh: A. thu giảm số chiều B. rời rạc hóa dữ liệu số C. thu giảm lượng số dữ liệu D. chọn một số thuộc tính 37. Gom cụm dữ liệu là một kỹ thuật có thể dùng trong công việc nào sau đây: A. thu giảm lượng số (numerosity reduction) dữ liệu B. nhận diện các điểm ngoại biên C. rời rạc hóa dữ liệu D. tất cả các câu trên đều đúng 38. Chi-square là một kỹ thuật phân tích tương quan giữa hai thuộc tính là A. dữ liệu phân loại (categorical data) B. dữ liệu số (numerical data) C. dữ liệu liên tục D. cả ba câu trên đều sai 39. (Đúng/sai) Hồi quy là một phương pháp để thu giảm lượng số (numerosity reduction) dữ liệu. 40. Potter’s Wheel là tên của công cụ thương mại dùng để: A. làm sạch dữ liệu B. tích hợp dữ liệu C. biến đổi dữ liệu D. khai phá dữ liệu 41. Weka là tên của công cụ phần mềm dùng để: A. làm sạch dữ liệu B. tích hợp dữ liệu C. biến đổi dữ liệu D. khai phá dữ liệu 42. Độ lợi thông tin (information gain) được dùng trong ngữ cảnh nào sau đây: A. thu giảm số chiều
  • 5. B. chọn một số thuộc tính từ một tập thuộc tính (attribute subset selection) C. thu giảm lượng số dữ liệu D. gộp khối dữ liệu (data cube aggregation) 43. Các điểm ngoại biên (outlier) có thể phát hiện được nhờ phương pháp nào sau đây: A. Dùng trị trung bình và độ lệch chuẩn B. Dùng giá trị IQR (interquartile range), Q1 và Q3 C. Dùng biểu đồ tần số. D. Cả ba phương pháp trên 44. CRISP-DM là tên A. một ngôn ngữ truy vấn chuyên dụng để khai phá dữ liệu. B. một phần mềm chuyên dụng để khai phá dữ liệu. C. một quá trình chuẩn để khai phá dữ liệu. D. cả ba câu trên đều sai.
  • 6. B. chọn một số thuộc tính từ một tập thuộc tính (attribute subset selection) C. thu giảm lượng số dữ liệu D. gộp khối dữ liệu (data cube aggregation) 43. Các điểm ngoại biên (outlier) có thể phát hiện được nhờ phương pháp nào sau đây: A. Dùng trị trung bình và độ lệch chuẩn B. Dùng giá trị IQR (interquartile range), Q1 và Q3 C. Dùng biểu đồ tần số. D. Cả ba phương pháp trên 44. CRISP-DM là tên A. một ngôn ngữ truy vấn chuyên dụng để khai phá dữ liệu. B. một phần mềm chuyên dụng để khai phá dữ liệu. C. một quá trình chuẩn để khai phá dữ liệu. D. cả ba câu trên đều sai.