SlideShare a Scribd company logo
ĐỒ ÁN TỐT NGHIỆP
NGHIÊN CỨU LUẬT KẾT HỢP ÁP DỤNG
XÂY DỰNG MẠNG CHIA SẺ ĐỒ VẬT
MIGI
GV Hướng dẫn: ThS.Hoàng Anh Việt
SV Thực hiện: Lê Minh Nghĩa
Lớp : Công Nghệ Phần Mềm K51
NỘI DUNG TRÌNH BÀY
1. Đặt vấn đề
2. Các kiến thức liên quan
3. Xây dựng giải pháp
4. Thử nghiệm và đánh giá
5. Kết luận và hướng phát triển
2
1. Đặt vấn đề
3
44
55
Thống kê
6
90% có thể tái chế
Nhưng chỉ thực
hiện được 15%
Giải pháp
77
Tôi có một
cái áo cho
đi
Tôi cần một cái
áo!
Một môi trường chia sẻ
Cảm ơn!
Vấn đề phát sinh
8
Ai là người thực
sự cần???
Khai phá dữ liệu
để tìm các tri
thức hữu ích
Các tri thức có thể khai phá được
• Tìm ra thói quen chia sẻ đồ vật
Vd: cho điện thoại cũ => cho kèm bộ sạc
điện
• Phân tích sở thích người dùng
• Điều tra thị trường
9
Mục tiêu đồ án
• Xây dựng mạng xã hội chia sẻ đồ vật Migi
• Nghiên cứu lý thuyết Datamining, trong đó
tập trung về luật kết hợp
• Đề xuất mô hình gợi ý dựa trên luật kết hợp
• Thử nghiệm tìm luật kết hợp trên bộ dữ liệu
Adventurework
10
2.Tổng quan về luật kết hợp
11
Sữa, bánh
mỳ, ,ngũ cốc
Sữa, bánh
mỳ, đường, tr
ứng
Sữa, bánh
mỳ, bơ
Đường, trứng
Khánh hàng 2
Khánh hàng 3
Khánh hàng 4
Khánh hàng 5
Những mặt
hàng nào
thường được
đặt mua cùng
nhau?
2.1. Luật kết hợp là gì?
• Được sử dụng để tìm các mấy quan hệ giữa
các đối tượng trong một giao dịch.
Vd:
- Mua sữa thì thường mua bánh mỳ
- Mua bánh mỳ thì thường mua bơ
- Người mua máy tính thì thường mua phần tử
virus
12
Các khái niệm cơ bản
13
Giao dịch Các Item
T100 Sữa, bánh mỳ, ngũ cốc
T200 Sữa, bánh mỳ, đường, trứng
T300 Sữa, bánh mỳ, bơ
T400 Đường trứng
14
Items Số lần xuất hiện
Trứng 2
Sữa, 3
Bánh mỳ 3
Ngũ cốc 1
Đường 2
Bơ 1
Các Item
Độ hỗ trợ- support count
Cơ sở dữ liệu giao dịch
Độ hỗ trợ tối thiểu: min_sup=2
Tập 2 mục
{Sữa, Bánh mỳ} SupportCount=3>min_sup
Số lần xuất hiện
Tập mục
thường
xuyên
Luật: Sữa  Bánh mỳ Độ tin cậy- Confidence???
Độ tin cậy của luật kết hợp
• Luật A=> B chấp nhận nếu:
confidence (A=>B) > min_confidene
Vd:
15
Min_Confidence=90% Luật chấp nhận được
Khó khăn của thuật toán
• Độ phức tạp và thời gian tính toán.
Vd: với tập mục thường xuyên có 100 phần tử.
Thì tổng số tập mục con là tập mục thường
xuyên sẽ là:
• Tính tin cậy của luật kết hợp sinh ra.
16
2.3. Các thuật toán cơ bản
• Thuật toán Apriori
• Thuật toán PHP- Perfect Hashing and Pruning
• Thuật toán FP Tree
17
Thuật toán Apriori
• Mục đích: Tìm kiếm các tập múc thường xuyên
• Các bước:
B1:Sinh các tập mục ứng viên K phần tử từ các
tập mục K-1
B2:Loại bỏ các tập mục ứng viên nếu tồn tại bất
kỳ một tập hợp con nào không phải là tập mục
thường xuyên
B3:Kết thúc khi không còn sinh được một tập
mục ứng viên nào là tập mục thường xuyên
18
Mô tả thuật toán
19
20
Trans Items
T100 I1, I2, I5
T200 I2,I4
T300 I2,I3
T400 I1,I2,I4
T500 I1,I3
T600 I2,I3
T700 I1,I3
T800 I1,I2,I3,I5
T900 I1,I2,I3
Item Sup.Count
I1 6
I2 7
I3 6
I4 2
I5 2
C1
Item Sup.Count
I1 6
I2 7
I3 6
I4 2
I5 I2
MinSup=2
L1
ItemSet
{I1,I2}
{I1,I3}
{I1,I4}
{I1,I5}
{I2,I3}
{I2,I4}
{I2,I5}
{I3,I4}
{I3,I5}
{I4,I5}
C2
ItemSet Sup.Count
{I1,I2} 4
{I1,I3} 4
{I1,I4} 1
{I1,I5} 2
{I2,I3} 4
{I2,I4} 2
{I2,I5} 2
{I3,I4} 0
{I3,I5} 1
{I4,I5} 0
C2
ItemSet Sup.Count
{I1,I2} 4
{I1,I3} 4
{I1,I5} 2
{I2,I3} 4
{I2,I4} 2
{I2,I5} 2
L2
L1 x L1
Cơ sở dữ liệu giao dịch
21
ItemSet Sup.Count
{I1,I2} 4
{I1,I3} 4
{I1,I5} 2
{I2,I3} 4
{I2,I4} 2
{I2,I5} 2
L2
ItemSet
{I1,I2,I3}
{I1,I2,I5}
{I1,I3,I5}
{I2,I3,I4}
{I2,I3,I5}
{I2,I4,I5}
C3 SubSet
{I1,I2}
{I1,I3}
{I2,I3}
Thuộc L2
SubSet
{I1,I3}
{I1,I5}
{I3,I5} Không thuộc L2
L2 x L2
ItemSet
{I1,I2,I3}
{I1,I2,I5}
ItemSet Sup.Count
{I1,I2,I3} 2
{I1,I2,I5} 2
C3
C3
ItemSet Sup.Count
{I1,I2,I3} 2
{I1,I2,I5} 2
L3
2.3.2.Thuật toán PHP
• Cải tiến từ thuật toán Apriori:
1. Sử dụng cấu trúc bảng băm:
- Lưu trữ độ hỗ trợ của các tập mục 2 phần tử
22
23
Trans Items
T100 I1, I2, I5
T200 I2,I4
T300 I2,I3
T400 I1,I2,I4
T500 I1,I3
T600 I2,I3
T700 I1,I3
T800 I1,I2,I3,I5
T900 I1,I2,I3
Item Sup.Count
I1 6
I2 7
I3 6
I4 2
I5 I2
I1I2 I1I5 I2I4 I2I3 I1I4 I1I3 I1I5 I3I5
4 2 2 4 1 4 2 1
Bảng băm cho tập 2 phần tử
L1
Quét DB
Cơ sở dữ liệu giao dịch
Thuật toán PHP
2. Loại bỏ các giao dịch
- Loại bỏ các giao dịch mà không có đủ k+1
tập k-mục
- Loại bỏ những mục nào có số lần xuất hiện
trong tập Lk nhỏ hơn k lần.
24
2525
Trans Items
T100 I1, I2, I5
T200 I2,I4
T300 I2,I3
T400 I1,I2,I4
T500 I1,I3
T600 I2,I3
T700 I1,I3
T800 I1,I2,I3,I5
T900 I1,I2,I3
Item Sup.Count
I1 6
I2 7
I3 6
I4 2
I5 2
C1
Item Sup.Count
I1 6
I2 7
I3 6
I4 2
I5 I2
MinSup=2
L1
ItemSet
{I1,I2}
{I1,I3}
{I1,I4}
{I1,I5}
{I2,I3}
{I2,I4}
{I2,I5}
{I3,I4}
{I3,I5}
{I4,I5}
C2
ItemSet Sup.Count
{I1,I2} 4
{I1,I3} 4
{I1,I4} 1
{I1,I5} 2
{I2,I3} 4
{I2,I4} 2
{I2,I5} 2
{I3,I4} 0
{I3,I5} 1
{I4,I5} 0
C2
ItemSet Sup.Count
{I1,I2} 4
{I1,I3} 4
{I1,I5} 2
{I2,I3} 4
{I2,I4} 2
{I2,I5} 2
L2
L1 x L1
Cơ sở dữ liệu giao dịch
Trans Items
T800 I1,I2,I3,I5
Đánh giá trên bộ dữ liệu thử
K=2 K=3 K=4 K=5 K-6 K=7
Transaction 20019 4503 1017 583 237 34
0
5000
10000
15000
20000
25000
Sốgiáodịch
Transaction
26
2.3.3.Thuật toán FP Tree
• Mục đích:
- Biểu diễn các giao dịch bằng cấu trúc dữ liệu
cây.
- Không sinh các ứng viên mà tìm kiếm tập mục
ngay trên cây.
• Các bước của thuật toán:
B1: Xây dựng cây biểu diễn các giao dịch
B2: Tìm kiếm đệ quy trên cây để sinh ra các luật
kết hợp
27
Mô tả thuật toán
28
29
Item Sup.Count
I2 7
I1 6
I3 6
I4 2
I5 2
NullTrans Items
T100 I1, I2, I5
T200 I2,I4
T300 I2,I3
T400 I1,I2,I4
T500 I1,I3
T600 I2,I3
T700 I1,I3
T800 I1,I2,I3,I5
T900 I1,I2,I3
T100:I2,I1,I5
I2:1
I1:1
I5:1
T200:I2,I4
I4:1
I2:2
Root Node
30
31
I5 {I2,I1:1},{I2,I1,I3:1}
Item Sup.Count
I2 2
I1 2
I3 1
Item Sup.Count
I2 2
I1 2
Sufffix Conditional Pattern Base
Min Sup=2
{I2,I1:2}
{}
I2:2
I1:2
ItemSet Conditional Pattern Base
I5,I1 {I2:2}
I5,I2 {}
Tập mục thường xuyên 2 phần tử
Prefix
I5I1
I5I1
{}
I2:2
Item Sup.Count
I2 2
ItemSet Conditional Pattern Base
I5,I1,I2 {}
Tập mục thường xuyên 3 phần tử
Kết quả thu được
32
So sánh hiệu năng ba thuật toán
33
Han, J., Pei, J., Yin, J., (2000), Mining Frequent Patterns without Candidate
Generation, Proceedings of the 2000 ACM SIGMOD international conference on
Management of data, pp. 1-12
3.1. Kiến trúc tổng thể của hệ thống
34
Web UI
ADO.NET Entity
Recommender
Image server
Caching Server
Business Layer
Google Map
Facebook Database- SQL Server 2008
Data Analysis
S
e
r
v
i
c
e
s
Mobile App
Mô tả các tầng
• Tầng WebUI: Sử dụng các công
nghệ:ASP.NET MVC, JQuery, Google Map
• Tầng Business: Tầng này chưa toàn bộ
nghiệp vụ của hệ thống.
• Tầng Data: Sử dụng SQL Server
2008, ADO.NET Entity
• Các Service: Sử dụng WCF xây dựng các
service mở
35
Mô tả các tầng
• Data Analysis: phân tích dữ liệu nhằm tìm kiếm
các tri thức hữu ích.
• Recommender: Dựa trên các tri thức tích lũy
gợi ý cho người dùng
• Image Server: Quản lý việc hiện thị ảnh cho site
• Caching Server: Để tăng tốc độ của web site
• Ứng dụng facebook: Truy cấp hệ thống từ
Facebook
• Ứng dụng Mobile: Cho phép truy cấp hệ thống
mọi nơi
36
3.2 Thiết kế cơ sở dữ liệu
37
3.3.Cơ sở dữ liệu cho việc phân tích
• Dữ liệu sau khi được tiền xử lý chuyển
thành:
38
3.4. Xây dựng module gợi ý từ các
luật kết hợp
Module gợi ý được xây dưng dựa trên:
• Các luật kết hợp
• Dữ liệu về địa điểm người dùng (đã được khai
báo)
• Dữ liệu về chủng loại sản phẩm
39
3.5. Bộ dữ liệu thử nghiệm
• Sử dụng bộ dữ liệu bán xe đạp
Adventurework do Microsoft cung cấp
• Các đặc điểm chính:
Tất cả 266 sản phẩm được giao dịch
Có 21209 giao dịch có từ hai sản phẩm được mua
Trung bình mỗi giao dịch có 5 sản phẩm
Giao dịch từ 2 cho tới 21 sản phẩm chiếm: 94.3% số
giao dịch
40
Một số luật khai thác được
{Mountain-100 Black, 44}=>{Half-Finger Gloves, M}
{Mountain-100 Silver, 42}=>{ Half-Finger Gloves, M }
{ Mountain-100 Silver, 42}=>{ LL Road Handlebars }
{ Mountain-100 Silver, 42, Half-Finger Gloves, M }=>{
Men's Sports Shorts, S}
{ Mountain-100 Silver, 42 }=>{ Men's Sports
Shorts, M, Racing Socks, M}
{ Mountain-500 Black, 48 , LL Mountain Pedal }=>{ ML
Mountain Front Wheel }
41
4. Kết luận và hướng phát triển
42
4.1 Các kết quả đạt được
Về nghiên cứu:
- Các kiến thức tổng quát về Data Mining
- Lý thuyết về luật kết hợp
- Các thuật toán cơ bản để khai phá luật kết hợp
Về sản phẩm: Góp phần xây dựng mạng chia sẻ đồ vật với các tính
năng chính:
- Cho phép người dùng đưa thông tin chia sẻ đồ vật
- Gợi ý người dùng khi chia sẻ đồ vật
- Cho phép các tổ chức khởi tạo các sự kiện từ thiện
Các đóng góp:
- Đề xuất được mô hình phân tích dữ liệu dựa trên luật kết hợp
43
4.2 Hướng phát triển
• Hoàn thiện các tính năng chia sẻ
• Xây dựng hệ thống có khả năng chịu tải cao
• Tăng cường tính bảo mật
• Hoàn thiện quy trình trích rút và chuẩn hóa dữ
liệu
• Áp dụng các mô hình xử lý dữ liệu phân tán
• Nghiên cứu luật kết hợp trên môi trường tính
toán song song
44
Tài liệu tham khảo
• Han, J., Kamber, M., Data Mining: Concepts and
Techniques, The Morgan
Kaufmann Series in Data Management Systems
• Zaki, M.J., (2000), Generating Non-Redundant Association
Rules, Proceedings of the sixth ACM SIGKDD international
conference on Knowledge discovery and data mining, pp.
34 – 43.
• Website: http://www.msdn.com
• Website: http://www.jquery.com
• Website: http://www.asp.net/mvc
• Website: http://www.facebook.com/developer
• Website:http://code.google.com
45
EM XIN CHÂN THÀNH CẢM ƠN!
46

More Related Content

What's hot

PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdfPHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
Man_Ebook
 
Bài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tinBài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tin
Tran Tien
 
Bài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệuBài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệu
Lê Minh
 
lý thuyết cơ sở dữ liệu phân tán
lý thuyết cơ sở dữ liệu phân tánlý thuyết cơ sở dữ liệu phân tán
lý thuyết cơ sở dữ liệu phân tán
Ngo Trung
 
04. de cuong bai giang cong nghe web
04. de cuong bai giang cong nghe web04. de cuong bai giang cong nghe web
04. de cuong bai giang cong nghe web
Đinh Luận
 
Slide bai giang_an_toan_va_bao_mat_thong_tin
Slide bai giang_an_toan_va_bao_mat_thong_tinSlide bai giang_an_toan_va_bao_mat_thong_tin
Slide bai giang_an_toan_va_bao_mat_thong_tin
Lang Codon
 
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNGPHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
Thùy Linh
 
Chuong 3- CSDL phân tán
Chuong 3- CSDL phân tánChuong 3- CSDL phân tán
Chuong 3- CSDL phân tán
duysu
 

What's hot (20)

PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdfPHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
PHÂN CỤM DỮ LIỆU TRONG DATAMING.pdf
 
Bài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tinBài giảng bảo mật hệ thống thông tin
Bài giảng bảo mật hệ thống thông tin
 
Bài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệuBài tập thiết kế cơ sở dữ liệu
Bài tập thiết kế cơ sở dữ liệu
 
Phương pháp tham lam
Phương pháp tham lamPhương pháp tham lam
Phương pháp tham lam
 
lý thuyết cơ sở dữ liệu phân tán
lý thuyết cơ sở dữ liệu phân tánlý thuyết cơ sở dữ liệu phân tán
lý thuyết cơ sở dữ liệu phân tán
 
04. de cuong bai giang cong nghe web
04. de cuong bai giang cong nghe web04. de cuong bai giang cong nghe web
04. de cuong bai giang cong nghe web
 
Slide bai giang_an_toan_va_bao_mat_thong_tin
Slide bai giang_an_toan_va_bao_mat_thong_tinSlide bai giang_an_toan_va_bao_mat_thong_tin
Slide bai giang_an_toan_va_bao_mat_thong_tin
 
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNGPHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
PHÂN TÍCH THIẾT KẾ HỆ THỐNG BÁN HÀNG QUA MẠNG
 
Thuật toán K mean
Thuật toán K meanThuật toán K mean
Thuật toán K mean
 
Phân tích thiết kế hệ thống thông tin quản lý bán hàng của công ty cổ phần qu...
Phân tích thiết kế hệ thống thông tin quản lý bán hàng của công ty cổ phần qu...Phân tích thiết kế hệ thống thông tin quản lý bán hàng của công ty cổ phần qu...
Phân tích thiết kế hệ thống thông tin quản lý bán hàng của công ty cổ phần qu...
 
Báo Cáo Bài Tập Lớn Môn Lập Trình Web Xây Dựng Website Tin Tức
Báo Cáo Bài Tập Lớn Môn Lập Trình Web Xây Dựng Website Tin TứcBáo Cáo Bài Tập Lớn Môn Lập Trình Web Xây Dựng Website Tin Tức
Báo Cáo Bài Tập Lớn Môn Lập Trình Web Xây Dựng Website Tin Tức
 
Bảo mật mạng máy tính và tường lửa
Bảo mật mạng máy tính và tường lửaBảo mật mạng máy tính và tường lửa
Bảo mật mạng máy tính và tường lửa
 
Hệ thống quản lý bán hàng tại siêu thị
Hệ thống quản lý bán hàng tại siêu thịHệ thống quản lý bán hàng tại siêu thị
Hệ thống quản lý bán hàng tại siêu thị
 
Hệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng onlineHệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng online
 
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thịđồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
đồ áN phân tích thiết kế hệ thống quản lý bán hàng siêu thị
 
Báo cáo Quản lý dự án phần mềm PTIT
Báo cáo Quản lý dự án phần mềm PTITBáo cáo Quản lý dự án phần mềm PTIT
Báo cáo Quản lý dự án phần mềm PTIT
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
 
Chuong 3- CSDL phân tán
Chuong 3- CSDL phân tánChuong 3- CSDL phân tán
Chuong 3- CSDL phân tán
 
Cơ sở dữ liệu nâng cao
Cơ sở dữ liệu nâng caoCơ sở dữ liệu nâng cao
Cơ sở dữ liệu nâng cao
 
Bài 6: Kiến thức cơ sở về điều khiển truy cập - Giáo trình FPT
Bài 6: Kiến thức cơ sở về điều khiển truy cập - Giáo trình FPTBài 6: Kiến thức cơ sở về điều khiển truy cập - Giáo trình FPT
Bài 6: Kiến thức cơ sở về điều khiển truy cập - Giáo trình FPT
 

Viewers also liked

Viewers also liked (20)

itlchn 20 - Kien truc he thong chung khoan - Phan 1
itlchn 20 - Kien truc he thong chung khoan - Phan 1itlchn 20 - Kien truc he thong chung khoan - Phan 1
itlchn 20 - Kien truc he thong chung khoan - Phan 1
 
ITEC - Qua trinh phat trien he thong BigData
ITEC - Qua trinh phat trien he thong BigDataITEC - Qua trinh phat trien he thong BigData
ITEC - Qua trinh phat trien he thong BigData
 
itlchn 20 - Kien truc he thong chung khoan - Phan 2
itlchn 20 - Kien truc he thong chung khoan - Phan 2itlchn 20 - Kien truc he thong chung khoan - Phan 2
itlchn 20 - Kien truc he thong chung khoan - Phan 2
 
Domain Driven Design và Event Driven Architecture
Domain Driven Design và Event Driven Architecture Domain Driven Design và Event Driven Architecture
Domain Driven Design và Event Driven Architecture
 
ITLCHN 18 - Automation & DevOps - Automic
ITLCHN 18 -  Automation & DevOps - AutomicITLCHN 18 -  Automation & DevOps - Automic
ITLCHN 18 - Automation & DevOps - Automic
 
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
ITLC - Hanoi - NodeJS - ArrowJS - 27-11 - 2015
 
Graph ql
Graph qlGraph ql
Graph ql
 
IM Group hợp tác Haravan - slide nền tảng tổng thể haravan
IM Group hợp tác Haravan - slide nền tảng tổng thể haravanIM Group hợp tác Haravan - slide nền tảng tổng thể haravan
IM Group hợp tác Haravan - slide nền tảng tổng thể haravan
 
Building Bizweb Microservices with Docker
Building Bizweb Microservices with DockerBuilding Bizweb Microservices with Docker
Building Bizweb Microservices with Docker
 
Bizweb Microservices Architecture
Bizweb Microservices ArchitectureBizweb Microservices Architecture
Bizweb Microservices Architecture
 
ITLC HN 14 - Bizweb Microservices Architecture
ITLC HN 14  - Bizweb Microservices ArchitectureITLC HN 14  - Bizweb Microservices Architecture
ITLC HN 14 - Bizweb Microservices Architecture
 
Distributed Transaction in Microservice
Distributed Transaction in MicroserviceDistributed Transaction in Microservice
Distributed Transaction in Microservice
 
Tiki.vn - How we scale as a tech startup
Tiki.vn - How we scale as a tech startupTiki.vn - How we scale as a tech startup
Tiki.vn - How we scale as a tech startup
 
Ecom trend
Ecom trendEcom trend
Ecom trend
 
Niels Leenheer - Weird browsers - code.talks 2015
Niels Leenheer - Weird browsers - code.talks 2015Niels Leenheer - Weird browsers - code.talks 2015
Niels Leenheer - Weird browsers - code.talks 2015
 
Dennis Benkert & Matthias Lübken - Patterns in a containerized world? - code....
Dennis Benkert & Matthias Lübken - Patterns in a containerized world? - code....Dennis Benkert & Matthias Lübken - Patterns in a containerized world? - code....
Dennis Benkert & Matthias Lübken - Patterns in a containerized world? - code....
 
ABOUT YOU get on board
ABOUT YOU get on boardABOUT YOU get on board
ABOUT YOU get on board
 
Stefan Richter - Writing simple, readable and robust code: Examples in Java, ...
Stefan Richter - Writing simple, readable and robust code: Examples in Java, ...Stefan Richter - Writing simple, readable and robust code: Examples in Java, ...
Stefan Richter - Writing simple, readable and robust code: Examples in Java, ...
 
google project glass technology
google project glass technologygoogle project glass technology
google project glass technology
 
UX Designer Skills
UX Designer SkillsUX Designer Skills
UX Designer Skills
 

Similar to Nghiên cứu luật kết hợp áp dụng xây dựng mạng chia sẻ đồ vật MiGi

Gan hang cau_hoi_trac_nghiem_6024
Gan hang cau_hoi_trac_nghiem_6024Gan hang cau_hoi_trac_nghiem_6024
Gan hang cau_hoi_trac_nghiem_6024
Hongxuan Nguyen
 
Chuong 1 tổng quan về HTTT kế toán
Chuong 1 tổng quan về HTTT kế toánChuong 1 tổng quan về HTTT kế toán
Chuong 1 tổng quan về HTTT kế toán
dlmonline24h
 
hệ thống thông tin và nghiên cứu marketing
hệ thống thông tin và nghiên cứu marketinghệ thống thông tin và nghiên cứu marketing
hệ thống thông tin và nghiên cứu marketing
xuanduong92
 
2.2-HethongThongtin_Trong_Tochuc.pdf
2.2-HethongThongtin_Trong_Tochuc.pdf2.2-HethongThongtin_Trong_Tochuc.pdf
2.2-HethongThongtin_Trong_Tochuc.pdf
ThoMyNguyn17
 
Infochief - It management skills leaflet
Infochief - It management skills leafletInfochief - It management skills leaflet
Infochief - It management skills leaflet
INFOCHIEF institute
 

Similar to Nghiên cứu luật kết hợp áp dụng xây dựng mạng chia sẻ đồ vật MiGi (20)

GS. TSKH. Hồ Tú Bảo: Khoa học dữ liệu và Khoa học dữ liệu trong kinh doanh
GS. TSKH. Hồ Tú Bảo: Khoa học dữ liệu và Khoa học dữ liệu trong kinh doanhGS. TSKH. Hồ Tú Bảo: Khoa học dữ liệu và Khoa học dữ liệu trong kinh doanh
GS. TSKH. Hồ Tú Bảo: Khoa học dữ liệu và Khoa học dữ liệu trong kinh doanh
 
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTITKHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
KHO DỮ LIỆU VÀ KHAI PHÁ DỮ LIỆU PTIT
 
Đề tài: Quản lý nhập xuất vật tư tại công ty xây dựng Tiền Phong
Đề tài: Quản lý nhập xuất vật tư tại công ty xây dựng Tiền PhongĐề tài: Quản lý nhập xuất vật tư tại công ty xây dựng Tiền Phong
Đề tài: Quản lý nhập xuất vật tư tại công ty xây dựng Tiền Phong
 
Lựa chọn thuộc tính và Khai phá luật kết hợp trên WEKA
Lựa chọn thuộc tính và Khai phá luật kết hợp trên WEKALựa chọn thuộc tính và Khai phá luật kết hợp trên WEKA
Lựa chọn thuộc tính và Khai phá luật kết hợp trên WEKA
 
Unit1_R_Version1.3.pptx
Unit1_R_Version1.3.pptxUnit1_R_Version1.3.pptx
Unit1_R_Version1.3.pptx
 
Gan hang cau_hoi_trac_nghiem_6024
Gan hang cau_hoi_trac_nghiem_6024Gan hang cau_hoi_trac_nghiem_6024
Gan hang cau_hoi_trac_nghiem_6024
 
NHÓM 1010_ĐỒ ÁN LẬP TRÌNH WEB .docx.pptx
NHÓM 1010_ĐỒ ÁN LẬP TRÌNH WEB .docx.pptxNHÓM 1010_ĐỒ ÁN LẬP TRÌNH WEB .docx.pptx
NHÓM 1010_ĐỒ ÁN LẬP TRÌNH WEB .docx.pptx
 
Mo hinh He thong va Mo phong.ppt
Mo hinh He thong va Mo phong.pptMo hinh He thong va Mo phong.ppt
Mo hinh He thong va Mo phong.ppt
 
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
[VFS 2019] Data Strategy for Vietnamese Businesses to Levarage AI
 
Đồ án trang web bán văn phòng phẩm
Đồ án trang web bán văn phòng phẩmĐồ án trang web bán văn phòng phẩm
Đồ án trang web bán văn phòng phẩm
 
Luận văn: Công tác quản lý tài sản cố định tại các công ty, HAY
Luận văn: Công tác quản lý tài sản cố định tại các công ty, HAYLuận văn: Công tác quản lý tài sản cố định tại các công ty, HAY
Luận văn: Công tác quản lý tài sản cố định tại các công ty, HAY
 
2017_11B_Bai1.pdf
2017_11B_Bai1.pdf2017_11B_Bai1.pdf
2017_11B_Bai1.pdf
 
Chương 3: PHÁT TRIỂN MẪU KHÁI NIỆM_Phần 4
Chương 3: PHÁT TRIỂN MẪU KHÁI NIỆM_Phần 4Chương 3: PHÁT TRIỂN MẪU KHÁI NIỆM_Phần 4
Chương 3: PHÁT TRIỂN MẪU KHÁI NIỆM_Phần 4
 
Tổng Quan Về Hệ Thống Thông Tin Kế Toán
Tổng Quan Về Hệ Thống Thông Tin Kế ToánTổng Quan Về Hệ Thống Thông Tin Kế Toán
Tổng Quan Về Hệ Thống Thông Tin Kế Toán
 
HSBD Day hoc theo du an
HSBD Day hoc theo du anHSBD Day hoc theo du an
HSBD Day hoc theo du an
 
Chuong 1 tổng quan về HTTT kế toán
Chuong 1 tổng quan về HTTT kế toánChuong 1 tổng quan về HTTT kế toán
Chuong 1 tổng quan về HTTT kế toán
 
hệ thống thông tin và nghiên cứu marketing
hệ thống thông tin và nghiên cứu marketinghệ thống thông tin và nghiên cứu marketing
hệ thống thông tin và nghiên cứu marketing
 
2.2-HethongThongtin_Trong_Tochuc.pdf
2.2-HethongThongtin_Trong_Tochuc.pdf2.2-HethongThongtin_Trong_Tochuc.pdf
2.2-HethongThongtin_Trong_Tochuc.pdf
 
Bài Giảng Thư Viện Số Và Truy Cập Mở Tài Liệu Lưu Trữ
Bài Giảng Thư Viện Số Và Truy Cập Mở Tài Liệu Lưu Trữ Bài Giảng Thư Viện Số Và Truy Cập Mở Tài Liệu Lưu Trữ
Bài Giảng Thư Viện Số Và Truy Cập Mở Tài Liệu Lưu Trữ
 
Infochief - It management skills leaflet
Infochief - It management skills leafletInfochief - It management skills leaflet
Infochief - It management skills leaflet
 

Recently uploaded

kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsbkjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
hoangphuc12ta6
 
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdfGIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
LngHu10
 

Recently uploaded (18)

GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdfGIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
 
3000 từ thông dụng tiếng anh quốc tế Effortless
3000 từ thông dụng tiếng anh quốc tế Effortless3000 từ thông dụng tiếng anh quốc tế Effortless
3000 từ thông dụng tiếng anh quốc tế Effortless
 
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
20 ĐỀ DỰ ĐOÁN - PHÁT TRIỂN ĐỀ MINH HỌA BGD KỲ THI TỐT NGHIỆP THPT NĂM 2024 MÔ...
 
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
TÀI LIỆU DẠY THÊM HÓA HỌC 12 - SÁCH MỚI (BẢN HS+GV) (FORM BÀI TẬP 2025 CHUNG ...
 
Thực hành lễ tân ngoại giao - công tác NG
Thực hành lễ tân ngoại giao - công tác NGThực hành lễ tân ngoại giao - công tác NG
Thực hành lễ tân ngoại giao - công tác NG
 
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doconluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
onluyen.vn_Ebook 120 đề thi tuyển sinh tiếng anh 10 theo cấu trúc sở hà nội.doc
 
DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdfDS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
DS thi KTHP HK2 (dot 3) nam hoc 2023-2024.pdf
 
Bài thuyết trình môn học Hệ Điều Hành.pptx
Bài thuyết trình môn học Hệ Điều Hành.pptxBài thuyết trình môn học Hệ Điều Hành.pptx
Bài thuyết trình môn học Hệ Điều Hành.pptx
 
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
ĐỀ THI THỬ TUYỂN SINH VÀO LỚP 10 THPT MÔN TOÁN CÁC TỈNH NĂM HỌC 2023-2024 CÓ ...
 
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsbkjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
kjsbgkjbskfkgabksfbgbsfjkvbksfbkbfskbskbkjsb
 
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CÁNH DIỀU ...
 
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
 
slide tuần kinh tế công nghệ phần mềm hust
slide tuần kinh tế công nghệ phần mềm hustslide tuần kinh tế công nghệ phần mềm hust
slide tuần kinh tế công nghệ phần mềm hust
 
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
BÀI TẬP DẠY THÊM TOÁN LỚP 12 SÁCH MỚI THEO FORM THI MỚI BGD 2025 - CHÂN TRỜI ...
 
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
Nghiên cứu cơ chế và động học phản ứng giữa hợp chất Aniline (C6H5NH2) với gố...
 
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdfGIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
GIAO TRINH TRIET HOC MAC - LENIN (Quoc gia).pdf
 
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
 
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
2.THUỐC AN THẦN VÀ THUỐC GÂY NGỦ.pptx
 

Nghiên cứu luật kết hợp áp dụng xây dựng mạng chia sẻ đồ vật MiGi

  • 1. ĐỒ ÁN TỐT NGHIỆP NGHIÊN CỨU LUẬT KẾT HỢP ÁP DỤNG XÂY DỰNG MẠNG CHIA SẺ ĐỒ VẬT MIGI GV Hướng dẫn: ThS.Hoàng Anh Việt SV Thực hiện: Lê Minh Nghĩa Lớp : Công Nghệ Phần Mềm K51
  • 2. NỘI DUNG TRÌNH BÀY 1. Đặt vấn đề 2. Các kiến thức liên quan 3. Xây dựng giải pháp 4. Thử nghiệm và đánh giá 5. Kết luận và hướng phát triển 2
  • 3. 1. Đặt vấn đề 3
  • 4. 44
  • 5. 55
  • 6. Thống kê 6 90% có thể tái chế Nhưng chỉ thực hiện được 15%
  • 7. Giải pháp 77 Tôi có một cái áo cho đi Tôi cần một cái áo! Một môi trường chia sẻ Cảm ơn!
  • 8. Vấn đề phát sinh 8 Ai là người thực sự cần??? Khai phá dữ liệu để tìm các tri thức hữu ích
  • 9. Các tri thức có thể khai phá được • Tìm ra thói quen chia sẻ đồ vật Vd: cho điện thoại cũ => cho kèm bộ sạc điện • Phân tích sở thích người dùng • Điều tra thị trường 9
  • 10. Mục tiêu đồ án • Xây dựng mạng xã hội chia sẻ đồ vật Migi • Nghiên cứu lý thuyết Datamining, trong đó tập trung về luật kết hợp • Đề xuất mô hình gợi ý dựa trên luật kết hợp • Thử nghiệm tìm luật kết hợp trên bộ dữ liệu Adventurework 10
  • 11. 2.Tổng quan về luật kết hợp 11 Sữa, bánh mỳ, ,ngũ cốc Sữa, bánh mỳ, đường, tr ứng Sữa, bánh mỳ, bơ Đường, trứng Khánh hàng 2 Khánh hàng 3 Khánh hàng 4 Khánh hàng 5 Những mặt hàng nào thường được đặt mua cùng nhau?
  • 12. 2.1. Luật kết hợp là gì? • Được sử dụng để tìm các mấy quan hệ giữa các đối tượng trong một giao dịch. Vd: - Mua sữa thì thường mua bánh mỳ - Mua bánh mỳ thì thường mua bơ - Người mua máy tính thì thường mua phần tử virus 12
  • 13. Các khái niệm cơ bản 13
  • 14. Giao dịch Các Item T100 Sữa, bánh mỳ, ngũ cốc T200 Sữa, bánh mỳ, đường, trứng T300 Sữa, bánh mỳ, bơ T400 Đường trứng 14 Items Số lần xuất hiện Trứng 2 Sữa, 3 Bánh mỳ 3 Ngũ cốc 1 Đường 2 Bơ 1 Các Item Độ hỗ trợ- support count Cơ sở dữ liệu giao dịch Độ hỗ trợ tối thiểu: min_sup=2 Tập 2 mục {Sữa, Bánh mỳ} SupportCount=3>min_sup Số lần xuất hiện Tập mục thường xuyên Luật: Sữa  Bánh mỳ Độ tin cậy- Confidence???
  • 15. Độ tin cậy của luật kết hợp • Luật A=> B chấp nhận nếu: confidence (A=>B) > min_confidene Vd: 15 Min_Confidence=90% Luật chấp nhận được
  • 16. Khó khăn của thuật toán • Độ phức tạp và thời gian tính toán. Vd: với tập mục thường xuyên có 100 phần tử. Thì tổng số tập mục con là tập mục thường xuyên sẽ là: • Tính tin cậy của luật kết hợp sinh ra. 16
  • 17. 2.3. Các thuật toán cơ bản • Thuật toán Apriori • Thuật toán PHP- Perfect Hashing and Pruning • Thuật toán FP Tree 17
  • 18. Thuật toán Apriori • Mục đích: Tìm kiếm các tập múc thường xuyên • Các bước: B1:Sinh các tập mục ứng viên K phần tử từ các tập mục K-1 B2:Loại bỏ các tập mục ứng viên nếu tồn tại bất kỳ một tập hợp con nào không phải là tập mục thường xuyên B3:Kết thúc khi không còn sinh được một tập mục ứng viên nào là tập mục thường xuyên 18
  • 19. Mô tả thuật toán 19
  • 20. 20 Trans Items T100 I1, I2, I5 T200 I2,I4 T300 I2,I3 T400 I1,I2,I4 T500 I1,I3 T600 I2,I3 T700 I1,I3 T800 I1,I2,I3,I5 T900 I1,I2,I3 Item Sup.Count I1 6 I2 7 I3 6 I4 2 I5 2 C1 Item Sup.Count I1 6 I2 7 I3 6 I4 2 I5 I2 MinSup=2 L1 ItemSet {I1,I2} {I1,I3} {I1,I4} {I1,I5} {I2,I3} {I2,I4} {I2,I5} {I3,I4} {I3,I5} {I4,I5} C2 ItemSet Sup.Count {I1,I2} 4 {I1,I3} 4 {I1,I4} 1 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 {I3,I4} 0 {I3,I5} 1 {I4,I5} 0 C2 ItemSet Sup.Count {I1,I2} 4 {I1,I3} 4 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 L2 L1 x L1 Cơ sở dữ liệu giao dịch
  • 21. 21 ItemSet Sup.Count {I1,I2} 4 {I1,I3} 4 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 L2 ItemSet {I1,I2,I3} {I1,I2,I5} {I1,I3,I5} {I2,I3,I4} {I2,I3,I5} {I2,I4,I5} C3 SubSet {I1,I2} {I1,I3} {I2,I3} Thuộc L2 SubSet {I1,I3} {I1,I5} {I3,I5} Không thuộc L2 L2 x L2 ItemSet {I1,I2,I3} {I1,I2,I5} ItemSet Sup.Count {I1,I2,I3} 2 {I1,I2,I5} 2 C3 C3 ItemSet Sup.Count {I1,I2,I3} 2 {I1,I2,I5} 2 L3
  • 22. 2.3.2.Thuật toán PHP • Cải tiến từ thuật toán Apriori: 1. Sử dụng cấu trúc bảng băm: - Lưu trữ độ hỗ trợ của các tập mục 2 phần tử 22
  • 23. 23 Trans Items T100 I1, I2, I5 T200 I2,I4 T300 I2,I3 T400 I1,I2,I4 T500 I1,I3 T600 I2,I3 T700 I1,I3 T800 I1,I2,I3,I5 T900 I1,I2,I3 Item Sup.Count I1 6 I2 7 I3 6 I4 2 I5 I2 I1I2 I1I5 I2I4 I2I3 I1I4 I1I3 I1I5 I3I5 4 2 2 4 1 4 2 1 Bảng băm cho tập 2 phần tử L1 Quét DB Cơ sở dữ liệu giao dịch
  • 24. Thuật toán PHP 2. Loại bỏ các giao dịch - Loại bỏ các giao dịch mà không có đủ k+1 tập k-mục - Loại bỏ những mục nào có số lần xuất hiện trong tập Lk nhỏ hơn k lần. 24
  • 25. 2525 Trans Items T100 I1, I2, I5 T200 I2,I4 T300 I2,I3 T400 I1,I2,I4 T500 I1,I3 T600 I2,I3 T700 I1,I3 T800 I1,I2,I3,I5 T900 I1,I2,I3 Item Sup.Count I1 6 I2 7 I3 6 I4 2 I5 2 C1 Item Sup.Count I1 6 I2 7 I3 6 I4 2 I5 I2 MinSup=2 L1 ItemSet {I1,I2} {I1,I3} {I1,I4} {I1,I5} {I2,I3} {I2,I4} {I2,I5} {I3,I4} {I3,I5} {I4,I5} C2 ItemSet Sup.Count {I1,I2} 4 {I1,I3} 4 {I1,I4} 1 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 {I3,I4} 0 {I3,I5} 1 {I4,I5} 0 C2 ItemSet Sup.Count {I1,I2} 4 {I1,I3} 4 {I1,I5} 2 {I2,I3} 4 {I2,I4} 2 {I2,I5} 2 L2 L1 x L1 Cơ sở dữ liệu giao dịch Trans Items T800 I1,I2,I3,I5
  • 26. Đánh giá trên bộ dữ liệu thử K=2 K=3 K=4 K=5 K-6 K=7 Transaction 20019 4503 1017 583 237 34 0 5000 10000 15000 20000 25000 Sốgiáodịch Transaction 26
  • 27. 2.3.3.Thuật toán FP Tree • Mục đích: - Biểu diễn các giao dịch bằng cấu trúc dữ liệu cây. - Không sinh các ứng viên mà tìm kiếm tập mục ngay trên cây. • Các bước của thuật toán: B1: Xây dựng cây biểu diễn các giao dịch B2: Tìm kiếm đệ quy trên cây để sinh ra các luật kết hợp 27
  • 28. Mô tả thuật toán 28
  • 29. 29 Item Sup.Count I2 7 I1 6 I3 6 I4 2 I5 2 NullTrans Items T100 I1, I2, I5 T200 I2,I4 T300 I2,I3 T400 I1,I2,I4 T500 I1,I3 T600 I2,I3 T700 I1,I3 T800 I1,I2,I3,I5 T900 I1,I2,I3 T100:I2,I1,I5 I2:1 I1:1 I5:1 T200:I2,I4 I4:1 I2:2 Root Node
  • 30. 30
  • 31. 31 I5 {I2,I1:1},{I2,I1,I3:1} Item Sup.Count I2 2 I1 2 I3 1 Item Sup.Count I2 2 I1 2 Sufffix Conditional Pattern Base Min Sup=2 {I2,I1:2} {} I2:2 I1:2 ItemSet Conditional Pattern Base I5,I1 {I2:2} I5,I2 {} Tập mục thường xuyên 2 phần tử Prefix I5I1 I5I1 {} I2:2 Item Sup.Count I2 2 ItemSet Conditional Pattern Base I5,I1,I2 {} Tập mục thường xuyên 3 phần tử
  • 32. Kết quả thu được 32
  • 33. So sánh hiệu năng ba thuật toán 33 Han, J., Pei, J., Yin, J., (2000), Mining Frequent Patterns without Candidate Generation, Proceedings of the 2000 ACM SIGMOD international conference on Management of data, pp. 1-12
  • 34. 3.1. Kiến trúc tổng thể của hệ thống 34 Web UI ADO.NET Entity Recommender Image server Caching Server Business Layer Google Map Facebook Database- SQL Server 2008 Data Analysis S e r v i c e s Mobile App
  • 35. Mô tả các tầng • Tầng WebUI: Sử dụng các công nghệ:ASP.NET MVC, JQuery, Google Map • Tầng Business: Tầng này chưa toàn bộ nghiệp vụ của hệ thống. • Tầng Data: Sử dụng SQL Server 2008, ADO.NET Entity • Các Service: Sử dụng WCF xây dựng các service mở 35
  • 36. Mô tả các tầng • Data Analysis: phân tích dữ liệu nhằm tìm kiếm các tri thức hữu ích. • Recommender: Dựa trên các tri thức tích lũy gợi ý cho người dùng • Image Server: Quản lý việc hiện thị ảnh cho site • Caching Server: Để tăng tốc độ của web site • Ứng dụng facebook: Truy cấp hệ thống từ Facebook • Ứng dụng Mobile: Cho phép truy cấp hệ thống mọi nơi 36
  • 37. 3.2 Thiết kế cơ sở dữ liệu 37
  • 38. 3.3.Cơ sở dữ liệu cho việc phân tích • Dữ liệu sau khi được tiền xử lý chuyển thành: 38
  • 39. 3.4. Xây dựng module gợi ý từ các luật kết hợp Module gợi ý được xây dưng dựa trên: • Các luật kết hợp • Dữ liệu về địa điểm người dùng (đã được khai báo) • Dữ liệu về chủng loại sản phẩm 39
  • 40. 3.5. Bộ dữ liệu thử nghiệm • Sử dụng bộ dữ liệu bán xe đạp Adventurework do Microsoft cung cấp • Các đặc điểm chính: Tất cả 266 sản phẩm được giao dịch Có 21209 giao dịch có từ hai sản phẩm được mua Trung bình mỗi giao dịch có 5 sản phẩm Giao dịch từ 2 cho tới 21 sản phẩm chiếm: 94.3% số giao dịch 40
  • 41. Một số luật khai thác được {Mountain-100 Black, 44}=>{Half-Finger Gloves, M} {Mountain-100 Silver, 42}=>{ Half-Finger Gloves, M } { Mountain-100 Silver, 42}=>{ LL Road Handlebars } { Mountain-100 Silver, 42, Half-Finger Gloves, M }=>{ Men's Sports Shorts, S} { Mountain-100 Silver, 42 }=>{ Men's Sports Shorts, M, Racing Socks, M} { Mountain-500 Black, 48 , LL Mountain Pedal }=>{ ML Mountain Front Wheel } 41
  • 42. 4. Kết luận và hướng phát triển 42
  • 43. 4.1 Các kết quả đạt được Về nghiên cứu: - Các kiến thức tổng quát về Data Mining - Lý thuyết về luật kết hợp - Các thuật toán cơ bản để khai phá luật kết hợp Về sản phẩm: Góp phần xây dựng mạng chia sẻ đồ vật với các tính năng chính: - Cho phép người dùng đưa thông tin chia sẻ đồ vật - Gợi ý người dùng khi chia sẻ đồ vật - Cho phép các tổ chức khởi tạo các sự kiện từ thiện Các đóng góp: - Đề xuất được mô hình phân tích dữ liệu dựa trên luật kết hợp 43
  • 44. 4.2 Hướng phát triển • Hoàn thiện các tính năng chia sẻ • Xây dựng hệ thống có khả năng chịu tải cao • Tăng cường tính bảo mật • Hoàn thiện quy trình trích rút và chuẩn hóa dữ liệu • Áp dụng các mô hình xử lý dữ liệu phân tán • Nghiên cứu luật kết hợp trên môi trường tính toán song song 44
  • 45. Tài liệu tham khảo • Han, J., Kamber, M., Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems • Zaki, M.J., (2000), Generating Non-Redundant Association Rules, Proceedings of the sixth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 34 – 43. • Website: http://www.msdn.com • Website: http://www.jquery.com • Website: http://www.asp.net/mvc • Website: http://www.facebook.com/developer • Website:http://code.google.com 45
  • 46. EM XIN CHÂN THÀNH CẢM ƠN! 46

Editor's Notes

  1. Give a brief overview of the presentation. Describe the major focus of the presentation and why it is important.Introduce each of the major topics.To provide a road map for the audience, you can repeat this Overview slide throughout the presentation, highlighting the particular topic you will discuss next.
  2. Hàngnămcórấtnhiềuthiên tai xảyrakhắpmọinơitrênthếgiới.Trướcsựnổigiậncủathiênnhiêngiườngnhư con ngườingàycàngnhỏbé.Thiên tai đãlấyđitấtcả, nhàcửa, ruộngđồngđểbịcuốnphăngđi. Vànhữngđốvậtvốnlàtốithiệuđốivới con người nay lạinhữngthứthiếtyếuchongườibịnạn.
  3. Trongkhiđó,cònvôsốđồvậtmàchúngtakhôngcòndùngnữa.Chấtđộngtrongkhođểhưhỏngtheothờigian, hay vứtđikhimànóvẫncòngiátrị.
  4. Theo thôngkếthìcótới 90% nhữngđồcũđóchúngtacòncóthểtáichếtáisửdụngđược.Nhưngchỉthựchiệnđược 15%. Córấtnhiềungườiđangcầnchúng, vàđiềuđóthậtlàphíphạm.
  5. ĐóchínhlàđộnglựcchoviệcrađờimạngchiasẻđồvậtMiGi. Nơimàngườidùngcóthểdễdàngchiasẽnhữngđồvậtmàmìnhkhôngdùngnữa. Cũngnhưcóthểđónggópchonhữngsựkiệntừthiện.
  6. Nhưngcómộtvấnđềphátsinhkhingườidùngmuốnchiasẻmộtđồvậtnàođó.