SlideShare a Scribd company logo
1 of 21
BÁO CÁO KẾT THÚC
THỰC TẬP
Thực tập sinh: THÁI QUANG TIẾN
Công ty GMO-Z.COM VNLAB
NỘI DUNG
TRÌNH BÀY
1. GIỚI THIỆU BẢN THÂN
2. KAGGLE PROJECT
3. TỔNG KẾT KÌ THỰC TẬP
1. Sơ lược về bản thân
GIỚI THIỆU
BẢNTHÂNSƠ LƯỢC
• Thái Quang Tiến
• ĐH Bách Khoa Đà Nẵng, CNTT, Khóa 2015
SỞ THÍCH
• Game, nghe nhạc, tìm & thử cái mới
LĨNH VỰC
QUAN TÂM
• Low-level programming, HCI và một số lĩnh vực khác
thuộc khoa học máy tính
• NNLT thường dùng: C/C++, Java, Assembly,…
2. Kaggle Project
BÀI TOÁN
NHẬN BIẾT GIAO DỊCH LỪA ĐẢO
SỬ DỤNG HỌC MÁY
(CREDIT CARD FRAUD DETECTION USING
MACHINE LEARNING)
?
NỘIDUNG
NỘI DUNG:
Cho bộ dữ liệu gồm các giao dịch
thẻ tín dụng, mỗi giao dịch được
mô tả bởi 30 đặc trưng và được
gán nhãn 0-1 tương ứng với giao
dịch hợp pháp/không hợp pháp.
Yêu cầu viết chương trình bằng
Python sử dụng Machine Learning
để nhận biết một giao dịch có phải
là lừa đảo hay không?
PHƯƠNGPHÁP
TIẾPCẬN
PHƯƠNG PHÁP TIẾP CẬN:
•Phân tích dữ liệu
•Lập ra model sơ khai, thử nghiệm
•Đánh giá và cải tiến/thay đổi model
•Thay đổi cách tiếp cận (Supervised
Learning => Unsupervised Learning) và
thực hiện như trên
PHƯƠNGPHÁP
ĐÁNHGIÁ
&
NỀNTẢNGLẬPTRÌNH
PHƯƠNG PHÁP ĐÁNH GIÁ:
•Thông số đánh giá chính: AUPRC, Recall
•Thông số tham khảo: AUROC, Fbeta
score, Precision, Accuracy
NỀN TẢNG LẬP TRÌNH:
•Trang luyện tập phân tích dữ liệu Kaggle
•Jupyter notebook
•Python
•Sklearn, matplot, seaborn
PHÂN TÍCH
DỮ LIỆU
Kiểm tra nhận
định ban đầu
Phân tích từng
đặc trưng
Tính correlation
giữa các đặc
trưng
Xử lý đặc trưng
“Time”
TÁCH TRAIN
TEST SET
Có/không có
đặc trưng
“Time”
Chia random /
stratified với tỷ
lệ 80/20
Chia random +
Holdout CV
LẬP MODEL
Logistic
Regression
Random Forest
Tuning:
K-fold CV =>
Regularization
Param
Đánh giá với
từng thông số
Class Weight
ĐÁNH GIÁ
MODEL
MAE, Accuracy,
Fscore,
Precision/Recall
Vẽ confusion
matrix
Vẽ ROC curve và
tính AUROC
Vẽ PR curve và
tính AUPRC
TRỌNG TÂM:
AUPRC, RECALL!
TIẾP CẬN
UNSUPER-
VISED
K-Mean
clustering
Isolation Forest
Đánh giá
TRÌNH TỰ THIẾT KẾ
3. Kết quả project
ĐÃLÀMĐƯỢC
•Đã lập được kế hoạch, hướng tiếp
cận đối với bài toán mới
•Học được cơ bản cách phân tích dữ
liệu
•Áp dụng được những kiến thức đã
học được vào bài toán thực tế
•Học cách nhìn bài toán dưới nhiều
góc độ
CHƯALÀMĐƯỢC
•Kế hoạch không ổn định, hay thay
đổi
•Chưa thuần thục Python và các thư
viện liên quan, mất nhiều thời gian
để viết code
•Lý thuyết còn nhiều chỗ chưa nắm
vững
CẢI TIẾN
•Phân tích kĩ hơn dữ liệu, sử dụng
các kĩ thuật phức tạp để tiền xử lý
•Thử nghiệm thêm các model khác
(SVM, Naïve Bayes, NN,…)
•Tuning model với các kĩ thuật khác
nhau (GridSearch,
RandomSearch,…)
•Tiền xử lý dữ liệu cho bài toán
Unsupervised Learning
•Thử nghiệm các model
Unsupervised khác nhau
4. Tổng kết kì thực tập
NỘIDUNG
THỰCTẬP
•Training cơ bản: linux, vagrant,
design pattern, git, DB design
•Khóa học Machine Learning cơ bản
•Viết bài blog và thuyết trình
•Bài toán thực tế
•Luyện tập tiếng Nhật
NHỮNGĐIỀU
ĐÃHỌCĐƯỢC
•Kiến thức kỹ thuật
•Cách lập kế hoạch và duy trì nó
trong làm việc, học tập
•Cách tự nghiên cứu, tìm hiểu chủ
đề mới trong khoảng thời gian giới
hạn
•Cách trình bày những điều mình
biết đến người khác một cách hệ
thống, rõ ràng, dễ hiểu
KHÓKHĂN
•Tiếp xúc với nhiều công nghệ mới
•Giữ lịch trình, kế hoạch ổn định,
chi tiết
•Nền tảng toán học chưa chắc chắn
•Cần nắm vững một lượng lớn lý
thuyết
XINCÁMƠNMỌINGƯỜIRẤTNHIỀU!

More Related Content

What's hot

Lập trình web asp.net MVC
Lập trình web asp.net MVCLập trình web asp.net MVC
Lập trình web asp.net MVCMasterCode.vn
 
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBáo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBách Nguyễn
 
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPT
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPTBài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPT
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPTMasterCode.vn
 
Thiet ke test case luong
Thiet ke test case luongThiet ke test case luong
Thiet ke test case luongHoangThiHien1
 
cấu hình access rule ISA 2006
cấu hình access rule ISA 2006cấu hình access rule ISA 2006
cấu hình access rule ISA 2006vuhosking
 
Đồ án kiểm thử phần mềm
Đồ án kiểm thử phần mềmĐồ án kiểm thử phần mềm
Đồ án kiểm thử phần mềmNguyễn Anh
 
Hệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng onlineHệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng onlineHan Nguyen
 
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...TÀI LIỆU NGÀNH MAY
 
Thiết kế csdl quản lý nhân sự
Thiết kế csdl quản lý nhân sựThiết kế csdl quản lý nhân sự
Thiết kế csdl quản lý nhân sựleemindinh
 
Tương tác người-máy
Tương tác người-máyTương tác người-máy
Tương tác người-máyAlice_Stone
 
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCM
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCMGiáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCM
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCMfrank5991
 
[123doc] do-an-phan-mem-quan-ly-nhan-su-tien-luong
[123doc]   do-an-phan-mem-quan-ly-nhan-su-tien-luong[123doc]   do-an-phan-mem-quan-ly-nhan-su-tien-luong
[123doc] do-an-phan-mem-quan-ly-nhan-su-tien-luongDuytPhm8
 
Báo cáo bài tập lớn phân tích thiết kế hệ thống
Báo cáo bài tập lớn phân tích thiết kế hệ thốngBáo cáo bài tập lớn phân tích thiết kế hệ thống
Báo cáo bài tập lớn phân tích thiết kế hệ thốngJojo Kim
 
Bai tap-thuc-hanh-he-quan-tri-csdl
Bai tap-thuc-hanh-he-quan-tri-csdlBai tap-thuc-hanh-he-quan-tri-csdl
Bai tap-thuc-hanh-he-quan-tri-csdlgiang nguyen le
 
Báo cáo t hiết kế mạng doanh nghiệp
Báo cáo t hiết kế mạng doanh nghiệpBáo cáo t hiết kế mạng doanh nghiệp
Báo cáo t hiết kế mạng doanh nghiệpLe Trung Hieu
 

What's hot (20)

Lập trình web asp.net MVC
Lập trình web asp.net MVCLập trình web asp.net MVC
Lập trình web asp.net MVC
 
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptxBáo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
Báo cáo bài tập Lưu trữ và xử lý dữ liệu lớn.pptx
 
Điên toán đám mây
Điên toán đám mâyĐiên toán đám mây
Điên toán đám mây
 
Uml hà
Uml hàUml hà
Uml hà
 
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPT
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPTBài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPT
Bài 5: Triển khai AD – Quản trị tài khoản máy tính - Giáo trình FPT
 
Thiet ke test case luong
Thiet ke test case luongThiet ke test case luong
Thiet ke test case luong
 
cấu hình access rule ISA 2006
cấu hình access rule ISA 2006cấu hình access rule ISA 2006
cấu hình access rule ISA 2006
 
Đồ án kiểm thử phần mềm
Đồ án kiểm thử phần mềmĐồ án kiểm thử phần mềm
Đồ án kiểm thử phần mềm
 
Hệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng onlineHệ thống quản lý bán hàng online
Hệ thống quản lý bán hàng online
 
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...
[Kho tài liệu ngành may] các phương pháp và thủ thuật được áp dụng trong kiểm...
 
Thiết kế csdl quản lý nhân sự
Thiết kế csdl quản lý nhân sựThiết kế csdl quản lý nhân sự
Thiết kế csdl quản lý nhân sự
 
Tương tác người-máy
Tương tác người-máyTương tác người-máy
Tương tác người-máy
 
Đề tài: Thiết kế hệ thống mạng cho một công ty, HOT, 9đ
Đề tài: Thiết kế hệ thống mạng cho một công ty, HOT, 9đĐề tài: Thiết kế hệ thống mạng cho một công ty, HOT, 9đ
Đề tài: Thiết kế hệ thống mạng cho một công ty, HOT, 9đ
 
Đề tài: Chương trình quản lý nhân sự tiền lương tại doanh nghiệp
Đề tài: Chương trình quản lý nhân sự tiền lương tại doanh nghiệpĐề tài: Chương trình quản lý nhân sự tiền lương tại doanh nghiệp
Đề tài: Chương trình quản lý nhân sự tiền lương tại doanh nghiệp
 
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCM
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCMGiáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCM
Giáo trình Thông tin vệ tinh - Học viện Bưu chính Viễn thông TP.HCM
 
[123doc] do-an-phan-mem-quan-ly-nhan-su-tien-luong
[123doc]   do-an-phan-mem-quan-ly-nhan-su-tien-luong[123doc]   do-an-phan-mem-quan-ly-nhan-su-tien-luong
[123doc] do-an-phan-mem-quan-ly-nhan-su-tien-luong
 
Đề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đ
Đề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đĐề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đ
Đề tài: Nghiên cứu thuật toán K-nearest neighbor, HAY, 9đ
 
Báo cáo bài tập lớn phân tích thiết kế hệ thống
Báo cáo bài tập lớn phân tích thiết kế hệ thốngBáo cáo bài tập lớn phân tích thiết kế hệ thống
Báo cáo bài tập lớn phân tích thiết kế hệ thống
 
Bai tap-thuc-hanh-he-quan-tri-csdl
Bai tap-thuc-hanh-he-quan-tri-csdlBai tap-thuc-hanh-he-quan-tri-csdl
Bai tap-thuc-hanh-he-quan-tri-csdl
 
Báo cáo t hiết kế mạng doanh nghiệp
Báo cáo t hiết kế mạng doanh nghiệpBáo cáo t hiết kế mạng doanh nghiệp
Báo cáo t hiết kế mạng doanh nghiệp
 

Similar to Nhận biết giao dịch lừa đảo sử dụng học máy

bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalbui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalSP Tin K34
 
C1 introduction
C1 introductionC1 introduction
C1 introductionHồ Lợi
 
CTDL&GT_01
CTDL&GT_01CTDL&GT_01
CTDL&GT_01kikihoho
 
Bài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhBài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhChâu Trần
 
5 implementation
5 implementation5 implementation
5 implementationTho Da
 
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...sividocz
 
DCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdfDCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdftrucmt2000
 
Ke hoach bai giang
Ke hoach bai giangKe hoach bai giang
Ke hoach bai giangChau Nguyen
 
Kỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxKỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxPhamLong70
 
Kichbandayhoc
KichbandayhocKichbandayhoc
Kichbandayhocvothu123
 
Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Nguyen Chien
 
Giải bài toán trên máy tính
Giải bài toán trên máy tínhGiải bài toán trên máy tính
Giải bài toán trên máy tínhthuhoai2088
 
05_Project_management.ppt
05_Project_management.ppt05_Project_management.ppt
05_Project_management.ppttienlqtienlq
 
Quản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdQuản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdLNhtQuang11
 

Similar to Nhận biết giao dịch lừa đảo sử dụng học máy (20)

Thdc 06
Thdc 06Thdc 06
Thdc 06
 
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascalbui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
bui anh_tai__Bai_19_mot_so_thu_vien_chuan_trong_pascal
 
C1 introduction
C1 introductionC1 introduction
C1 introduction
 
C1 introduction
C1 introductionC1 introduction
C1 introduction
 
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình JavaĐề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
Đề tài: Công cụ sinh dữ liệu thử tự động cho chương trình Java
 
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.docXây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
Xây Dựng Công Cụ Sinh Dữ Liệu Thử Tự Động Cho Chương Trình Java.doc
 
Emailing buoi 2 thuat toan
Emailing buoi 2   thuat toanEmailing buoi 2   thuat toan
Emailing buoi 2 thuat toan
 
CTDL&GT_01
CTDL&GT_01CTDL&GT_01
CTDL&GT_01
 
Bài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tínhBài 6: Giải bài toán trên máy tính
Bài 6: Giải bài toán trên máy tính
 
5 implementation
5 implementation5 implementation
5 implementation
 
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...Luận Văn  Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
Luận Văn Đề Cương Dùng Cho Ngành Công Nghệ Thông Tin Cấu Trúc Dữ Liệu Và Giả...
 
chương1.pdf
chương1.pdfchương1.pdf
chương1.pdf
 
DCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdfDCCTK45_Lập Trình HĐT.pdf
DCCTK45_Lập Trình HĐT.pdf
 
Ke hoach bai giang
Ke hoach bai giangKe hoach bai giang
Ke hoach bai giang
 
Kỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptxKỹ năng xây dựng đề cương nghiên cứu.pptx
Kỹ năng xây dựng đề cương nghiên cứu.pptx
 
Kichbandayhoc
KichbandayhocKichbandayhoc
Kichbandayhoc
 
Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08Vxl Dahl 2009 05 08
Vxl Dahl 2009 05 08
 
Giải bài toán trên máy tính
Giải bài toán trên máy tínhGiải bài toán trên máy tính
Giải bài toán trên máy tính
 
05_Project_management.ppt
05_Project_management.ppt05_Project_management.ppt
05_Project_management.ppt
 
Quản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasdQuản lý dự án phần mềm dasssssssssaasdasdasd
Quản lý dự án phần mềm dasssssssssaasdasdasd
 

More from GMO-Z.com Vietnam Lab Center

高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方GMO-Z.com Vietnam Lab Center
 
Phương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerPhương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerGMO-Z.com Vietnam Lab Center
 
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...GMO-Z.com Vietnam Lab Center
 
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesTìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesGMO-Z.com Vietnam Lab Center
 
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkXây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkGMO-Z.com Vietnam Lab Center
 
Hệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtHệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtGMO-Z.com Vietnam Lab Center
 
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngBlockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngGMO-Z.com Vietnam Lab Center
 
Giới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGiới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGMO-Z.com Vietnam Lab Center
 
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterTài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterGMO-Z.com Vietnam Lab Center
 
Create android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeCreate android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeGMO-Z.com Vietnam Lab Center
 

More from GMO-Z.com Vietnam Lab Center (20)

高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方高負荷に耐えうるWebApplication Serverの作り方
高負荷に耐えうるWebApplication Serverの作り方
 
Phương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application ServerPhương pháp và chiến lược đối ứng tải trong Web Application Server
Phương pháp và chiến lược đối ứng tải trong Web Application Server
 
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
Ứng dụng NLP vào việc xác định ý muốn người dùng (Intent Detection) và sửa lỗ...
 
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với KubernetesTìm hiểu và triển khai ứng dụng Web với Kubernetes
Tìm hiểu và triển khai ứng dụng Web với Kubernetes
 
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii FrameworkXây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
Xây dựng hệ thống quản lý sân bóng sử dụng Yii Framework
 
Hệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặtHệ thống giám sát nhận diện khuôn mặt
Hệ thống giám sát nhận diện khuôn mặt
 
Image Style Transfer
Image Style TransferImage Style Transfer
Image Style Transfer
 
Optimizing MySQL queries
Optimizing MySQL queriesOptimizing MySQL queries
Optimizing MySQL queries
 
Surveillance on slam technology
Surveillance on slam technologySurveillance on slam technology
Surveillance on slam technology
 
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụngBlockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
Blockchain & Smart Contract - Bắt đầu như thế nào và các ứng dụng
 
Giới thiệu Embulk
Giới thiệu Embulk Giới thiệu Embulk
Giới thiệu Embulk
 
Giới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cdGiới thiệu docker và ứng dụng trong ci-cd
Giới thiệu docker và ứng dụng trong ci-cd
 
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab CenterTài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
Tài liệu giới thiệu công ty GMO-Z.com Vietnam Lab Center
 
Chia se Agile
Chia se AgileChia se Agile
Chia se Agile
 
Agile retrospective
Agile retrospectiveAgile retrospective
Agile retrospective
 
Giới thiệu Agile + Scrum
Giới thiệu Agile + ScrumGiới thiệu Agile + Scrum
Giới thiệu Agile + Scrum
 
Create android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React NaticeCreate android app can send SMS and Email by React Natice
Create android app can send SMS and Email by React Natice
 
Introduce React Native
Introduce React NativeIntroduce React Native
Introduce React Native
 
Spark tuning
Spark tuningSpark tuning
Spark tuning
 
Git in real product
Git in real productGit in real product
Git in real product
 

Nhận biết giao dịch lừa đảo sử dụng học máy

  • 1. BÁO CÁO KẾT THÚC THỰC TẬP Thực tập sinh: THÁI QUANG TIẾN Công ty GMO-Z.COM VNLAB
  • 2. NỘI DUNG TRÌNH BÀY 1. GIỚI THIỆU BẢN THÂN 2. KAGGLE PROJECT 3. TỔNG KẾT KÌ THỰC TẬP
  • 3. 1. Sơ lược về bản thân
  • 4. GIỚI THIỆU BẢNTHÂNSƠ LƯỢC • Thái Quang Tiến • ĐH Bách Khoa Đà Nẵng, CNTT, Khóa 2015 SỞ THÍCH • Game, nghe nhạc, tìm & thử cái mới LĨNH VỰC QUAN TÂM • Low-level programming, HCI và một số lĩnh vực khác thuộc khoa học máy tính • NNLT thường dùng: C/C++, Java, Assembly,…
  • 6. BÀI TOÁN NHẬN BIẾT GIAO DỊCH LỪA ĐẢO SỬ DỤNG HỌC MÁY (CREDIT CARD FRAUD DETECTION USING MACHINE LEARNING) ?
  • 7. NỘIDUNG NỘI DUNG: Cho bộ dữ liệu gồm các giao dịch thẻ tín dụng, mỗi giao dịch được mô tả bởi 30 đặc trưng và được gán nhãn 0-1 tương ứng với giao dịch hợp pháp/không hợp pháp. Yêu cầu viết chương trình bằng Python sử dụng Machine Learning để nhận biết một giao dịch có phải là lừa đảo hay không?
  • 8. PHƯƠNGPHÁP TIẾPCẬN PHƯƠNG PHÁP TIẾP CẬN: •Phân tích dữ liệu •Lập ra model sơ khai, thử nghiệm •Đánh giá và cải tiến/thay đổi model •Thay đổi cách tiếp cận (Supervised Learning => Unsupervised Learning) và thực hiện như trên
  • 9. PHƯƠNGPHÁP ĐÁNHGIÁ & NỀNTẢNGLẬPTRÌNH PHƯƠNG PHÁP ĐÁNH GIÁ: •Thông số đánh giá chính: AUPRC, Recall •Thông số tham khảo: AUROC, Fbeta score, Precision, Accuracy NỀN TẢNG LẬP TRÌNH: •Trang luyện tập phân tích dữ liệu Kaggle •Jupyter notebook •Python •Sklearn, matplot, seaborn
  • 10.
  • 11.
  • 12. PHÂN TÍCH DỮ LIỆU Kiểm tra nhận định ban đầu Phân tích từng đặc trưng Tính correlation giữa các đặc trưng Xử lý đặc trưng “Time” TÁCH TRAIN TEST SET Có/không có đặc trưng “Time” Chia random / stratified với tỷ lệ 80/20 Chia random + Holdout CV LẬP MODEL Logistic Regression Random Forest Tuning: K-fold CV => Regularization Param Đánh giá với từng thông số Class Weight ĐÁNH GIÁ MODEL MAE, Accuracy, Fscore, Precision/Recall Vẽ confusion matrix Vẽ ROC curve và tính AUROC Vẽ PR curve và tính AUPRC TRỌNG TÂM: AUPRC, RECALL! TIẾP CẬN UNSUPER- VISED K-Mean clustering Isolation Forest Đánh giá TRÌNH TỰ THIẾT KẾ
  • 13. 3. Kết quả project
  • 14. ĐÃLÀMĐƯỢC •Đã lập được kế hoạch, hướng tiếp cận đối với bài toán mới •Học được cơ bản cách phân tích dữ liệu •Áp dụng được những kiến thức đã học được vào bài toán thực tế •Học cách nhìn bài toán dưới nhiều góc độ
  • 15. CHƯALÀMĐƯỢC •Kế hoạch không ổn định, hay thay đổi •Chưa thuần thục Python và các thư viện liên quan, mất nhiều thời gian để viết code •Lý thuyết còn nhiều chỗ chưa nắm vững
  • 16. CẢI TIẾN •Phân tích kĩ hơn dữ liệu, sử dụng các kĩ thuật phức tạp để tiền xử lý •Thử nghiệm thêm các model khác (SVM, Naïve Bayes, NN,…) •Tuning model với các kĩ thuật khác nhau (GridSearch, RandomSearch,…) •Tiền xử lý dữ liệu cho bài toán Unsupervised Learning •Thử nghiệm các model Unsupervised khác nhau
  • 17. 4. Tổng kết kì thực tập
  • 18. NỘIDUNG THỰCTẬP •Training cơ bản: linux, vagrant, design pattern, git, DB design •Khóa học Machine Learning cơ bản •Viết bài blog và thuyết trình •Bài toán thực tế •Luyện tập tiếng Nhật
  • 19. NHỮNGĐIỀU ĐÃHỌCĐƯỢC •Kiến thức kỹ thuật •Cách lập kế hoạch và duy trì nó trong làm việc, học tập •Cách tự nghiên cứu, tìm hiểu chủ đề mới trong khoảng thời gian giới hạn •Cách trình bày những điều mình biết đến người khác một cách hệ thống, rõ ràng, dễ hiểu
  • 20. KHÓKHĂN •Tiếp xúc với nhiều công nghệ mới •Giữ lịch trình, kế hoạch ổn định, chi tiết •Nền tảng toán học chưa chắc chắn •Cần nắm vững một lượng lớn lý thuyết