SlideShare a Scribd company logo
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN MẠNH HÙNG
NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL,
ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG
TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội –
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
ĐẠI HỌC QUỘC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN MẠNH HÙNG
NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL,
ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG
TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH
Ngành : Công nghệ thông tin
Chuyên ngành : Kỹ thuật phần mềm
Mã số : 8480103.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS ĐỖ TRUNG TUẤN
Hà Nội –
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI CAM ĐOAN
Tôi xin cam đoan: luận văn “Nghiên cứu về mạng neural Convolutional, áp dụng
vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.” là công trình nghiên
cứu của tôi dưới sự hướng dẫn của giảng viên hướng dẫn, không sao chép lại của người
khác. Các tài liệu được luận văn tham khảo, kế thừa và trích dẫn đều được liệt kê trong
danh mục các tài liệu tham khảo.
Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan trên.
Hà Nội, ngày tháng năm 2019
Học viên
Nguyễn Mạnh Hùng
i
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô trường Đại học Công nghệ, Đại học quốc
gia Hà Nội, đặc biệt các thầy cô bộ môn Kỹ thuật phần mềm, đã tận tình dạy dỗ, giúp đỡ
và tạo mọi điều kiện tốt nhất cho em trong suốt quãng thời gian em theo học tại trường, để
em có thể hoàn thành được đề tài này.
Em tỏ lòng biết ơn sâu sắc với PGS.TS Đỗ Trung Tuấn, người thầy đã tận tình
hướng dẫn khoa học và giúp đỡ, chỉ bảo em trong suốt quá trình nghiên cứu và hoàn thành
luận văn này.
Tôi xin chân thành cảm ơn các bạn học viên cao học khóa 22 tại trường Đại học
Công nghệ, Đại học quốc gia Hà Nội đã giúp đỡ tôi trong quá trình theo học tại trường,
cũng như giúp đỡ tôi thực hiện đề tài này.
Xin trân trọng cảm ơn!
ii
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
MỤC LỤC
LỜI CAM ĐOAN............................................................................................i
LỜI CẢM ƠN................................................................................................ ii
MỤC LỤC..................................................................................................... iii
DANH MỤC HÌNH VẼ................................................................................vi
DANH MỤC BẢNG BIỂU............................................................................x
DANH MỤC VIẾT TẮT ..............................................................................xi
LỜI MỞ ĐẦU.................................................................................................1
Lý do chọn đề tài ............................................................................................... 1
Cơ sở khoa học và thực tiễn của đề tài.............................................................. 1
Mục tiêu của luận văn........................................................................................ 2
Cấu trúc luận văn............................................................................................... 3
CHƯƠNG 1. ...................................................................................................4
TỔNG QUAN VỀ MẠNG NƠ RON............................................................4
VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP...............................4
1.1. Nơ ron nhân tạo ................................................................................4
1.1.1 Lịch sử của nơ ron nhân tạo ..................................................................... 4
1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học................................. 5
1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo ................................ 5
1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo .......................... 8
1.2 Mạng nơ ron nhân tạo.....................................................................11
1.2.1 Giới thiệu mạng nơ ron nhân tạo............................................................ 11
1.2.2 Một số kiểu mạng nơ ron........................................................................ 11
1.2.3 Mạng nơ ron lan truyền ngược ............................................................... 13
1.3 Mạng nơ ron tích chập ....................................................................18
1.3.1 Khái niệm về mạng nơ ron tích chập...................................................... 18
iii
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.3.2 Mô hình mạng nơ ron tích chập.............................................................. 19
1.3.2 Xây dựng mạng nơ ron tích chập ........................................................... 20
1.4 Kết luận.............................................................................................27
CHƯƠNG 2. .................................................................................................28
BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP .......28
2.1 Khái niệm về nhận dạng..................................................................28
2.1.1 Nhận dạng đối tượng .............................................................................. 28
2.1.2 Nhận dạng khuôn mặt............................................................................. 29
2.2. Lịch sử và phát triển.......................................................................30
2.3. Cách thức hoạt động.......................................................................30
2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera.....32
2.4.1 Nhận diện khuôn mặt.............................................................................. 32
2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt ...................................... 33
2.4.3 Liên kết khuôn mặt................................................................................. 34
2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo...............35
2.5.1 Mô hình DeepID 2 (NIPS 2014)............................................................. 35
2.5.2 Mô hình DeepID3 (arXiv 2015) ............................................................. 38
2.5.3 Mô hình DeepFace (Facebook, CVPR 2014)......................................... 39
2.5.4 Mô hình FaceNet (Google 2015)............................................................ 39
2.5.5 Mô hình Baidu (2015) ............................................................................ 41
2.6 Kết luận.............................................................................................42
CHƯƠNG 3. .................................................................................................44
SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP...............................................44
TRONG NHẬN DẠNG ĐỐI TƯỢNG.......................................................44
3.1 Sơ lược về áp dụng mạng nơ ron tích chập vào các giải pháp
thông minh trong thực tế...................................................................44
iv
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
3.2 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện
người vào/ra và đánh giá thực nghiệm, so sánh với phương pháp
HOG ....................................................................................................44
3.2.1 Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng
nơ ron tích chập ......................................................................................... 44
3.2.2 Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người . 45
3.2.3 Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng
để so sánh................................................................................................... 47
3.2.4 So sánh khả năng nhận diện của hệ thống nhận diện người vào/ra sử
dụng mạng nơ ron tích chập với phương pháp HOG đã có....................... 50
3.2.5 Mô tả cơ chế chạy nhận diện người trong lõi máy chủ tính toán ........... 52
3.2.6 Mô tả quá trình sử dụng hệ thống ở giao diện người dùng để hiển thị kết
quả ............................................................................................................. 53
3.3 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện
khuôn mặt và đánh giá thực nghiệm, so sánh với phương pháp
HOG ....................................................................................................55
3.3.1 Xây dựng hệ thống nhận diện khuôn mặt............................................... 55
3.3.2 Giới thiệu cơ chế của máy chủ xử lý nhận diện ..................................... 56
3.3.3 Giới thiệu sơ lược về phương pháp phát hiện khuôn mặt sử dụng HOG sẽ
được dùng để so sánh ................................................................................ 58
3.3.4 So sánh hệ thống nhận diện khuôn mặt với phương pháp HOG đã có .. 59
3.3.4 So sánh khả năng nhận diện khuôn mặt giữa HOG và CNN ................. 62
3.2.5 Kết quả hệ thống web nhận diện khuôn mặt .......................................... 64
3.3 Kết luận.............................................................................................67
KẾT LUẬN...................................................................................................68
Kết quả đã thực hiện được của luận văn.......................................................... 68
Phương hướng phát triển luận văn................................................................... 69
TÀI LIỆU THAM KHẢO...........................................................................70
v
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC HÌNH VẼ
Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10]............ 4
Hình 1.2: Hình ảnh một nơ ron sinh học [14] ..................................................................... 5
Hình 1.3: Công thức của một nơ ron nhân tạo [41]............................................................. 5
Hình 1.4: Hình ảnh một nơ ron nhân tạo............................................................................. 6
Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế....................................... 6
Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có
thiên lệch.............................................................................................................................. 7
Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau ....................... 7
Hình 1.8: Đồ thị hàm Sigmoid ............................................................................................ 8
Hình 1.9: Đồ thị hàm TanH................................................................................................. 9
Hình 1.10: Đồ thị hàm tuyến tính........................................................................................ 9
Hình 1.11: Đồ thị hàm RELU............................................................................................ 10
Hình 1.12: Đồ thị hàm ELU .............................................................................................. 10
Hình 1.13: Mạng nơ ron truyền thẳng ............................................................................... 11
Hình 1.14: Mạng nơ ron hồi quy ....................................................................................... 12
Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy.............................................. 12
Hình 1.16: Các tầng (layer) trong CNN là 3 chiều............................................................ 18
Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]................... 19
Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]........................................ 19
Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ............................................. 20
Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron............ 20
Hình 1.21: Ví dụ về lớp tích chập ..................................................................................... 21
Hình 1.22: So sánh giữa ReLU và Sigmoid. ..................................................................... 23
Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp ............................................................. 24
Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ............................................................ 25
Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)..... 25
vi
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.26: Cấu trúc của AlexNet ...................................................................................... 26
Hình 1.27: Cấu trúc của VGGNet ..................................................................................... 27
Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng........................ 29
Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32,
conv42 và conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt.............................. 29
Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người................................. 31
Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh.................................................................... 31
Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh ................................................................... 32
Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu................. 33
Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ
phát hiện các điểm mốc trên khuôn mặt............................................................................ 33
Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt............................................................. 34
Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS
CS2, là bộ dữ liệu mở rộng của IJB-A .............................................................................. 35
Hình 2.10: Kiến trúc mạng của mô hình DeepID 2........................................................... 36
Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm....................... 36
Hình 2.12: Kiến trúc mạng của mô hình DeepID3............................................................ 38
Hình 2.13: Kiến trúc của DeepFace .................................................................................. 39
Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus..................................... 40
Hình 2. 15 Mô hình GoogleNet......................................................................................... 40
Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu............... 41
Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất
bản...................................................................................................................................... 42
Hình 3.1: Hình ảnh thiết kế của hệ thống nhận diện đối tượng......................................... 45
Hình 3.2: Phương pháp mạng YOLO sử dụng để nhận diện đối tượng............................ 46
Hình 3.3: Mô hình mạng yolo ........................................................................................... 47
Hình 3.4: Tiền xử lý để xác định khung hình.................................................................... 48
Hình 3.5: Độ dốc sau khi tính toán.................................................................................... 48
vii
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 3.6: Kết quả sau khi tính toán véc tơ đặc trưng cho từng ô...................................... 49
Hình 3.7: Biểu diễn các véc tơ chỉ hướng theo HOG thu được sau khi tính toán............. 50
Hình 3.8: Hình ảnh nhận diện bằng phương pháp HOG................................................... 50
Hình 3.9: Hình ảnh nhận diện bằng phương pháp CNN ................................................... 51
Hình 3.10: Hệ thống sử dụng ffmpeg để trích xuất các khung hình trong video.............. 52
Hình 3.11: Các khung hình lần lượt được hệ thống trích xuất và đưa vào lõi để xử lý. ... 52
Hình 3.12: Dữ liệu số người vào/ra được nhập vào cơ sở dữ liệu, và video báo cáo được
hệ thống tự động xuất ra để làm đối chiếu. ....................................................................... 53
Hình 3.13: Hình ảnh đăng nhập vào hệ thống................................................................... 53
Hình 3.14: Kết quả dữ liệu đã được thêm vào cơ sở dữ liệu và hiển trị trên web............. 54
Hình 3.15: Một ví dụ tương tự dữ liệu được xuất báo cáo nhận diện trong hệ thống....... 54
Hình 3.16: Kiến trúc hệ thống nhận diện khuôn mặt, tích hợp cùng hệ thống mua hàng .. 55
Hình 3.17: Khuôn mặt được trích xuất từ bức ảnh............................................................ 56
Hình 3.18: Hình ảnh 68 điểm mốc trên khuôn mặt được sử dụng trên bộ thư viện dlib .. 57
Hình 3.19: Hình ảnh trích xuất đặc trưng khuôn mặt........................................................ 57
Hình 3.20: Khuôn mặt được sử dụng để nhận dạng.......................................................... 58
Hình 3.21: Khuôn mặt được trích xuất.............................................................................. 58
Hình 3.22: Hình ảnh được xử lý sau khi qua bộ lọc Gabor............................................... 58
Hình 3.23: Các đặc trưng được trích xuất bằng HOG....................................................... 59
Hình 3.24: Phát hiện khuôn mặt sử dụng HOG................................................................. 59
Hình 3.25: Phát hiện khuôn mặt sử dụng CNN................................................................. 60
Hình 3.26: Phát hiện khuôn mặt sử dụng HOG với góc nghiêng lớn ............................... 60
Hình 3.27: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 61
Hình 3.28: Kết quả nhận diện khuôn mặt với HOG.......................................................... 62
Hình 3.29: Phát hiện khuôn mặt sử dụng CNN................................................................. 62
Hình 3. 30: Nhận diện khuôn mặt sử dụng HOG với góc nghiêng lớn............................. 63
Hình 3.31: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 63
viii
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 3.32: Giao diện hệ thống trên web (hai hình trên) và giao diện hệ thống trên mobile
(hai hình dưới) ................................................................................................................... 65
Hình 3.33: Huấn luyện thêm khuôn mặt mới .................................................................... 65
Hình 3.34: Kết quả nhận diện sau khi huấn luyện............................................................. 66
Hình 3.35: Nhận diện user có ID 00280 với góc nghiêng khoảng 80 độ và user có ID
00388 với góc nghiêng 30 độ trên mặt phẳng Oxz............................................................ 67
ix
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC BẢNG BIỂU
Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số
lượng của các phần khuôn mặt .......................................................................................... 36
Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó
trên bộ thư viện LFW ........................................................................................................ 37
Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện
LFW................................................................................................................................... 38
Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu
LFW................................................................................................................................... 39
Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet................................. 41
Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo.......................... 41
Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau............................................................... 42
Bảng 3.1 Kết quả so sánh nhận diện người giữa phương pháp mạng nơ ron tích chập và
phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống................... 51
Bảng 3.2: Kết quả so sánh phát hiện khuôn mặt giữa phương pháp mạng nơ ron tích chập
và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 61
Bảng 3.3: Kết quả so sánh nhận diện khuôn mặt giữa phương pháp mạng nơ ron tích chập
và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 64
Bảng 3.4: Cơ sở dữ liệu thời gian phát hiện khuôn mặt của hệ thống .............................. 67
x
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC VIẾT TẮT
Từ viết tắt Ý nghĩa
AI Artificial Intelligence - Trí tuệ nhân tạo
ANN Artificial Neural Network – Mạng thần kinh nhân tạo
CNN Convolutional Neural Network – Mạng thần kinh tích chập
ReLU Rectified Linear Unit – Điều chỉnh đơn vị tuyến tính
CSDL Cơ sở dữ liệu
GPU Graphics Processing Unit – Vi xử lý đồ họa
CPU Central Processing Unit – Bộ xử lý trung tâm
CUDA
Compute Unified Device Architecture - kiến trúc tính toán song song
do hãng NVIDIA phát triển.
IOT Internet of Things – vạn vật kết nối
ASCI Red
Accelerated Strategic Computing Initiative Red – một siêu máy tính
của Intel
W Watt – một đơn vị đo lường của điện lực
kW KiloWatt – một đơn vị đo lường của điện lực
SVM Support Vector Machine – một thuật toán phân lớp
DP2MFD Deep Pyramid Deformable Parts Model for Face Detection
IJB-A
IARPA Janus Benchmark-A – một thử thách mở cho nhận diện khuôn
mặt
KLT Kanade–Lucas–Tomasi – một giải thuật thị giác máy tính
LFW Labeled Faces in the Wild – một bộ thư viện khuôn mặt
xi
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
API Application Programming Interface – giao diện lập trình
YOLO
You only look once – một hệ thống mạng nơ ron nhân tạo phát hiện
đối tượng thời gian thực
HOG Histogram of Oriented Gradients – biểu đồ độ dốc định hướng
PCA Principal Component Analysis - Phân tích thành phần chính
xii
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI MỞ ĐẦU
Lý do chọn đề tài
Trong giai đoạn gần đây, cụm từ cách mạng công nghiệp lần thứ tư được nhắc đến
rất nhiều trên truyền thông. Khái niệm cách mạng công nghiệp 4.0 được đưa ra dựa trên
xu thế bùng nổ của nhiều công nghệ mới như: công nghệ truyền dẫn tốc độ cao, CPU rất
mạnh, GPU hàng ngàn nhân, công nghệ chế tạo bộ nhớ đạt nhiều đột phá. Song song với
đó, công nghệ dần làm các thiết bị nhỏ lại, nhưng sức mạnh tăng lên đáng kể. Công nghệ
mạch nhúng cũng bùng nổ không kém với nhiều mạch nhúng nhỏ, sử dụng lượng điện
khiêm tốn, nhưng khả năng tính toán lên tới hàng ngàn tỉ phép tính trên giây, tương đương
sức mạnh của 1 siêu máy tính cách đây khoảng 20 năm. Ví dụ như board mạch Nvidia's
Jetson TX1 được ra mắt năm 2015, có thể nằm vừa trong lòng bàn tay và chỉ sử dụng 10
oát điện, đã có sức mạnh tính toán tới 1 ngàn tỉ phép tính trên giây, điều mà cách đó tròn
20 năm, vào năm 1996, siêu máy tính ASCI Red của Intel, phải sử dụng tới 6000
vi xử lý Pentium Pros, vận hành với 1000 kW mới có thể đạt được sức mạnh tính toán
trên.
Máy tính hiện nay có sức mạnh tính toán lớn nhưng giá thành lại ở mức phổ thông,
dẫn tới người làm nghiên cứu rất dễ dàng để có thể tự kiểm nghiệm được các lý thuyết về
trí tuệ nhân tạo từ nhiều năm trước. Cùng với mã nguồn mở, hiện làn sóng trí tuệ nhân tạo
đang bùng nổ mạnh mẽ trong thời gian gần đây, và đem lại rất nhiều ứng dụng trong đời
sống
Chính vì lý do trên, việc tìm hiểu và nghiên cứu thị giác máy tính rất có ý nghĩa và
thiết thực. Hiện nay trên thế giới, nhiều nước đã và đang ứng dụng thị giác máy tính vào
đời sống hàng ngày, ví dụ như SkyNet của Trung Quốc, các hệ thống kiểm duyệt nội
dung tự động, …
Cơ sở khoa học và thực tiễn của đề tài
Ngày nay, trong kỷ nguyên số, máy tính là một phần không thể thiếu trong nghiên
cứu khoa học cũng như trong đời sống hàng ngày. Tuy nhiên, do hệ thống máy tính dựa
trên lý thuyết cổ điển (tập hợp, logic nhị phân), nên dù có khả năng tính toán lớn và độ
chính xác cao, thì máy tính cũng chỉ có thể làm việc theo một chương trình gồm các thuật
toán được viết sẵn do lập trình viên chứ chưa thể tự lập luận hay sáng tạo.
Học máy (Machine learning) là một phương pháp phân tích dữ liệu có thể tự động
hóa phân tích dữ liệu và tìm ra các trích xuất đặc trưng của bộ dữ liệu. Học máy sử dụng
các thuật toán trừu tượng để tự học từ dữ liệu, cho phép máy tính tìm thấy những thông
1
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
tin có giá trị ẩn ở rất sâu mà không thể lập trình được bằng cách thông thường. Khi tiếp
xúc với dữ liệu mới, học máy có thể thích ứng rất nhanh và độc lập.
Học sâu (Deep Learning) là một ngành đặc biệt của học máy. Học sâu sử dụng
mạng nơ ron nhân tạo (Artificial Neural Networks) để giải quyết các bài toán mà tính toán
cứng chưa thể xử lý được như dữ liệu trừu tượng, dữ liệu mờ, dữ liệu không rõ ràng,...
Với tính chất như vậy, học sâu thường được ứng dụng trong nhận diện hình ảnh, nhận
diện giọng nói, xử lý ngôn ngữ tự nhiên hoặc dự đoán, dự báo.
Mạng nơ ron nhân tạo (Artificial Neural Networks) là một mô hình xử lý thông tin,
cấu thành từ các lớp nơ ron, được ra đời trên cơ sở mô phỏng hoạt động não bộ của sinh
vật. Mạng nơ ron nhân tạo gắn kết nhiều nơ ron theo một mô hình nhất định, được trải qua
huấn luyện để rút ra được kinh nghiệm, và sử dụng các kinh nghiệm đã có để xử lý các
thông tin mới. Mạng nơ ron nhân tạo thường áp dụng vào giải các bài toán nhận dạng
mẫu, hoặc dự đoán.
Mạng nơ ron Tích chập (Convolutional Neural Network) là một trong những mô
hình học sâu hiện đại nhất hiện nay. Mạng nơ ron Tích chập hiện nay thường được sử
dụng nhiều trong các hệ thống thông minh do ưu điểm của mạng là có độ chính xác cao,
tuy nhiên tốc độ tính toán lại rất nhanh. Vì lý do đó, mạng nơ ron tích chập rất mạnh trong
xử lý hình ảnh, và được ứng dụng rất nhiều trong ngành thị giác máy tính trong các bài
toán liên quan đến nhận dạng đối tượng.
Ngày nay, với sự phát triển của công nghệ bán dẫn, máy tính ngày càng nhỏ đi,
năng lượng tiêu thụ ngày càng thấp xuống, trong khi sức mạnh lại ngày càng tăng lên. Với
những ưu điểm như vậy, chúng ta có thể thấy rất nhiều thiết bị thông minh đã và đang
hiện diện mọi nơi trong đời sống, với camera nhiều điểm ảnh, bộ nhớ trong lớn và vi xử lý
mạnh như: điện thoại thông minh, máy ảnh kỹ thuật số, camera hành trình,… Ngoài ra,
với sự bùng nổ của xu hướng mạng vạn vật IOT, người ta có thể sẽ còn thấy rất nhiều
thiết bị thông minh mới xuất hiện: xe ô tô tự lái, thiết bị bay không người lái tự giao
hàng,... Có thể thấy, việc sử dụng trí thông minh nhân tạo để khai thác dữ liệu hình ảnh
trong các thiết bị thông minh trong tương lai đã và đang trở thành xu hướng. Từ nhận định
trên và sự gợi ý của giảng viên hướng dẫn, tôi quyết định chọn nội dung “Nghiên cứu về
mạng Neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị
giác máy tính” để làm đề tài nghiên cứu thực hiện luận văn thạc sỹ của mình.
Mục tiêu của luận văn
Luận văn của tôi tập trung vào nghiên cứu, tìm hiểu về mạng nơ ron tích chập. Sau
đó so sánh các phương pháp học sâu ở mức độ tổng quan trên phương diện học thuật, từ
2
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
đó thấy được tiềm năng cũng như hạn chế của AI với cái nhìn khách quan nhất. Ở phần
ứng dụng, tôi sử dụng mạng nơ ron tích chập để áp dụng vào hai bài toán thực tế: bài toán
nhận dạng người và bài toán nhận diện khuôn mặt trong lĩnh vực thị giác máy tính.
Cấu trúc luận văn
Luận văn được tổ chức gồm ba chương gồm:
Chương 1: Trình bày tổng quan về nơ ron, các thành phần và cơ chế hoạt
động của nơ ron. Từ đó, trình bày về một số kiểu mạng nơ ron và cơ chế lan
truyền ngược. Cuối cùng là giới thiệu về cấu tạo và cách hoạt động của
mạng nơ ron tích chập;
Chương 2: Trình bày tổng quan về bài toán nhận dạng bằng mạng nơ ron
tích chập, cách thức hoạt động của việc nhận dạng đối tượng và nhận dạng
khuôn mặt của mạng nơ ron tích chập. Ngoài ra, chương hai giới thiệu về
các mô hình sử dụng nơ ron tích chập nổi tiếng đang được áp dụng hiện nay
và kết quả của từng mô hình;
Chương 3: Áp dụng mạng nơ ron tích chập vào trong thực tế. Ở chương
này, tác giả báo cáo về kết quả đạt được khi áp dụng mạng nơ ron tích chập
để xây dựng hai hệ thống: hệ thống nhận dạng người và hệ thống nhận diện
khuôn mặt. Ngoài ra, tác giả có thực hiện so sánh với phương pháp cũ để có
thể thấy ưu điểm và hạn chế của mạng nơ ron tích chập.
Cuối cùng là phần kết luận cho phép tóm tắt kết quả đã đạt được và nêu ra những
tồn tại, dựa vào đó để đưa ra những mục tiêu và phương hướng phát triển cho hệ thống
sau này.
3
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 1.
TỔNG QUAN VỀ MẠNG NƠ RON
VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP
1.1. Nơ ron nhân tạo
1.1.1 Lịch sử của nơ ron nhân tạo
Vào năm 1943, nhà thần kinh học Warren McCulloch đã cùng nhà toán học
Walter Pitts đã viết một cuốn sách về cách mạng thần kinh hoạt động. Và họ đã thực hiện
mô phỏng một mạng thần kinh đơn giản trên một mạch điện. [9]
Vào năm 1949, Donald Hebb đã viết cuốn sách Organization of Behavior. Điểm
nhấn chính là mạng thần kinh nào được sử dụng nhiều sẽ được tăng cường.
Vào năm 1959, David Hubel và Torsten Wiesel đã xuất bản cuốn sách Receptive
fields of single neurons in the cat’s striate cortex, miêu tả về phản ứng của các tế bào thần
kinh thị giác trên loài mèo, cũng như cách loài mèo ghi nhớ và nhận diện hình dạng trên
kiến trúc vỏ não của nó.
Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10]
Vào năm 1989, Yann LeCun đã áp dụng thuật toán học cho mạng nơ ron theo kiểu
lan truyền ngược vào kiến trúc mạng nơ ron tích chập của Fukushima. Sau đó vài năm,
LeCun đã công bố LeNet-5 [13]. Có thể nói, LeNet-5 là một trong những mạng nơ ron
tích chập sơ khai nhất, tuy nhiên các dấu ấn của nó vẫn tồn tại tới ngày nay, có thể thấy
thông qua một số thành phần thiết yếu mà các mạng nơ ron tích chập của ngày nay vẫn
đang sử dụng
4
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học
Hình 1.2: Hình ảnh một nơ ron sinh học [14]
Một nơ ron gồm có: thân nơ ron, tua gai thần kinh, sợi trục thần kinh, trong đó:
Thân nơ ron: là nơi xử lý các tín hiệu được đưa vào;
Tua gai thần kinh: là nơi nhận các xung điện vào trong nơ ron;
Sợi trục thần kinh: là nơi đưa tín hiệu ra ngoài sau khi được xử lý bởi nơ
ron;
Khớp thần kinh: vị trí nằm giữa tua gai thần kinh và sợi trục thần kinh, đây
là điểm liên kết đầu ra của nơ ron này với đầu vào của nơ ron khác.
1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo
Dựa vào cấu tạo của một nơ ron sinh học, các nhà khoa học nghiên cứu và lập trình
đã đưa ra kiến trúc của một nơ ron nhân tạo:
Hình 1.3: Công thức của một nơ ron nhân tạo [41]
5
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Mạng nơ ron nhân tạo có thể mô tả đơn giản lại như sau:
Hình 1.4: Hình ảnh một nơ ron nhân tạo
Trong đó:
Danh sách các đầu vào: Là các thuộc tính đầu vào của một nơ ron. Số lượng
thuộc tính đầu vào thường nhiều hơn một, do dữ liệu thô đầu vào thường là
một vector nhiều chiều, hoặc nhiều nơ ron tầng trước kết nối tới một nơ ron
tầng sau.
Trọng số liên kết: Các liên kết được thể hiện độ mạnh yếu qua một giá trị
được gọi là trọng số liên kết. Kết hơp với các đầu truyền, tín hiệu đến các
nơ ron nhân tạo khác sẽ được tính bằng ;
Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế
6
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hàm tổng: Tổng các tích của các đầu vào với trọng số liên kết mô phỏng
các khớp kết nối. Sau đó đi qua hàm tính tổng để tính ra giá trị trước khi
đưa vào hàm truyền;
Thiên lệch (b): Độ lệch được đưa vào sau khi khi tính toán xong hàm tổng,
tạo ra giá trị cuối cùng trước khi đưa vào hàm truyền. Mục đích của việc
thêm vào thiên lệch nhằm dịch chuyển chức năng của hàm kích hoạt sang
trái hoặc phải, giúp ích khi mạng được huấn luyện. Hình ảnh vị trí thiên
lệch được thêm vào trong mạng nơ ron thực tế.
Hình ảnh huấn luyện khi có và không có thiên lệch:
Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có thiên lệch
Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau
Hàm kích hoạt (Activation functions): Hàm này được sử dụng để tính toán giá trị
của đầu ra dựa vào giá trị của hàm Tổng.
7
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo
1.1.4.1 Hàm Sigmod
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm Sigmoid được sử dụng vì ngưỡng của nó nằm trong khoảng (0, 1). Do đó,
hàm này được sử dụng nhiều cho các mô hình dự đoán xác suất đầu ra, tức kết quả chỉ tồn
tại trong khoảng từ 0 đến 1: khi đầu vào là số dương lớn, đầu ra của hàm sigmoid gần
bằng 1. Khi nhỏ hơn 0, đầu ra gần bằng 0. Tuy nhiên, việc tối ưu của hàm này khó
khăn, nguyên nhân vì nếu giá trị đầu vào của hàm là 1 số rất lớn, thì đầu ra của hàm càng
về 2 đầu xấp xỉ 1 hoặc 0, nên tốc độ hội tụ sẽ rất chậm.
Hình 1.8: Đồ thị hàm Sigmoid
1.1.4.2 Hàm TanH
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm TanH được sử dụng vì đầu ra của hàm nằm trong khoảng , thích hợp
với các mô hình đầu ra có ba giá trị: âm, trung tính (0) và dương. Chúng ta có thể thấy rõ
hơn điều này trong hình minh họa.
8
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.9: Đồ thị hàm TanH
1.1.4.3. Hàm tuyến tính
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm tuyến tính áp dụng thao tác nhận dạng trên dữ liệu với dữ liệu đầu ra tỷ lệ
thuận với dữ liệu đầu vào.
Hình 1.10: Đồ thị hàm tuyến tính
1.1.4.4 Hàm RELU
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm RELU áp dụng với những trường hợp cần đầu ra nằm trong khoảng (0, +∞).
Hàm RELU có tốc độ tính toán rất nhanh, gán các giá trị âm trở thành 0 ngay lập tức, phù
9
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
hợp cho việc huấn luyện từ dữ liệu chuẩn. Tuy nhiên, điều này khiến hàm RELU không
ánh xạ các giá trị âm một cách thích hợp.
Hình 1.11: Đồ thị hàm RELU
1.1.4.5 Hàm ELU
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm ELU là một biến thể của hàm RELU. Hàm thường được sử dụng khi ngưỡng
đầu ra của nó nằm trong khoảng (-1, +∞). Hàm ELU khắc phục hạn chế ánh xạ các giá trị
âm của hàm RELU.
Hình 1.12: Đồ thị hàm ELU
10
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.2 Mạng nơ ron nhân tạo
1.2.1 Giới thiệu mạng nơ ron nhân tạo
Mạng nơ ron nhân tạo (Artificial Neural Network ANN) là một chuỗi các giải
thuật lập trình, mô phỏng dựa trên cách hoạt động của mạng lưới thần kinh trong não bộ
các sinh vật sống. Mạng nơ ron nhân tạo được sử dụng để tìm ra mối quan hệ của một tập
dữ liệu thông qua một thiết kế kiến trúc chứa nhiều tầng ẩn (hidden layer), mỗi tầng lại
chứa nhiều nơ ron. Các nơ ron được kết nối với nhau và độ mạnh yếu của các liên kết
được biểu hiện qua trọng số liên kết.
Lập trình thông thường có thể làm được rất nhiều phần mềm lớn, như tính toán mô
phỏng các vụ nổ hạt nhân trong siêu máy tính ở các phòng thí nghiệm, hoặc tái hiện các tế
bào ở cấp độ phân tử để phân tích các thử nghiệm thuốc. Một siêu máy tính có thể tính
toán được nhiều tỉ phép tính trên giây, tuy nhiên lập trình thông thường lại gặp khó khăn
trong việc nhận ra các mẫu đơn giản, ví dụ như nhận diện mặt người, điều mà một bộ não
sinh học xử lý nhanh và chính xác hơn nhiều.
Áp dụng với các kỹ thuật học sâu, mạng nơ ron nhân tạo hiện nay đang được áp
dụng để giải quyết những vấn đề mà lập trình theo logic thông thường khó có thể giải
quyết được. Do đó, mạng nơ ron nhân tạo đang nhanh chóng trở nên phổ biến, và là xu
thế trên nhiều lĩnh vực.
1.2.2 Một số kiểu mạng nơ ron
Có hai kiểu mạng nơ ron chính: mạng nơ ron truyền thằng (feedforward neural
network) và mạng nơ ron hồi quy (recurrent neural network).
Mạng truyền thẳng và hồi quy được minh họa như sau:
Hình 1.13: Mạng nơ ron truyền thẳng
11
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Dễ thấy, ở mạng nơ ron truyền thẳng, các nơ ron trong tầng ẩn đều được kết
nối với các nơ ron trong tầng n. Do có nhiều tầng ẩn nên chúng ta có thể thấy rằng mạng
truyền thẳng kéo dài trong không gian, và là không có bất kỳ đường tuần hoàn (cyclic
path) nào nằm trong mạng. Mạng nơ ron truyền thẳng rất phổ biến hiện nay.
Hình 1.14: Mạng nơ ron hồi quy
Một loại khác là mạng nơ ron hồi quy. Không giống như mạng nơ ron truyền
thẳng, mạng nơ ron hồi quy có ít nhất một đường dẫn tuần hoàn. Chúng ta có thể thấy nó
ở hình minh họa phía trên. Vì có một đường dẫn tuần hoàn, nên mạng nơ ron hồi quy có
thể gây ra vòng lặp vô cực. Tuy nhiên, mạng nơ ron tuần hoàn có một ứng dụng quan
trọng là chúng có thể nhận diện cho các giai đoạn thời gian khác nhau, như hình minh họa
sau:
Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy
Như ví dụ trên, có một nút A kết nối với nút B và một chu kỳ đến chính nút A.
Mạng nơ ron hồi quy không xử lý đường dẫn tuần hoàn và các kết nối cùng một lúc.
Mạng nơ ron hồi quy giả sử rằng đầu ra của nút A trong thời gian n là đầu vào của nút B
và nút A trong thời gian n + 1. Vì vậy, ngoài tính chất kéo dài trong không gian khi kết
nối với các tầng nơ ron tiếp theo, mạng nơ ron hồi quy cũng nằm sâu trong thời gian. Vì
vậy, các mạng nơ ron hồi quy có thể mô hình hóa các hệ thống thay đổi theo bối cảnh. Ví
dụ: mạng nơ ron hồi quy thường được sử dụng trong xử lý ngôn ngữ theo ngữ cảnh. Mạng
12
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
nơ ron hồi quy có thể xử lý các phụ thuộc xa (long-term dependencies) theo mốc thời
gian, ví dụ như mạng bộ nhớ dài-ngắn (Long Short Term Memory networks).
1.2.3 Mạng nơ ron lan truyền ngược
1.2.3.1 Tổng quan về mạng nơ ron lan truyền ngược
Giải thuật lan truyền ngược được mô tả ngắn gọn như sau:
1. Bước 1: Lan truyền. Giai đoạn lan truyền có hai bước, lan truyền tiến và lan
truyền ngược. Bước lan truyền tiến là nhập dữ liệu huấn luyện vào các mạng
nơ ron và tính toán đầu ra. Sau đó, dựa vào kết quả đầu ra, so sánh với dữ
liệu huấn luyện. Chúng ta có thể sử dụng lan truyền ngược để cập nhật
ngược lại trọng số lại cho các nơron trong các tầng trước đó.
2. Bước 2: Cập nhật trọng số. Mạng cập nhật các giá trị của trọng số của nơ
ron theo lỗi của kết quả đầu ra.
3. Bước 3: Lặp hai bước trên. Lặp lại bước một và hai cho đến khi sai số tối
thiểu. Sau đó kết thúc khóa huấn luyện.
1.2.3.2 Cách thức lan truyền ngược
1. Sử dụng để biểu diễn đầu vào cho nút của lớp .
2. Sử dụng cho trọng số từ nút của lớp đến nút của lớp
3. Sử dụng được biểu diễn cho độ lệch của nút của lớp .
4. Sử dụng đại diện cho đầu ra của nút của lớp .
5. Sử dụng đại diện cho đầu ra mong muốn, dựa trên tập huấn luyện được sử
dụng.
6. Sử dụng là hàm kích hoạt, sử dụng Sigmoid cho hàm kích hoạt.
Để có được lỗi tối thiểu, hàm chi phí được tính toán với công thức như sau:
13
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Trong đó x là đầu vào dữ liệu huấn luyện và là đầu ra mong muốn. L là tổng số
lớp và y L
là đầu ra của mạng nơ ron tương ứng với đầu vào x. Để đạo hàm dễ dàng, ta
j
nhân tổng của (4) với một hằng số 1/2.
Để tìm ra mức tối thiểu. Trước tiên, ta tính toán các đạo hàm riêng của hàm chi phí
đối với bất kỳ trọng số nào, với công thức sau:
Có hai trường hợp: Nút là một nút đầu ra hoặc trong một tầng ẩn. Trong trường
hợp ở tầng đầu ra, trước tiên chúng ta tính đạo hàm chênh lệch:
Phương trình cuối cùng dựa trên quy tắc chuỗi. Nút là nút duy nhất có trọng số
nên các giá trị khác sẽ bằng 0. Và là đầu ra của hàm kích hoạt (hàm Sigmoid). Do
đó, phương trình mới thu được là:
Trong đó xL
sự kết hợp tuyến tính của tất cả các đầu vào của nút j trong tầng L với
k
các trọng số. Hàm sigmoid là đạo hàm có dạng sau:
14
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Do đó, hàm trên trở thành:
Vì
x W y
L 1
L L
k ik i
i L 1
. Vì vậy, (9) trở thành:
(10)
Vì liên quan đến và không liên quan khi khác . Do đó, có mối
quan hệ giữa nút của tầng và nút của tầng . Ta có công thức:
để biểu diễn nút của tầng . Do vậy, phương trình mới thu được là:
Ta xem xét các nút của tầng ẩn . Ở lớp ngay trước lớp đầu ra. Áp dụng đạo
hàm riêng một phần trên trọng số cho hàm chi phí. Các trọng số cho các nút của tầng ẩn
này:
15
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Vì có một tổng trên tầng. Do thay đổi của các trọng số cho các nút của các
tầng ẩn sẽ ảnh hưởng đến đầu ra mạng nơ ron. Do đó, áp dụng quy tắc chuỗi (chain rule):
Sau đó, đạo hàm theo quy tắc chuỗi:
Dòng thứ 2 của (14) dựa vào đầu vào của là sự kết hợp tuyến tính giữa các đầu
ra của nút của lớp trước với trọng số. Vì đạo hàm không liên quan đến nút của lớp L.
Do đó, ta đơn giản hóa đạo hàm dựa trên quy tắc chuỗi:
Chuyển thành . Do đó phương trình trở thành:
Ta xét 2 trường hợp:
16
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Đối với tầng đầu ra nút k: , trong đó:
Đối với tầng ẩn nút j: , trong đó:
Áp dụng quy trình tương tự. Ví dụ, Tính đạo hàm riêng cho độ lệch của nút k trong
lớp cuối cùng và thu được:
Bởi vì nên . Phương trình có thể được cập nhật
thành:
Công thức trên áp dụng với bất kể đầu ra nào. Vì vậy, độ dốc của hàm chi phí so
với độ lệch là:
Rút ra từ công thức trên, giải thuật loan truyền ngược sẽ được mô tả như sau:
Bước 1: Chạy mạng tính toán với dữ liệu đầu vào để có được đầu ra mạng
Bước 2: Đối với mỗi nút đầu ra, ta thực hiện phép tính:
Bước 3: Đối với mỗi nút ở tầng ẩn, ta thực hiện phép tính:
17
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bước 4: Cập nhật các trọng số và thiên lệch như sau:
Giả thiết:
Áp dụng:
Tham số trong thuật toán được gọi là tốc độ học tập. Thuật toán này lặp lại cho
đến khi đạt sai số tối thiểu hoặc dưới ngưỡng chấp nhận được để hoàn thành quá trình
huấn luyện.
1.3 Mạng nơ ron tích chập
1.3.1 Khái niệm về mạng nơ ron tích chập
Mạng nơ ron tích chập là một trong những mạng truyền thẳng đặc biệt. Mạng nơ
ron tích chập là một mô hình học sâu phổ biến và tiên tiến nhất hiện nay. Hầu hết các hệ
thống nhận diện và xử lý ảnh hiện nay đều sử dụng mạng nơ ron tích chập vì tốc độ xử lý
nhanh và độ chính xác cao. Trong mạng nơ ron truyền thống, các tầng được coi là một
chiều, thì trong mạng nơ ron tích chập, các tầng được coi là 3 chiều, gồm: chiều cao,
chiều rộng và chiều sâu (Hình 1.11). Mạng nơ ron tích chập có hai khái niệm quan trọng:
kết nối cục bộ và chia sẻ tham số. Những khái niệm này góp phần giảm số lượng trọng số
cần được huấn luyện, do đó tăng nhanh được tốc độ tính toán.
Hình 1.16: Các tầng (layer) trong CNN là 3 chiều
18
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]
1.3.2 Mô hình mạng nơ ron tích chập
Có ba tầng chính để xây dựng kiến trúc cho một mạng nơ ron tích chập:
1. Tầng tích chập;
2. Tầng gộp (pooling layer);
3. Tầng được kết nối đầy đủ (fully-connected).
Tầng kết nối đầy đủ giống như các mạng nơ ron thông thường, và tầng chập thực
hiện tích chập nhiều lần trên tầng trước. Tầng gộp có thể làm giảm kích thước mẫu trên
từng khối 2x2 của tầng trước đó. Ở các mạng nơ ron tích chập, kiến trúc mạng thường
chồng ba tầng này để xây dựng kiến trúc đầy đủ. Ví dụ minh họa về một kiến trúc mạng
nơ ron tích chập đầy đủ:
Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]
19
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.3.2 Xây dựng mạng nơ ron tích chập
1.3.2.1 Mạng được kết nối cục bộ
Trong xử lý hình ảnh, thông tin của hình ảnh là các điểm ảnh (pixel). Nếu sử dụng
mạng được kết nối đầy đủ, chúng ta sẽ có rất nhiều tham số. Ví dụ, một hình ảnh RGB có
kích thước 512x512 pixel sẽ có 786432 (= 512 x 512 x 3) tham số đầu vào. Vì vậy, nếu
chúng ta sử dụng kiến trúc mạng nơ ron trong hình sau:
Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ
Hình trên cho thấy nếu áp dụng mạng nơ ron được kết nối đầy đủ, toàn bộ kiến
trúc mạng sẽ cần tính toán hơn 3 triệu nơ ron. Số lượng lớn các nơ ron làm cho toàn bộ
quá trình học rất chậm và dẫn đến quá tải so với khả năng tính toán của máy tính hiện tại.
Qua một vài nghiên cứu về xử lý ảnh, các nhà nghiên cứu nhận thấy rằng các tính
năng trong một hình ảnh thường là cục bộ, và các nhà nghiên cứu chú ý đến các tính năng
cấp thấp đầu tiên khi xử lý ảnh. Vì vậy, kiến trúc mạng có thể chuyển mạng được kết nối
đầy đủ sang mạng được kết nối cục bộ, nhằm làm giảm độ phức tạp của tính toán. Đây là
một trong những ý tưởng chính trong CNN. Chúng ta có thể thấy rõ hơn qua hình sau:
Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron
tầng ẩn
Giống như xử lý hình ảnh thông thường, chúng ta có thể kết nối cục bộ một khối
vuông ma trận với nơ ron. Kích thước khối thông thường là 3x3, 5x5, hoặc 7x7. Ý nghĩa
vật lý của khối giống như một cửa sổ trượt (cửa sổ trượt là một trong những phương pháp
20
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
xử lý ảnh). Bằng cách đó, số lượng tham số có thể giảm xuống rất nhỏ nhưng không gây
ra giảm hoặc mất thông tin, vì hình ảnh thông thường thường có tính lặp trong không
gian. Để trích xuất nhiều thông tin hơn, các mạng nơ ron kết nối khối cùng với một nơ ron
khác. Độ sâu trong các tầng là số lần chúng ta kết nối một khu vực với các nơ ron khác
nhau. Ví dụ, mạng kết nối cùng một khu vực với 5 nơ ron khác nhau. Vì vậy, độ sâu là
năm trong tầng mới. Chúng ta có thể thấy rõ hơn qua hình sau:
Hình 1.21: Ví dụ về lớp tích chập
Trong thực tế, có thể kết nối tất cả thông tin độ sâu (ví dụ: kênh 3 RGB) với nơ ron
tiếp theo vì kết nối là cục bộ trong không gian và có chiều sâu đầy đủ. Tuy nhiên ở ví dụ
này chỉ kết nối thông tin cục bộ về chiều cao và chiều rộng. Vì vậy, có thể có
các tham số trong hình trên cho nơ ron sau lớp màu xanh nếu chúng ta sử dụng cửa sổ
. Biến thứ nhất và thứ hai là chiều cao và chiều rộng của kích thước cửa sổ và biến
thứ ba là độ sâu của lớp.
Ví dụ này di chuyển cửa sổ bên trong hình ảnh và làm cho tầng tiếp theo cũng có
chiều cao và chiều rộng, và là một hai chiều. Ví dụ: nếu chúng ta di chuyển cửa sổ 1 pixel
mỗi lần, gọi là bước nhảy là 1, trong một hình ảnh và kích thước cửa sổ là
sẽ có các nơ ron ở tầng tiếp theo. Có thể thấy rằng, kích
thước đã giảm từ 32 xuống 28. Vì vậy, để bảo toàn kích thước, chúng ta thêm phần trống
vào đường viền. Quay lại ví dụ trên, nếu chúng ta đệm với 2 pixel, có
các nơ ron ở lớp tiếp theo để giữ kích thước chiều cao và chiều
rộng. Như ví dụ trên, nếu chúng ta sử dụng kích thước cửa sổ w, chúng ta sẽ có 1 vùng
được tích chập với kích cỡ của cửa sổ mới là pixel. Thông tin đường viền sẽ
không ảnh hưởng nhiều vì những giá trị đó chỉ được sử dụng một lần.
21
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Phần kế tiếp sẽ chi tiết hơn về bước nhảy của cửa sổ trượt, tức khoảng cách thay
đổi của cửa sổ mỗi lần. Ví dụ: giả sử bước nhảy là 2 và cửa sổ trượt bao phủ vùng
Sau đó, cửa sổ thứ hai bao phủ vùng và cửa sổ thứ 3 bao phủ vùng
Ví dụ, nếu chúng ta sử dụng bước nhảy 1 và kích thước cửa sổ trong hình
ảnh và không sử dụng bù viền (pad-zero), thì chúng ta sẽ có
các nơ ron ở lớp tiếp theo. Nếu chúng ta thay đổi bước nhảy 1 thành
bước nhảy 2và những tham số khác vẫn giữ nguyên, thì chúng ta sẽ có có
những nơ ron ở lớp tiếp theo. Chúng ta có thể kết luận rằng nếu chúng
ta sử dụng bước nhảy s, kích thước cửa sổ trong ảnh , thì sẽ có
các nơ ron ở lớp tiếp theo. Khi
chúng ta sử dụng bước nhảy 3 và những tham số khác vẫn giữ nguyên thì chúng ta sẽ
nhận được Vì kết quả không phải là số nguyên, nên bước nhảy 3
không thể dùng vì chúng ta không thể có được một khối hoàn chỉnh trong một mạng nơ
ron.
1.3.2.2 Chia sẻ tham số
Trong ví dụ minh họa của mục 1.3.2.1, ta sẽ có số lượng là nơ ron
ở tầng tiếp theo có bước nhảy 1, kích thước cửa sổ 5 x 5 và không có đệm, với độ sâu là 5.
Mỗi nơ ron sẽ có tham số. Vì vậy, trong tầng tiếp theo sẽ có
tham số. Ở đây, chúng ta có thể chia sẻ các tham số
theo từng độ sâu, do đó nơ ron ở mỗi tầng ẩn sẽ sử dụng tham số giống nhau là
, và tổng tham số sử dụng cho mỗi tầng là . Điều này làm số
lượng tham số giảm một cách đáng kể. Tương tự, các nơ ron ở mỗi độ sâu trong tầng tiếp
theo sẽ áp dụng tích chập cho tầng trước đó. Và quá trình học tập giống như học lõi (core)
tích chập. Đây là lý do mà các mạng nơ ron này được gọi là mạng nơ ron tích chập.
1.3.2.3 Hàm kích hoạt
Trong mô hình nơ ron truyền thống, các mạng thường sử dụng hàm sigmoid cho
hàm kích hoạt. Tuy nhiên Krizhevsky [21] đã thử với hàm kích hoạt RELU. Sau khi so
22
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
sánh hiệu quả của hàm kích hoạt RELU và hàm kích hoạt sigmoid trong CNNs. Họ thấy
rằng mô hình với RELU cần ít thời gian lặp hơn trong khi đạt tỷ lệ lỗi khi huấn luyện
tương đương. Chúng ta có thể thấy kết quả trong hình sau:
Hình 1.22: So sánh giữa ReLU và Sigmoid.
Như hình trên, đường liền nét là mô hình sử dụng RELU và đường đứt nét là sử
dụng hàm Sigmoid. Có thể dễ dàng thấy rằng, RELU cần ít vòng lặp hơn để đạt tỉ lệ lỗi
chấp nhận được. Do đó, ngày nay đa số các mô hình CNN gần đây sử dụng RELU để làm
hàm kích hoạt.
1.3.2.4. Tầng gộp
Tầng gộp sẽ giảm kích cỡ của hình ảnh ngay sau khi thực hiện tích chập, giúp giữ
lại các đặc điểm, tính chất nổi bật nhất của ảnh. Điều này cho phép giảm mức độ tính toán
khi hình ảnh có kích thước quá lớn, đồng thời không làm mất đi các đặc điểm quan trọng
của ảnh.
Tuy đã sử dụng các mạng được kết nối cục bộ và chia sẻ tham số, tuy nhiên số
lượng tham số trong mang nơ ron vẫn là quá lớn. So với một tập dữ liệu tương đối nhỏ, nó
có thể gây ra tình trạng quá khớp (overfitting). Vì vậy, mạng nơ ron nhân tạo thường chèn
các tầng gộp vào mạng. Tầng gộp xử lý để giảm dần số lượng tham số nhằm cải thiện thời
gian tính toán trong mạng nơ ron. Tầng gộp áp dụng lấy mẫu xuống cho tầng trước bằng
cách sử dụng hàm max. Tầng gộp hoạt động độc lập trên mỗi tầng trước đó. Ngoài ra, có
23
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thể đặt lượng pixel khi chúng ta di chuyển cửa sổ trượt hoặc bước nhảy, như làm với tầng
tích chập. Ví dụ, trong hình sau:
Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp
Ở ví dụ trên, kích thước cửa sổ trượt là và bước nhảy mỗi lần trượt là 2. Tại
mỗi cửa sổ, hàm max sẽ lấy giá trị tối đa để đại diện cho giá trị của tầng tiếp theo. Có hai
loại tầng gộp: Nếu kích thước cửa sổ trượt bằng bước nhảy, đó là gộp chung (traditional
pooling). Nếu kích thước cửa sổ trượt lớn hơn bước nhảy, đó là gộp nhóm (overlapping
pooling). Trong thực tế, các mạng nơ ron thường sử dụng kích thước cửa sổ cùng
kích thước bước nhảy là 2 trong gộp chung và sử dụng kích thước cửa sổ cùng
kích thước bước nhảy là 2 trong gộp nhóm, vì nếu tăng kích cỡ cửa sổ sẽ rất dễ làm mất
các đặc tính của dữ liệu.
Ngoài việc gộp sử dụng hàm max, người ta có thể sử dụng các hàm khác. Ví dụ
người ta có thể sử dụng hàm tính trung bình của cửa sổ trượt để tính toán giá trị cho tầng
tiếp theo, được gọi là gộp trung bình.
1.3.2.5. Tầng được kết nối đầy đủ
Tầng thứ ba là tầng được kết nối đầy đủ. Tầng này giống như mạng nơ ron truyền
thống: các nơ ron ở tầng trước sẽ kết nối với một nơ ron ở tầng tiếp theo và tầng cuối
cùng là đầu ra. Để có thể đưa hình ảnh từ những tầng trước vào, ta phải dàn phẳng dữ liệu
ra thành một véc tơ nhiều chiều. Cuối cùng là sử dụng hàm softmax để thực hiện phân
loại đối tượng
24
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ
1.3.2.6 Mô hình quá khớp
Cấu trúc của một mạng CNN rất lớn, trong mạng có rất nhiều nơ ron, kết nối, cũng
như có rất nhiều trọng số cần thiết để huấn luyện. Nhưng lượng dữ liệu huấn luyện thường
không đủ để huấn luyện hoàn thiện cho một mạng nơ ron lớn. Nó có thể gây ra một số vấn
đề về quá khớp, khiến cho khi huấn luyện có kết quả rất cao, nhưng áp dụng thực tế gây ra
sai số lớn. Có một số kỹ thuật để cải thiện điều này.
Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)
Một trong những phương pháp đó là là giảm trọng số trong lúc huấn luyện.
Dropout là một trong những kỹ thuật nổi tiếng và khá phổ biển để khắc phục vấn đề này.
Dropout đặt đầu ra của mỗi nơ ron ẩn thành 0 với xác suất 0,5. Vì vậy, các nơ ron này sẽ
không đóng góp vào lan truyền tiến, do đó và sẽ không tham gia vào lan truyền ngược.
Thông thường, đối với các đầu vào khác nhau, mạng nơ ron xử lý dropout theo một cấu
trúc khác nhau.
Một cách khác để cải thiện việc việc quá khớp là tăng lượng dữ liệu. Chúng ta có
thể phản chiếu hình ảnh, lộn ngược hình ảnh, lấy mẫu hình ảnh, v.v. Những cách này sẽ
tăng số lượng dữ liệu huấn luyện. Vì vậy, nó có khả năng ngăn chặn quá khớp. Với ví dụ
thực tế, trong một vài dự án, các bức ảnh được sử dụng để huấn luyện đã được xử lý thêm
25
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
bước xoay, với mỗi lần từ 15 đến 20 độ cũng như áp dụng thêm phương pháp phản chiếu
bức ảnh. Kết quả, hệ thống AI đã phát hiện cải thiện đáng kể việc nhận diện.
1.3.2.7. Một số mạng tích chập nổi tiếng
Có một số kiến trúc mạng nơ ron tích chập nổi tiếng. Một số thử nghiệm cho thấy
chúng có hiệu suất tốt hơn. Vì vậy, đôi khi nhiều người sử dụng mạng được thiết kế sẵn
thay vì tự thiết kế mạng. Ở các phần sau luận văn sẽ giới thiệu một vài mạng tích chập nổi
tiếng và thông dụng hiện nay.
AlexNet
Hình 1.26: Cấu trúc của AlexNet
Alex đã phát triển mạng này vào năm 2012. Cho tới thời điểm hiện tại, AlexNet
vẫn còn đang được sử dụng phổ biến và rộng rãi. Mạng AlexNet có năm lớp chập và ba
lớp kết nối đầy đủ. Cấu trúc trong AlexNet được chia thành hai khối. Nguyên nhân vì tác
giả đã sử dụng hai GPU để huấn luyện dữ liệu song song. Mạng này được sử dụng trong
phân loại đối tượng quy mô lớn. Lớp đầu ra có một nghìn nơ ron. Đó là bởi vì kiến trúc
ban đầu được thiết kế để phân loại một nghìn nhãn. Thông thường, những người áp dụng
kiến trúc mạng nơ ron AlexNet sẽ thay thế lớp cuối cùng, phụ thuộc vào mục đích của họ.
Tác giả của mạng này đã làm nhiều thử nghiệm để có thể ra được mô hình này có kết quả
tốt nhất. Vì vậy, hiệu suất của cấu trúc này rất ổn định và mạng này được sử dụng rộng rãi
trong nhiều ứng dụng.
VGGNet
VGGNet [10] được phát triển vào năm 2014 và đã giành chiến thắng trong cuộc thi
ILSVRC-2014. Mạng này mạnh hơn mạng AlexNet nhưng rất sâu. Mạng này có 16 đến
19 tầng (Hình 1.21). Mạng này đã được thiết kế với 5 cấu trúc. Sau một số thí nghiệm, D
và E là cấu trúc tốt nhất. Hiệu suất của E tốt hơn một chút so với B. Nhưng các tham số
trong E lớn hơn D. Vì vậy, người sử dụng có thể chọn một trong số cấu trúc mạng dựa
trên những gì họ cần. Đặc điểm của VGGNet là việc áp dụng nhiều lớp chập với kích
26
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thước cửa sổ nhỏ thay vì lớp chập với kích thước cửa sổ lớn, sau đó là lớp gộp. Nó làm
cho mạng linh hoạt hơn.
Hình 1.27: Cấu trúc của VGGNet
1.4 Kết luận
Mạng nơ ron nhân tạo là một chuỗi các thuật toán được sử dụng để tìm ra mối quan
hệ của một tập dữ liệu thông qua cơ chế vận hành của bộ não sinh học. Mạng nơ ron nhân
tạo thường được huấn luyện qua một tập dữ liệu chuẩn cho trước, từ đó có thể đúc rút
được kiến thức từ tập dữ liệu huấn luyện, và áp dụng với các tập dữ liệu khác với độ chính
xác cao.
Các phương pháp sử dụng để huấn luyện mạng nơ ron nhân tạo ngày càng tối ưu
hơn về mặt tính toán và phục vụ cho nhiều mục đích khác nhau. Hiện nay, kiến trúc mạng
nơ ron ngày càng được hoàn thiện cho nhiều nhiệm vụ, trong đó mạng nơ ron tích chập
được chú ý rất nhiều vì tính hiệu quả trong thị giác máy tính. Mạng nơ ron tích chập với
các cải tiến góp phần giảm thời gian tính toán và tăng độ chính xác hứa hẹn sẽ là một
trong những phương pháp được áp dụng rất nhiều vào thực tế trong tương lai.
27
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 2.
BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP
2.1 Khái niệm về nhận dạng
Nhận dạng là một ngành thuộc lĩnh vực trí tuệ nhân tạo. Nhận dạng mẫu là khả
năng phát hiện sự sắp xếp các đặc tính hoặc dữ liệu mang lại thông tin về một hệ thống
hoặc tập dữ liệu nhất định. Nhận dạng mẫu chia thành nhiều lĩnh vực trong công nghệ
thông tin, bao gồm phân tích dữ liệu lớn, nhận dạng sinh trắc học, bảo mật và trí tuệ nhân
tạo. Nhận dạng đối tượng trong hình ảnh là một nhánh của nhận dạng mẫu. Nhận dạng đối
tượng trong hình ảnh thể hiện qua các công nghệ máy tính có thể nhận ra người, động vật,
vật thể hoặc các đối tượng mục tiêu khác thông qua việc sử dụng các thuật toán và khái
niệm học máy.
2.1.1 Nhận dạng đối tượng
Một số khái niệm liên quan:
Nhận dạng đối tượng (object recognition) là một thuật ngữ chung để mô tả
một tập hợp các cách xử lý trong thị giác máy tính có liên quan đến việc xác
định các đối tượng trong ảnh kỹ thuật số.
Phân loại hình ảnh (image classification) liên quan đến việc dự đoán, phân
loại các lớp thông tin của một đối tượng trong một hình ảnh.
Khoanh vùng đối tượng (object localization) là việc xác định vị trí của một
hoặc nhiều đối tượng trong một hình ảnh bằng hình chữ nhật xung quanh
phạm vi của đối tượng bằng hộp chứa (bounding box).
Phát hiện đối tượng (object detection) kết hợp cả hai nhiệm vụ nhận dạng
đối tượng và khoanh vùng đối tượng. Phát hiện đối tượng là việc khoanh
vùng và phân loại một hoặc nhiều đối tượng khác nhau trong một hình ảnh.
Nhận dạng đối tượng khác với phát hiện đối tượng ở chỗ nhận dạng đối tượng
mang ý nghĩa rộng hơn, bao gồm cả việc phân loại hình ảnh (đòi hỏi thuật toán xác định
các lớp của đối tượng xuất hiện trong hình ảnh), cũng như phát hiện đối tượng (đòi hỏi
thuật toán khoanh vùng, định vị được tất cả các đối tượng có trong hình ảnh)
28
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng
2.1.2 Nhận dạng khuôn mặt
Nhận dạng khuôn mặt là khả năng nhận diện, lưu trữ,so sánh và phân tích các mẫu
dựa trên đường nét khuôn mặt để nhận dạng người từ hình ảnh hoặc video. Hệ thống
thường sử dụng các công nghệ để thực hiện nhận dạng khuôn mặt như sử dụng sinh trắc
học để ánh xạ các đặc điểm khuôn mặt từ ảnh hoặc video. Hệ thống so sánh thông tin này
với một cơ sở dữ liệu đã lưu trữ về các khuôn mặt để tìm ra một kết quả khớp chính xác
Nhận dạng khuôn mặt ngày càng được quan tâm trong nhiều lĩnh vực, như Trung
Quốc có hệ thống Skynet để chấm điểm công dân, hay nhiều chuỗi cửa hàng lớn cũng sử
dụng nhận dạng khuôn mặt khách hàng thân thiết để phân tích thói quen tiêu dùng. Trên
thực tế, công nghệ nhận dạng khuôn mặt đã nhận được sự chú ý đáng kể vì nó có tiềm
năng cho một loạt các ứng dụng liên quan đến thực thi pháp luật cũng như các doanh
nghiệp khác.
Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32, conv42 và
conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt.
29
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.2. Lịch sử và phát triển
Nhận dạng khuôn mặt tự động là một khái niệm tương đối mới, được phát triển
vào những năm 1960. Hệ thống bán tự động đầu tiên cho nhận dạng khuôn mặt cần quản
trị viên phải xác định được vị trí các điểm cần được đánh dấu (như mắt, tai, mũi và
miệng) trên các bức ảnh, sau đó tính toán khoảng cách và tỷ lệ đến một điểm tham chiếu
chung, cuối cùng đó được so sánh với dữ liệu để ra kết quả.
Vào những năm 1970, Goldstein, Harmon và Lesk1 sử dụng 21 loại thông tin cụ
thể, chẳng hạn như màu tóc và độ dày môi để tự động nhận dạng. Vấn đề với cả hai giải
pháp ban đầu này là các phép đo dựa trên vị trí, và cần sự tính toán thủ công của con
người để có thể vận hành.
Năm 1988, Kirby và Sirovich áp dụng phân tích các thành phần nổi bật, một kỹ
thuật đại số tuyến tính tiêu chuẩn vào việc nhận dạng khuôn mặt. Đây được coi là một
phần của cột mốc thay đổi vì dưới một trăm giá trị được yêu cầu mã hóa chính xác một
hình ảnh khuôn mặt được căn chỉnh và chuẩn hóa phù hợp.
Vào năm 1991, Turk và Pentland phát hiện ra rằng trong khi sử dụng kỹ thuật
thành phần riêng, lỗi dư (residual error) có thể được sử dụng để phát hiện khuôn mặt trong
hình ảnh - một khám phá có thể tạo ra được một hệ thống nhận diện khuôn mặt tự động,
thời gian thực và đáng tin cậy. Mặc dù cách tiếp cận có phần bị hạn chế bởi các yếu tố
máy móc của giai đoạn đó, nhưng nó đã tạo ra sự quan tâm đáng kể trong việc phát triển
công nghệ nhận dạng khuôn mặt tự động.
Công nghệ đầu tiên đã thu hút được sự chú ý rất lớn của truyền thông khi triển khai
thử nghiệm tại Super Bowl tháng 1 năm 2001, trong đó ghi lại hình ảnh từ camera giám
sát và so sánh chúng với một cơ sở dữ liệu kỹ thuật số. Sau sự kiện này, đã có các phân
tích về tính cần thiết của việc sử dụng công nghệ để hỗ trợ nhu cầu quốc gia, trong khi
vẫn quan tâm đến các mối quan tâm xã hội và quyền riêng tư của cộng đồng. Ngày nay,
công nghệ nhận dạng khuôn mặt đang được sử dụng để chống lại gian lận hộ chiếu, hỗ trợ
thực thi pháp luật, xác định trẻ em mất tích, và giảm thiểu gian lận danh tính.
2.3. Cách thức hoạt động
Phương pháp bao gồm các bước khác nhau để thực hiện nhận diện khuôn mặt tự
động. Đầu tiên là thực hiện phát hiện khuôn mặt để khoanh vùng khuôn mặt trong từng
khung hình ảnh và video. Sau đó, dữ liệu ở bước trên đuợc liên kết với các khuôn mặt
được phát hiện với danh tính chung trên các video và căn chỉnh các khuôn mặt thành tọa
độ bằng cách sử dụng các mốc được phát hiện. Cuối cùng, hệ thống thực hiện xác minh
30
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
khuôn mặt để tính toán độ tương tự giữa một cặp hình ảnh / video. Sơ lược phương pháp
được minh họa trong hình 2.3.
Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người
bằng mạng nơ ron tích chập
Cụ thể, ta có thể xem xét ví dụ với thiết kế mạng ở hình 2.4 để rõ hơn về tổng quan
cách thức hoạt động:
Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh
Từ mạng nơ ron trên, ta có thể thấy các bước xử lý ảnh từ trái sang phải. Lần lượt,
ta có thể thấy hình ảnh các cửa sổ dò tìm (ô vuông màu xanh) đang giảm dần và hiệu
chỉnh dần theo từng giai đoạn dò tìm:
31
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh
2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera
2.4.1 Nhận diện khuôn mặt
Tất cả các khuôn mặt trong khung hình ảnh / video được phát hiện bằng hệ thống
dò khuôn mặt dựa trên mạng nơ ron tích chập sâu (Deep Convolutional Neural Network –
DCNN), được gọi là Mô hình tháp sâu để phát hiện khuôn mặt (Deep Pyramid
Deformable Parts Model for Face Detection - DP2MFD) [38], bao gồm hai mô-đun. Mô-
đun đầu tiên tạo ra một hình tháp sâu được chuẩn hóa bảy cấp cho bất kỳ hình ảnh đầu
vào nào có kích thước tùy ý, như đã minh họa trong hình ảnh 2.3. Kiến trúc mạng nơ ron
tích chập tương tự như Alexnet, được sử dụng để trích xuất các tính năng sâu. Mạng hình
tháp này tạo ra một tháp gồm 256 bản đồ đặc trưng ở lớp tích chập thứ 5 (conv5). Bộ lọc
được áp dụng để có được lớp max5. Thông thường, cường độ kích hoạt cho một
vùng khuôn mặt giảm theo kích thước của cấp độ của tháp. Do đó, một khuôn mặt lớn
được phát hiện bởi cửa sổ trượt có kích thước cố đinh ở cấp độ tháp thấp hơn sẽ có điểm
phát hiện cao so với khuôn mặt nhỏ được phát hiện ở cấp độ tháp cao hơn. Để giảm độ
lệch này cho kích thước khuôn mặt, hệ thống áp dụng bước chuẩn hóa điểm z trên các
tính năng max5 ở mỗi cấp. Đối với vectơ đặc trưng 256 chiều ở cấp tháp i và vị trí
(j, k), tính năng chuẩn hóa được tính như sau:
Trong đó, là vectơ đặc trưng trung bình và là độ lệch chuẩn cho cấp độ tháp
i. Các tính năng max5 được chuẩn hóa là . Sau đó, các tính năng có độ dài từ mỗi
vị trí trong tháp được trích xuất bằng cách sử dụng phương pháp cửa sổ trượt. Mô-đun thứ
hai là một SVM tuyến tính (linear SVM), lấy các tính năng này làm đầu vào để phân loại
từng vị trí là mặt, hoặc không phải là mặt, dựa trên điểm được tính toán. Mô hình tháp sâu
32
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
để phát hiện khuôn mặt - DP2MFD có khả năng nhận diện rất tốt trên các độ sáng ảnh
khác nhau, cũng như kích cỡ khuôn mặt. Chúng ta có thể thấy thông qua ví dụ sau:
Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu
2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt
Khi các khuôn mặt được phát hiện, thuật toán thực hiện phát hiện các điểm quan
trọng để căn chỉnh khuôn mặt. Thuật toán sẽ tìm cách khôi phục mặt về hình dáng mặc
định ban đầu: gọi khuôn mặt là I, hình dạng ban đầu là S0
, thuật toán sẽ tính toán mức
tăng hình dạng ∆S từ các mô tả sâu (deep descriptors) và cập nhật bằng công thức sau:
Các tính năng CNN (được biểu thị là Φ trong công thức trên) được thiết kế với
bước nhảy và cách gộp hợp lý, được sử dụng làm các tính năng để thực hiện tính toán. Ở
đây, kiến trúc CNN được sử dụng tương tự như Alexnet với các trọng số được xử lý trước
cho bộ dữ liệu ImageNet như trong hình sau:
Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ phát hiện các
điểm mốc trên khuôn mặt
Vì mục tiêu mạng CNN này là phát hiện khuôn mặt. Do đó, mạng sẽ được căn
chỉnh để xử lý dữ liệu khuôn mặt tốt hơn. Các dữ liệu đầu ra ở từng tầng sẽ là dữ liệu đầu
vào ở tầng tiếp theo. Trong hình trên, chúng ta có thể thấy có 5 tầng. Sau khi hoàn thành
33
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
phát hiện các mốc, khuôn mặt sẽ được căn chỉnh theo tọa độ bằng cách sử dụng phép biến
đổi và các điểm mốc.
Điều này giúp mạng tìm hiểu các đặc điểm cụ thể đối với khuôn mặt. Hơn nữa,
mạng áp dụng hồi quy theo tầng, trong đó đầu ra được tạo bởi giai đoạn đầu tiên sẽ được
sử dụng làm đầu vào cho giai đoạn tiếp theo, tổng là năm giai đoạn tích chập được áp
dụng trong hệ thống. Các bộ lọc được chọn để trích xuất tính năng được tinh chỉnh trong
các giai đoạn sau để cải thiện việc chuẩn hóa các mốc trên khuôn mặt. Sau khi hoàn thành
phát hiện các mốc trên khuôn mặt, mỗi khuôn mặt được căn chỉnh theo tọa độ chính tắc
bằng cách sử dụng biến đổi tương tự và các điểm mốc.
Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt
2.4.3 Liên kết khuôn mặt
Vì có nhiều đối tượng xuất hiện trong các khung hình của video, nên việc thực
hiện liên kết khuôn mặt để gán từng khuôn mặt cho đối tượng tương ứng là một bước
quan trọng để chọn đúng đối tượng khi xác minh khuôn mặt. Do đó, khi một khuôn mặt
trong khung hình của video được phát hiện, hệ thống theo dõi khuôn mặt bằng cách tích
hợp các kết quả từ trình phát hiện khuôn mặt, trình theo dõi khuôn mặt và bước liên kết
khuôn mặt.
Hệ thống áp dụng thuật toán nhận diện khuôn mặt trong mọi khung hình bằng
phương pháp nhận diện khuôn mặt được trình bày trong phần trước. Vùng phát hiện
khuôn mặt được coi như một khuôn mặt mới nếu không có tỷ lệ trùng lặp với bất kỳ vùng
phát hiện nào trong các khung hình trước. Tỷ lệ trùng lặp của một vùng phát hiện được
phát hiện và vùng phát hiện trong khung hình trước được xác định là:
34
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Qua thực nghiệm, ngưỡng 0,2 là đủ để coi như xuất hiện khuôn mặt mới, do các
khung hình của video cách nhau chỉ một phần nhỏ của giây. Để theo dõi khuôn mặt, các
nhà khoa học sử dụng giải thuật Kanade-Lucas-Tomasi (KLT) để theo dõi các khuôn mặt
giữa hai khung hình liên tiếp. Hệ thống cập nhật các vùng phát hiện trong quá trình theo
dõi dựa vào khung hình mới nhất. Vùng phát hiện sẽ thay thế cho vùng phát hiện
nếu nhỏ hơn ngưỡng (0,2). Quá trình theo dõi khuôn mặt sẽ bị chấm dứt nếu
không có phát hiện khuôn mặt tương ứng chồng chéo với nó cho nhiều hơn khung hình.
Hệ thống thường đặt giới hạn bằng 4 khung hình, dựa trên cơ sở thực nghiệm. Hình ảnh
kết quả của phương pháp liên kết khuôn mặt cho các video của JANUS CS2:
Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS CS2, là bộ
dữ liệu mở rộng của IJB-A
2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo
2.5.1 Mô hình DeepID 2 (NIPS 2014)
Cách thức hoạt động của mô hình DeepID 2:
Trong quá trình huấn luyện, 200 phần khuôn mặt được cắt với các vị trí, tỉ lệ và
kênh màu sắc khác nhau. Mỗi phần khuôn mặt và phần đối xứng được đưa vào ConvNet.
Hai vector 160 chiều được trích xuất từ phần khuôn mặt và phần đối xứng. Chọn 25 phần
khuôn mặt tốt nhất.
35
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.10: Kiến trúc mạng của mô hình DeepID 2
Một ví dụ về 25 phần khuôn mặt tốt nhất:
Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm
Kết quả của mô hình thể hiện trong bảng.
Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số lượng của
các phần khuôn mặt
36
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Qua bảng 2.1, ta có thể thấy, khi sử dụng 25 phần khuôn mặt để trích xuất đặc
điểm, độ chính xác của phương pháp rất cao, xấp xỉ tới 99%. Tuy nhiên, khi nhận diện với
25 phần khuôn mặt, máy tính cần mất 0.035 giây để tính toán. Mặt khác, với việc chỉ sử
dụng một phần khuôn mặt để trích xuất đặc trưng, thời gian xử lý rất nhanh, chỉ 0,0017
giây, tuy nhiên độ chính xác chỉ còn 95,43%. Dựa trên bảng thống kê này, các nhà phát
triển có thể căn chỉnh số phần khuôn mặt để tối ưu cho bài toán thực tế. Ví dụ như, nếu
cần một hệ thống phản hồi nhanh mà không quá ưu tiên độ chính xác, có thể chỉ sử dụng
một phần khuôn mặt để trích xuất đặc trưng, ngược lại, ta có thể tăng số phần khuôn mặt
nhằm tăng độ chính xác.
Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó trên bộ thư
viện LFW
Qua bảng so sánh trên, ta có thể thấy mô hình DeepID2 khi sử dụng trên bộ thư
viện LFW có độ chính xác rất cao, lên tới hơn 99%. Với độ chính xác cao như vậy,
DeepID2 có thể đưa ra làm sản phẩm và thương mại hóa.
37
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.5.2 Mô hình DeepID3 (arXiv 2015)
Hình 2.12: Kiến trúc mạng của mô hình DeepID3
DeepID3 là mô hình nâng cấp của DeepID2+
Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện LFW
Với bộ dữ liệu LFW năm 2015, ta có thể thấy DeepID3 đã có những cải tiến nhất
định so với DeepID2+, với độ chính xác được tăng cường lên tới 1%
38
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.5.3 Mô hình DeepFace (Facebook, CVPR 2014)
Sơ lược kiến trúc DeepFace: DeepFace sử dụng căn chỉnh 3D để xử lý khuôn mặt.
Sau đó đầu vào được bộ lọc tích chập-gộp chung, tiếp theo được xử lý bởi ba tầng được
kết nối cục bộ và hai tầng được kết nối đầy đủ. Màu sắc minh họa dựa trên đặc trưng được
xử lý ở mỗi tầng. Mạng bao gồm hơn 120 triệu tham số, trong đó hơn 95% đến từ các lớp
cục bộ và được kết nối đầy đủ.
Hình 2.13: Kiến trúc của DeepFace
Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu
LFW
Có thể thấy, mô hình DeepFace đạt kết quả rất cao, lên đến 0.95 tới 0.97, gần ở
mức tiệm cận con người.
2.5.4 Mô hình FaceNet (Google 2015)
FaceNet là một mô hình được tạo ra từ google, và được huấn luyện bởi 260 triệu
bức ảnh. FaceNet có 2 mô hình CNN: mô hình lấy cảm hứng từ Zeiler & Fergus, và mô
hình GoogLeNet.
39
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus
Hình 2. 15 Mô hình GoogleNet
40
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet
Qua bảng trên ta có thể thấy kiến trúc NN2 và NN1 có độ chính xác cao nhất.
Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo
Quả bảng so sánh độ chính xác dựa trên dữ liệu đào tạo, ta có thể thấy độ chính xác
được cải thiện rõ rệt khi dữ liệu tăng lên đáng kể. Do đó, ngoài kiến trúc mạng hợp lý, dữ
liệu được sử dụng để đào tạo cũng là một nhân tố góp phần tạo nên độ chính xác cao cho
mô hình.
2.5.5 Mô hình Baidu (2015)
Mô hình Baidu, 2015, là mô hình được tạo ra bởi hãng Baidu, Trung Quốc. Với
nguồn lực và lượng thông tin cá nhân lớn, Baidu đã xây dựng được một hệ thống nhận
diện khuôn mặt với tỉ lệ lỗi rất thấp.
Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu
41
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau
Có thể thấy, ở mô hình của Baidu, với lượng người càng lớn và số khuôn mặt càng
nhiều, hệ thống càng trở nên chính xác.
2.6 Kết luận
Bài toán nhận dạng đã có từ rất lâu với nhiều phương pháp khác nhau. Tuy nhiên,
với các kỹ thuật mới, ta có thể thấy rằng độ chính xác của các phương pháp ngày càng
tăng trong khi chi phí tính toán ngày càng giảm.
Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất bản
Qua cách thức hoạt động và các mô hình được sử dụng trong bài toán nhận dạng, ta
có thể thấy dữ liệu là chìa khóa rất quan trọng trong việc đào tạo. Nếu mô hình còn hạn
chế, nhưng lại có rất nhiều dữ liệu để đào tạo thì độ chính xác của hệ thống sẽ được cải
42
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thiện ở mức đáng kể. Có thể thấy, các mô hình có độ chính xác cao trên 97% đều sử dụng
trên 100 nghìn ảnh để huẩn luyện. Ngoài ra, việc xử lý nhiều phần khuôn mặt cũng giúp
ích rất nhiều cho độ chính xác của nhận diện, tuy nhiên hệ thống sẽ cần số lượng tính toán
lớn hơn để có thể nhận diện.
Các phương pháp nhận dạng bằng mạng nơ ron tích chập hiện nay có độ sai số rất
nhỏ và nằm trong ngưỡng chấp nhận được. Nên việc áp dụng mạng nơ ron tích chập để
xây dựng một hệ thống nhận diện là hoàn toàn khả thi và có thể đáp ứng nhiều nhu cầu
khi chúng ta đang dần tiến tới cách mạng công nghiệp 4.0.
43
Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 3.
SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP
TRONG NHẬN DẠNG ĐỐI TƯỢNG

More Related Content

What's hot

Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdfThiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
Man_Ebook
 
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
lamluanvan.net Viết thuê luận văn
 
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền HìnhCác Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
Viết Thuê Đề Tài Luận Văn trangluanvan.com
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
Võ Phúc
 
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docxTÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
DV Viết Luận văn luanvanmaster.com ZALO 0973287149
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
Võ Phúc
 
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docxỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
Dịch Vụ Viết Bài Trọn Gói ZALO 0917193864
 
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂYLUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
ssuserc1c2711
 
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đĐề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
Dịch vụ viết bài trọn gói ZALO: 0909232620
 
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
Dịch vụ viết bài trọn gói ZALO: 0936 885 877
 
introduction to ss7 network
introduction to ss7 networkintroduction to ss7 network
introduction to ss7 network
Mohmmad Azam
 
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
The Boss
 
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đHệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
Dịch vụ viết bài trọn gói ZALO: 0909232620
 
Luận văn: Bài toán nhận dạng biển số xe, HAY
Luận văn: Bài toán nhận dạng biển số xe, HAYLuận văn: Bài toán nhận dạng biển số xe, HAY
Luận văn: Bài toán nhận dạng biển số xe, HAY
Dịch vụ viết bài trọn gói ZALO: 0909232620
 
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnhĐề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
Dịch vụ viết bài trọn gói ZALO 0917193864
 
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAYLuận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
Viết Thuê Khóa Luận _ ZALO 0917.193.864 default
 
luan van thac si xay dung he thong quan ly thong tin tuyen sinh
luan van thac si xay dung he thong quan ly thong tin tuyen sinhluan van thac si xay dung he thong quan ly thong tin tuyen sinh
luan van thac si xay dung he thong quan ly thong tin tuyen sinh
Dịch vụ viết thuê Luận Văn - ZALO 0932091562
 
Quan li cua hang laptop
Quan li cua hang laptopQuan li cua hang laptop
Quan li cua hang laptop
kukitaka
 
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
Hien Dam
 
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
https://www.facebook.com/garmentspace
 

What's hot (20)

Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdfThiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
Thiết kế bộ điều khiển cho máy bay không người lái UAV.pdf
 
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
KHOÁ LUẬN GIẢI PHÁP HOÀN THIỆN HOẠT ĐỘNG DIGITAL MARKETING CHO KHÁCH HÀNG CỦA...
 
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền HìnhCác Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
Các Nhân Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Dịch Vụ Truyền Hình
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
 
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docxTÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
TÌM HIỂU VÀ TRIỂN KHAI TRUNG TÂM GIÁM SÁT AN TOÀN MẠNG TRÊN NỀN TẢNG WAZUH.docx
 
Giáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tinGiáo trình phân tích thiết kế hệ thống thông tin
Giáo trình phân tích thiết kế hệ thống thông tin
 
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docxỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
ỨNG DỤNG DEEP LEARNING XÂY DỰNG HỆ THỐNG NHẬN DIỆN TƯ THẾ NGƯỜI.docx
 
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂYLUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
LUẬN VĂN THẠC SĨ: ỨNG DỤNG HỌC SÂU TRONG PHÂN LOẠI TRÁI CÂY
 
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đĐề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
Đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, 9đ
 
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
Luận Văn Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Ba...
 
introduction to ss7 network
introduction to ss7 networkintroduction to ss7 network
introduction to ss7 network
 
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...
 
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đHệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu, 9đ
 
Luận văn: Bài toán nhận dạng biển số xe, HAY
Luận văn: Bài toán nhận dạng biển số xe, HAYLuận văn: Bài toán nhận dạng biển số xe, HAY
Luận văn: Bài toán nhận dạng biển số xe, HAY
 
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnhĐề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
Đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh
 
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAYLuận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
Luận văn thạc sĩ trường đại học Bách Khoa Hà Nội, HAY
 
luan van thac si xay dung he thong quan ly thong tin tuyen sinh
luan van thac si xay dung he thong quan ly thong tin tuyen sinhluan van thac si xay dung he thong quan ly thong tin tuyen sinh
luan van thac si xay dung he thong quan ly thong tin tuyen sinh
 
Quan li cua hang laptop
Quan li cua hang laptopQuan li cua hang laptop
Quan li cua hang laptop
 
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
BTL phân tích thiết kế hệ thống- Đề tài quản lý nhập hàng thực phẩm khô tại s...
 
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
Khóa luận tốt nghiệp Xây dựng hệ thống hỗ trợ tương tác trong quá trình điều ...
 

Similar to Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.doc

Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.docThiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.docPháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
Dịch vụ viết thuê đề tài trọn gói 👉👉 Liên hệ ZALO/TELE: 0917.193.864 ❤❤
 
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
Dịch vụ viết đề tài trọn gói Zalo/Tele: 0917.193.864
 
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
Dịch vụ viết thuê đề tài trọn gói 🥳🥳 Liên hệ ZALO/TELE: 0917.193.864 ❤❤
 
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.docLuận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
Dịch vụ viết đề tài trọn gói Zalo/Tele: 0917.193.864
 
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.docYếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docxLuận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
Dịch vụ viết thuê đề tài trọn gói 🥰🥰 Liên hệ ZALO/TELE: 0917.193.864 ❤❤
 
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
Dịch vụ viết đề tài trọn gói Liên hệ ZALO/TELE: 0973.287.149
 
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0917.193.864
 
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0917.193.864
 
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.dockHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.docLuận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
Dịch vụ viết đề tài trọn gói Zalo/Tele: 0917.193.864
 
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
Dịch vụ viết đề tài trọn gói Liên hệ ZALO/TELE: 0973.287.149
 
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.docLuận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0917.193.864
 
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0973.287.149
 
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0973.287.149
 
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.docGiải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0917.193.864
 
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
Dịch vụ viết thuê đề tài trọn gói Liên hệ ZALO/TELE: 0973.287.149
 
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 

Similar to Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.doc (20)

Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.docThiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do.doc
 
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.docPháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam.doc
 
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
Luận Văn Các Nhân Tố Ảnh Hưởng Đếntính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ...
 
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành...
 
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.docLuận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.doc
 
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.docYếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp.doc
 
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docxLuận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội.docx
 
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Độ...
 
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì...
 
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế...
 
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận ...
 
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.dockHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK.doc
 
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.docLuận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh.doc
 
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công ...
 
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.docLuận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng.doc
 
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt...
 
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ...
 
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.docGiải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương.doc
 
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại ...
 
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đôn...
 

More from Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍

Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docx
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docxCƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docx
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.docNghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.doc
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.docĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.doc
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.docĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm.doc
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm.docĐồ án tốt nghiệp - Sấy bã mía, 9 điểm.doc
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.docHoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.docĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.docĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docxThiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docxThiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍
 

More from Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍 (20)

Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách s...
 
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệ...
 
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docx
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docxCƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docx
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU.docx
 
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của k...
 
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing củ...
 
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của ...
 
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳ...
 
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 20...
 
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.docNghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa.doc
 
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối ...
 
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của n...
 
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.doc
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.docĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.doc
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI.doc
 
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.docĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ.doc
 
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm.doc
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm.docĐồ án tốt nghiệp - Sấy bã mía, 9 điểm.doc
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm.doc
 
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.docHoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu.doc
 
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.docĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần.doc
 
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.docĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ.doc
 
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docxThiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm.docx
 
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhậ...
 
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docxThiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh.docx
 

Recently uploaded

HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docxHỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
giangnguyen312210254
 
AV6 - PIE CHART WRITING skill in english
AV6 - PIE CHART WRITING skill in englishAV6 - PIE CHART WRITING skill in english
AV6 - PIE CHART WRITING skill in english
Qucbo964093
 
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
https://www.facebook.com/garmentspace
 
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
Nguyen Thanh Tu Collection
 
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdfGIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
Điện Lạnh Bách Khoa Hà Nội
 
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
nhanviet247
 
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nayẢnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
chinhkt50
 
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
ngocnguyensp1
 
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
duykhoacao
 
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTUChuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
nvlinhchi1612
 
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
Nguyen Thanh Tu Collection
 
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptxDẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
nvlinhchi1612
 

Recently uploaded (12)

HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docxHỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
HỆ THỐNG 432 CÂU HỎI TRẮC NGHIỆM MÔN TTHCM.docx
 
AV6 - PIE CHART WRITING skill in english
AV6 - PIE CHART WRITING skill in englishAV6 - PIE CHART WRITING skill in english
AV6 - PIE CHART WRITING skill in english
 
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
Khoá luận tốt nghiệp ngành Truyền thông đa phương tiện Xây dựng kế hoạch truy...
 
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
98 BÀI LUYỆN NGHE TUYỂN SINH VÀO LỚP 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ ...
 
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdfGIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
 
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
ÔN-TẬP-CHƯƠNG1 Lịch sử đảng Việt Nam chủ đề 2
 
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nayẢnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
Ảnh hưởng của nhân sinh quan Phật giáo đến đời sống tinh thần Việt Nam hiện nay
 
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
30 - ĐỀ THI HSG - HÓA HỌC 9 - NĂM HỌC 2021 - 2022.pdf
 
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
Chương III (Nội dung vẽ sơ đồ tư duy chương 3)
 
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTUChuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
Chuong 2 Ngu am hoc - Dẫn luận ngôn ngữ - FTU
 
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
CHUYÊN ĐỀ BỒI DƯỠNG HỌC SINH GIỎI KHOA HỌC TỰ NHIÊN 9 CHƯƠNG TRÌNH MỚI - PHẦN...
 
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptxDẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
Dẫn luận ngôn ngữ - Tu vung ngu nghia.pptx
 

Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.doc

  • 1. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN MẠNH HÙNG NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL, ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Hà Nội –
  • 2. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 ĐẠI HỌC QUỘC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN MẠNH HÙNG NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL, ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH Ngành : Công nghệ thông tin Chuyên ngành : Kỹ thuật phần mềm Mã số : 8480103.01 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS ĐỖ TRUNG TUẤN Hà Nội –
  • 3. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 LỜI CAM ĐOAN Tôi xin cam đoan: luận văn “Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.” là công trình nghiên cứu của tôi dưới sự hướng dẫn của giảng viên hướng dẫn, không sao chép lại của người khác. Các tài liệu được luận văn tham khảo, kế thừa và trích dẫn đều được liệt kê trong danh mục các tài liệu tham khảo. Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan trên. Hà Nội, ngày tháng năm 2019 Học viên Nguyễn Mạnh Hùng i
  • 4. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 LỜI CẢM ƠN Em xin chân thành cảm ơn các thầy cô trường Đại học Công nghệ, Đại học quốc gia Hà Nội, đặc biệt các thầy cô bộ môn Kỹ thuật phần mềm, đã tận tình dạy dỗ, giúp đỡ và tạo mọi điều kiện tốt nhất cho em trong suốt quãng thời gian em theo học tại trường, để em có thể hoàn thành được đề tài này. Em tỏ lòng biết ơn sâu sắc với PGS.TS Đỗ Trung Tuấn, người thầy đã tận tình hướng dẫn khoa học và giúp đỡ, chỉ bảo em trong suốt quá trình nghiên cứu và hoàn thành luận văn này. Tôi xin chân thành cảm ơn các bạn học viên cao học khóa 22 tại trường Đại học Công nghệ, Đại học quốc gia Hà Nội đã giúp đỡ tôi trong quá trình theo học tại trường, cũng như giúp đỡ tôi thực hiện đề tài này. Xin trân trọng cảm ơn! ii
  • 5. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 MỤC LỤC LỜI CAM ĐOAN............................................................................................i LỜI CẢM ƠN................................................................................................ ii MỤC LỤC..................................................................................................... iii DANH MỤC HÌNH VẼ................................................................................vi DANH MỤC BẢNG BIỂU............................................................................x DANH MỤC VIẾT TẮT ..............................................................................xi LỜI MỞ ĐẦU.................................................................................................1 Lý do chọn đề tài ............................................................................................... 1 Cơ sở khoa học và thực tiễn của đề tài.............................................................. 1 Mục tiêu của luận văn........................................................................................ 2 Cấu trúc luận văn............................................................................................... 3 CHƯƠNG 1. ...................................................................................................4 TỔNG QUAN VỀ MẠNG NƠ RON............................................................4 VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP...............................4 1.1. Nơ ron nhân tạo ................................................................................4 1.1.1 Lịch sử của nơ ron nhân tạo ..................................................................... 4 1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học................................. 5 1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo ................................ 5 1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo .......................... 8 1.2 Mạng nơ ron nhân tạo.....................................................................11 1.2.1 Giới thiệu mạng nơ ron nhân tạo............................................................ 11 1.2.2 Một số kiểu mạng nơ ron........................................................................ 11 1.2.3 Mạng nơ ron lan truyền ngược ............................................................... 13 1.3 Mạng nơ ron tích chập ....................................................................18 1.3.1 Khái niệm về mạng nơ ron tích chập...................................................... 18 iii
  • 6. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 1.3.2 Mô hình mạng nơ ron tích chập.............................................................. 19 1.3.2 Xây dựng mạng nơ ron tích chập ........................................................... 20 1.4 Kết luận.............................................................................................27 CHƯƠNG 2. .................................................................................................28 BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP .......28 2.1 Khái niệm về nhận dạng..................................................................28 2.1.1 Nhận dạng đối tượng .............................................................................. 28 2.1.2 Nhận dạng khuôn mặt............................................................................. 29 2.2. Lịch sử và phát triển.......................................................................30 2.3. Cách thức hoạt động.......................................................................30 2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera.....32 2.4.1 Nhận diện khuôn mặt.............................................................................. 32 2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt ...................................... 33 2.4.3 Liên kết khuôn mặt................................................................................. 34 2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo...............35 2.5.1 Mô hình DeepID 2 (NIPS 2014)............................................................. 35 2.5.2 Mô hình DeepID3 (arXiv 2015) ............................................................. 38 2.5.3 Mô hình DeepFace (Facebook, CVPR 2014)......................................... 39 2.5.4 Mô hình FaceNet (Google 2015)............................................................ 39 2.5.5 Mô hình Baidu (2015) ............................................................................ 41 2.6 Kết luận.............................................................................................42 CHƯƠNG 3. .................................................................................................44 SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP...............................................44 TRONG NHẬN DẠNG ĐỐI TƯỢNG.......................................................44 3.1 Sơ lược về áp dụng mạng nơ ron tích chập vào các giải pháp thông minh trong thực tế...................................................................44 iv
  • 7. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 3.2 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện người vào/ra và đánh giá thực nghiệm, so sánh với phương pháp HOG ....................................................................................................44 3.2.1 Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng nơ ron tích chập ......................................................................................... 44 3.2.2 Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người . 45 3.2.3 Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng để so sánh................................................................................................... 47 3.2.4 So sánh khả năng nhận diện của hệ thống nhận diện người vào/ra sử dụng mạng nơ ron tích chập với phương pháp HOG đã có....................... 50 3.2.5 Mô tả cơ chế chạy nhận diện người trong lõi máy chủ tính toán ........... 52 3.2.6 Mô tả quá trình sử dụng hệ thống ở giao diện người dùng để hiển thị kết quả ............................................................................................................. 53 3.3 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện khuôn mặt và đánh giá thực nghiệm, so sánh với phương pháp HOG ....................................................................................................55 3.3.1 Xây dựng hệ thống nhận diện khuôn mặt............................................... 55 3.3.2 Giới thiệu cơ chế của máy chủ xử lý nhận diện ..................................... 56 3.3.3 Giới thiệu sơ lược về phương pháp phát hiện khuôn mặt sử dụng HOG sẽ được dùng để so sánh ................................................................................ 58 3.3.4 So sánh hệ thống nhận diện khuôn mặt với phương pháp HOG đã có .. 59 3.3.4 So sánh khả năng nhận diện khuôn mặt giữa HOG và CNN ................. 62 3.2.5 Kết quả hệ thống web nhận diện khuôn mặt .......................................... 64 3.3 Kết luận.............................................................................................67 KẾT LUẬN...................................................................................................68 Kết quả đã thực hiện được của luận văn.......................................................... 68 Phương hướng phát triển luận văn................................................................... 69 TÀI LIỆU THAM KHẢO...........................................................................70 v
  • 8. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 DANH MỤC HÌNH VẼ Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10]............ 4 Hình 1.2: Hình ảnh một nơ ron sinh học [14] ..................................................................... 5 Hình 1.3: Công thức của một nơ ron nhân tạo [41]............................................................. 5 Hình 1.4: Hình ảnh một nơ ron nhân tạo............................................................................. 6 Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế....................................... 6 Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có thiên lệch.............................................................................................................................. 7 Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau ....................... 7 Hình 1.8: Đồ thị hàm Sigmoid ............................................................................................ 8 Hình 1.9: Đồ thị hàm TanH................................................................................................. 9 Hình 1.10: Đồ thị hàm tuyến tính........................................................................................ 9 Hình 1.11: Đồ thị hàm RELU............................................................................................ 10 Hình 1.12: Đồ thị hàm ELU .............................................................................................. 10 Hình 1.13: Mạng nơ ron truyền thẳng ............................................................................... 11 Hình 1.14: Mạng nơ ron hồi quy ....................................................................................... 12 Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy.............................................. 12 Hình 1.16: Các tầng (layer) trong CNN là 3 chiều............................................................ 18 Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]................... 19 Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]........................................ 19 Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ............................................. 20 Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron............ 20 Hình 1.21: Ví dụ về lớp tích chập ..................................................................................... 21 Hình 1.22: So sánh giữa ReLU và Sigmoid. ..................................................................... 23 Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp ............................................................. 24 Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ............................................................ 25 Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)..... 25 vi
  • 9. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 1.26: Cấu trúc của AlexNet ...................................................................................... 26 Hình 1.27: Cấu trúc của VGGNet ..................................................................................... 27 Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng........................ 29 Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32, conv42 và conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt.............................. 29 Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người................................. 31 Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh.................................................................... 31 Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh ................................................................... 32 Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu................. 33 Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ phát hiện các điểm mốc trên khuôn mặt............................................................................ 33 Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt............................................................. 34 Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS CS2, là bộ dữ liệu mở rộng của IJB-A .............................................................................. 35 Hình 2.10: Kiến trúc mạng của mô hình DeepID 2........................................................... 36 Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm....................... 36 Hình 2.12: Kiến trúc mạng của mô hình DeepID3............................................................ 38 Hình 2.13: Kiến trúc của DeepFace .................................................................................. 39 Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus..................................... 40 Hình 2. 15 Mô hình GoogleNet......................................................................................... 40 Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu............... 41 Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất bản...................................................................................................................................... 42 Hình 3.1: Hình ảnh thiết kế của hệ thống nhận diện đối tượng......................................... 45 Hình 3.2: Phương pháp mạng YOLO sử dụng để nhận diện đối tượng............................ 46 Hình 3.3: Mô hình mạng yolo ........................................................................................... 47 Hình 3.4: Tiền xử lý để xác định khung hình.................................................................... 48 Hình 3.5: Độ dốc sau khi tính toán.................................................................................... 48 vii
  • 10. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 3.6: Kết quả sau khi tính toán véc tơ đặc trưng cho từng ô...................................... 49 Hình 3.7: Biểu diễn các véc tơ chỉ hướng theo HOG thu được sau khi tính toán............. 50 Hình 3.8: Hình ảnh nhận diện bằng phương pháp HOG................................................... 50 Hình 3.9: Hình ảnh nhận diện bằng phương pháp CNN ................................................... 51 Hình 3.10: Hệ thống sử dụng ffmpeg để trích xuất các khung hình trong video.............. 52 Hình 3.11: Các khung hình lần lượt được hệ thống trích xuất và đưa vào lõi để xử lý. ... 52 Hình 3.12: Dữ liệu số người vào/ra được nhập vào cơ sở dữ liệu, và video báo cáo được hệ thống tự động xuất ra để làm đối chiếu. ....................................................................... 53 Hình 3.13: Hình ảnh đăng nhập vào hệ thống................................................................... 53 Hình 3.14: Kết quả dữ liệu đã được thêm vào cơ sở dữ liệu và hiển trị trên web............. 54 Hình 3.15: Một ví dụ tương tự dữ liệu được xuất báo cáo nhận diện trong hệ thống....... 54 Hình 3.16: Kiến trúc hệ thống nhận diện khuôn mặt, tích hợp cùng hệ thống mua hàng .. 55 Hình 3.17: Khuôn mặt được trích xuất từ bức ảnh............................................................ 56 Hình 3.18: Hình ảnh 68 điểm mốc trên khuôn mặt được sử dụng trên bộ thư viện dlib .. 57 Hình 3.19: Hình ảnh trích xuất đặc trưng khuôn mặt........................................................ 57 Hình 3.20: Khuôn mặt được sử dụng để nhận dạng.......................................................... 58 Hình 3.21: Khuôn mặt được trích xuất.............................................................................. 58 Hình 3.22: Hình ảnh được xử lý sau khi qua bộ lọc Gabor............................................... 58 Hình 3.23: Các đặc trưng được trích xuất bằng HOG....................................................... 59 Hình 3.24: Phát hiện khuôn mặt sử dụng HOG................................................................. 59 Hình 3.25: Phát hiện khuôn mặt sử dụng CNN................................................................. 60 Hình 3.26: Phát hiện khuôn mặt sử dụng HOG với góc nghiêng lớn ............................... 60 Hình 3.27: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 61 Hình 3.28: Kết quả nhận diện khuôn mặt với HOG.......................................................... 62 Hình 3.29: Phát hiện khuôn mặt sử dụng CNN................................................................. 62 Hình 3. 30: Nhận diện khuôn mặt sử dụng HOG với góc nghiêng lớn............................. 63 Hình 3.31: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 63 viii
  • 11. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 3.32: Giao diện hệ thống trên web (hai hình trên) và giao diện hệ thống trên mobile (hai hình dưới) ................................................................................................................... 65 Hình 3.33: Huấn luyện thêm khuôn mặt mới .................................................................... 65 Hình 3.34: Kết quả nhận diện sau khi huấn luyện............................................................. 66 Hình 3.35: Nhận diện user có ID 00280 với góc nghiêng khoảng 80 độ và user có ID 00388 với góc nghiêng 30 độ trên mặt phẳng Oxz............................................................ 67 ix
  • 12. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 DANH MỤC BẢNG BIỂU Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số lượng của các phần khuôn mặt .......................................................................................... 36 Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó trên bộ thư viện LFW ........................................................................................................ 37 Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện LFW................................................................................................................................... 38 Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu LFW................................................................................................................................... 39 Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet................................. 41 Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo.......................... 41 Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau............................................................... 42 Bảng 3.1 Kết quả so sánh nhận diện người giữa phương pháp mạng nơ ron tích chập và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống................... 51 Bảng 3.2: Kết quả so sánh phát hiện khuôn mặt giữa phương pháp mạng nơ ron tích chập và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 61 Bảng 3.3: Kết quả so sánh nhận diện khuôn mặt giữa phương pháp mạng nơ ron tích chập và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 64 Bảng 3.4: Cơ sở dữ liệu thời gian phát hiện khuôn mặt của hệ thống .............................. 67 x
  • 13. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 DANH MỤC VIẾT TẮT Từ viết tắt Ý nghĩa AI Artificial Intelligence - Trí tuệ nhân tạo ANN Artificial Neural Network – Mạng thần kinh nhân tạo CNN Convolutional Neural Network – Mạng thần kinh tích chập ReLU Rectified Linear Unit – Điều chỉnh đơn vị tuyến tính CSDL Cơ sở dữ liệu GPU Graphics Processing Unit – Vi xử lý đồ họa CPU Central Processing Unit – Bộ xử lý trung tâm CUDA Compute Unified Device Architecture - kiến trúc tính toán song song do hãng NVIDIA phát triển. IOT Internet of Things – vạn vật kết nối ASCI Red Accelerated Strategic Computing Initiative Red – một siêu máy tính của Intel W Watt – một đơn vị đo lường của điện lực kW KiloWatt – một đơn vị đo lường của điện lực SVM Support Vector Machine – một thuật toán phân lớp DP2MFD Deep Pyramid Deformable Parts Model for Face Detection IJB-A IARPA Janus Benchmark-A – một thử thách mở cho nhận diện khuôn mặt KLT Kanade–Lucas–Tomasi – một giải thuật thị giác máy tính LFW Labeled Faces in the Wild – một bộ thư viện khuôn mặt xi
  • 14. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 API Application Programming Interface – giao diện lập trình YOLO You only look once – một hệ thống mạng nơ ron nhân tạo phát hiện đối tượng thời gian thực HOG Histogram of Oriented Gradients – biểu đồ độ dốc định hướng PCA Principal Component Analysis - Phân tích thành phần chính xii
  • 15. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 LỜI MỞ ĐẦU Lý do chọn đề tài Trong giai đoạn gần đây, cụm từ cách mạng công nghiệp lần thứ tư được nhắc đến rất nhiều trên truyền thông. Khái niệm cách mạng công nghiệp 4.0 được đưa ra dựa trên xu thế bùng nổ của nhiều công nghệ mới như: công nghệ truyền dẫn tốc độ cao, CPU rất mạnh, GPU hàng ngàn nhân, công nghệ chế tạo bộ nhớ đạt nhiều đột phá. Song song với đó, công nghệ dần làm các thiết bị nhỏ lại, nhưng sức mạnh tăng lên đáng kể. Công nghệ mạch nhúng cũng bùng nổ không kém với nhiều mạch nhúng nhỏ, sử dụng lượng điện khiêm tốn, nhưng khả năng tính toán lên tới hàng ngàn tỉ phép tính trên giây, tương đương sức mạnh của 1 siêu máy tính cách đây khoảng 20 năm. Ví dụ như board mạch Nvidia's Jetson TX1 được ra mắt năm 2015, có thể nằm vừa trong lòng bàn tay và chỉ sử dụng 10 oát điện, đã có sức mạnh tính toán tới 1 ngàn tỉ phép tính trên giây, điều mà cách đó tròn 20 năm, vào năm 1996, siêu máy tính ASCI Red của Intel, phải sử dụng tới 6000 vi xử lý Pentium Pros, vận hành với 1000 kW mới có thể đạt được sức mạnh tính toán trên. Máy tính hiện nay có sức mạnh tính toán lớn nhưng giá thành lại ở mức phổ thông, dẫn tới người làm nghiên cứu rất dễ dàng để có thể tự kiểm nghiệm được các lý thuyết về trí tuệ nhân tạo từ nhiều năm trước. Cùng với mã nguồn mở, hiện làn sóng trí tuệ nhân tạo đang bùng nổ mạnh mẽ trong thời gian gần đây, và đem lại rất nhiều ứng dụng trong đời sống Chính vì lý do trên, việc tìm hiểu và nghiên cứu thị giác máy tính rất có ý nghĩa và thiết thực. Hiện nay trên thế giới, nhiều nước đã và đang ứng dụng thị giác máy tính vào đời sống hàng ngày, ví dụ như SkyNet của Trung Quốc, các hệ thống kiểm duyệt nội dung tự động, … Cơ sở khoa học và thực tiễn của đề tài Ngày nay, trong kỷ nguyên số, máy tính là một phần không thể thiếu trong nghiên cứu khoa học cũng như trong đời sống hàng ngày. Tuy nhiên, do hệ thống máy tính dựa trên lý thuyết cổ điển (tập hợp, logic nhị phân), nên dù có khả năng tính toán lớn và độ chính xác cao, thì máy tính cũng chỉ có thể làm việc theo một chương trình gồm các thuật toán được viết sẵn do lập trình viên chứ chưa thể tự lập luận hay sáng tạo. Học máy (Machine learning) là một phương pháp phân tích dữ liệu có thể tự động hóa phân tích dữ liệu và tìm ra các trích xuất đặc trưng của bộ dữ liệu. Học máy sử dụng các thuật toán trừu tượng để tự học từ dữ liệu, cho phép máy tính tìm thấy những thông 1
  • 16. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 tin có giá trị ẩn ở rất sâu mà không thể lập trình được bằng cách thông thường. Khi tiếp xúc với dữ liệu mới, học máy có thể thích ứng rất nhanh và độc lập. Học sâu (Deep Learning) là một ngành đặc biệt của học máy. Học sâu sử dụng mạng nơ ron nhân tạo (Artificial Neural Networks) để giải quyết các bài toán mà tính toán cứng chưa thể xử lý được như dữ liệu trừu tượng, dữ liệu mờ, dữ liệu không rõ ràng,... Với tính chất như vậy, học sâu thường được ứng dụng trong nhận diện hình ảnh, nhận diện giọng nói, xử lý ngôn ngữ tự nhiên hoặc dự đoán, dự báo. Mạng nơ ron nhân tạo (Artificial Neural Networks) là một mô hình xử lý thông tin, cấu thành từ các lớp nơ ron, được ra đời trên cơ sở mô phỏng hoạt động não bộ của sinh vật. Mạng nơ ron nhân tạo gắn kết nhiều nơ ron theo một mô hình nhất định, được trải qua huấn luyện để rút ra được kinh nghiệm, và sử dụng các kinh nghiệm đã có để xử lý các thông tin mới. Mạng nơ ron nhân tạo thường áp dụng vào giải các bài toán nhận dạng mẫu, hoặc dự đoán. Mạng nơ ron Tích chập (Convolutional Neural Network) là một trong những mô hình học sâu hiện đại nhất hiện nay. Mạng nơ ron Tích chập hiện nay thường được sử dụng nhiều trong các hệ thống thông minh do ưu điểm của mạng là có độ chính xác cao, tuy nhiên tốc độ tính toán lại rất nhanh. Vì lý do đó, mạng nơ ron tích chập rất mạnh trong xử lý hình ảnh, và được ứng dụng rất nhiều trong ngành thị giác máy tính trong các bài toán liên quan đến nhận dạng đối tượng. Ngày nay, với sự phát triển của công nghệ bán dẫn, máy tính ngày càng nhỏ đi, năng lượng tiêu thụ ngày càng thấp xuống, trong khi sức mạnh lại ngày càng tăng lên. Với những ưu điểm như vậy, chúng ta có thể thấy rất nhiều thiết bị thông minh đã và đang hiện diện mọi nơi trong đời sống, với camera nhiều điểm ảnh, bộ nhớ trong lớn và vi xử lý mạnh như: điện thoại thông minh, máy ảnh kỹ thuật số, camera hành trình,… Ngoài ra, với sự bùng nổ của xu hướng mạng vạn vật IOT, người ta có thể sẽ còn thấy rất nhiều thiết bị thông minh mới xuất hiện: xe ô tô tự lái, thiết bị bay không người lái tự giao hàng,... Có thể thấy, việc sử dụng trí thông minh nhân tạo để khai thác dữ liệu hình ảnh trong các thiết bị thông minh trong tương lai đã và đang trở thành xu hướng. Từ nhận định trên và sự gợi ý của giảng viên hướng dẫn, tôi quyết định chọn nội dung “Nghiên cứu về mạng Neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính” để làm đề tài nghiên cứu thực hiện luận văn thạc sỹ của mình. Mục tiêu của luận văn Luận văn của tôi tập trung vào nghiên cứu, tìm hiểu về mạng nơ ron tích chập. Sau đó so sánh các phương pháp học sâu ở mức độ tổng quan trên phương diện học thuật, từ 2
  • 17. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 đó thấy được tiềm năng cũng như hạn chế của AI với cái nhìn khách quan nhất. Ở phần ứng dụng, tôi sử dụng mạng nơ ron tích chập để áp dụng vào hai bài toán thực tế: bài toán nhận dạng người và bài toán nhận diện khuôn mặt trong lĩnh vực thị giác máy tính. Cấu trúc luận văn Luận văn được tổ chức gồm ba chương gồm: Chương 1: Trình bày tổng quan về nơ ron, các thành phần và cơ chế hoạt động của nơ ron. Từ đó, trình bày về một số kiểu mạng nơ ron và cơ chế lan truyền ngược. Cuối cùng là giới thiệu về cấu tạo và cách hoạt động của mạng nơ ron tích chập; Chương 2: Trình bày tổng quan về bài toán nhận dạng bằng mạng nơ ron tích chập, cách thức hoạt động của việc nhận dạng đối tượng và nhận dạng khuôn mặt của mạng nơ ron tích chập. Ngoài ra, chương hai giới thiệu về các mô hình sử dụng nơ ron tích chập nổi tiếng đang được áp dụng hiện nay và kết quả của từng mô hình; Chương 3: Áp dụng mạng nơ ron tích chập vào trong thực tế. Ở chương này, tác giả báo cáo về kết quả đạt được khi áp dụng mạng nơ ron tích chập để xây dựng hai hệ thống: hệ thống nhận dạng người và hệ thống nhận diện khuôn mặt. Ngoài ra, tác giả có thực hiện so sánh với phương pháp cũ để có thể thấy ưu điểm và hạn chế của mạng nơ ron tích chập. Cuối cùng là phần kết luận cho phép tóm tắt kết quả đã đạt được và nêu ra những tồn tại, dựa vào đó để đưa ra những mục tiêu và phương hướng phát triển cho hệ thống sau này. 3
  • 18. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 CHƯƠNG 1. TỔNG QUAN VỀ MẠNG NƠ RON VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP 1.1. Nơ ron nhân tạo 1.1.1 Lịch sử của nơ ron nhân tạo Vào năm 1943, nhà thần kinh học Warren McCulloch đã cùng nhà toán học Walter Pitts đã viết một cuốn sách về cách mạng thần kinh hoạt động. Và họ đã thực hiện mô phỏng một mạng thần kinh đơn giản trên một mạch điện. [9] Vào năm 1949, Donald Hebb đã viết cuốn sách Organization of Behavior. Điểm nhấn chính là mạng thần kinh nào được sử dụng nhiều sẽ được tăng cường. Vào năm 1959, David Hubel và Torsten Wiesel đã xuất bản cuốn sách Receptive fields of single neurons in the cat’s striate cortex, miêu tả về phản ứng của các tế bào thần kinh thị giác trên loài mèo, cũng như cách loài mèo ghi nhớ và nhận diện hình dạng trên kiến trúc vỏ não của nó. Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10] Vào năm 1989, Yann LeCun đã áp dụng thuật toán học cho mạng nơ ron theo kiểu lan truyền ngược vào kiến trúc mạng nơ ron tích chập của Fukushima. Sau đó vài năm, LeCun đã công bố LeNet-5 [13]. Có thể nói, LeNet-5 là một trong những mạng nơ ron tích chập sơ khai nhất, tuy nhiên các dấu ấn của nó vẫn tồn tại tới ngày nay, có thể thấy thông qua một số thành phần thiết yếu mà các mạng nơ ron tích chập của ngày nay vẫn đang sử dụng 4
  • 19. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học Hình 1.2: Hình ảnh một nơ ron sinh học [14] Một nơ ron gồm có: thân nơ ron, tua gai thần kinh, sợi trục thần kinh, trong đó: Thân nơ ron: là nơi xử lý các tín hiệu được đưa vào; Tua gai thần kinh: là nơi nhận các xung điện vào trong nơ ron; Sợi trục thần kinh: là nơi đưa tín hiệu ra ngoài sau khi được xử lý bởi nơ ron; Khớp thần kinh: vị trí nằm giữa tua gai thần kinh và sợi trục thần kinh, đây là điểm liên kết đầu ra của nơ ron này với đầu vào của nơ ron khác. 1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo Dựa vào cấu tạo của một nơ ron sinh học, các nhà khoa học nghiên cứu và lập trình đã đưa ra kiến trúc của một nơ ron nhân tạo: Hình 1.3: Công thức của một nơ ron nhân tạo [41] 5
  • 20. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Mạng nơ ron nhân tạo có thể mô tả đơn giản lại như sau: Hình 1.4: Hình ảnh một nơ ron nhân tạo Trong đó: Danh sách các đầu vào: Là các thuộc tính đầu vào của một nơ ron. Số lượng thuộc tính đầu vào thường nhiều hơn một, do dữ liệu thô đầu vào thường là một vector nhiều chiều, hoặc nhiều nơ ron tầng trước kết nối tới một nơ ron tầng sau. Trọng số liên kết: Các liên kết được thể hiện độ mạnh yếu qua một giá trị được gọi là trọng số liên kết. Kết hơp với các đầu truyền, tín hiệu đến các nơ ron nhân tạo khác sẽ được tính bằng ; Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế 6
  • 21. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hàm tổng: Tổng các tích của các đầu vào với trọng số liên kết mô phỏng các khớp kết nối. Sau đó đi qua hàm tính tổng để tính ra giá trị trước khi đưa vào hàm truyền; Thiên lệch (b): Độ lệch được đưa vào sau khi khi tính toán xong hàm tổng, tạo ra giá trị cuối cùng trước khi đưa vào hàm truyền. Mục đích của việc thêm vào thiên lệch nhằm dịch chuyển chức năng của hàm kích hoạt sang trái hoặc phải, giúp ích khi mạng được huấn luyện. Hình ảnh vị trí thiên lệch được thêm vào trong mạng nơ ron thực tế. Hình ảnh huấn luyện khi có và không có thiên lệch: Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có thiên lệch Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau Hàm kích hoạt (Activation functions): Hàm này được sử dụng để tính toán giá trị của đầu ra dựa vào giá trị của hàm Tổng. 7
  • 22. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo 1.1.4.1 Hàm Sigmod Biểu diễn hàm: Đạo hàm của hàm: Hàm Sigmoid được sử dụng vì ngưỡng của nó nằm trong khoảng (0, 1). Do đó, hàm này được sử dụng nhiều cho các mô hình dự đoán xác suất đầu ra, tức kết quả chỉ tồn tại trong khoảng từ 0 đến 1: khi đầu vào là số dương lớn, đầu ra của hàm sigmoid gần bằng 1. Khi nhỏ hơn 0, đầu ra gần bằng 0. Tuy nhiên, việc tối ưu của hàm này khó khăn, nguyên nhân vì nếu giá trị đầu vào của hàm là 1 số rất lớn, thì đầu ra của hàm càng về 2 đầu xấp xỉ 1 hoặc 0, nên tốc độ hội tụ sẽ rất chậm. Hình 1.8: Đồ thị hàm Sigmoid 1.1.4.2 Hàm TanH Biểu diễn hàm: Đạo hàm của hàm: Hàm TanH được sử dụng vì đầu ra của hàm nằm trong khoảng , thích hợp với các mô hình đầu ra có ba giá trị: âm, trung tính (0) và dương. Chúng ta có thể thấy rõ hơn điều này trong hình minh họa. 8
  • 23. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 1.9: Đồ thị hàm TanH 1.1.4.3. Hàm tuyến tính Biểu diễn hàm: Đạo hàm của hàm: Hàm tuyến tính áp dụng thao tác nhận dạng trên dữ liệu với dữ liệu đầu ra tỷ lệ thuận với dữ liệu đầu vào. Hình 1.10: Đồ thị hàm tuyến tính 1.1.4.4 Hàm RELU Biểu diễn hàm: Đạo hàm của hàm: Hàm RELU áp dụng với những trường hợp cần đầu ra nằm trong khoảng (0, +∞). Hàm RELU có tốc độ tính toán rất nhanh, gán các giá trị âm trở thành 0 ngay lập tức, phù 9
  • 24. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 hợp cho việc huấn luyện từ dữ liệu chuẩn. Tuy nhiên, điều này khiến hàm RELU không ánh xạ các giá trị âm một cách thích hợp. Hình 1.11: Đồ thị hàm RELU 1.1.4.5 Hàm ELU Biểu diễn hàm: Đạo hàm của hàm: Hàm ELU là một biến thể của hàm RELU. Hàm thường được sử dụng khi ngưỡng đầu ra của nó nằm trong khoảng (-1, +∞). Hàm ELU khắc phục hạn chế ánh xạ các giá trị âm của hàm RELU. Hình 1.12: Đồ thị hàm ELU 10
  • 25. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 1.2 Mạng nơ ron nhân tạo 1.2.1 Giới thiệu mạng nơ ron nhân tạo Mạng nơ ron nhân tạo (Artificial Neural Network ANN) là một chuỗi các giải thuật lập trình, mô phỏng dựa trên cách hoạt động của mạng lưới thần kinh trong não bộ các sinh vật sống. Mạng nơ ron nhân tạo được sử dụng để tìm ra mối quan hệ của một tập dữ liệu thông qua một thiết kế kiến trúc chứa nhiều tầng ẩn (hidden layer), mỗi tầng lại chứa nhiều nơ ron. Các nơ ron được kết nối với nhau và độ mạnh yếu của các liên kết được biểu hiện qua trọng số liên kết. Lập trình thông thường có thể làm được rất nhiều phần mềm lớn, như tính toán mô phỏng các vụ nổ hạt nhân trong siêu máy tính ở các phòng thí nghiệm, hoặc tái hiện các tế bào ở cấp độ phân tử để phân tích các thử nghiệm thuốc. Một siêu máy tính có thể tính toán được nhiều tỉ phép tính trên giây, tuy nhiên lập trình thông thường lại gặp khó khăn trong việc nhận ra các mẫu đơn giản, ví dụ như nhận diện mặt người, điều mà một bộ não sinh học xử lý nhanh và chính xác hơn nhiều. Áp dụng với các kỹ thuật học sâu, mạng nơ ron nhân tạo hiện nay đang được áp dụng để giải quyết những vấn đề mà lập trình theo logic thông thường khó có thể giải quyết được. Do đó, mạng nơ ron nhân tạo đang nhanh chóng trở nên phổ biến, và là xu thế trên nhiều lĩnh vực. 1.2.2 Một số kiểu mạng nơ ron Có hai kiểu mạng nơ ron chính: mạng nơ ron truyền thằng (feedforward neural network) và mạng nơ ron hồi quy (recurrent neural network). Mạng truyền thẳng và hồi quy được minh họa như sau: Hình 1.13: Mạng nơ ron truyền thẳng 11
  • 26. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Dễ thấy, ở mạng nơ ron truyền thẳng, các nơ ron trong tầng ẩn đều được kết nối với các nơ ron trong tầng n. Do có nhiều tầng ẩn nên chúng ta có thể thấy rằng mạng truyền thẳng kéo dài trong không gian, và là không có bất kỳ đường tuần hoàn (cyclic path) nào nằm trong mạng. Mạng nơ ron truyền thẳng rất phổ biến hiện nay. Hình 1.14: Mạng nơ ron hồi quy Một loại khác là mạng nơ ron hồi quy. Không giống như mạng nơ ron truyền thẳng, mạng nơ ron hồi quy có ít nhất một đường dẫn tuần hoàn. Chúng ta có thể thấy nó ở hình minh họa phía trên. Vì có một đường dẫn tuần hoàn, nên mạng nơ ron hồi quy có thể gây ra vòng lặp vô cực. Tuy nhiên, mạng nơ ron tuần hoàn có một ứng dụng quan trọng là chúng có thể nhận diện cho các giai đoạn thời gian khác nhau, như hình minh họa sau: Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy Như ví dụ trên, có một nút A kết nối với nút B và một chu kỳ đến chính nút A. Mạng nơ ron hồi quy không xử lý đường dẫn tuần hoàn và các kết nối cùng một lúc. Mạng nơ ron hồi quy giả sử rằng đầu ra của nút A trong thời gian n là đầu vào của nút B và nút A trong thời gian n + 1. Vì vậy, ngoài tính chất kéo dài trong không gian khi kết nối với các tầng nơ ron tiếp theo, mạng nơ ron hồi quy cũng nằm sâu trong thời gian. Vì vậy, các mạng nơ ron hồi quy có thể mô hình hóa các hệ thống thay đổi theo bối cảnh. Ví dụ: mạng nơ ron hồi quy thường được sử dụng trong xử lý ngôn ngữ theo ngữ cảnh. Mạng 12
  • 27. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 nơ ron hồi quy có thể xử lý các phụ thuộc xa (long-term dependencies) theo mốc thời gian, ví dụ như mạng bộ nhớ dài-ngắn (Long Short Term Memory networks). 1.2.3 Mạng nơ ron lan truyền ngược 1.2.3.1 Tổng quan về mạng nơ ron lan truyền ngược Giải thuật lan truyền ngược được mô tả ngắn gọn như sau: 1. Bước 1: Lan truyền. Giai đoạn lan truyền có hai bước, lan truyền tiến và lan truyền ngược. Bước lan truyền tiến là nhập dữ liệu huấn luyện vào các mạng nơ ron và tính toán đầu ra. Sau đó, dựa vào kết quả đầu ra, so sánh với dữ liệu huấn luyện. Chúng ta có thể sử dụng lan truyền ngược để cập nhật ngược lại trọng số lại cho các nơron trong các tầng trước đó. 2. Bước 2: Cập nhật trọng số. Mạng cập nhật các giá trị của trọng số của nơ ron theo lỗi của kết quả đầu ra. 3. Bước 3: Lặp hai bước trên. Lặp lại bước một và hai cho đến khi sai số tối thiểu. Sau đó kết thúc khóa huấn luyện. 1.2.3.2 Cách thức lan truyền ngược 1. Sử dụng để biểu diễn đầu vào cho nút của lớp . 2. Sử dụng cho trọng số từ nút của lớp đến nút của lớp 3. Sử dụng được biểu diễn cho độ lệch của nút của lớp . 4. Sử dụng đại diện cho đầu ra của nút của lớp . 5. Sử dụng đại diện cho đầu ra mong muốn, dựa trên tập huấn luyện được sử dụng. 6. Sử dụng là hàm kích hoạt, sử dụng Sigmoid cho hàm kích hoạt. Để có được lỗi tối thiểu, hàm chi phí được tính toán với công thức như sau: 13
  • 28. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Trong đó x là đầu vào dữ liệu huấn luyện và là đầu ra mong muốn. L là tổng số lớp và y L là đầu ra của mạng nơ ron tương ứng với đầu vào x. Để đạo hàm dễ dàng, ta j nhân tổng của (4) với một hằng số 1/2. Để tìm ra mức tối thiểu. Trước tiên, ta tính toán các đạo hàm riêng của hàm chi phí đối với bất kỳ trọng số nào, với công thức sau: Có hai trường hợp: Nút là một nút đầu ra hoặc trong một tầng ẩn. Trong trường hợp ở tầng đầu ra, trước tiên chúng ta tính đạo hàm chênh lệch: Phương trình cuối cùng dựa trên quy tắc chuỗi. Nút là nút duy nhất có trọng số nên các giá trị khác sẽ bằng 0. Và là đầu ra của hàm kích hoạt (hàm Sigmoid). Do đó, phương trình mới thu được là: Trong đó xL sự kết hợp tuyến tính của tất cả các đầu vào của nút j trong tầng L với k các trọng số. Hàm sigmoid là đạo hàm có dạng sau: 14
  • 29. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Do đó, hàm trên trở thành: Vì x W y L 1 L L k ik i i L 1 . Vì vậy, (9) trở thành: (10) Vì liên quan đến và không liên quan khi khác . Do đó, có mối quan hệ giữa nút của tầng và nút của tầng . Ta có công thức: để biểu diễn nút của tầng . Do vậy, phương trình mới thu được là: Ta xem xét các nút của tầng ẩn . Ở lớp ngay trước lớp đầu ra. Áp dụng đạo hàm riêng một phần trên trọng số cho hàm chi phí. Các trọng số cho các nút của tầng ẩn này: 15
  • 30. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Vì có một tổng trên tầng. Do thay đổi của các trọng số cho các nút của các tầng ẩn sẽ ảnh hưởng đến đầu ra mạng nơ ron. Do đó, áp dụng quy tắc chuỗi (chain rule): Sau đó, đạo hàm theo quy tắc chuỗi: Dòng thứ 2 của (14) dựa vào đầu vào của là sự kết hợp tuyến tính giữa các đầu ra của nút của lớp trước với trọng số. Vì đạo hàm không liên quan đến nút của lớp L. Do đó, ta đơn giản hóa đạo hàm dựa trên quy tắc chuỗi: Chuyển thành . Do đó phương trình trở thành: Ta xét 2 trường hợp: 16
  • 31. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Đối với tầng đầu ra nút k: , trong đó: Đối với tầng ẩn nút j: , trong đó: Áp dụng quy trình tương tự. Ví dụ, Tính đạo hàm riêng cho độ lệch của nút k trong lớp cuối cùng và thu được: Bởi vì nên . Phương trình có thể được cập nhật thành: Công thức trên áp dụng với bất kể đầu ra nào. Vì vậy, độ dốc của hàm chi phí so với độ lệch là: Rút ra từ công thức trên, giải thuật loan truyền ngược sẽ được mô tả như sau: Bước 1: Chạy mạng tính toán với dữ liệu đầu vào để có được đầu ra mạng Bước 2: Đối với mỗi nút đầu ra, ta thực hiện phép tính: Bước 3: Đối với mỗi nút ở tầng ẩn, ta thực hiện phép tính: 17
  • 32. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Bước 4: Cập nhật các trọng số và thiên lệch như sau: Giả thiết: Áp dụng: Tham số trong thuật toán được gọi là tốc độ học tập. Thuật toán này lặp lại cho đến khi đạt sai số tối thiểu hoặc dưới ngưỡng chấp nhận được để hoàn thành quá trình huấn luyện. 1.3 Mạng nơ ron tích chập 1.3.1 Khái niệm về mạng nơ ron tích chập Mạng nơ ron tích chập là một trong những mạng truyền thẳng đặc biệt. Mạng nơ ron tích chập là một mô hình học sâu phổ biến và tiên tiến nhất hiện nay. Hầu hết các hệ thống nhận diện và xử lý ảnh hiện nay đều sử dụng mạng nơ ron tích chập vì tốc độ xử lý nhanh và độ chính xác cao. Trong mạng nơ ron truyền thống, các tầng được coi là một chiều, thì trong mạng nơ ron tích chập, các tầng được coi là 3 chiều, gồm: chiều cao, chiều rộng và chiều sâu (Hình 1.11). Mạng nơ ron tích chập có hai khái niệm quan trọng: kết nối cục bộ và chia sẻ tham số. Những khái niệm này góp phần giảm số lượng trọng số cần được huấn luyện, do đó tăng nhanh được tốc độ tính toán. Hình 1.16: Các tầng (layer) trong CNN là 3 chiều 18
  • 33. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20] 1.3.2 Mô hình mạng nơ ron tích chập Có ba tầng chính để xây dựng kiến trúc cho một mạng nơ ron tích chập: 1. Tầng tích chập; 2. Tầng gộp (pooling layer); 3. Tầng được kết nối đầy đủ (fully-connected). Tầng kết nối đầy đủ giống như các mạng nơ ron thông thường, và tầng chập thực hiện tích chập nhiều lần trên tầng trước. Tầng gộp có thể làm giảm kích thước mẫu trên từng khối 2x2 của tầng trước đó. Ở các mạng nơ ron tích chập, kiến trúc mạng thường chồng ba tầng này để xây dựng kiến trúc đầy đủ. Ví dụ minh họa về một kiến trúc mạng nơ ron tích chập đầy đủ: Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19] 19
  • 34. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 1.3.2 Xây dựng mạng nơ ron tích chập 1.3.2.1 Mạng được kết nối cục bộ Trong xử lý hình ảnh, thông tin của hình ảnh là các điểm ảnh (pixel). Nếu sử dụng mạng được kết nối đầy đủ, chúng ta sẽ có rất nhiều tham số. Ví dụ, một hình ảnh RGB có kích thước 512x512 pixel sẽ có 786432 (= 512 x 512 x 3) tham số đầu vào. Vì vậy, nếu chúng ta sử dụng kiến trúc mạng nơ ron trong hình sau: Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ Hình trên cho thấy nếu áp dụng mạng nơ ron được kết nối đầy đủ, toàn bộ kiến trúc mạng sẽ cần tính toán hơn 3 triệu nơ ron. Số lượng lớn các nơ ron làm cho toàn bộ quá trình học rất chậm và dẫn đến quá tải so với khả năng tính toán của máy tính hiện tại. Qua một vài nghiên cứu về xử lý ảnh, các nhà nghiên cứu nhận thấy rằng các tính năng trong một hình ảnh thường là cục bộ, và các nhà nghiên cứu chú ý đến các tính năng cấp thấp đầu tiên khi xử lý ảnh. Vì vậy, kiến trúc mạng có thể chuyển mạng được kết nối đầy đủ sang mạng được kết nối cục bộ, nhằm làm giảm độ phức tạp của tính toán. Đây là một trong những ý tưởng chính trong CNN. Chúng ta có thể thấy rõ hơn qua hình sau: Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron tầng ẩn Giống như xử lý hình ảnh thông thường, chúng ta có thể kết nối cục bộ một khối vuông ma trận với nơ ron. Kích thước khối thông thường là 3x3, 5x5, hoặc 7x7. Ý nghĩa vật lý của khối giống như một cửa sổ trượt (cửa sổ trượt là một trong những phương pháp 20
  • 35. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 xử lý ảnh). Bằng cách đó, số lượng tham số có thể giảm xuống rất nhỏ nhưng không gây ra giảm hoặc mất thông tin, vì hình ảnh thông thường thường có tính lặp trong không gian. Để trích xuất nhiều thông tin hơn, các mạng nơ ron kết nối khối cùng với một nơ ron khác. Độ sâu trong các tầng là số lần chúng ta kết nối một khu vực với các nơ ron khác nhau. Ví dụ, mạng kết nối cùng một khu vực với 5 nơ ron khác nhau. Vì vậy, độ sâu là năm trong tầng mới. Chúng ta có thể thấy rõ hơn qua hình sau: Hình 1.21: Ví dụ về lớp tích chập Trong thực tế, có thể kết nối tất cả thông tin độ sâu (ví dụ: kênh 3 RGB) với nơ ron tiếp theo vì kết nối là cục bộ trong không gian và có chiều sâu đầy đủ. Tuy nhiên ở ví dụ này chỉ kết nối thông tin cục bộ về chiều cao và chiều rộng. Vì vậy, có thể có các tham số trong hình trên cho nơ ron sau lớp màu xanh nếu chúng ta sử dụng cửa sổ . Biến thứ nhất và thứ hai là chiều cao và chiều rộng của kích thước cửa sổ và biến thứ ba là độ sâu của lớp. Ví dụ này di chuyển cửa sổ bên trong hình ảnh và làm cho tầng tiếp theo cũng có chiều cao và chiều rộng, và là một hai chiều. Ví dụ: nếu chúng ta di chuyển cửa sổ 1 pixel mỗi lần, gọi là bước nhảy là 1, trong một hình ảnh và kích thước cửa sổ là sẽ có các nơ ron ở tầng tiếp theo. Có thể thấy rằng, kích thước đã giảm từ 32 xuống 28. Vì vậy, để bảo toàn kích thước, chúng ta thêm phần trống vào đường viền. Quay lại ví dụ trên, nếu chúng ta đệm với 2 pixel, có các nơ ron ở lớp tiếp theo để giữ kích thước chiều cao và chiều rộng. Như ví dụ trên, nếu chúng ta sử dụng kích thước cửa sổ w, chúng ta sẽ có 1 vùng được tích chập với kích cỡ của cửa sổ mới là pixel. Thông tin đường viền sẽ không ảnh hưởng nhiều vì những giá trị đó chỉ được sử dụng một lần. 21
  • 36. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Phần kế tiếp sẽ chi tiết hơn về bước nhảy của cửa sổ trượt, tức khoảng cách thay đổi của cửa sổ mỗi lần. Ví dụ: giả sử bước nhảy là 2 và cửa sổ trượt bao phủ vùng Sau đó, cửa sổ thứ hai bao phủ vùng và cửa sổ thứ 3 bao phủ vùng Ví dụ, nếu chúng ta sử dụng bước nhảy 1 và kích thước cửa sổ trong hình ảnh và không sử dụng bù viền (pad-zero), thì chúng ta sẽ có các nơ ron ở lớp tiếp theo. Nếu chúng ta thay đổi bước nhảy 1 thành bước nhảy 2và những tham số khác vẫn giữ nguyên, thì chúng ta sẽ có có những nơ ron ở lớp tiếp theo. Chúng ta có thể kết luận rằng nếu chúng ta sử dụng bước nhảy s, kích thước cửa sổ trong ảnh , thì sẽ có các nơ ron ở lớp tiếp theo. Khi chúng ta sử dụng bước nhảy 3 và những tham số khác vẫn giữ nguyên thì chúng ta sẽ nhận được Vì kết quả không phải là số nguyên, nên bước nhảy 3 không thể dùng vì chúng ta không thể có được một khối hoàn chỉnh trong một mạng nơ ron. 1.3.2.2 Chia sẻ tham số Trong ví dụ minh họa của mục 1.3.2.1, ta sẽ có số lượng là nơ ron ở tầng tiếp theo có bước nhảy 1, kích thước cửa sổ 5 x 5 và không có đệm, với độ sâu là 5. Mỗi nơ ron sẽ có tham số. Vì vậy, trong tầng tiếp theo sẽ có tham số. Ở đây, chúng ta có thể chia sẻ các tham số theo từng độ sâu, do đó nơ ron ở mỗi tầng ẩn sẽ sử dụng tham số giống nhau là , và tổng tham số sử dụng cho mỗi tầng là . Điều này làm số lượng tham số giảm một cách đáng kể. Tương tự, các nơ ron ở mỗi độ sâu trong tầng tiếp theo sẽ áp dụng tích chập cho tầng trước đó. Và quá trình học tập giống như học lõi (core) tích chập. Đây là lý do mà các mạng nơ ron này được gọi là mạng nơ ron tích chập. 1.3.2.3 Hàm kích hoạt Trong mô hình nơ ron truyền thống, các mạng thường sử dụng hàm sigmoid cho hàm kích hoạt. Tuy nhiên Krizhevsky [21] đã thử với hàm kích hoạt RELU. Sau khi so 22
  • 37. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 sánh hiệu quả của hàm kích hoạt RELU và hàm kích hoạt sigmoid trong CNNs. Họ thấy rằng mô hình với RELU cần ít thời gian lặp hơn trong khi đạt tỷ lệ lỗi khi huấn luyện tương đương. Chúng ta có thể thấy kết quả trong hình sau: Hình 1.22: So sánh giữa ReLU và Sigmoid. Như hình trên, đường liền nét là mô hình sử dụng RELU và đường đứt nét là sử dụng hàm Sigmoid. Có thể dễ dàng thấy rằng, RELU cần ít vòng lặp hơn để đạt tỉ lệ lỗi chấp nhận được. Do đó, ngày nay đa số các mô hình CNN gần đây sử dụng RELU để làm hàm kích hoạt. 1.3.2.4. Tầng gộp Tầng gộp sẽ giảm kích cỡ của hình ảnh ngay sau khi thực hiện tích chập, giúp giữ lại các đặc điểm, tính chất nổi bật nhất của ảnh. Điều này cho phép giảm mức độ tính toán khi hình ảnh có kích thước quá lớn, đồng thời không làm mất đi các đặc điểm quan trọng của ảnh. Tuy đã sử dụng các mạng được kết nối cục bộ và chia sẻ tham số, tuy nhiên số lượng tham số trong mang nơ ron vẫn là quá lớn. So với một tập dữ liệu tương đối nhỏ, nó có thể gây ra tình trạng quá khớp (overfitting). Vì vậy, mạng nơ ron nhân tạo thường chèn các tầng gộp vào mạng. Tầng gộp xử lý để giảm dần số lượng tham số nhằm cải thiện thời gian tính toán trong mạng nơ ron. Tầng gộp áp dụng lấy mẫu xuống cho tầng trước bằng cách sử dụng hàm max. Tầng gộp hoạt động độc lập trên mỗi tầng trước đó. Ngoài ra, có 23
  • 38. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 thể đặt lượng pixel khi chúng ta di chuyển cửa sổ trượt hoặc bước nhảy, như làm với tầng tích chập. Ví dụ, trong hình sau: Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp Ở ví dụ trên, kích thước cửa sổ trượt là và bước nhảy mỗi lần trượt là 2. Tại mỗi cửa sổ, hàm max sẽ lấy giá trị tối đa để đại diện cho giá trị của tầng tiếp theo. Có hai loại tầng gộp: Nếu kích thước cửa sổ trượt bằng bước nhảy, đó là gộp chung (traditional pooling). Nếu kích thước cửa sổ trượt lớn hơn bước nhảy, đó là gộp nhóm (overlapping pooling). Trong thực tế, các mạng nơ ron thường sử dụng kích thước cửa sổ cùng kích thước bước nhảy là 2 trong gộp chung và sử dụng kích thước cửa sổ cùng kích thước bước nhảy là 2 trong gộp nhóm, vì nếu tăng kích cỡ cửa sổ sẽ rất dễ làm mất các đặc tính của dữ liệu. Ngoài việc gộp sử dụng hàm max, người ta có thể sử dụng các hàm khác. Ví dụ người ta có thể sử dụng hàm tính trung bình của cửa sổ trượt để tính toán giá trị cho tầng tiếp theo, được gọi là gộp trung bình. 1.3.2.5. Tầng được kết nối đầy đủ Tầng thứ ba là tầng được kết nối đầy đủ. Tầng này giống như mạng nơ ron truyền thống: các nơ ron ở tầng trước sẽ kết nối với một nơ ron ở tầng tiếp theo và tầng cuối cùng là đầu ra. Để có thể đưa hình ảnh từ những tầng trước vào, ta phải dàn phẳng dữ liệu ra thành một véc tơ nhiều chiều. Cuối cùng là sử dụng hàm softmax để thực hiện phân loại đối tượng 24
  • 39. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ 1.3.2.6 Mô hình quá khớp Cấu trúc của một mạng CNN rất lớn, trong mạng có rất nhiều nơ ron, kết nối, cũng như có rất nhiều trọng số cần thiết để huấn luyện. Nhưng lượng dữ liệu huấn luyện thường không đủ để huấn luyện hoàn thiện cho một mạng nơ ron lớn. Nó có thể gây ra một số vấn đề về quá khớp, khiến cho khi huấn luyện có kết quả rất cao, nhưng áp dụng thực tế gây ra sai số lớn. Có một số kỹ thuật để cải thiện điều này. Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải) Một trong những phương pháp đó là là giảm trọng số trong lúc huấn luyện. Dropout là một trong những kỹ thuật nổi tiếng và khá phổ biển để khắc phục vấn đề này. Dropout đặt đầu ra của mỗi nơ ron ẩn thành 0 với xác suất 0,5. Vì vậy, các nơ ron này sẽ không đóng góp vào lan truyền tiến, do đó và sẽ không tham gia vào lan truyền ngược. Thông thường, đối với các đầu vào khác nhau, mạng nơ ron xử lý dropout theo một cấu trúc khác nhau. Một cách khác để cải thiện việc việc quá khớp là tăng lượng dữ liệu. Chúng ta có thể phản chiếu hình ảnh, lộn ngược hình ảnh, lấy mẫu hình ảnh, v.v. Những cách này sẽ tăng số lượng dữ liệu huấn luyện. Vì vậy, nó có khả năng ngăn chặn quá khớp. Với ví dụ thực tế, trong một vài dự án, các bức ảnh được sử dụng để huấn luyện đã được xử lý thêm 25
  • 40. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 bước xoay, với mỗi lần từ 15 đến 20 độ cũng như áp dụng thêm phương pháp phản chiếu bức ảnh. Kết quả, hệ thống AI đã phát hiện cải thiện đáng kể việc nhận diện. 1.3.2.7. Một số mạng tích chập nổi tiếng Có một số kiến trúc mạng nơ ron tích chập nổi tiếng. Một số thử nghiệm cho thấy chúng có hiệu suất tốt hơn. Vì vậy, đôi khi nhiều người sử dụng mạng được thiết kế sẵn thay vì tự thiết kế mạng. Ở các phần sau luận văn sẽ giới thiệu một vài mạng tích chập nổi tiếng và thông dụng hiện nay. AlexNet Hình 1.26: Cấu trúc của AlexNet Alex đã phát triển mạng này vào năm 2012. Cho tới thời điểm hiện tại, AlexNet vẫn còn đang được sử dụng phổ biến và rộng rãi. Mạng AlexNet có năm lớp chập và ba lớp kết nối đầy đủ. Cấu trúc trong AlexNet được chia thành hai khối. Nguyên nhân vì tác giả đã sử dụng hai GPU để huấn luyện dữ liệu song song. Mạng này được sử dụng trong phân loại đối tượng quy mô lớn. Lớp đầu ra có một nghìn nơ ron. Đó là bởi vì kiến trúc ban đầu được thiết kế để phân loại một nghìn nhãn. Thông thường, những người áp dụng kiến trúc mạng nơ ron AlexNet sẽ thay thế lớp cuối cùng, phụ thuộc vào mục đích của họ. Tác giả của mạng này đã làm nhiều thử nghiệm để có thể ra được mô hình này có kết quả tốt nhất. Vì vậy, hiệu suất của cấu trúc này rất ổn định và mạng này được sử dụng rộng rãi trong nhiều ứng dụng. VGGNet VGGNet [10] được phát triển vào năm 2014 và đã giành chiến thắng trong cuộc thi ILSVRC-2014. Mạng này mạnh hơn mạng AlexNet nhưng rất sâu. Mạng này có 16 đến 19 tầng (Hình 1.21). Mạng này đã được thiết kế với 5 cấu trúc. Sau một số thí nghiệm, D và E là cấu trúc tốt nhất. Hiệu suất của E tốt hơn một chút so với B. Nhưng các tham số trong E lớn hơn D. Vì vậy, người sử dụng có thể chọn một trong số cấu trúc mạng dựa trên những gì họ cần. Đặc điểm của VGGNet là việc áp dụng nhiều lớp chập với kích 26
  • 41. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 thước cửa sổ nhỏ thay vì lớp chập với kích thước cửa sổ lớn, sau đó là lớp gộp. Nó làm cho mạng linh hoạt hơn. Hình 1.27: Cấu trúc của VGGNet 1.4 Kết luận Mạng nơ ron nhân tạo là một chuỗi các thuật toán được sử dụng để tìm ra mối quan hệ của một tập dữ liệu thông qua cơ chế vận hành của bộ não sinh học. Mạng nơ ron nhân tạo thường được huấn luyện qua một tập dữ liệu chuẩn cho trước, từ đó có thể đúc rút được kiến thức từ tập dữ liệu huấn luyện, và áp dụng với các tập dữ liệu khác với độ chính xác cao. Các phương pháp sử dụng để huấn luyện mạng nơ ron nhân tạo ngày càng tối ưu hơn về mặt tính toán và phục vụ cho nhiều mục đích khác nhau. Hiện nay, kiến trúc mạng nơ ron ngày càng được hoàn thiện cho nhiều nhiệm vụ, trong đó mạng nơ ron tích chập được chú ý rất nhiều vì tính hiệu quả trong thị giác máy tính. Mạng nơ ron tích chập với các cải tiến góp phần giảm thời gian tính toán và tăng độ chính xác hứa hẹn sẽ là một trong những phương pháp được áp dụng rất nhiều vào thực tế trong tương lai. 27
  • 42. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 CHƯƠNG 2. BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP 2.1 Khái niệm về nhận dạng Nhận dạng là một ngành thuộc lĩnh vực trí tuệ nhân tạo. Nhận dạng mẫu là khả năng phát hiện sự sắp xếp các đặc tính hoặc dữ liệu mang lại thông tin về một hệ thống hoặc tập dữ liệu nhất định. Nhận dạng mẫu chia thành nhiều lĩnh vực trong công nghệ thông tin, bao gồm phân tích dữ liệu lớn, nhận dạng sinh trắc học, bảo mật và trí tuệ nhân tạo. Nhận dạng đối tượng trong hình ảnh là một nhánh của nhận dạng mẫu. Nhận dạng đối tượng trong hình ảnh thể hiện qua các công nghệ máy tính có thể nhận ra người, động vật, vật thể hoặc các đối tượng mục tiêu khác thông qua việc sử dụng các thuật toán và khái niệm học máy. 2.1.1 Nhận dạng đối tượng Một số khái niệm liên quan: Nhận dạng đối tượng (object recognition) là một thuật ngữ chung để mô tả một tập hợp các cách xử lý trong thị giác máy tính có liên quan đến việc xác định các đối tượng trong ảnh kỹ thuật số. Phân loại hình ảnh (image classification) liên quan đến việc dự đoán, phân loại các lớp thông tin của một đối tượng trong một hình ảnh. Khoanh vùng đối tượng (object localization) là việc xác định vị trí của một hoặc nhiều đối tượng trong một hình ảnh bằng hình chữ nhật xung quanh phạm vi của đối tượng bằng hộp chứa (bounding box). Phát hiện đối tượng (object detection) kết hợp cả hai nhiệm vụ nhận dạng đối tượng và khoanh vùng đối tượng. Phát hiện đối tượng là việc khoanh vùng và phân loại một hoặc nhiều đối tượng khác nhau trong một hình ảnh. Nhận dạng đối tượng khác với phát hiện đối tượng ở chỗ nhận dạng đối tượng mang ý nghĩa rộng hơn, bao gồm cả việc phân loại hình ảnh (đòi hỏi thuật toán xác định các lớp của đối tượng xuất hiện trong hình ảnh), cũng như phát hiện đối tượng (đòi hỏi thuật toán khoanh vùng, định vị được tất cả các đối tượng có trong hình ảnh) 28
  • 43. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng 2.1.2 Nhận dạng khuôn mặt Nhận dạng khuôn mặt là khả năng nhận diện, lưu trữ,so sánh và phân tích các mẫu dựa trên đường nét khuôn mặt để nhận dạng người từ hình ảnh hoặc video. Hệ thống thường sử dụng các công nghệ để thực hiện nhận dạng khuôn mặt như sử dụng sinh trắc học để ánh xạ các đặc điểm khuôn mặt từ ảnh hoặc video. Hệ thống so sánh thông tin này với một cơ sở dữ liệu đã lưu trữ về các khuôn mặt để tìm ra một kết quả khớp chính xác Nhận dạng khuôn mặt ngày càng được quan tâm trong nhiều lĩnh vực, như Trung Quốc có hệ thống Skynet để chấm điểm công dân, hay nhiều chuỗi cửa hàng lớn cũng sử dụng nhận dạng khuôn mặt khách hàng thân thiết để phân tích thói quen tiêu dùng. Trên thực tế, công nghệ nhận dạng khuôn mặt đã nhận được sự chú ý đáng kể vì nó có tiềm năng cho một loạt các ứng dụng liên quan đến thực thi pháp luật cũng như các doanh nghiệp khác. Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32, conv42 và conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt. 29
  • 44. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 2.2. Lịch sử và phát triển Nhận dạng khuôn mặt tự động là một khái niệm tương đối mới, được phát triển vào những năm 1960. Hệ thống bán tự động đầu tiên cho nhận dạng khuôn mặt cần quản trị viên phải xác định được vị trí các điểm cần được đánh dấu (như mắt, tai, mũi và miệng) trên các bức ảnh, sau đó tính toán khoảng cách và tỷ lệ đến một điểm tham chiếu chung, cuối cùng đó được so sánh với dữ liệu để ra kết quả. Vào những năm 1970, Goldstein, Harmon và Lesk1 sử dụng 21 loại thông tin cụ thể, chẳng hạn như màu tóc và độ dày môi để tự động nhận dạng. Vấn đề với cả hai giải pháp ban đầu này là các phép đo dựa trên vị trí, và cần sự tính toán thủ công của con người để có thể vận hành. Năm 1988, Kirby và Sirovich áp dụng phân tích các thành phần nổi bật, một kỹ thuật đại số tuyến tính tiêu chuẩn vào việc nhận dạng khuôn mặt. Đây được coi là một phần của cột mốc thay đổi vì dưới một trăm giá trị được yêu cầu mã hóa chính xác một hình ảnh khuôn mặt được căn chỉnh và chuẩn hóa phù hợp. Vào năm 1991, Turk và Pentland phát hiện ra rằng trong khi sử dụng kỹ thuật thành phần riêng, lỗi dư (residual error) có thể được sử dụng để phát hiện khuôn mặt trong hình ảnh - một khám phá có thể tạo ra được một hệ thống nhận diện khuôn mặt tự động, thời gian thực và đáng tin cậy. Mặc dù cách tiếp cận có phần bị hạn chế bởi các yếu tố máy móc của giai đoạn đó, nhưng nó đã tạo ra sự quan tâm đáng kể trong việc phát triển công nghệ nhận dạng khuôn mặt tự động. Công nghệ đầu tiên đã thu hút được sự chú ý rất lớn của truyền thông khi triển khai thử nghiệm tại Super Bowl tháng 1 năm 2001, trong đó ghi lại hình ảnh từ camera giám sát và so sánh chúng với một cơ sở dữ liệu kỹ thuật số. Sau sự kiện này, đã có các phân tích về tính cần thiết của việc sử dụng công nghệ để hỗ trợ nhu cầu quốc gia, trong khi vẫn quan tâm đến các mối quan tâm xã hội và quyền riêng tư của cộng đồng. Ngày nay, công nghệ nhận dạng khuôn mặt đang được sử dụng để chống lại gian lận hộ chiếu, hỗ trợ thực thi pháp luật, xác định trẻ em mất tích, và giảm thiểu gian lận danh tính. 2.3. Cách thức hoạt động Phương pháp bao gồm các bước khác nhau để thực hiện nhận diện khuôn mặt tự động. Đầu tiên là thực hiện phát hiện khuôn mặt để khoanh vùng khuôn mặt trong từng khung hình ảnh và video. Sau đó, dữ liệu ở bước trên đuợc liên kết với các khuôn mặt được phát hiện với danh tính chung trên các video và căn chỉnh các khuôn mặt thành tọa độ bằng cách sử dụng các mốc được phát hiện. Cuối cùng, hệ thống thực hiện xác minh 30
  • 45. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 khuôn mặt để tính toán độ tương tự giữa một cặp hình ảnh / video. Sơ lược phương pháp được minh họa trong hình 2.3. Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người bằng mạng nơ ron tích chập Cụ thể, ta có thể xem xét ví dụ với thiết kế mạng ở hình 2.4 để rõ hơn về tổng quan cách thức hoạt động: Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh Từ mạng nơ ron trên, ta có thể thấy các bước xử lý ảnh từ trái sang phải. Lần lượt, ta có thể thấy hình ảnh các cửa sổ dò tìm (ô vuông màu xanh) đang giảm dần và hiệu chỉnh dần theo từng giai đoạn dò tìm: 31
  • 46. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh 2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera 2.4.1 Nhận diện khuôn mặt Tất cả các khuôn mặt trong khung hình ảnh / video được phát hiện bằng hệ thống dò khuôn mặt dựa trên mạng nơ ron tích chập sâu (Deep Convolutional Neural Network – DCNN), được gọi là Mô hình tháp sâu để phát hiện khuôn mặt (Deep Pyramid Deformable Parts Model for Face Detection - DP2MFD) [38], bao gồm hai mô-đun. Mô- đun đầu tiên tạo ra một hình tháp sâu được chuẩn hóa bảy cấp cho bất kỳ hình ảnh đầu vào nào có kích thước tùy ý, như đã minh họa trong hình ảnh 2.3. Kiến trúc mạng nơ ron tích chập tương tự như Alexnet, được sử dụng để trích xuất các tính năng sâu. Mạng hình tháp này tạo ra một tháp gồm 256 bản đồ đặc trưng ở lớp tích chập thứ 5 (conv5). Bộ lọc được áp dụng để có được lớp max5. Thông thường, cường độ kích hoạt cho một vùng khuôn mặt giảm theo kích thước của cấp độ của tháp. Do đó, một khuôn mặt lớn được phát hiện bởi cửa sổ trượt có kích thước cố đinh ở cấp độ tháp thấp hơn sẽ có điểm phát hiện cao so với khuôn mặt nhỏ được phát hiện ở cấp độ tháp cao hơn. Để giảm độ lệch này cho kích thước khuôn mặt, hệ thống áp dụng bước chuẩn hóa điểm z trên các tính năng max5 ở mỗi cấp. Đối với vectơ đặc trưng 256 chiều ở cấp tháp i và vị trí (j, k), tính năng chuẩn hóa được tính như sau: Trong đó, là vectơ đặc trưng trung bình và là độ lệch chuẩn cho cấp độ tháp i. Các tính năng max5 được chuẩn hóa là . Sau đó, các tính năng có độ dài từ mỗi vị trí trong tháp được trích xuất bằng cách sử dụng phương pháp cửa sổ trượt. Mô-đun thứ hai là một SVM tuyến tính (linear SVM), lấy các tính năng này làm đầu vào để phân loại từng vị trí là mặt, hoặc không phải là mặt, dựa trên điểm được tính toán. Mô hình tháp sâu 32
  • 47. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 để phát hiện khuôn mặt - DP2MFD có khả năng nhận diện rất tốt trên các độ sáng ảnh khác nhau, cũng như kích cỡ khuôn mặt. Chúng ta có thể thấy thông qua ví dụ sau: Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu 2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt Khi các khuôn mặt được phát hiện, thuật toán thực hiện phát hiện các điểm quan trọng để căn chỉnh khuôn mặt. Thuật toán sẽ tìm cách khôi phục mặt về hình dáng mặc định ban đầu: gọi khuôn mặt là I, hình dạng ban đầu là S0 , thuật toán sẽ tính toán mức tăng hình dạng ∆S từ các mô tả sâu (deep descriptors) và cập nhật bằng công thức sau: Các tính năng CNN (được biểu thị là Φ trong công thức trên) được thiết kế với bước nhảy và cách gộp hợp lý, được sử dụng làm các tính năng để thực hiện tính toán. Ở đây, kiến trúc CNN được sử dụng tương tự như Alexnet với các trọng số được xử lý trước cho bộ dữ liệu ImageNet như trong hình sau: Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ phát hiện các điểm mốc trên khuôn mặt Vì mục tiêu mạng CNN này là phát hiện khuôn mặt. Do đó, mạng sẽ được căn chỉnh để xử lý dữ liệu khuôn mặt tốt hơn. Các dữ liệu đầu ra ở từng tầng sẽ là dữ liệu đầu vào ở tầng tiếp theo. Trong hình trên, chúng ta có thể thấy có 5 tầng. Sau khi hoàn thành 33
  • 48. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 phát hiện các mốc, khuôn mặt sẽ được căn chỉnh theo tọa độ bằng cách sử dụng phép biến đổi và các điểm mốc. Điều này giúp mạng tìm hiểu các đặc điểm cụ thể đối với khuôn mặt. Hơn nữa, mạng áp dụng hồi quy theo tầng, trong đó đầu ra được tạo bởi giai đoạn đầu tiên sẽ được sử dụng làm đầu vào cho giai đoạn tiếp theo, tổng là năm giai đoạn tích chập được áp dụng trong hệ thống. Các bộ lọc được chọn để trích xuất tính năng được tinh chỉnh trong các giai đoạn sau để cải thiện việc chuẩn hóa các mốc trên khuôn mặt. Sau khi hoàn thành phát hiện các mốc trên khuôn mặt, mỗi khuôn mặt được căn chỉnh theo tọa độ chính tắc bằng cách sử dụng biến đổi tương tự và các điểm mốc. Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt 2.4.3 Liên kết khuôn mặt Vì có nhiều đối tượng xuất hiện trong các khung hình của video, nên việc thực hiện liên kết khuôn mặt để gán từng khuôn mặt cho đối tượng tương ứng là một bước quan trọng để chọn đúng đối tượng khi xác minh khuôn mặt. Do đó, khi một khuôn mặt trong khung hình của video được phát hiện, hệ thống theo dõi khuôn mặt bằng cách tích hợp các kết quả từ trình phát hiện khuôn mặt, trình theo dõi khuôn mặt và bước liên kết khuôn mặt. Hệ thống áp dụng thuật toán nhận diện khuôn mặt trong mọi khung hình bằng phương pháp nhận diện khuôn mặt được trình bày trong phần trước. Vùng phát hiện khuôn mặt được coi như một khuôn mặt mới nếu không có tỷ lệ trùng lặp với bất kỳ vùng phát hiện nào trong các khung hình trước. Tỷ lệ trùng lặp của một vùng phát hiện được phát hiện và vùng phát hiện trong khung hình trước được xác định là: 34
  • 49. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Qua thực nghiệm, ngưỡng 0,2 là đủ để coi như xuất hiện khuôn mặt mới, do các khung hình của video cách nhau chỉ một phần nhỏ của giây. Để theo dõi khuôn mặt, các nhà khoa học sử dụng giải thuật Kanade-Lucas-Tomasi (KLT) để theo dõi các khuôn mặt giữa hai khung hình liên tiếp. Hệ thống cập nhật các vùng phát hiện trong quá trình theo dõi dựa vào khung hình mới nhất. Vùng phát hiện sẽ thay thế cho vùng phát hiện nếu nhỏ hơn ngưỡng (0,2). Quá trình theo dõi khuôn mặt sẽ bị chấm dứt nếu không có phát hiện khuôn mặt tương ứng chồng chéo với nó cho nhiều hơn khung hình. Hệ thống thường đặt giới hạn bằng 4 khung hình, dựa trên cơ sở thực nghiệm. Hình ảnh kết quả của phương pháp liên kết khuôn mặt cho các video của JANUS CS2: Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS CS2, là bộ dữ liệu mở rộng của IJB-A 2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo 2.5.1 Mô hình DeepID 2 (NIPS 2014) Cách thức hoạt động của mô hình DeepID 2: Trong quá trình huấn luyện, 200 phần khuôn mặt được cắt với các vị trí, tỉ lệ và kênh màu sắc khác nhau. Mỗi phần khuôn mặt và phần đối xứng được đưa vào ConvNet. Hai vector 160 chiều được trích xuất từ phần khuôn mặt và phần đối xứng. Chọn 25 phần khuôn mặt tốt nhất. 35
  • 50. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 2.10: Kiến trúc mạng của mô hình DeepID 2 Một ví dụ về 25 phần khuôn mặt tốt nhất: Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm Kết quả của mô hình thể hiện trong bảng. Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số lượng của các phần khuôn mặt 36
  • 51. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Qua bảng 2.1, ta có thể thấy, khi sử dụng 25 phần khuôn mặt để trích xuất đặc điểm, độ chính xác của phương pháp rất cao, xấp xỉ tới 99%. Tuy nhiên, khi nhận diện với 25 phần khuôn mặt, máy tính cần mất 0.035 giây để tính toán. Mặt khác, với việc chỉ sử dụng một phần khuôn mặt để trích xuất đặc trưng, thời gian xử lý rất nhanh, chỉ 0,0017 giây, tuy nhiên độ chính xác chỉ còn 95,43%. Dựa trên bảng thống kê này, các nhà phát triển có thể căn chỉnh số phần khuôn mặt để tối ưu cho bài toán thực tế. Ví dụ như, nếu cần một hệ thống phản hồi nhanh mà không quá ưu tiên độ chính xác, có thể chỉ sử dụng một phần khuôn mặt để trích xuất đặc trưng, ngược lại, ta có thể tăng số phần khuôn mặt nhằm tăng độ chính xác. Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó trên bộ thư viện LFW Qua bảng so sánh trên, ta có thể thấy mô hình DeepID2 khi sử dụng trên bộ thư viện LFW có độ chính xác rất cao, lên tới hơn 99%. Với độ chính xác cao như vậy, DeepID2 có thể đưa ra làm sản phẩm và thương mại hóa. 37
  • 52. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 2.5.2 Mô hình DeepID3 (arXiv 2015) Hình 2.12: Kiến trúc mạng của mô hình DeepID3 DeepID3 là mô hình nâng cấp của DeepID2+ Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện LFW Với bộ dữ liệu LFW năm 2015, ta có thể thấy DeepID3 đã có những cải tiến nhất định so với DeepID2+, với độ chính xác được tăng cường lên tới 1% 38
  • 53. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 2.5.3 Mô hình DeepFace (Facebook, CVPR 2014) Sơ lược kiến trúc DeepFace: DeepFace sử dụng căn chỉnh 3D để xử lý khuôn mặt. Sau đó đầu vào được bộ lọc tích chập-gộp chung, tiếp theo được xử lý bởi ba tầng được kết nối cục bộ và hai tầng được kết nối đầy đủ. Màu sắc minh họa dựa trên đặc trưng được xử lý ở mỗi tầng. Mạng bao gồm hơn 120 triệu tham số, trong đó hơn 95% đến từ các lớp cục bộ và được kết nối đầy đủ. Hình 2.13: Kiến trúc của DeepFace Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu LFW Có thể thấy, mô hình DeepFace đạt kết quả rất cao, lên đến 0.95 tới 0.97, gần ở mức tiệm cận con người. 2.5.4 Mô hình FaceNet (Google 2015) FaceNet là một mô hình được tạo ra từ google, và được huấn luyện bởi 260 triệu bức ảnh. FaceNet có 2 mô hình CNN: mô hình lấy cảm hứng từ Zeiler & Fergus, và mô hình GoogLeNet. 39
  • 54. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus Hình 2. 15 Mô hình GoogleNet 40
  • 55. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet Qua bảng trên ta có thể thấy kiến trúc NN2 và NN1 có độ chính xác cao nhất. Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo Quả bảng so sánh độ chính xác dựa trên dữ liệu đào tạo, ta có thể thấy độ chính xác được cải thiện rõ rệt khi dữ liệu tăng lên đáng kể. Do đó, ngoài kiến trúc mạng hợp lý, dữ liệu được sử dụng để đào tạo cũng là một nhân tố góp phần tạo nên độ chính xác cao cho mô hình. 2.5.5 Mô hình Baidu (2015) Mô hình Baidu, 2015, là mô hình được tạo ra bởi hãng Baidu, Trung Quốc. Với nguồn lực và lượng thông tin cá nhân lớn, Baidu đã xây dựng được một hệ thống nhận diện khuôn mặt với tỉ lệ lỗi rất thấp. Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu 41
  • 56. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau Có thể thấy, ở mô hình của Baidu, với lượng người càng lớn và số khuôn mặt càng nhiều, hệ thống càng trở nên chính xác. 2.6 Kết luận Bài toán nhận dạng đã có từ rất lâu với nhiều phương pháp khác nhau. Tuy nhiên, với các kỹ thuật mới, ta có thể thấy rằng độ chính xác của các phương pháp ngày càng tăng trong khi chi phí tính toán ngày càng giảm. Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất bản Qua cách thức hoạt động và các mô hình được sử dụng trong bài toán nhận dạng, ta có thể thấy dữ liệu là chìa khóa rất quan trọng trong việc đào tạo. Nếu mô hình còn hạn chế, nhưng lại có rất nhiều dữ liệu để đào tạo thì độ chính xác của hệ thống sẽ được cải 42
  • 57. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 thiện ở mức đáng kể. Có thể thấy, các mô hình có độ chính xác cao trên 97% đều sử dụng trên 100 nghìn ảnh để huẩn luyện. Ngoài ra, việc xử lý nhiều phần khuôn mặt cũng giúp ích rất nhiều cho độ chính xác của nhận diện, tuy nhiên hệ thống sẽ cần số lượng tính toán lớn hơn để có thể nhận diện. Các phương pháp nhận dạng bằng mạng nơ ron tích chập hiện nay có độ sai số rất nhỏ và nằm trong ngưỡng chấp nhận được. Nên việc áp dụng mạng nơ ron tích chập để xây dựng một hệ thống nhận diện là hoàn toàn khả thi và có thể đáp ứng nhiều nhu cầu khi chúng ta đang dần tiến tới cách mạng công nghiệp 4.0. 43
  • 58. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864 CHƯƠNG 3. SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP TRONG NHẬN DẠNG ĐỐI TƯỢNG