Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính. Ngày nay, trong kỷ nguyên số, máy tính là một phần không thể thiếu trong nghiên cứu khoa học cũng như trong đời sống hàng ngày. Tuy nhiên, do hệ thống máy tính dựa trên lý thuyết cổ điển (tập hợp, logic nhị phân), nên dù có khả năng tính toán lớn và độ chính xác cao, thì máy tính cũng chỉ có thể làm việc theo một chương trình gồm các thuật toán được viết sẵn do lập trình viên chứ chưa thể tự lập luận hay sáng tạo.
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Kỹ thuật giấu tin trong tệp văn bản, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn đồ án tốt nghiệp ngành điện công nghiệp với đề tài: Nghiên cứu và khai thác hệ thống dẫn đường bằng vệ tinh GPS, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn thạc sĩ ngành hệ thống thông tin với đề tài: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên các đặc trưng miền tần số, cho các bạn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Kỹ thuật giấu tin trong tệp văn bản, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://vietbaitotnghiep.com/dich-vu-viet-thue-luan-van
Download luận văn đồ án tốt nghiệp ngành điện công nghiệp với đề tài: Nghiên cứu và khai thác hệ thống dẫn đường bằng vệ tinh GPS, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn thạc sĩ ngành hệ thống thông tin với đề tài: Xây dựng hệ thống tìm kiếm âm thanh theo nội dung dựa trên các đặc trưng miền tần số, cho các bạn tham khảo
Khoá Luận Nghiên Cứu Các Yếu Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Của Khách Hàng Đối Với Dịch Vụ Truyền Hình Fpt Play Box Tại Công Ty Cổ Phần Viễn Thông Fpt-Chi Nhánh Huế đã chia sẻ đến cho các bạn nguồn tài liệu hoàn toàn hữu ích đáng để xem và tham khảo. Nếu như các bạn có nhu cầu cần tải bài mẫu này hãy nhắn tin nhanh qua zalo/telegram : 0973.287.149 để được hỗ trợ tải nhé.
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://baocaothuctap.net
Luận Văn Thạc Sĩ Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Banking Tại Ngân Hàng Nông Nghiệp Và Phát Triển Nông Thôn Chi Nhánh Khu Công Nghiệp Tân Tạo Tp.Hcm đã chia sẻ đến cho các bạn nguồn tài liệu hoàn toàn hữu ích. Nếu như bạn có nhu cầu cần tải bài mẫu này vui lòng nhắn tin ngay qua zalo/telegram : 0932.091.562 để được hỗ trợ tải nhé.
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...The Boss
Đề tài tốt nghiệp ngành công nghệ thông tin chuyên ngành công nghệ phần mềm. Báo cáo đồ án ứng dụng nhận dạng chữ viết tay xây dựng phần mềm học từ vựng tiếng anh trên môi trường Nodejs và framework angular
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://baocaothuctap.net
Download luận văn thạc sĩ ngành công nghệ thông tin với đề tài: Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh MMPOUA, cho các bạn làm luận văn tham khảo
Tải luận văn thạc sĩ của trường đại học Bách Khoa Hà Nội với đề tài: Phân tích và xây dựng một số giải pháp nhằm nâng cao chất lượng đào tạo tại Chương trình đào tạo kỹ sư chất lượng cao - Trung tâm đào tạo Tài năng & chất lượng cao – Trường đại học Bách khoa Hà Nội. ZALO/TELEGRAM 0917 193 864
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do. Việc điều khiển canh tay robot được áp dụng mờ trên nền đại số gia tử có ý nghĩa thực tiễn lớn. Bời vì, robot được áp dụng ngày một rộng rãi trong nhiều lĩnh vực khác nhau, chúng phải làm việc ở những môi trường có điều kiện khắc nghiêt và luôn thay đổi để thay thế cho con người. Việc nâng cao chất lượng điều khiển robot sẽ góp phần nâng cao chất lượng sản phẩm, nâng cao năng suất và hiệu quả lao động.
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam. Khóa luận làm rõ các khái niệm về nội dung các quy định pháp luật về ĐTM trong các khu công nghiệp. Phân tích được thực tiễn pháp luật và thực thi pháp luật ĐTM tại khu vực này. Nghiên cứu kinh nghiệm một số quốc gia trên thế giới về xây dựng và thực hiện pháp luật ĐTM. Từ đó đưa ra những giải pháp cho việc hoàn thiện pháp luật ĐTM ở nước ta.
Khoá Luận Nghiên Cứu Các Yếu Tố Ảnh Hưởng Đến Quyết Định Lựa Chọn Của Khách Hàng Đối Với Dịch Vụ Truyền Hình Fpt Play Box Tại Công Ty Cổ Phần Viễn Thông Fpt-Chi Nhánh Huế đã chia sẻ đến cho các bạn nguồn tài liệu hoàn toàn hữu ích đáng để xem và tham khảo. Nếu như các bạn có nhu cầu cần tải bài mẫu này hãy nhắn tin nhanh qua zalo/telegram : 0973.287.149 để được hỗ trợ tải nhé.
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Tìm hiểu hệ thống phát hiện xâm nhập IDS-SNORT, cho các bạn làm luận văn tham khảo
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://baocaothuctap.net
Luận Văn Thạc Sĩ Nghiên Cứu Những Yếu Tố Ảnh Hưởng Đến Quyết Định Sử Dụng Internet Banking Tại Ngân Hàng Nông Nghiệp Và Phát Triển Nông Thôn Chi Nhánh Khu Công Nghiệp Tân Tạo Tp.Hcm đã chia sẻ đến cho các bạn nguồn tài liệu hoàn toàn hữu ích. Nếu như bạn có nhu cầu cần tải bài mẫu này vui lòng nhắn tin ngay qua zalo/telegram : 0932.091.562 để được hỗ trợ tải nhé.
Báo cáo đồ án tốt nghiệp "Ứng dụng trí tuệ nhân tạo nhận dạng chữ viết tay xâ...The Boss
Đề tài tốt nghiệp ngành công nghệ thông tin chuyên ngành công nghệ phần mềm. Báo cáo đồ án ứng dụng nhận dạng chữ viết tay xây dựng phần mềm học từ vựng tiếng anh trên môi trường Nodejs và framework angular
Nhận viết luận văn đại học, thạc sĩ trọn gói, chất lượng, LH ZALO=>0909232620
Tham khảo dịch vụ, bảng giá tại: https://baocaothuctap.net
Download luận văn thạc sĩ ngành công nghệ thông tin với đề tài: Hệ thống tự động phân luồng câu hỏi và giải đáp yêu cầu trực tuyến, cho các bạn làm luận văn tham khảo
Nhận viết luận văn Đại học , thạc sĩ - Zalo: 0917.193.864
Tham khảo bảng giá dịch vụ viết bài tại: vietbaocaothuctap.net
Download luận văn đồ án tốt nghiệp ngành công nghệ thông tin với đề tài: Kỹ thuật giấu tin thuận nghịch tránh vượt ngưỡng trong ảnh MMPOUA, cho các bạn làm luận văn tham khảo
Tải luận văn thạc sĩ của trường đại học Bách Khoa Hà Nội với đề tài: Phân tích và xây dựng một số giải pháp nhằm nâng cao chất lượng đào tạo tại Chương trình đào tạo kỹ sư chất lượng cao - Trung tâm đào tạo Tài năng & chất lượng cao – Trường đại học Bách khoa Hà Nội. ZALO/TELEGRAM 0917 193 864
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
Thiết kế bộ điều khiển mờ theo đại số gia tử cho robot 2 bậc tự do. Việc điều khiển canh tay robot được áp dụng mờ trên nền đại số gia tử có ý nghĩa thực tiễn lớn. Bời vì, robot được áp dụng ngày một rộng rãi trong nhiều lĩnh vực khác nhau, chúng phải làm việc ở những môi trường có điều kiện khắc nghiêt và luôn thay đổi để thay thế cho con người. Việc nâng cao chất lượng điều khiển robot sẽ góp phần nâng cao chất lượng sản phẩm, nâng cao năng suất và hiệu quả lao động.
Pháp luật đánh giá tác động môi trường tại các khu công nghiệp ở Việt Nam. Khóa luận làm rõ các khái niệm về nội dung các quy định pháp luật về ĐTM trong các khu công nghiệp. Phân tích được thực tiễn pháp luật và thực thi pháp luật ĐTM tại khu vực này. Nghiên cứu kinh nghiệm một số quốc gia trên thế giới về xây dựng và thực hiện pháp luật ĐTM. Từ đó đưa ra những giải pháp cho việc hoàn thiện pháp luật ĐTM ở nước ta.
Luận Văn Các Nhân Tố Ảnh Hưởng Đến tính Hữu Hiệu Của Hệ Thống Kiểm Soát Nội Bộ. Xác định các nhân tố tác động đến tính hữu hiệu của HTKSNB trong các DNBH phi nhân thọ tại Việt Nam. Đo lường mức độ ảnh hưởng của từng nhân tố tác động đến tính hữu hiệu của HTKSNB tại các doanh nghiệp này.
Thực thi chính sách đối với người có công trên địa bàn quận Liên Chiểu, thành phố Đà Nẵng. Trên cơ sở làm rõ những vấn đề lý luận và thực trạng thực thi chính sách đối với ngƣời có công trên địa bàn quận Liên Chiểu, thành phố Đà Nẵng; luận văn đề xuất những giải pháp góp phần hoàn thiện công tác thực thi chính sách với đối tƣợng ngƣời có công trên địa bàn quận Liên Chiểu, thành phố Đà Nẵng.
Luận Văn Ứng Dụng Hoàn Thiện Quản Trị Rủi Ro Tín Dụng Theo Basel II.
Để thực hiện được mục tiêu chính, đề tài giải quyết các mục tiêu cụ thể như sau:
Một là phân tích, đánh giá thực trạng rủi ro tín dụng và quản trị rủi ro tín dụng tại VPBank, thực trạng về an toàn vốn theo chuẩn Basel II tại VPBank và đánh giá các yêu cầu của Basel II trong QTRR tín dụng tại VPBank.
Từ đó, hướng tới mục tiêu cuối cùng là xây dựng kế hoạch và giải pháp nhằm hoàn thiện hoạt động quản trị rủi ro tín dụng tại VPBank theo Basel II.
Yếu tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp. Đề tài nghiên cứu các nhân tố ảnh hưởng đến xu hướng sử dụng hóa đơn điện từ của các doanh nghiệp tại quận Bình Thủy thành phố Cần Thơ nhằm đề xuất giải pháp cho Chi cục Thuế quận Bình Thủy gia tăng số lượng khách hàng sử dụng hóa đơn điện tử.
Luận văn Phát Triển Nguồn Nhân Lực Tại Trường Đại Học Nội Vụ Hà Nội. Sự tăng trưởng của một quốc gia tuỳ thuộc vào việc quốc gia đó sử dụng như thế nào các nguồn vốn: vốn con người (nguồn nhân lực), vốn vật chất và tài nguyên. Trong đó, vốn con người đóng vai trò quyết định đến sự thành đạt của mỗi tổ chức, đến sự thành công của mọi hoạt động của tổ chức đó. Vì thế,
không phải vô cớ người ta khẳng định yếu tố nguồn nhân lực là nguồn tài nguyên quý báu nhất của mọi tổ chức. Sở dĩ nguồn nhân lực trở thành một
trong những nguồn lực quan trọng nhất của sự phát triển kinh tế - xã hội, chính là bắt nguồn từ vai trò của yếu tố con người.
Yếu tố tác động đến ý định sử dụng dịch vụ ngân hàng số tại ngân hàng Quân Đội. - Nghiên cứu định lượng: Trên cơ sở lý luận và thiết kế nghiên cứu, tác giả xây dựng phiếu khảo sát và tiến hành khảo sát sơ bộ nhằm kiểm tra sự phù hợp của các câu hỏi với nội dung cần khảo sát. Sau khi Phiếu khảo sát được chỉnh sửa bổ sung cho phù hợp, tác giả tiến hành khảo sát chính thức để thu thập dữ liệu sơ cấp. Các số liệu sau khi thu thập được sẽ được thống kê, xử lý bằng phần mềm SPSS 20 nhằm kiểm định các giả thuyết, các vấn đề nghiên cứu đặt ra.
Giải Pháp Nâng Cao Động Lực Làm Việc Cho Nhân Viên Tại Công Ty Cổ Phần Bao Bì. Tạo động lực là vấn đề thuộc lĩnh vực quản trị của mỗi doanh nghiệp. Các nhà quản trị trong tổ chức muốn xây dựng doanh nghiệp vững mạnh thì phải áp dụng mọi biện pháp kích thích người lao động hăng say làm việc, phát huy tính sáng tạo trong quá trình làm việc.
Quản Lý Thu Thuế Thông Qua Mối Quan Hệ Giữa Kế Toán Tài Chính Và Kế Toán Thuế. Nghiên cứu những ảnh hưởng từ mối quan hệ giữa KTTC & KTT đến hiệu quả quản lý thu thuế tại Việt Nam, từ đó khuyến nghị các chính sách, giải pháp để giảm gánh nặng thuế và ngăn ngừa các hành vi điều chỉnh lợi nhuận với mục đích gây thất thu hoặc thất thoát thuế đối với doanh nghiệp, đồng thời, nâng cao hiệu quả quản lý thu thuế đối với cơ quan thuế.
Nâng Cao Hiệu Quả Thực Hiện Chính Sách Giảm Nghèo Bền Vững Trên Địa Bàn Quận Bình Tân. Để đánh giá một cách toàn diện khách quan về cách đo lường chuẩn hộ nghèo cần phải tuân thủ theo phương pháp duy vật biện chứng và phương pháp duy vật lịch sử. Phương pháp phân tích diễn dịch và quy nạp được áp dụng để đánh giá tình trạng nghèo đa chiều. Phương pháp định tính cũng được sử dụng thông qua kết hợp giữa lý luận và thực tiễn dựa trên những quy luật phát triển khách quan về kinh tế - xã hội, cùng với những quan điểm, chính sách của Nhà nước để hệ thống hoá và phát triển cơ sở lý luận, xác định một số chỉ tiêu đánh giá về nghèo và giảm nghèo.
kHÓA LUẬN TỐT NGHIỆP HOẠT ĐỘNG QUẢN LÝ NỢ CÓ VẤN ĐỀ TẠI VIETINBANK. Systematization of fundamental theoretical issues on problem debt, indicators for assessing the effectiveness of problem debt management and problematic debt management are three stages of implementation. Identify problematic debt, develop strategies and institutional arrangements for resolving problem loans, and finally deal with problem loans.
Luận Văn Các Nhân Tố Tác Động Đến Giá Trị Thương Hiệu Bưởi Da Xanh. Xác định cụ thể các nhân tố tác động đến giá trị thương hiệu Bưởi da xanh Hương Miền Tây tỉnh Bến Tre. Xác định mức độ ảnh hưởng cụ thể của các nhân tố trong việc tác động tới giá trị thương hiệu Bưởi da xanh Hương Miền Tây tỉnh Bến Tre.
- Từ kết quả nghiên cứu của đề tài rút ra những kết luận và kiến nghị một số hàm ý chính sách đến các nhà quản lý doanh nghiệp nhằm giúp họ hiểu rõ hơn về ảnh hưởng của các nhân tố tới giá trị thương hiệu. Từ đó, các nhà quản lý sẽ có sự điều chỉnh để đưa ra chiến lược thích hợp để nâng cao giá trị thương hiệu Bưởi da xanh Hương Miền Tây tỉnh Bến Tre và tăng cường năng lực cạnh tranh một cách bền vững.
Các Nhân Tố Ảnh Hưởng Đến Chất Lượng Kiểm Toán Ước Tính Kế Toán Của Các Công Ty Kiểm Toán Độc Lập. Nghiên cứu với mục tiêu chung là nhằm đánh giá mức độ ảnh hưởng của các nhân tố đến CLKT ƯTKT của các DNKT độc lập trên địa bàn TP. HCM, từ đó đưa ra một số giải pháp nâng cao CLKT khoản mục này với các mục tiêu cụ thể như sau: Nhận diện các nhân tố tác động đến CLKT ƯTKT của các DNKT độc lập trên địa bàn TP. HCM. Đo lường mức độ ảnh hưởng của các nhân tố tác động này đến CLKT ƯTKT của các DNKT trên địa bàn TP. HCM dưới góc nhìn của KTV và DNKT.
Luận Văn Hoàn Thiện Công Tác Quản Trị Tri Thức Tại Công Ty Cổ Phần Vng. Phân tích thực trạng công tác quản trị tri thức tại Công ty cổ phần VNG, từ đó đưa ra giải pháp nhằm hoàn thiện công tác quản trị tri thức tại Công ty.
Các Nhân Tố Ảnh Hưởng Đến Sự Tự Nguyện Áp Dụng IFRS Tại Các Doanh Nghiệp Việt Nam. Đề tài sử dụng phương pháp nghiên cứu định lượng, kiểm định giả thuyết thông qua bảng câu hỏi khảo sát để trả lời cho câu hỏi nghiên cứu thứ nhất. Sau đó, sử dụng phần mềm thống kê SPSS để phân tích Crosstabs, Chi-squares và Fisher exact test để đánh giá mối liên hệ giữa các nhân tố với biến phụ thuộc, phân tích logictis nhị phân để kiểm định giả thuyết mô hình và đánh giá mức độ tác động của từng nhân tố đối với biến phụ thuộc để xác định câu trả lời cho câu hỏi nghiên cứu thứ hai.
Các Nhân Tố Tác Động Đến Tăng Trưởng Tín Dụng Của Các Ngân Hàng Thương Mại Cổ Phần Tại Việt Nam. Cụ thể, tín dụng tăng trưởng có nghĩa là lượng cung tiền được bơm vào nền kinh tế tăng lên. Chính sự tăng lên này kéo theo rất nhiều sự thay đổi: khả năng tiếp cận nguồn vốn của các chủ thể cần vốn có xu hướng tăng lên, nguồn cung tiền cho các hoạt động đầu tư cơ sở hạ tầng, cho đầu tư phát triển, máy móc thiết bị, công nghệ, phần mềm, nguồn nhân lực,.. cũng vì thế mà tăng lên. Kết quả tất yếu kéo theo là toàn bộ nền kinh tế tăng trưởng về mặt quy mô.
Giải Pháp Hoàn Thiện Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Ngoại Thương. Tuy nhiên vấn đề nguồn nhân lực trong Vietcombank Tân Định có những đặc thù riêng như thế nào, đồng thời gặp những khó khăn gì và làm thế nào để phát triển nguồn nhân lực trong lĩnh vực ngân hàng trong quá trình hội nhập kinh tế vẫn là câu hỏi chưa có lời giải thích thỏa đáng. Chính vì vậy việc nghiên cứu về vấn đề này ở Vietcombank Tân Định là cần thiết khách quan. Từ thực trạng và yêu cầu phát triển nguồn nhân lực cho Vietcombank Tân Định trong thời gian tới, tác giả chọn đề tài “Giải Pháp Hoàn Thiện Thực Tiễn Quản Trị Nguồn Nhân Lực Tại Ngân Hàng Tmcp Ngoại Thương Việt Nam Chi Nhánh Tân Định Đến Năm 2020” để nghiên cứu.
Các Yếu Tố Ảnh Hưởng Đến Ý Định Khởi Nghiệp Của Sinh Viên Tại Các Trường Đại Học. Đề tài nghiên cứu góp phần cung cấp thêm cơ sở cho các nhà quản trị, các nhà hoạch định chính sách tại Việt Nam để xây dựng, điều chỉnh chính sách nhằm thúc đẩy hoặc có các biện pháp hỗ trợ, can thiệp nhằm nâng cao ý định khởi nghiệp của sinh viên.
Phân tích tài chính tại công ty cổ phần sản xuất lâm sản xuất khẩu Quảng Đông, Quảng Bình. Kết quả của luận văn sẽ đóng góp vào hệ thống hóa cơ sở lý luận về phân tích tài chính doanh nghiệp, đồng thời hỗ trợ công ty Cổ phần sản xuất lâm sản xuất khẩu Quảng Đông trong việc tham khảo và ứng dụng vào công tác quản lý tài chính của mình.
Similar to Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.doc (20)
Phân tích các yếu tố ảnh hưởng đến lòng trung thành của nhân viên tại khách sạn Sài Gòn Morin Huế. - Hệ thống hóa trên trên cơ sở phân tích các nhân tố ảnh hưởng đến lòng trung thành của nhân viên đề đề xuất các giải pháp nâng cao lòng trung thành của nhân viên khách sạn SÀI GÒN MORIN HUẾ.
Nghiên cứu về phát triển hệ thống kênh phân phối sản phẩm của các doanh nghiệp ngành công nghệ thông tin. Kênh phân phối là tập hợp các cá nhân hay công ty tự gánh vác hay giúp đỡ chuyển giao cho một ai đó quyền sở hữu đối với một hang hóa cụ thể hay một dịch vụ trên con đường từ nhà sản xuất đến người tiêu dung theo Philip Kotler
CƠ SỞ LÝ LUẬN VỀ THƯƠNG HIỆU. Theo định nghĩa của Hội Marketing Hoa Kỳ: Thương hiệu là một cái tên, một từ ngữ, một dấu hiệu, một biểu tượng, một hình vẽ, hay tổng hợp tất cả các yếu tố kể trên nhằm xác định một sản phẩm hay một dịch vụ của một (hay một nhóm) người bán và phân biệt các sản phẩm (dịch vụ) đó với các đối thủ cạnh tranh [1].
Cơ sở lý luận của việc nâng cao chất lượng phục vụ tại bộ phận đón tiếp của khách sạn. Trong khu vực đón tiếp, bộ phận đón tiếp đóng vai trò đặc biệt quan trọng, nó được ví như bộ mặt của khách sạn , đại diện cho khách sạn trong các mối quan hệ đối ngoại với khách hàng, với các nhà cung cấp khách, với các tổ chức cung ứng vá các đối tác khác. Và hơn thế nữa, trong quá trình phụcvụ khách lưu trú trong khách sạn thì bộ phận lễ tân lại đóng vai trò như là một chiếc cầu nối giữa khách sạn và khách, nối giữa các bộ phận riêng biệt khác lại với nhau, tạo nên một sự thống nhất, ăn khớp trong sự hoạt động của khách sạn.
Cơ sở lý luận về phát triển thị trƣờng khách inbound dưới góc độ marketing của doanh nghiệp lữ hành. Định nghĩa của nhà kinh tế ngƣời Anh - Olgilvi: “Để trở thành khách du lịch cần có hai điều kiện sau: thứ nhất phải xa nhà một thời gian dưới một năm; thứ hai là phải dùng những khoản tiền kiếm được ở nơi khác”.
Cơ sở lý luận về thị trường và sử dụng marketing nhằm mở rộng thị trường của doanh nghiệp. Hoạt động mở rộng thị trường là một trong những tác động Marketing nhằm mở rộng phạm vi thị trường cũng như phạm vi hoạt động kinh doanh của doanh nghiệp. Mở rộng thị trường giữ một vai trò quan trọng đối với việc thiết lập và mở rộng hệ thống sản xuất hàng hóa, kinh doanh và quản lý kinh tế với mục tiêu lợi nhuận và duy trì ưu thế cạnh tranh. Thị trường đảm bảo cho sản xuất phát triển liên tục với quy mô ngày càng mở rộng và đảm bảo hàng hóa luôn phù hợp với thị hiêu của người tiêu dùng, nó thúc đẩy nhu cầu, gợi mở nhu cầu đưa đến cho người tiêu dùng những sản phẩm có chất lượng cao, văn minh, hiện đại.
Tính toán thiết kế chế tạo và vận hành thử nghiệm hệ thống cấp đông I-Q-F thẳng. Những người ăn nhiều cá được cho là có nguy cơ mắc bệnh tim thấp hơn người không ăn. Lợi ích này thường được liên kết với cá có dầu, do hàm lượng axit béo omega-3 cao. Tuy nhiên, việc ăn cá nạc cũng có thể liên quan đến việc giảm cholesterol- nguy co gây bệnh tim.
Tính toán, thiết kế máy sấy bơm nhiệt sấy thanh long cắt lát với năng suất 200kg mẻ. Để đáp ứng cho những vấn đề này, mục đích chính là nghiên cứu, tính toán, thiết kế mô hình máy sấy lạnh tận dụng một phần nhiệt thải ra của dàn nóng để nung nóng tác nhân sấy (TNS).
Nghiên cứu nhiệt phân gỗ nhằm nâng cao chất lượng sản phẩm than hoa. Mục đích nghiên cứu của luận văn là: Nghiên cứu quá trình nhiệt phân gỗ; xác định ảnh hưởng của các yếu tố nhiệt độ bao gồm: nhiệt độ thực hiện quá trình nhiệt phân, thời gian nhiệt phân và tốc độ gia nhiệt tới tỷ lệ và các đặc tính của than hoa sau khi nhiệt phân nhằm mục đích cuối cùng là nâng cao chất lượng sản phẩm than hoa.
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu. Nghiên cứu sản phẩm thanh long sấy từ nguồn nguyên liệu thanh long Long An để có được hương vị đặc trưng, có giá trị cảm quan và dinh dưỡng cao, có thể sử dụng trong một khoảng thời gian cho phép. Để đáp ứng mục tiêu đề ra, đề tài sẽ tiến hành thí nghiệm theo những nội dung như sau:
Nghiên cứu ứng dụng hệ điều khiển dự báo để điều khiển mức nước bao hơi của nhà máy nhiệt điện. Phƣơng pháp điều khiển dự báo dựa trên mô hình của hệ thống thật để dự báo trƣớc các đáp ứng ở tƣơng lai, trên cơ sở đó, một thuật toán tối ƣu hoá hàm mục tiêu sẽ đƣợc sử dụng để tính toán chuỗi tín hiệu điều khiển sao cho sai lệch giữa đáp ứng dự báo và đáp ứng tham chiếu của mô hình là nhỏ nhất.
ĐỒ ÁN - BÁO CÁO MÔ HÌNH KHO LẠNH DÀN TRẢI. Kho lạnh là một phòng hay kho chứa được thiết kế, lắp đặt với hệ thống làm mát, làm lạnh hay cấp đông để bảo quản, lưu trữ hàng hóa lâu và giữ được chất lượng tốt nhất.
ĐỒ ÁN - Tính toán thiết kế máy sấy khoai lang năng suất 100 kg mẻ. Ở Việt Nam, khoai lang là cây lƣơng thực truyền thống đứng thứ ba sau lúa, ngô và đứng thứ hai về giá trị kinh tế sau khoai tây. Khoai lang đƣợc trồng ở khắp mọi nơi trên cả nƣớc từ Đồng bằng đến Miền núi, Duyên hải Miền Trung và vùng Đồng bằng Sông Cửu long. Năm 2004, diện tích khoai lang đạt 203,6 nghìn ha và sản lƣợng là 1535,7 nghìn tấn . Đặc biệt tổng diện tích trồng khoai lang ở vùng ĐBSCL liên tục tăng trong những năm gần đây, từ 9.900 ha năm 2000 lên 14.000 ha năm 2007 với sản lƣợng đạt 285,5 ngàn tấn. Năng suất khoai lang ở ĐBSCL thuộc loại cao nhất nƣớc nhƣng cũng chỉ đạt 20,3 tấn/ha. So với tiềm năng về đất đai và khí hậu thời tiết thì năng suất còn rất thấp [16].
Đồ án tốt nghiệp - Sấy bã mía, 9 điểm. Mục đích của quá trình này là phá hủy cấu trúc sơ xợi của cellulose, hemicellulose… và tăng hàm lượng proteine trong thức ăn cho gia súc. Hiện nay, bên Nhật làm cái này với qui mô công nghiệp rồi, họ còn sang Việt Nam để định mua bã mía của mình
Hoàn thiện quy trình sản xuất thanh long sấy bằng phương pháp sấy đối lưu. Nghiên cứu sản phẩm thanh long sấy từ nguồn nguyên liệu thanh long Long An để có được hương vị đặc trưng, có giá trị cảm quan và dinh dưỡng cao, có thể sử dụng trong một khoảng thời gian cho phép. Để đáp ứng mục tiêu đề ra, đề tài sẽ tiến hành thí nghiệm theo những nội dung như sau:
ĐỒ ÁN - Điều khiển lưu lượng không khí trong phòng sạch thông qua biến tần. Nhiệm vụ chủ yếu là ngăn ngừa không cho không khí, hạt bụi, chất nhiễm trùng; từ phòng, khu vực dơ hơn sang phòng, khu vực sạch hơn. Nguyên tắc di chuyển căn bản của không khí là từ nơi có áp suất cao tới nơi có áp suất thấp. Như vậy, phòng có cấp độ sạch hơn thì có áp cao hơn và ngược lại. Để kiểm soát áp suất phòng thì thường có đồng hồ đo áp suất, khi áp phòng vượt quá sẽ tự động tràn ra ngoài thông qua cửa gió xì. Thường thì những phòng nào có yêu cầu cao mới gắn miệng gió xì.
ĐỒ ÁN - Tính toán thiết bị sấy nấm kểu sấy hầm, năng suất nhập liệu 650kgmẻ. Nấm được phân loại riêng so với thực vật và động vật được gọi giới nấm. Đặc điểm phân loại quan trọng phân chia nó thành giới riêng có rất nhiều nguyên nhân. Nấm chưa cấu trúc mô, nấm có thể là đơn bào hoặc đa bào, không có chất diệp lục, chất dự trữ trong nấm không phải là tinh bột và glycogen như thực vật, động vật. Nấm sinh sản bằng bào tử hoặc sinh sản sinh dưỡng (sợi nấm hay tơ nấm). Nấm là sinh vật hoại sinh chúng hấp thụ dinh dưỡng từ các thực vật hoặc động vật chết, một số ký sinh.
Thiết kế nhà máy sản xuất bia năng suất 91,8 triệu lít sản phẩm năm. Bia không cồn là loại bia có nồng độ cồn không quá 0,5% theo tiêu chuẩn của Châu Âu và Mỹ [12]. Được sản xuất từ các nguyên liệu dùng để sản xuất bia thông thường như malt, houblon và các nguyên liệu khác, bia không cồn là đồ uống bổ dưỡng, có lợi cho sức khỏe người tiêu dùng và góp phần hạn chế một số tiêu cực của việc lạm dụng đồ uống có cồn.
Tính toán thiết kế hệ thống sấy thùng quay sấy cà phê nhân theo năng suất nhập liệu 300kgh. Vật liệu ẩm trong kỹ thuật sấy phải là các vật có khả năng chứa nước hoặc hơi nước trong quá trình hình thành hoặc gia công bản thân các vật liệu như các loại nông sản (lúa, ngô, đậu, v.v…), giấy, vải sợi, gỗ, các loại huyền phù hoặc các lớp sơn trên bề mặt các chi tiết kim loại, v.v… (Tính toán và thiết kế hệ thống sấy, Trần Văn Phú)
Thiết kế hệ thống sấy thùng quay sấy bắp với năng suất 800 kgh. Hạt ngô thuộc loại quả dĩnh gồm 4 bộ phân chính: vỏ hạt, lớp alơron, phôi và nội nhũ. Phía dưới hạt có gốc hạt gắn liền với lõi ngô. Vỏ hạt bao bọc xung quanh, màu sắc vỏ hạt tùy thuộc vào từng giống, nằm sau lớp vỏ hạt là lớp aleron bao bọc lấy nội nhũ và phôi. Nội nhũ là thành phần chính 70-78% trọng lượng hạt, thành phần chủ yếu là tinh bột, ngoài ra còn có protein, lipid, vitamin, khoáng và enzyme để nuôi phôi phát triển. Phôi ngô lớn (chiếm 8 -15%) nên cần chú trọng bảo quản.
More from Dịch vụ viết thuê đề tài trọn gói ☎☎☎ Liên hệ ZALO/TELE: 0973.287.149 👍👍 (20)
Để xem full tài liệu Xin vui long liên hệ page để được hỗ trợ
:
https://www.facebook.com/garmentspace/
https://www.facebook.com/thuvienluanvan01
HOẶC
https://www.facebook.com/thuvienluanvan01
https://www.facebook.com/thuvienluanvan01
tai lieu tong hop, thu vien luan van, luan van tong hop, do an chuyen nganh
GIÁO TRÌNH 2-TÀI LIỆU SỬA CHỮA BOARD MONO TỦ LẠNH MÁY GIẶT ĐIỀU HÒA.pdf
https://dienlanhbachkhoa.net.vn
Hotline/Zalo: 0338580000
Địa chỉ: Số 108 Trần Phú, Hà Đông, Hà Nội
Nghiên cứu về mạng neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.doc
1. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN MẠNH HÙNG
NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL,
ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG
TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội –
2. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
ĐẠI HỌC QUỘC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN MẠNH HÙNG
NGHIÊN CỨU VỀ MẠNG NEURAL CONVOLUTIONAL,
ÁP DỤNG VÀO BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG
TRONG LĨNH VỰC THỊ GIÁC MÁY TÍNH
Ngành : Công nghệ thông tin
Chuyên ngành : Kỹ thuật phần mềm
Mã số : 8480103.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS ĐỖ TRUNG TUẤN
Hà Nội –
3. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI CAM ĐOAN
Tôi xin cam đoan: luận văn “Nghiên cứu về mạng neural Convolutional, áp dụng
vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính.” là công trình nghiên
cứu của tôi dưới sự hướng dẫn của giảng viên hướng dẫn, không sao chép lại của người
khác. Các tài liệu được luận văn tham khảo, kế thừa và trích dẫn đều được liệt kê trong
danh mục các tài liệu tham khảo.
Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan trên.
Hà Nội, ngày tháng năm 2019
Học viên
Nguyễn Mạnh Hùng
i
4. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô trường Đại học Công nghệ, Đại học quốc
gia Hà Nội, đặc biệt các thầy cô bộ môn Kỹ thuật phần mềm, đã tận tình dạy dỗ, giúp đỡ
và tạo mọi điều kiện tốt nhất cho em trong suốt quãng thời gian em theo học tại trường, để
em có thể hoàn thành được đề tài này.
Em tỏ lòng biết ơn sâu sắc với PGS.TS Đỗ Trung Tuấn, người thầy đã tận tình
hướng dẫn khoa học và giúp đỡ, chỉ bảo em trong suốt quá trình nghiên cứu và hoàn thành
luận văn này.
Tôi xin chân thành cảm ơn các bạn học viên cao học khóa 22 tại trường Đại học
Công nghệ, Đại học quốc gia Hà Nội đã giúp đỡ tôi trong quá trình theo học tại trường,
cũng như giúp đỡ tôi thực hiện đề tài này.
Xin trân trọng cảm ơn!
ii
5. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
MỤC LỤC
LỜI CAM ĐOAN............................................................................................i
LỜI CẢM ƠN................................................................................................ ii
MỤC LỤC..................................................................................................... iii
DANH MỤC HÌNH VẼ................................................................................vi
DANH MỤC BẢNG BIỂU............................................................................x
DANH MỤC VIẾT TẮT ..............................................................................xi
LỜI MỞ ĐẦU.................................................................................................1
Lý do chọn đề tài ............................................................................................... 1
Cơ sở khoa học và thực tiễn của đề tài.............................................................. 1
Mục tiêu của luận văn........................................................................................ 2
Cấu trúc luận văn............................................................................................... 3
CHƯƠNG 1. ...................................................................................................4
TỔNG QUAN VỀ MẠNG NƠ RON............................................................4
VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP...............................4
1.1. Nơ ron nhân tạo ................................................................................4
1.1.1 Lịch sử của nơ ron nhân tạo ..................................................................... 4
1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học................................. 5
1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo ................................ 5
1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo .......................... 8
1.2 Mạng nơ ron nhân tạo.....................................................................11
1.2.1 Giới thiệu mạng nơ ron nhân tạo............................................................ 11
1.2.2 Một số kiểu mạng nơ ron........................................................................ 11
1.2.3 Mạng nơ ron lan truyền ngược ............................................................... 13
1.3 Mạng nơ ron tích chập ....................................................................18
1.3.1 Khái niệm về mạng nơ ron tích chập...................................................... 18
iii
6. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.3.2 Mô hình mạng nơ ron tích chập.............................................................. 19
1.3.2 Xây dựng mạng nơ ron tích chập ........................................................... 20
1.4 Kết luận.............................................................................................27
CHƯƠNG 2. .................................................................................................28
BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP .......28
2.1 Khái niệm về nhận dạng..................................................................28
2.1.1 Nhận dạng đối tượng .............................................................................. 28
2.1.2 Nhận dạng khuôn mặt............................................................................. 29
2.2. Lịch sử và phát triển.......................................................................30
2.3. Cách thức hoạt động.......................................................................30
2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera.....32
2.4.1 Nhận diện khuôn mặt.............................................................................. 32
2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt ...................................... 33
2.4.3 Liên kết khuôn mặt................................................................................. 34
2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo...............35
2.5.1 Mô hình DeepID 2 (NIPS 2014)............................................................. 35
2.5.2 Mô hình DeepID3 (arXiv 2015) ............................................................. 38
2.5.3 Mô hình DeepFace (Facebook, CVPR 2014)......................................... 39
2.5.4 Mô hình FaceNet (Google 2015)............................................................ 39
2.5.5 Mô hình Baidu (2015) ............................................................................ 41
2.6 Kết luận.............................................................................................42
CHƯƠNG 3. .................................................................................................44
SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP...............................................44
TRONG NHẬN DẠNG ĐỐI TƯỢNG.......................................................44
3.1 Sơ lược về áp dụng mạng nơ ron tích chập vào các giải pháp
thông minh trong thực tế...................................................................44
iv
7. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
3.2 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện
người vào/ra và đánh giá thực nghiệm, so sánh với phương pháp
HOG ....................................................................................................44
3.2.1 Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng
nơ ron tích chập ......................................................................................... 44
3.2.2 Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người . 45
3.2.3 Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng
để so sánh................................................................................................... 47
3.2.4 So sánh khả năng nhận diện của hệ thống nhận diện người vào/ra sử
dụng mạng nơ ron tích chập với phương pháp HOG đã có....................... 50
3.2.5 Mô tả cơ chế chạy nhận diện người trong lõi máy chủ tính toán ........... 52
3.2.6 Mô tả quá trình sử dụng hệ thống ở giao diện người dùng để hiển thị kết
quả ............................................................................................................. 53
3.3 Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện
khuôn mặt và đánh giá thực nghiệm, so sánh với phương pháp
HOG ....................................................................................................55
3.3.1 Xây dựng hệ thống nhận diện khuôn mặt............................................... 55
3.3.2 Giới thiệu cơ chế của máy chủ xử lý nhận diện ..................................... 56
3.3.3 Giới thiệu sơ lược về phương pháp phát hiện khuôn mặt sử dụng HOG sẽ
được dùng để so sánh ................................................................................ 58
3.3.4 So sánh hệ thống nhận diện khuôn mặt với phương pháp HOG đã có .. 59
3.3.4 So sánh khả năng nhận diện khuôn mặt giữa HOG và CNN ................. 62
3.2.5 Kết quả hệ thống web nhận diện khuôn mặt .......................................... 64
3.3 Kết luận.............................................................................................67
KẾT LUẬN...................................................................................................68
Kết quả đã thực hiện được của luận văn.......................................................... 68
Phương hướng phát triển luận văn................................................................... 69
TÀI LIỆU THAM KHẢO...........................................................................70
v
8. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC HÌNH VẼ
Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10]............ 4
Hình 1.2: Hình ảnh một nơ ron sinh học [14] ..................................................................... 5
Hình 1.3: Công thức của một nơ ron nhân tạo [41]............................................................. 5
Hình 1.4: Hình ảnh một nơ ron nhân tạo............................................................................. 6
Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế....................................... 6
Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có
thiên lệch.............................................................................................................................. 7
Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau ....................... 7
Hình 1.8: Đồ thị hàm Sigmoid ............................................................................................ 8
Hình 1.9: Đồ thị hàm TanH................................................................................................. 9
Hình 1.10: Đồ thị hàm tuyến tính........................................................................................ 9
Hình 1.11: Đồ thị hàm RELU............................................................................................ 10
Hình 1.12: Đồ thị hàm ELU .............................................................................................. 10
Hình 1.13: Mạng nơ ron truyền thẳng ............................................................................... 11
Hình 1.14: Mạng nơ ron hồi quy ....................................................................................... 12
Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy.............................................. 12
Hình 1.16: Các tầng (layer) trong CNN là 3 chiều............................................................ 18
Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]................... 19
Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]........................................ 19
Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ............................................. 20
Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron............ 20
Hình 1.21: Ví dụ về lớp tích chập ..................................................................................... 21
Hình 1.22: So sánh giữa ReLU và Sigmoid. ..................................................................... 23
Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp ............................................................. 24
Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ............................................................ 25
Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)..... 25
vi
9. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.26: Cấu trúc của AlexNet ...................................................................................... 26
Hình 1.27: Cấu trúc của VGGNet ..................................................................................... 27
Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng........................ 29
Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32,
conv42 và conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt.............................. 29
Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người................................. 31
Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh.................................................................... 31
Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh ................................................................... 32
Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu................. 33
Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ
phát hiện các điểm mốc trên khuôn mặt............................................................................ 33
Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt............................................................. 34
Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS
CS2, là bộ dữ liệu mở rộng của IJB-A .............................................................................. 35
Hình 2.10: Kiến trúc mạng của mô hình DeepID 2........................................................... 36
Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm....................... 36
Hình 2.12: Kiến trúc mạng của mô hình DeepID3............................................................ 38
Hình 2.13: Kiến trúc của DeepFace .................................................................................. 39
Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus..................................... 40
Hình 2. 15 Mô hình GoogleNet......................................................................................... 40
Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu............... 41
Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất
bản...................................................................................................................................... 42
Hình 3.1: Hình ảnh thiết kế của hệ thống nhận diện đối tượng......................................... 45
Hình 3.2: Phương pháp mạng YOLO sử dụng để nhận diện đối tượng............................ 46
Hình 3.3: Mô hình mạng yolo ........................................................................................... 47
Hình 3.4: Tiền xử lý để xác định khung hình.................................................................... 48
Hình 3.5: Độ dốc sau khi tính toán.................................................................................... 48
vii
10. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 3.6: Kết quả sau khi tính toán véc tơ đặc trưng cho từng ô...................................... 49
Hình 3.7: Biểu diễn các véc tơ chỉ hướng theo HOG thu được sau khi tính toán............. 50
Hình 3.8: Hình ảnh nhận diện bằng phương pháp HOG................................................... 50
Hình 3.9: Hình ảnh nhận diện bằng phương pháp CNN ................................................... 51
Hình 3.10: Hệ thống sử dụng ffmpeg để trích xuất các khung hình trong video.............. 52
Hình 3.11: Các khung hình lần lượt được hệ thống trích xuất và đưa vào lõi để xử lý. ... 52
Hình 3.12: Dữ liệu số người vào/ra được nhập vào cơ sở dữ liệu, và video báo cáo được
hệ thống tự động xuất ra để làm đối chiếu. ....................................................................... 53
Hình 3.13: Hình ảnh đăng nhập vào hệ thống................................................................... 53
Hình 3.14: Kết quả dữ liệu đã được thêm vào cơ sở dữ liệu và hiển trị trên web............. 54
Hình 3.15: Một ví dụ tương tự dữ liệu được xuất báo cáo nhận diện trong hệ thống....... 54
Hình 3.16: Kiến trúc hệ thống nhận diện khuôn mặt, tích hợp cùng hệ thống mua hàng .. 55
Hình 3.17: Khuôn mặt được trích xuất từ bức ảnh............................................................ 56
Hình 3.18: Hình ảnh 68 điểm mốc trên khuôn mặt được sử dụng trên bộ thư viện dlib .. 57
Hình 3.19: Hình ảnh trích xuất đặc trưng khuôn mặt........................................................ 57
Hình 3.20: Khuôn mặt được sử dụng để nhận dạng.......................................................... 58
Hình 3.21: Khuôn mặt được trích xuất.............................................................................. 58
Hình 3.22: Hình ảnh được xử lý sau khi qua bộ lọc Gabor............................................... 58
Hình 3.23: Các đặc trưng được trích xuất bằng HOG....................................................... 59
Hình 3.24: Phát hiện khuôn mặt sử dụng HOG................................................................. 59
Hình 3.25: Phát hiện khuôn mặt sử dụng CNN................................................................. 60
Hình 3.26: Phát hiện khuôn mặt sử dụng HOG với góc nghiêng lớn ............................... 60
Hình 3.27: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 61
Hình 3.28: Kết quả nhận diện khuôn mặt với HOG.......................................................... 62
Hình 3.29: Phát hiện khuôn mặt sử dụng CNN................................................................. 62
Hình 3. 30: Nhận diện khuôn mặt sử dụng HOG với góc nghiêng lớn............................. 63
Hình 3.31: Phát hiện khuôn mặt sử dụng CNN với góc nghiêng lớn................................ 63
viii
11. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 3.32: Giao diện hệ thống trên web (hai hình trên) và giao diện hệ thống trên mobile
(hai hình dưới) ................................................................................................................... 65
Hình 3.33: Huấn luyện thêm khuôn mặt mới .................................................................... 65
Hình 3.34: Kết quả nhận diện sau khi huấn luyện............................................................. 66
Hình 3.35: Nhận diện user có ID 00280 với góc nghiêng khoảng 80 độ và user có ID
00388 với góc nghiêng 30 độ trên mặt phẳng Oxz............................................................ 67
ix
12. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC BẢNG BIỂU
Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số
lượng của các phần khuôn mặt .......................................................................................... 36
Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó
trên bộ thư viện LFW ........................................................................................................ 37
Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện
LFW................................................................................................................................... 38
Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu
LFW................................................................................................................................... 39
Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet................................. 41
Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo.......................... 41
Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau............................................................... 42
Bảng 3.1 Kết quả so sánh nhận diện người giữa phương pháp mạng nơ ron tích chập và
phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống................... 51
Bảng 3.2: Kết quả so sánh phát hiện khuôn mặt giữa phương pháp mạng nơ ron tích chập
và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 61
Bảng 3.3: Kết quả so sánh nhận diện khuôn mặt giữa phương pháp mạng nơ ron tích chập
và phương pháp HOG trên kết quả trung bình của dữ liệu thực tế của hệ thống.............. 64
Bảng 3.4: Cơ sở dữ liệu thời gian phát hiện khuôn mặt của hệ thống .............................. 67
x
13. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
DANH MỤC VIẾT TẮT
Từ viết tắt Ý nghĩa
AI Artificial Intelligence - Trí tuệ nhân tạo
ANN Artificial Neural Network – Mạng thần kinh nhân tạo
CNN Convolutional Neural Network – Mạng thần kinh tích chập
ReLU Rectified Linear Unit – Điều chỉnh đơn vị tuyến tính
CSDL Cơ sở dữ liệu
GPU Graphics Processing Unit – Vi xử lý đồ họa
CPU Central Processing Unit – Bộ xử lý trung tâm
CUDA
Compute Unified Device Architecture - kiến trúc tính toán song song
do hãng NVIDIA phát triển.
IOT Internet of Things – vạn vật kết nối
ASCI Red
Accelerated Strategic Computing Initiative Red – một siêu máy tính
của Intel
W Watt – một đơn vị đo lường của điện lực
kW KiloWatt – một đơn vị đo lường của điện lực
SVM Support Vector Machine – một thuật toán phân lớp
DP2MFD Deep Pyramid Deformable Parts Model for Face Detection
IJB-A
IARPA Janus Benchmark-A – một thử thách mở cho nhận diện khuôn
mặt
KLT Kanade–Lucas–Tomasi – một giải thuật thị giác máy tính
LFW Labeled Faces in the Wild – một bộ thư viện khuôn mặt
xi
14. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
API Application Programming Interface – giao diện lập trình
YOLO
You only look once – một hệ thống mạng nơ ron nhân tạo phát hiện
đối tượng thời gian thực
HOG Histogram of Oriented Gradients – biểu đồ độ dốc định hướng
PCA Principal Component Analysis - Phân tích thành phần chính
xii
15. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
LỜI MỞ ĐẦU
Lý do chọn đề tài
Trong giai đoạn gần đây, cụm từ cách mạng công nghiệp lần thứ tư được nhắc đến
rất nhiều trên truyền thông. Khái niệm cách mạng công nghiệp 4.0 được đưa ra dựa trên
xu thế bùng nổ của nhiều công nghệ mới như: công nghệ truyền dẫn tốc độ cao, CPU rất
mạnh, GPU hàng ngàn nhân, công nghệ chế tạo bộ nhớ đạt nhiều đột phá. Song song với
đó, công nghệ dần làm các thiết bị nhỏ lại, nhưng sức mạnh tăng lên đáng kể. Công nghệ
mạch nhúng cũng bùng nổ không kém với nhiều mạch nhúng nhỏ, sử dụng lượng điện
khiêm tốn, nhưng khả năng tính toán lên tới hàng ngàn tỉ phép tính trên giây, tương đương
sức mạnh của 1 siêu máy tính cách đây khoảng 20 năm. Ví dụ như board mạch Nvidia's
Jetson TX1 được ra mắt năm 2015, có thể nằm vừa trong lòng bàn tay và chỉ sử dụng 10
oát điện, đã có sức mạnh tính toán tới 1 ngàn tỉ phép tính trên giây, điều mà cách đó tròn
20 năm, vào năm 1996, siêu máy tính ASCI Red của Intel, phải sử dụng tới 6000
vi xử lý Pentium Pros, vận hành với 1000 kW mới có thể đạt được sức mạnh tính toán
trên.
Máy tính hiện nay có sức mạnh tính toán lớn nhưng giá thành lại ở mức phổ thông,
dẫn tới người làm nghiên cứu rất dễ dàng để có thể tự kiểm nghiệm được các lý thuyết về
trí tuệ nhân tạo từ nhiều năm trước. Cùng với mã nguồn mở, hiện làn sóng trí tuệ nhân tạo
đang bùng nổ mạnh mẽ trong thời gian gần đây, và đem lại rất nhiều ứng dụng trong đời
sống
Chính vì lý do trên, việc tìm hiểu và nghiên cứu thị giác máy tính rất có ý nghĩa và
thiết thực. Hiện nay trên thế giới, nhiều nước đã và đang ứng dụng thị giác máy tính vào
đời sống hàng ngày, ví dụ như SkyNet của Trung Quốc, các hệ thống kiểm duyệt nội
dung tự động, …
Cơ sở khoa học và thực tiễn của đề tài
Ngày nay, trong kỷ nguyên số, máy tính là một phần không thể thiếu trong nghiên
cứu khoa học cũng như trong đời sống hàng ngày. Tuy nhiên, do hệ thống máy tính dựa
trên lý thuyết cổ điển (tập hợp, logic nhị phân), nên dù có khả năng tính toán lớn và độ
chính xác cao, thì máy tính cũng chỉ có thể làm việc theo một chương trình gồm các thuật
toán được viết sẵn do lập trình viên chứ chưa thể tự lập luận hay sáng tạo.
Học máy (Machine learning) là một phương pháp phân tích dữ liệu có thể tự động
hóa phân tích dữ liệu và tìm ra các trích xuất đặc trưng của bộ dữ liệu. Học máy sử dụng
các thuật toán trừu tượng để tự học từ dữ liệu, cho phép máy tính tìm thấy những thông
1
16. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
tin có giá trị ẩn ở rất sâu mà không thể lập trình được bằng cách thông thường. Khi tiếp
xúc với dữ liệu mới, học máy có thể thích ứng rất nhanh và độc lập.
Học sâu (Deep Learning) là một ngành đặc biệt của học máy. Học sâu sử dụng
mạng nơ ron nhân tạo (Artificial Neural Networks) để giải quyết các bài toán mà tính toán
cứng chưa thể xử lý được như dữ liệu trừu tượng, dữ liệu mờ, dữ liệu không rõ ràng,...
Với tính chất như vậy, học sâu thường được ứng dụng trong nhận diện hình ảnh, nhận
diện giọng nói, xử lý ngôn ngữ tự nhiên hoặc dự đoán, dự báo.
Mạng nơ ron nhân tạo (Artificial Neural Networks) là một mô hình xử lý thông tin,
cấu thành từ các lớp nơ ron, được ra đời trên cơ sở mô phỏng hoạt động não bộ của sinh
vật. Mạng nơ ron nhân tạo gắn kết nhiều nơ ron theo một mô hình nhất định, được trải qua
huấn luyện để rút ra được kinh nghiệm, và sử dụng các kinh nghiệm đã có để xử lý các
thông tin mới. Mạng nơ ron nhân tạo thường áp dụng vào giải các bài toán nhận dạng
mẫu, hoặc dự đoán.
Mạng nơ ron Tích chập (Convolutional Neural Network) là một trong những mô
hình học sâu hiện đại nhất hiện nay. Mạng nơ ron Tích chập hiện nay thường được sử
dụng nhiều trong các hệ thống thông minh do ưu điểm của mạng là có độ chính xác cao,
tuy nhiên tốc độ tính toán lại rất nhanh. Vì lý do đó, mạng nơ ron tích chập rất mạnh trong
xử lý hình ảnh, và được ứng dụng rất nhiều trong ngành thị giác máy tính trong các bài
toán liên quan đến nhận dạng đối tượng.
Ngày nay, với sự phát triển của công nghệ bán dẫn, máy tính ngày càng nhỏ đi,
năng lượng tiêu thụ ngày càng thấp xuống, trong khi sức mạnh lại ngày càng tăng lên. Với
những ưu điểm như vậy, chúng ta có thể thấy rất nhiều thiết bị thông minh đã và đang
hiện diện mọi nơi trong đời sống, với camera nhiều điểm ảnh, bộ nhớ trong lớn và vi xử lý
mạnh như: điện thoại thông minh, máy ảnh kỹ thuật số, camera hành trình,… Ngoài ra,
với sự bùng nổ của xu hướng mạng vạn vật IOT, người ta có thể sẽ còn thấy rất nhiều
thiết bị thông minh mới xuất hiện: xe ô tô tự lái, thiết bị bay không người lái tự giao
hàng,... Có thể thấy, việc sử dụng trí thông minh nhân tạo để khai thác dữ liệu hình ảnh
trong các thiết bị thông minh trong tương lai đã và đang trở thành xu hướng. Từ nhận định
trên và sự gợi ý của giảng viên hướng dẫn, tôi quyết định chọn nội dung “Nghiên cứu về
mạng Neural Convolutional, áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị
giác máy tính” để làm đề tài nghiên cứu thực hiện luận văn thạc sỹ của mình.
Mục tiêu của luận văn
Luận văn của tôi tập trung vào nghiên cứu, tìm hiểu về mạng nơ ron tích chập. Sau
đó so sánh các phương pháp học sâu ở mức độ tổng quan trên phương diện học thuật, từ
2
17. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
đó thấy được tiềm năng cũng như hạn chế của AI với cái nhìn khách quan nhất. Ở phần
ứng dụng, tôi sử dụng mạng nơ ron tích chập để áp dụng vào hai bài toán thực tế: bài toán
nhận dạng người và bài toán nhận diện khuôn mặt trong lĩnh vực thị giác máy tính.
Cấu trúc luận văn
Luận văn được tổ chức gồm ba chương gồm:
Chương 1: Trình bày tổng quan về nơ ron, các thành phần và cơ chế hoạt
động của nơ ron. Từ đó, trình bày về một số kiểu mạng nơ ron và cơ chế lan
truyền ngược. Cuối cùng là giới thiệu về cấu tạo và cách hoạt động của
mạng nơ ron tích chập;
Chương 2: Trình bày tổng quan về bài toán nhận dạng bằng mạng nơ ron
tích chập, cách thức hoạt động của việc nhận dạng đối tượng và nhận dạng
khuôn mặt của mạng nơ ron tích chập. Ngoài ra, chương hai giới thiệu về
các mô hình sử dụng nơ ron tích chập nổi tiếng đang được áp dụng hiện nay
và kết quả của từng mô hình;
Chương 3: Áp dụng mạng nơ ron tích chập vào trong thực tế. Ở chương
này, tác giả báo cáo về kết quả đạt được khi áp dụng mạng nơ ron tích chập
để xây dựng hai hệ thống: hệ thống nhận dạng người và hệ thống nhận diện
khuôn mặt. Ngoài ra, tác giả có thực hiện so sánh với phương pháp cũ để có
thể thấy ưu điểm và hạn chế của mạng nơ ron tích chập.
Cuối cùng là phần kết luận cho phép tóm tắt kết quả đã đạt được và nêu ra những
tồn tại, dựa vào đó để đưa ra những mục tiêu và phương hướng phát triển cho hệ thống
sau này.
3
18. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 1.
TỔNG QUAN VỀ MẠNG NƠ RON
VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP
1.1. Nơ ron nhân tạo
1.1.1 Lịch sử của nơ ron nhân tạo
Vào năm 1943, nhà thần kinh học Warren McCulloch đã cùng nhà toán học
Walter Pitts đã viết một cuốn sách về cách mạng thần kinh hoạt động. Và họ đã thực hiện
mô phỏng một mạng thần kinh đơn giản trên một mạch điện. [9]
Vào năm 1949, Donald Hebb đã viết cuốn sách Organization of Behavior. Điểm
nhấn chính là mạng thần kinh nào được sử dụng nhiều sẽ được tăng cường.
Vào năm 1959, David Hubel và Torsten Wiesel đã xuất bản cuốn sách Receptive
fields of single neurons in the cat’s striate cortex, miêu tả về phản ứng của các tế bào thần
kinh thị giác trên loài mèo, cũng như cách loài mèo ghi nhớ và nhận diện hình dạng trên
kiến trúc vỏ não của nó.
Hình 1.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10]
Vào năm 1989, Yann LeCun đã áp dụng thuật toán học cho mạng nơ ron theo kiểu
lan truyền ngược vào kiến trúc mạng nơ ron tích chập của Fukushima. Sau đó vài năm,
LeCun đã công bố LeNet-5 [13]. Có thể nói, LeNet-5 là một trong những mạng nơ ron
tích chập sơ khai nhất, tuy nhiên các dấu ấn của nó vẫn tồn tại tới ngày nay, có thể thấy
thông qua một số thành phần thiết yếu mà các mạng nơ ron tích chập của ngày nay vẫn
đang sử dụng
4
19. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.1.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học
Hình 1.2: Hình ảnh một nơ ron sinh học [14]
Một nơ ron gồm có: thân nơ ron, tua gai thần kinh, sợi trục thần kinh, trong đó:
Thân nơ ron: là nơi xử lý các tín hiệu được đưa vào;
Tua gai thần kinh: là nơi nhận các xung điện vào trong nơ ron;
Sợi trục thần kinh: là nơi đưa tín hiệu ra ngoài sau khi được xử lý bởi nơ
ron;
Khớp thần kinh: vị trí nằm giữa tua gai thần kinh và sợi trục thần kinh, đây
là điểm liên kết đầu ra của nơ ron này với đầu vào của nơ ron khác.
1.1.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo
Dựa vào cấu tạo của một nơ ron sinh học, các nhà khoa học nghiên cứu và lập trình
đã đưa ra kiến trúc của một nơ ron nhân tạo:
Hình 1.3: Công thức của một nơ ron nhân tạo [41]
5
20. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Mạng nơ ron nhân tạo có thể mô tả đơn giản lại như sau:
Hình 1.4: Hình ảnh một nơ ron nhân tạo
Trong đó:
Danh sách các đầu vào: Là các thuộc tính đầu vào của một nơ ron. Số lượng
thuộc tính đầu vào thường nhiều hơn một, do dữ liệu thô đầu vào thường là
một vector nhiều chiều, hoặc nhiều nơ ron tầng trước kết nối tới một nơ ron
tầng sau.
Trọng số liên kết: Các liên kết được thể hiện độ mạnh yếu qua một giá trị
được gọi là trọng số liên kết. Kết hơp với các đầu truyền, tín hiệu đến các
nơ ron nhân tạo khác sẽ được tính bằng ;
Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế
6
21. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hàm tổng: Tổng các tích của các đầu vào với trọng số liên kết mô phỏng
các khớp kết nối. Sau đó đi qua hàm tính tổng để tính ra giá trị trước khi
đưa vào hàm truyền;
Thiên lệch (b): Độ lệch được đưa vào sau khi khi tính toán xong hàm tổng,
tạo ra giá trị cuối cùng trước khi đưa vào hàm truyền. Mục đích của việc
thêm vào thiên lệch nhằm dịch chuyển chức năng của hàm kích hoạt sang
trái hoặc phải, giúp ích khi mạng được huấn luyện. Hình ảnh vị trí thiên
lệch được thêm vào trong mạng nơ ron thực tế.
Hình ảnh huấn luyện khi có và không có thiên lệch:
Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có thiên lệch
Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau
Hàm kích hoạt (Activation functions): Hàm này được sử dụng để tính toán giá trị
của đầu ra dựa vào giá trị của hàm Tổng.
7
22. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.1.4. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo
1.1.4.1 Hàm Sigmod
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm Sigmoid được sử dụng vì ngưỡng của nó nằm trong khoảng (0, 1). Do đó,
hàm này được sử dụng nhiều cho các mô hình dự đoán xác suất đầu ra, tức kết quả chỉ tồn
tại trong khoảng từ 0 đến 1: khi đầu vào là số dương lớn, đầu ra của hàm sigmoid gần
bằng 1. Khi nhỏ hơn 0, đầu ra gần bằng 0. Tuy nhiên, việc tối ưu của hàm này khó
khăn, nguyên nhân vì nếu giá trị đầu vào của hàm là 1 số rất lớn, thì đầu ra của hàm càng
về 2 đầu xấp xỉ 1 hoặc 0, nên tốc độ hội tụ sẽ rất chậm.
Hình 1.8: Đồ thị hàm Sigmoid
1.1.4.2 Hàm TanH
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm TanH được sử dụng vì đầu ra của hàm nằm trong khoảng , thích hợp
với các mô hình đầu ra có ba giá trị: âm, trung tính (0) và dương. Chúng ta có thể thấy rõ
hơn điều này trong hình minh họa.
8
23. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.9: Đồ thị hàm TanH
1.1.4.3. Hàm tuyến tính
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm tuyến tính áp dụng thao tác nhận dạng trên dữ liệu với dữ liệu đầu ra tỷ lệ
thuận với dữ liệu đầu vào.
Hình 1.10: Đồ thị hàm tuyến tính
1.1.4.4 Hàm RELU
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm RELU áp dụng với những trường hợp cần đầu ra nằm trong khoảng (0, +∞).
Hàm RELU có tốc độ tính toán rất nhanh, gán các giá trị âm trở thành 0 ngay lập tức, phù
9
24. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
hợp cho việc huấn luyện từ dữ liệu chuẩn. Tuy nhiên, điều này khiến hàm RELU không
ánh xạ các giá trị âm một cách thích hợp.
Hình 1.11: Đồ thị hàm RELU
1.1.4.5 Hàm ELU
Biểu diễn hàm:
Đạo hàm của hàm:
Hàm ELU là một biến thể của hàm RELU. Hàm thường được sử dụng khi ngưỡng
đầu ra của nó nằm trong khoảng (-1, +∞). Hàm ELU khắc phục hạn chế ánh xạ các giá trị
âm của hàm RELU.
Hình 1.12: Đồ thị hàm ELU
10
25. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.2 Mạng nơ ron nhân tạo
1.2.1 Giới thiệu mạng nơ ron nhân tạo
Mạng nơ ron nhân tạo (Artificial Neural Network ANN) là một chuỗi các giải
thuật lập trình, mô phỏng dựa trên cách hoạt động của mạng lưới thần kinh trong não bộ
các sinh vật sống. Mạng nơ ron nhân tạo được sử dụng để tìm ra mối quan hệ của một tập
dữ liệu thông qua một thiết kế kiến trúc chứa nhiều tầng ẩn (hidden layer), mỗi tầng lại
chứa nhiều nơ ron. Các nơ ron được kết nối với nhau và độ mạnh yếu của các liên kết
được biểu hiện qua trọng số liên kết.
Lập trình thông thường có thể làm được rất nhiều phần mềm lớn, như tính toán mô
phỏng các vụ nổ hạt nhân trong siêu máy tính ở các phòng thí nghiệm, hoặc tái hiện các tế
bào ở cấp độ phân tử để phân tích các thử nghiệm thuốc. Một siêu máy tính có thể tính
toán được nhiều tỉ phép tính trên giây, tuy nhiên lập trình thông thường lại gặp khó khăn
trong việc nhận ra các mẫu đơn giản, ví dụ như nhận diện mặt người, điều mà một bộ não
sinh học xử lý nhanh và chính xác hơn nhiều.
Áp dụng với các kỹ thuật học sâu, mạng nơ ron nhân tạo hiện nay đang được áp
dụng để giải quyết những vấn đề mà lập trình theo logic thông thường khó có thể giải
quyết được. Do đó, mạng nơ ron nhân tạo đang nhanh chóng trở nên phổ biến, và là xu
thế trên nhiều lĩnh vực.
1.2.2 Một số kiểu mạng nơ ron
Có hai kiểu mạng nơ ron chính: mạng nơ ron truyền thằng (feedforward neural
network) và mạng nơ ron hồi quy (recurrent neural network).
Mạng truyền thẳng và hồi quy được minh họa như sau:
Hình 1.13: Mạng nơ ron truyền thẳng
11
26. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Dễ thấy, ở mạng nơ ron truyền thẳng, các nơ ron trong tầng ẩn đều được kết
nối với các nơ ron trong tầng n. Do có nhiều tầng ẩn nên chúng ta có thể thấy rằng mạng
truyền thẳng kéo dài trong không gian, và là không có bất kỳ đường tuần hoàn (cyclic
path) nào nằm trong mạng. Mạng nơ ron truyền thẳng rất phổ biến hiện nay.
Hình 1.14: Mạng nơ ron hồi quy
Một loại khác là mạng nơ ron hồi quy. Không giống như mạng nơ ron truyền
thẳng, mạng nơ ron hồi quy có ít nhất một đường dẫn tuần hoàn. Chúng ta có thể thấy nó
ở hình minh họa phía trên. Vì có một đường dẫn tuần hoàn, nên mạng nơ ron hồi quy có
thể gây ra vòng lặp vô cực. Tuy nhiên, mạng nơ ron tuần hoàn có một ứng dụng quan
trọng là chúng có thể nhận diện cho các giai đoạn thời gian khác nhau, như hình minh họa
sau:
Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy
Như ví dụ trên, có một nút A kết nối với nút B và một chu kỳ đến chính nút A.
Mạng nơ ron hồi quy không xử lý đường dẫn tuần hoàn và các kết nối cùng một lúc.
Mạng nơ ron hồi quy giả sử rằng đầu ra của nút A trong thời gian n là đầu vào của nút B
và nút A trong thời gian n + 1. Vì vậy, ngoài tính chất kéo dài trong không gian khi kết
nối với các tầng nơ ron tiếp theo, mạng nơ ron hồi quy cũng nằm sâu trong thời gian. Vì
vậy, các mạng nơ ron hồi quy có thể mô hình hóa các hệ thống thay đổi theo bối cảnh. Ví
dụ: mạng nơ ron hồi quy thường được sử dụng trong xử lý ngôn ngữ theo ngữ cảnh. Mạng
12
27. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
nơ ron hồi quy có thể xử lý các phụ thuộc xa (long-term dependencies) theo mốc thời
gian, ví dụ như mạng bộ nhớ dài-ngắn (Long Short Term Memory networks).
1.2.3 Mạng nơ ron lan truyền ngược
1.2.3.1 Tổng quan về mạng nơ ron lan truyền ngược
Giải thuật lan truyền ngược được mô tả ngắn gọn như sau:
1. Bước 1: Lan truyền. Giai đoạn lan truyền có hai bước, lan truyền tiến và lan
truyền ngược. Bước lan truyền tiến là nhập dữ liệu huấn luyện vào các mạng
nơ ron và tính toán đầu ra. Sau đó, dựa vào kết quả đầu ra, so sánh với dữ
liệu huấn luyện. Chúng ta có thể sử dụng lan truyền ngược để cập nhật
ngược lại trọng số lại cho các nơron trong các tầng trước đó.
2. Bước 2: Cập nhật trọng số. Mạng cập nhật các giá trị của trọng số của nơ
ron theo lỗi của kết quả đầu ra.
3. Bước 3: Lặp hai bước trên. Lặp lại bước một và hai cho đến khi sai số tối
thiểu. Sau đó kết thúc khóa huấn luyện.
1.2.3.2 Cách thức lan truyền ngược
1. Sử dụng để biểu diễn đầu vào cho nút của lớp .
2. Sử dụng cho trọng số từ nút của lớp đến nút của lớp
3. Sử dụng được biểu diễn cho độ lệch của nút của lớp .
4. Sử dụng đại diện cho đầu ra của nút của lớp .
5. Sử dụng đại diện cho đầu ra mong muốn, dựa trên tập huấn luyện được sử
dụng.
6. Sử dụng là hàm kích hoạt, sử dụng Sigmoid cho hàm kích hoạt.
Để có được lỗi tối thiểu, hàm chi phí được tính toán với công thức như sau:
13
28. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Trong đó x là đầu vào dữ liệu huấn luyện và là đầu ra mong muốn. L là tổng số
lớp và y L
là đầu ra của mạng nơ ron tương ứng với đầu vào x. Để đạo hàm dễ dàng, ta
j
nhân tổng của (4) với một hằng số 1/2.
Để tìm ra mức tối thiểu. Trước tiên, ta tính toán các đạo hàm riêng của hàm chi phí
đối với bất kỳ trọng số nào, với công thức sau:
Có hai trường hợp: Nút là một nút đầu ra hoặc trong một tầng ẩn. Trong trường
hợp ở tầng đầu ra, trước tiên chúng ta tính đạo hàm chênh lệch:
Phương trình cuối cùng dựa trên quy tắc chuỗi. Nút là nút duy nhất có trọng số
nên các giá trị khác sẽ bằng 0. Và là đầu ra của hàm kích hoạt (hàm Sigmoid). Do
đó, phương trình mới thu được là:
Trong đó xL
sự kết hợp tuyến tính của tất cả các đầu vào của nút j trong tầng L với
k
các trọng số. Hàm sigmoid là đạo hàm có dạng sau:
14
29. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Do đó, hàm trên trở thành:
Vì
x W y
L 1
L L
k ik i
i L 1
. Vì vậy, (9) trở thành:
(10)
Vì liên quan đến và không liên quan khi khác . Do đó, có mối
quan hệ giữa nút của tầng và nút của tầng . Ta có công thức:
để biểu diễn nút của tầng . Do vậy, phương trình mới thu được là:
Ta xem xét các nút của tầng ẩn . Ở lớp ngay trước lớp đầu ra. Áp dụng đạo
hàm riêng một phần trên trọng số cho hàm chi phí. Các trọng số cho các nút của tầng ẩn
này:
15
30. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Vì có một tổng trên tầng. Do thay đổi của các trọng số cho các nút của các
tầng ẩn sẽ ảnh hưởng đến đầu ra mạng nơ ron. Do đó, áp dụng quy tắc chuỗi (chain rule):
Sau đó, đạo hàm theo quy tắc chuỗi:
Dòng thứ 2 của (14) dựa vào đầu vào của là sự kết hợp tuyến tính giữa các đầu
ra của nút của lớp trước với trọng số. Vì đạo hàm không liên quan đến nút của lớp L.
Do đó, ta đơn giản hóa đạo hàm dựa trên quy tắc chuỗi:
Chuyển thành . Do đó phương trình trở thành:
Ta xét 2 trường hợp:
16
31. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Đối với tầng đầu ra nút k: , trong đó:
Đối với tầng ẩn nút j: , trong đó:
Áp dụng quy trình tương tự. Ví dụ, Tính đạo hàm riêng cho độ lệch của nút k trong
lớp cuối cùng và thu được:
Bởi vì nên . Phương trình có thể được cập nhật
thành:
Công thức trên áp dụng với bất kể đầu ra nào. Vì vậy, độ dốc của hàm chi phí so
với độ lệch là:
Rút ra từ công thức trên, giải thuật loan truyền ngược sẽ được mô tả như sau:
Bước 1: Chạy mạng tính toán với dữ liệu đầu vào để có được đầu ra mạng
Bước 2: Đối với mỗi nút đầu ra, ta thực hiện phép tính:
Bước 3: Đối với mỗi nút ở tầng ẩn, ta thực hiện phép tính:
17
32. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bước 4: Cập nhật các trọng số và thiên lệch như sau:
Giả thiết:
Áp dụng:
Tham số trong thuật toán được gọi là tốc độ học tập. Thuật toán này lặp lại cho
đến khi đạt sai số tối thiểu hoặc dưới ngưỡng chấp nhận được để hoàn thành quá trình
huấn luyện.
1.3 Mạng nơ ron tích chập
1.3.1 Khái niệm về mạng nơ ron tích chập
Mạng nơ ron tích chập là một trong những mạng truyền thẳng đặc biệt. Mạng nơ
ron tích chập là một mô hình học sâu phổ biến và tiên tiến nhất hiện nay. Hầu hết các hệ
thống nhận diện và xử lý ảnh hiện nay đều sử dụng mạng nơ ron tích chập vì tốc độ xử lý
nhanh và độ chính xác cao. Trong mạng nơ ron truyền thống, các tầng được coi là một
chiều, thì trong mạng nơ ron tích chập, các tầng được coi là 3 chiều, gồm: chiều cao,
chiều rộng và chiều sâu (Hình 1.11). Mạng nơ ron tích chập có hai khái niệm quan trọng:
kết nối cục bộ và chia sẻ tham số. Những khái niệm này góp phần giảm số lượng trọng số
cần được huấn luyện, do đó tăng nhanh được tốc độ tính toán.
Hình 1.16: Các tầng (layer) trong CNN là 3 chiều
18
33. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.17: Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]
1.3.2 Mô hình mạng nơ ron tích chập
Có ba tầng chính để xây dựng kiến trúc cho một mạng nơ ron tích chập:
1. Tầng tích chập;
2. Tầng gộp (pooling layer);
3. Tầng được kết nối đầy đủ (fully-connected).
Tầng kết nối đầy đủ giống như các mạng nơ ron thông thường, và tầng chập thực
hiện tích chập nhiều lần trên tầng trước. Tầng gộp có thể làm giảm kích thước mẫu trên
từng khối 2x2 của tầng trước đó. Ở các mạng nơ ron tích chập, kiến trúc mạng thường
chồng ba tầng này để xây dựng kiến trúc đầy đủ. Ví dụ minh họa về một kiến trúc mạng
nơ ron tích chập đầy đủ:
Hình 1.18: Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]
19
34. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
1.3.2 Xây dựng mạng nơ ron tích chập
1.3.2.1 Mạng được kết nối cục bộ
Trong xử lý hình ảnh, thông tin của hình ảnh là các điểm ảnh (pixel). Nếu sử dụng
mạng được kết nối đầy đủ, chúng ta sẽ có rất nhiều tham số. Ví dụ, một hình ảnh RGB có
kích thước 512x512 pixel sẽ có 786432 (= 512 x 512 x 3) tham số đầu vào. Vì vậy, nếu
chúng ta sử dụng kiến trúc mạng nơ ron trong hình sau:
Hình 1.19: Hình ảnh một mạng nơ ron được kết nối đầy đủ
Hình trên cho thấy nếu áp dụng mạng nơ ron được kết nối đầy đủ, toàn bộ kiến
trúc mạng sẽ cần tính toán hơn 3 triệu nơ ron. Số lượng lớn các nơ ron làm cho toàn bộ
quá trình học rất chậm và dẫn đến quá tải so với khả năng tính toán của máy tính hiện tại.
Qua một vài nghiên cứu về xử lý ảnh, các nhà nghiên cứu nhận thấy rằng các tính
năng trong một hình ảnh thường là cục bộ, và các nhà nghiên cứu chú ý đến các tính năng
cấp thấp đầu tiên khi xử lý ảnh. Vì vậy, kiến trúc mạng có thể chuyển mạng được kết nối
đầy đủ sang mạng được kết nối cục bộ, nhằm làm giảm độ phức tạp của tính toán. Đây là
một trong những ý tưởng chính trong CNN. Chúng ta có thể thấy rõ hơn qua hình sau:
Hình 1.20: Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một nơ ron
tầng ẩn
Giống như xử lý hình ảnh thông thường, chúng ta có thể kết nối cục bộ một khối
vuông ma trận với nơ ron. Kích thước khối thông thường là 3x3, 5x5, hoặc 7x7. Ý nghĩa
vật lý của khối giống như một cửa sổ trượt (cửa sổ trượt là một trong những phương pháp
20
35. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
xử lý ảnh). Bằng cách đó, số lượng tham số có thể giảm xuống rất nhỏ nhưng không gây
ra giảm hoặc mất thông tin, vì hình ảnh thông thường thường có tính lặp trong không
gian. Để trích xuất nhiều thông tin hơn, các mạng nơ ron kết nối khối cùng với một nơ ron
khác. Độ sâu trong các tầng là số lần chúng ta kết nối một khu vực với các nơ ron khác
nhau. Ví dụ, mạng kết nối cùng một khu vực với 5 nơ ron khác nhau. Vì vậy, độ sâu là
năm trong tầng mới. Chúng ta có thể thấy rõ hơn qua hình sau:
Hình 1.21: Ví dụ về lớp tích chập
Trong thực tế, có thể kết nối tất cả thông tin độ sâu (ví dụ: kênh 3 RGB) với nơ ron
tiếp theo vì kết nối là cục bộ trong không gian và có chiều sâu đầy đủ. Tuy nhiên ở ví dụ
này chỉ kết nối thông tin cục bộ về chiều cao và chiều rộng. Vì vậy, có thể có
các tham số trong hình trên cho nơ ron sau lớp màu xanh nếu chúng ta sử dụng cửa sổ
. Biến thứ nhất và thứ hai là chiều cao và chiều rộng của kích thước cửa sổ và biến
thứ ba là độ sâu của lớp.
Ví dụ này di chuyển cửa sổ bên trong hình ảnh và làm cho tầng tiếp theo cũng có
chiều cao và chiều rộng, và là một hai chiều. Ví dụ: nếu chúng ta di chuyển cửa sổ 1 pixel
mỗi lần, gọi là bước nhảy là 1, trong một hình ảnh và kích thước cửa sổ là
sẽ có các nơ ron ở tầng tiếp theo. Có thể thấy rằng, kích
thước đã giảm từ 32 xuống 28. Vì vậy, để bảo toàn kích thước, chúng ta thêm phần trống
vào đường viền. Quay lại ví dụ trên, nếu chúng ta đệm với 2 pixel, có
các nơ ron ở lớp tiếp theo để giữ kích thước chiều cao và chiều
rộng. Như ví dụ trên, nếu chúng ta sử dụng kích thước cửa sổ w, chúng ta sẽ có 1 vùng
được tích chập với kích cỡ của cửa sổ mới là pixel. Thông tin đường viền sẽ
không ảnh hưởng nhiều vì những giá trị đó chỉ được sử dụng một lần.
21
36. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Phần kế tiếp sẽ chi tiết hơn về bước nhảy của cửa sổ trượt, tức khoảng cách thay
đổi của cửa sổ mỗi lần. Ví dụ: giả sử bước nhảy là 2 và cửa sổ trượt bao phủ vùng
Sau đó, cửa sổ thứ hai bao phủ vùng và cửa sổ thứ 3 bao phủ vùng
Ví dụ, nếu chúng ta sử dụng bước nhảy 1 và kích thước cửa sổ trong hình
ảnh và không sử dụng bù viền (pad-zero), thì chúng ta sẽ có
các nơ ron ở lớp tiếp theo. Nếu chúng ta thay đổi bước nhảy 1 thành
bước nhảy 2và những tham số khác vẫn giữ nguyên, thì chúng ta sẽ có có
những nơ ron ở lớp tiếp theo. Chúng ta có thể kết luận rằng nếu chúng
ta sử dụng bước nhảy s, kích thước cửa sổ trong ảnh , thì sẽ có
các nơ ron ở lớp tiếp theo. Khi
chúng ta sử dụng bước nhảy 3 và những tham số khác vẫn giữ nguyên thì chúng ta sẽ
nhận được Vì kết quả không phải là số nguyên, nên bước nhảy 3
không thể dùng vì chúng ta không thể có được một khối hoàn chỉnh trong một mạng nơ
ron.
1.3.2.2 Chia sẻ tham số
Trong ví dụ minh họa của mục 1.3.2.1, ta sẽ có số lượng là nơ ron
ở tầng tiếp theo có bước nhảy 1, kích thước cửa sổ 5 x 5 và không có đệm, với độ sâu là 5.
Mỗi nơ ron sẽ có tham số. Vì vậy, trong tầng tiếp theo sẽ có
tham số. Ở đây, chúng ta có thể chia sẻ các tham số
theo từng độ sâu, do đó nơ ron ở mỗi tầng ẩn sẽ sử dụng tham số giống nhau là
, và tổng tham số sử dụng cho mỗi tầng là . Điều này làm số
lượng tham số giảm một cách đáng kể. Tương tự, các nơ ron ở mỗi độ sâu trong tầng tiếp
theo sẽ áp dụng tích chập cho tầng trước đó. Và quá trình học tập giống như học lõi (core)
tích chập. Đây là lý do mà các mạng nơ ron này được gọi là mạng nơ ron tích chập.
1.3.2.3 Hàm kích hoạt
Trong mô hình nơ ron truyền thống, các mạng thường sử dụng hàm sigmoid cho
hàm kích hoạt. Tuy nhiên Krizhevsky [21] đã thử với hàm kích hoạt RELU. Sau khi so
22
37. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
sánh hiệu quả của hàm kích hoạt RELU và hàm kích hoạt sigmoid trong CNNs. Họ thấy
rằng mô hình với RELU cần ít thời gian lặp hơn trong khi đạt tỷ lệ lỗi khi huấn luyện
tương đương. Chúng ta có thể thấy kết quả trong hình sau:
Hình 1.22: So sánh giữa ReLU và Sigmoid.
Như hình trên, đường liền nét là mô hình sử dụng RELU và đường đứt nét là sử
dụng hàm Sigmoid. Có thể dễ dàng thấy rằng, RELU cần ít vòng lặp hơn để đạt tỉ lệ lỗi
chấp nhận được. Do đó, ngày nay đa số các mô hình CNN gần đây sử dụng RELU để làm
hàm kích hoạt.
1.3.2.4. Tầng gộp
Tầng gộp sẽ giảm kích cỡ của hình ảnh ngay sau khi thực hiện tích chập, giúp giữ
lại các đặc điểm, tính chất nổi bật nhất của ảnh. Điều này cho phép giảm mức độ tính toán
khi hình ảnh có kích thước quá lớn, đồng thời không làm mất đi các đặc điểm quan trọng
của ảnh.
Tuy đã sử dụng các mạng được kết nối cục bộ và chia sẻ tham số, tuy nhiên số
lượng tham số trong mang nơ ron vẫn là quá lớn. So với một tập dữ liệu tương đối nhỏ, nó
có thể gây ra tình trạng quá khớp (overfitting). Vì vậy, mạng nơ ron nhân tạo thường chèn
các tầng gộp vào mạng. Tầng gộp xử lý để giảm dần số lượng tham số nhằm cải thiện thời
gian tính toán trong mạng nơ ron. Tầng gộp áp dụng lấy mẫu xuống cho tầng trước bằng
cách sử dụng hàm max. Tầng gộp hoạt động độc lập trên mỗi tầng trước đó. Ngoài ra, có
23
38. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thể đặt lượng pixel khi chúng ta di chuyển cửa sổ trượt hoặc bước nhảy, như làm với tầng
tích chập. Ví dụ, trong hình sau:
Hình 1.23: Ví dụ minh họa đơn giản về tầng gộp
Ở ví dụ trên, kích thước cửa sổ trượt là và bước nhảy mỗi lần trượt là 2. Tại
mỗi cửa sổ, hàm max sẽ lấy giá trị tối đa để đại diện cho giá trị của tầng tiếp theo. Có hai
loại tầng gộp: Nếu kích thước cửa sổ trượt bằng bước nhảy, đó là gộp chung (traditional
pooling). Nếu kích thước cửa sổ trượt lớn hơn bước nhảy, đó là gộp nhóm (overlapping
pooling). Trong thực tế, các mạng nơ ron thường sử dụng kích thước cửa sổ cùng
kích thước bước nhảy là 2 trong gộp chung và sử dụng kích thước cửa sổ cùng
kích thước bước nhảy là 2 trong gộp nhóm, vì nếu tăng kích cỡ cửa sổ sẽ rất dễ làm mất
các đặc tính của dữ liệu.
Ngoài việc gộp sử dụng hàm max, người ta có thể sử dụng các hàm khác. Ví dụ
người ta có thể sử dụng hàm tính trung bình của cửa sổ trượt để tính toán giá trị cho tầng
tiếp theo, được gọi là gộp trung bình.
1.3.2.5. Tầng được kết nối đầy đủ
Tầng thứ ba là tầng được kết nối đầy đủ. Tầng này giống như mạng nơ ron truyền
thống: các nơ ron ở tầng trước sẽ kết nối với một nơ ron ở tầng tiếp theo và tầng cuối
cùng là đầu ra. Để có thể đưa hình ảnh từ những tầng trước vào, ta phải dàn phẳng dữ liệu
ra thành một véc tơ nhiều chiều. Cuối cùng là sử dụng hàm softmax để thực hiện phân
loại đối tượng
24
39. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 1.24: Một ví dụ của lớp được kết nối đầy đủ
1.3.2.6 Mô hình quá khớp
Cấu trúc của một mạng CNN rất lớn, trong mạng có rất nhiều nơ ron, kết nối, cũng
như có rất nhiều trọng số cần thiết để huấn luyện. Nhưng lượng dữ liệu huấn luyện thường
không đủ để huấn luyện hoàn thiện cho một mạng nơ ron lớn. Nó có thể gây ra một số vấn
đề về quá khớp, khiến cho khi huấn luyện có kết quả rất cao, nhưng áp dụng thực tế gây ra
sai số lớn. Có một số kỹ thuật để cải thiện điều này.
Hình 1.25: Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)
Một trong những phương pháp đó là là giảm trọng số trong lúc huấn luyện.
Dropout là một trong những kỹ thuật nổi tiếng và khá phổ biển để khắc phục vấn đề này.
Dropout đặt đầu ra của mỗi nơ ron ẩn thành 0 với xác suất 0,5. Vì vậy, các nơ ron này sẽ
không đóng góp vào lan truyền tiến, do đó và sẽ không tham gia vào lan truyền ngược.
Thông thường, đối với các đầu vào khác nhau, mạng nơ ron xử lý dropout theo một cấu
trúc khác nhau.
Một cách khác để cải thiện việc việc quá khớp là tăng lượng dữ liệu. Chúng ta có
thể phản chiếu hình ảnh, lộn ngược hình ảnh, lấy mẫu hình ảnh, v.v. Những cách này sẽ
tăng số lượng dữ liệu huấn luyện. Vì vậy, nó có khả năng ngăn chặn quá khớp. Với ví dụ
thực tế, trong một vài dự án, các bức ảnh được sử dụng để huấn luyện đã được xử lý thêm
25
40. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
bước xoay, với mỗi lần từ 15 đến 20 độ cũng như áp dụng thêm phương pháp phản chiếu
bức ảnh. Kết quả, hệ thống AI đã phát hiện cải thiện đáng kể việc nhận diện.
1.3.2.7. Một số mạng tích chập nổi tiếng
Có một số kiến trúc mạng nơ ron tích chập nổi tiếng. Một số thử nghiệm cho thấy
chúng có hiệu suất tốt hơn. Vì vậy, đôi khi nhiều người sử dụng mạng được thiết kế sẵn
thay vì tự thiết kế mạng. Ở các phần sau luận văn sẽ giới thiệu một vài mạng tích chập nổi
tiếng và thông dụng hiện nay.
AlexNet
Hình 1.26: Cấu trúc của AlexNet
Alex đã phát triển mạng này vào năm 2012. Cho tới thời điểm hiện tại, AlexNet
vẫn còn đang được sử dụng phổ biến và rộng rãi. Mạng AlexNet có năm lớp chập và ba
lớp kết nối đầy đủ. Cấu trúc trong AlexNet được chia thành hai khối. Nguyên nhân vì tác
giả đã sử dụng hai GPU để huấn luyện dữ liệu song song. Mạng này được sử dụng trong
phân loại đối tượng quy mô lớn. Lớp đầu ra có một nghìn nơ ron. Đó là bởi vì kiến trúc
ban đầu được thiết kế để phân loại một nghìn nhãn. Thông thường, những người áp dụng
kiến trúc mạng nơ ron AlexNet sẽ thay thế lớp cuối cùng, phụ thuộc vào mục đích của họ.
Tác giả của mạng này đã làm nhiều thử nghiệm để có thể ra được mô hình này có kết quả
tốt nhất. Vì vậy, hiệu suất của cấu trúc này rất ổn định và mạng này được sử dụng rộng rãi
trong nhiều ứng dụng.
VGGNet
VGGNet [10] được phát triển vào năm 2014 và đã giành chiến thắng trong cuộc thi
ILSVRC-2014. Mạng này mạnh hơn mạng AlexNet nhưng rất sâu. Mạng này có 16 đến
19 tầng (Hình 1.21). Mạng này đã được thiết kế với 5 cấu trúc. Sau một số thí nghiệm, D
và E là cấu trúc tốt nhất. Hiệu suất của E tốt hơn một chút so với B. Nhưng các tham số
trong E lớn hơn D. Vì vậy, người sử dụng có thể chọn một trong số cấu trúc mạng dựa
trên những gì họ cần. Đặc điểm của VGGNet là việc áp dụng nhiều lớp chập với kích
26
41. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thước cửa sổ nhỏ thay vì lớp chập với kích thước cửa sổ lớn, sau đó là lớp gộp. Nó làm
cho mạng linh hoạt hơn.
Hình 1.27: Cấu trúc của VGGNet
1.4 Kết luận
Mạng nơ ron nhân tạo là một chuỗi các thuật toán được sử dụng để tìm ra mối quan
hệ của một tập dữ liệu thông qua cơ chế vận hành của bộ não sinh học. Mạng nơ ron nhân
tạo thường được huấn luyện qua một tập dữ liệu chuẩn cho trước, từ đó có thể đúc rút
được kiến thức từ tập dữ liệu huấn luyện, và áp dụng với các tập dữ liệu khác với độ chính
xác cao.
Các phương pháp sử dụng để huấn luyện mạng nơ ron nhân tạo ngày càng tối ưu
hơn về mặt tính toán và phục vụ cho nhiều mục đích khác nhau. Hiện nay, kiến trúc mạng
nơ ron ngày càng được hoàn thiện cho nhiều nhiệm vụ, trong đó mạng nơ ron tích chập
được chú ý rất nhiều vì tính hiệu quả trong thị giác máy tính. Mạng nơ ron tích chập với
các cải tiến góp phần giảm thời gian tính toán và tăng độ chính xác hứa hẹn sẽ là một
trong những phương pháp được áp dụng rất nhiều vào thực tế trong tương lai.
27
42. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 2.
BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP
2.1 Khái niệm về nhận dạng
Nhận dạng là một ngành thuộc lĩnh vực trí tuệ nhân tạo. Nhận dạng mẫu là khả
năng phát hiện sự sắp xếp các đặc tính hoặc dữ liệu mang lại thông tin về một hệ thống
hoặc tập dữ liệu nhất định. Nhận dạng mẫu chia thành nhiều lĩnh vực trong công nghệ
thông tin, bao gồm phân tích dữ liệu lớn, nhận dạng sinh trắc học, bảo mật và trí tuệ nhân
tạo. Nhận dạng đối tượng trong hình ảnh là một nhánh của nhận dạng mẫu. Nhận dạng đối
tượng trong hình ảnh thể hiện qua các công nghệ máy tính có thể nhận ra người, động vật,
vật thể hoặc các đối tượng mục tiêu khác thông qua việc sử dụng các thuật toán và khái
niệm học máy.
2.1.1 Nhận dạng đối tượng
Một số khái niệm liên quan:
Nhận dạng đối tượng (object recognition) là một thuật ngữ chung để mô tả
một tập hợp các cách xử lý trong thị giác máy tính có liên quan đến việc xác
định các đối tượng trong ảnh kỹ thuật số.
Phân loại hình ảnh (image classification) liên quan đến việc dự đoán, phân
loại các lớp thông tin của một đối tượng trong một hình ảnh.
Khoanh vùng đối tượng (object localization) là việc xác định vị trí của một
hoặc nhiều đối tượng trong một hình ảnh bằng hình chữ nhật xung quanh
phạm vi của đối tượng bằng hộp chứa (bounding box).
Phát hiện đối tượng (object detection) kết hợp cả hai nhiệm vụ nhận dạng
đối tượng và khoanh vùng đối tượng. Phát hiện đối tượng là việc khoanh
vùng và phân loại một hoặc nhiều đối tượng khác nhau trong một hình ảnh.
Nhận dạng đối tượng khác với phát hiện đối tượng ở chỗ nhận dạng đối tượng
mang ý nghĩa rộng hơn, bao gồm cả việc phân loại hình ảnh (đòi hỏi thuật toán xác định
các lớp của đối tượng xuất hiện trong hình ảnh), cũng như phát hiện đối tượng (đòi hỏi
thuật toán khoanh vùng, định vị được tất cả các đối tượng có trong hình ảnh)
28
43. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.1: Sự khác biệt giữa nhận dạng đối tượng và phát hiện đối tượng
2.1.2 Nhận dạng khuôn mặt
Nhận dạng khuôn mặt là khả năng nhận diện, lưu trữ,so sánh và phân tích các mẫu
dựa trên đường nét khuôn mặt để nhận dạng người từ hình ảnh hoặc video. Hệ thống
thường sử dụng các công nghệ để thực hiện nhận dạng khuôn mặt như sử dụng sinh trắc
học để ánh xạ các đặc điểm khuôn mặt từ ảnh hoặc video. Hệ thống so sánh thông tin này
với một cơ sở dữ liệu đã lưu trữ về các khuôn mặt để tìm ra một kết quả khớp chính xác
Nhận dạng khuôn mặt ngày càng được quan tâm trong nhiều lĩnh vực, như Trung
Quốc có hệ thống Skynet để chấm điểm công dân, hay nhiều chuỗi cửa hàng lớn cũng sử
dụng nhận dạng khuôn mặt khách hàng thân thiết để phân tích thói quen tiêu dùng. Trên
thực tế, công nghệ nhận dạng khuôn mặt đã nhận được sự chú ý đáng kể vì nó có tiềm
năng cho một loạt các ứng dụng liên quan đến thực thi pháp luật cũng như các doanh
nghiệp khác.
Hình 2.2: Một minh họa về một số bản đồ đặc trưng của các lớp DC12, conv22, conv32, conv42 và
conv52 được đào tạo cho nhiệm vụ nhận dạng khuôn mặt.
29
44. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.2. Lịch sử và phát triển
Nhận dạng khuôn mặt tự động là một khái niệm tương đối mới, được phát triển
vào những năm 1960. Hệ thống bán tự động đầu tiên cho nhận dạng khuôn mặt cần quản
trị viên phải xác định được vị trí các điểm cần được đánh dấu (như mắt, tai, mũi và
miệng) trên các bức ảnh, sau đó tính toán khoảng cách và tỷ lệ đến một điểm tham chiếu
chung, cuối cùng đó được so sánh với dữ liệu để ra kết quả.
Vào những năm 1970, Goldstein, Harmon và Lesk1 sử dụng 21 loại thông tin cụ
thể, chẳng hạn như màu tóc và độ dày môi để tự động nhận dạng. Vấn đề với cả hai giải
pháp ban đầu này là các phép đo dựa trên vị trí, và cần sự tính toán thủ công của con
người để có thể vận hành.
Năm 1988, Kirby và Sirovich áp dụng phân tích các thành phần nổi bật, một kỹ
thuật đại số tuyến tính tiêu chuẩn vào việc nhận dạng khuôn mặt. Đây được coi là một
phần của cột mốc thay đổi vì dưới một trăm giá trị được yêu cầu mã hóa chính xác một
hình ảnh khuôn mặt được căn chỉnh và chuẩn hóa phù hợp.
Vào năm 1991, Turk và Pentland phát hiện ra rằng trong khi sử dụng kỹ thuật
thành phần riêng, lỗi dư (residual error) có thể được sử dụng để phát hiện khuôn mặt trong
hình ảnh - một khám phá có thể tạo ra được một hệ thống nhận diện khuôn mặt tự động,
thời gian thực và đáng tin cậy. Mặc dù cách tiếp cận có phần bị hạn chế bởi các yếu tố
máy móc của giai đoạn đó, nhưng nó đã tạo ra sự quan tâm đáng kể trong việc phát triển
công nghệ nhận dạng khuôn mặt tự động.
Công nghệ đầu tiên đã thu hút được sự chú ý rất lớn của truyền thông khi triển khai
thử nghiệm tại Super Bowl tháng 1 năm 2001, trong đó ghi lại hình ảnh từ camera giám
sát và so sánh chúng với một cơ sở dữ liệu kỹ thuật số. Sau sự kiện này, đã có các phân
tích về tính cần thiết của việc sử dụng công nghệ để hỗ trợ nhu cầu quốc gia, trong khi
vẫn quan tâm đến các mối quan tâm xã hội và quyền riêng tư của cộng đồng. Ngày nay,
công nghệ nhận dạng khuôn mặt đang được sử dụng để chống lại gian lận hộ chiếu, hỗ trợ
thực thi pháp luật, xác định trẻ em mất tích, và giảm thiểu gian lận danh tính.
2.3. Cách thức hoạt động
Phương pháp bao gồm các bước khác nhau để thực hiện nhận diện khuôn mặt tự
động. Đầu tiên là thực hiện phát hiện khuôn mặt để khoanh vùng khuôn mặt trong từng
khung hình ảnh và video. Sau đó, dữ liệu ở bước trên đuợc liên kết với các khuôn mặt
được phát hiện với danh tính chung trên các video và căn chỉnh các khuôn mặt thành tọa
độ bằng cách sử dụng các mốc được phát hiện. Cuối cùng, hệ thống thực hiện xác minh
30
45. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
khuôn mặt để tính toán độ tương tự giữa một cặp hình ảnh / video. Sơ lược phương pháp
được minh họa trong hình 2.3.
Hình 2.3: Tổng quan về phương pháp nhận dạng khuôn mặt người
bằng mạng nơ ron tích chập
Cụ thể, ta có thể xem xét ví dụ với thiết kế mạng ở hình 2.4 để rõ hơn về tổng quan
cách thức hoạt động:
Hình 2.4: Thiết kế mạng nơ ron để xử lý ảnh
Từ mạng nơ ron trên, ta có thể thấy các bước xử lý ảnh từ trái sang phải. Lần lượt,
ta có thể thấy hình ảnh các cửa sổ dò tìm (ô vuông màu xanh) đang giảm dần và hiệu
chỉnh dần theo từng giai đoạn dò tìm:
31
46. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.5: Các giai đoạn dò tìm và hiệu chỉnh
2.4 Phương pháp nhận dạng đối tượng từ ảnh chụp của camera
2.4.1 Nhận diện khuôn mặt
Tất cả các khuôn mặt trong khung hình ảnh / video được phát hiện bằng hệ thống
dò khuôn mặt dựa trên mạng nơ ron tích chập sâu (Deep Convolutional Neural Network –
DCNN), được gọi là Mô hình tháp sâu để phát hiện khuôn mặt (Deep Pyramid
Deformable Parts Model for Face Detection - DP2MFD) [38], bao gồm hai mô-đun. Mô-
đun đầu tiên tạo ra một hình tháp sâu được chuẩn hóa bảy cấp cho bất kỳ hình ảnh đầu
vào nào có kích thước tùy ý, như đã minh họa trong hình ảnh 2.3. Kiến trúc mạng nơ ron
tích chập tương tự như Alexnet, được sử dụng để trích xuất các tính năng sâu. Mạng hình
tháp này tạo ra một tháp gồm 256 bản đồ đặc trưng ở lớp tích chập thứ 5 (conv5). Bộ lọc
được áp dụng để có được lớp max5. Thông thường, cường độ kích hoạt cho một
vùng khuôn mặt giảm theo kích thước của cấp độ của tháp. Do đó, một khuôn mặt lớn
được phát hiện bởi cửa sổ trượt có kích thước cố đinh ở cấp độ tháp thấp hơn sẽ có điểm
phát hiện cao so với khuôn mặt nhỏ được phát hiện ở cấp độ tháp cao hơn. Để giảm độ
lệch này cho kích thước khuôn mặt, hệ thống áp dụng bước chuẩn hóa điểm z trên các
tính năng max5 ở mỗi cấp. Đối với vectơ đặc trưng 256 chiều ở cấp tháp i và vị trí
(j, k), tính năng chuẩn hóa được tính như sau:
Trong đó, là vectơ đặc trưng trung bình và là độ lệch chuẩn cho cấp độ tháp
i. Các tính năng max5 được chuẩn hóa là . Sau đó, các tính năng có độ dài từ mỗi
vị trí trong tháp được trích xuất bằng cách sử dụng phương pháp cửa sổ trượt. Mô-đun thứ
hai là một SVM tuyến tính (linear SVM), lấy các tính năng này làm đầu vào để phân loại
từng vị trí là mặt, hoặc không phải là mặt, dựa trên điểm được tính toán. Mô hình tháp sâu
32
47. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
để phát hiện khuôn mặt - DP2MFD có khả năng nhận diện rất tốt trên các độ sáng ảnh
khác nhau, cũng như kích cỡ khuôn mặt. Chúng ta có thể thấy thông qua ví dụ sau:
Hình 2.6: Kết quả phát hiện mẫu trên ảnh IJB-A bằng phương pháp tháp sâu
2.4.2 Phát hiện các điểm quan trọng trên khuôn mặt
Khi các khuôn mặt được phát hiện, thuật toán thực hiện phát hiện các điểm quan
trọng để căn chỉnh khuôn mặt. Thuật toán sẽ tìm cách khôi phục mặt về hình dáng mặc
định ban đầu: gọi khuôn mặt là I, hình dạng ban đầu là S0
, thuật toán sẽ tính toán mức
tăng hình dạng ∆S từ các mô tả sâu (deep descriptors) và cập nhật bằng công thức sau:
Các tính năng CNN (được biểu thị là Φ trong công thức trên) được thiết kế với
bước nhảy và cách gộp hợp lý, được sử dụng làm các tính năng để thực hiện tính toán. Ở
đây, kiến trúc CNN được sử dụng tương tự như Alexnet với các trọng số được xử lý trước
cho bộ dữ liệu ImageNet như trong hình sau:
Hình 2.7: Kiến trúc DCNN được sử dụng để trích xuất các mô tả cục bộ cho nhiệm vụ phát hiện các
điểm mốc trên khuôn mặt
Vì mục tiêu mạng CNN này là phát hiện khuôn mặt. Do đó, mạng sẽ được căn
chỉnh để xử lý dữ liệu khuôn mặt tốt hơn. Các dữ liệu đầu ra ở từng tầng sẽ là dữ liệu đầu
vào ở tầng tiếp theo. Trong hình trên, chúng ta có thể thấy có 5 tầng. Sau khi hoàn thành
33
48. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
phát hiện các mốc, khuôn mặt sẽ được căn chỉnh theo tọa độ bằng cách sử dụng phép biến
đổi và các điểm mốc.
Điều này giúp mạng tìm hiểu các đặc điểm cụ thể đối với khuôn mặt. Hơn nữa,
mạng áp dụng hồi quy theo tầng, trong đó đầu ra được tạo bởi giai đoạn đầu tiên sẽ được
sử dụng làm đầu vào cho giai đoạn tiếp theo, tổng là năm giai đoạn tích chập được áp
dụng trong hệ thống. Các bộ lọc được chọn để trích xuất tính năng được tinh chỉnh trong
các giai đoạn sau để cải thiện việc chuẩn hóa các mốc trên khuôn mặt. Sau khi hoàn thành
phát hiện các mốc trên khuôn mặt, mỗi khuôn mặt được căn chỉnh theo tọa độ chính tắc
bằng cách sử dụng biến đổi tương tự và các điểm mốc.
Hình 2.8: Ví dụ về các điểm mốc trên khuôn mặt
2.4.3 Liên kết khuôn mặt
Vì có nhiều đối tượng xuất hiện trong các khung hình của video, nên việc thực
hiện liên kết khuôn mặt để gán từng khuôn mặt cho đối tượng tương ứng là một bước
quan trọng để chọn đúng đối tượng khi xác minh khuôn mặt. Do đó, khi một khuôn mặt
trong khung hình của video được phát hiện, hệ thống theo dõi khuôn mặt bằng cách tích
hợp các kết quả từ trình phát hiện khuôn mặt, trình theo dõi khuôn mặt và bước liên kết
khuôn mặt.
Hệ thống áp dụng thuật toán nhận diện khuôn mặt trong mọi khung hình bằng
phương pháp nhận diện khuôn mặt được trình bày trong phần trước. Vùng phát hiện
khuôn mặt được coi như một khuôn mặt mới nếu không có tỷ lệ trùng lặp với bất kỳ vùng
phát hiện nào trong các khung hình trước. Tỷ lệ trùng lặp của một vùng phát hiện được
phát hiện và vùng phát hiện trong khung hình trước được xác định là:
34
49. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Qua thực nghiệm, ngưỡng 0,2 là đủ để coi như xuất hiện khuôn mặt mới, do các
khung hình của video cách nhau chỉ một phần nhỏ của giây. Để theo dõi khuôn mặt, các
nhà khoa học sử dụng giải thuật Kanade-Lucas-Tomasi (KLT) để theo dõi các khuôn mặt
giữa hai khung hình liên tiếp. Hệ thống cập nhật các vùng phát hiện trong quá trình theo
dõi dựa vào khung hình mới nhất. Vùng phát hiện sẽ thay thế cho vùng phát hiện
nếu nhỏ hơn ngưỡng (0,2). Quá trình theo dõi khuôn mặt sẽ bị chấm dứt nếu
không có phát hiện khuôn mặt tương ứng chồng chéo với nó cho nhiều hơn khung hình.
Hệ thống thường đặt giới hạn bằng 4 khung hình, dựa trên cơ sở thực nghiệm. Hình ảnh
kết quả của phương pháp liên kết khuôn mặt cho các video của JANUS CS2:
Hình 2.9: Kết quả mẫu của phương pháp liên kết khuôn mặt cho các video của JANUS CS2, là bộ
dữ liệu mở rộng của IJB-A
2.5 Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo
2.5.1 Mô hình DeepID 2 (NIPS 2014)
Cách thức hoạt động của mô hình DeepID 2:
Trong quá trình huấn luyện, 200 phần khuôn mặt được cắt với các vị trí, tỉ lệ và
kênh màu sắc khác nhau. Mỗi phần khuôn mặt và phần đối xứng được đưa vào ConvNet.
Hai vector 160 chiều được trích xuất từ phần khuôn mặt và phần đối xứng. Chọn 25 phần
khuôn mặt tốt nhất.
35
50. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.10: Kiến trúc mạng của mô hình DeepID 2
Một ví dụ về 25 phần khuôn mặt tốt nhất:
Hình 2.11: 25 phần khuôn mặt tốt nhất được chọn để trích xuất đặc điểm
Kết quả của mô hình thể hiện trong bảng.
Bảng 2.1: Thống kê xác minh độ chính xác của khuôn mặt bằng DeepID2 khi tăng dần số lượng của
các phần khuôn mặt
36
51. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Qua bảng 2.1, ta có thể thấy, khi sử dụng 25 phần khuôn mặt để trích xuất đặc
điểm, độ chính xác của phương pháp rất cao, xấp xỉ tới 99%. Tuy nhiên, khi nhận diện với
25 phần khuôn mặt, máy tính cần mất 0.035 giây để tính toán. Mặt khác, với việc chỉ sử
dụng một phần khuôn mặt để trích xuất đặc trưng, thời gian xử lý rất nhanh, chỉ 0,0017
giây, tuy nhiên độ chính xác chỉ còn 95,43%. Dựa trên bảng thống kê này, các nhà phát
triển có thể căn chỉnh số phần khuôn mặt để tối ưu cho bài toán thực tế. Ví dụ như, nếu
cần một hệ thống phản hồi nhanh mà không quá ưu tiên độ chính xác, có thể chỉ sử dụng
một phần khuôn mặt để trích xuất đặc trưng, ngược lại, ta có thể tăng số phần khuôn mặt
nhằm tăng độ chính xác.
Bảng 2.2: So sánh độ chính xác của mô hình DeepID2 với các kết quả mô hình trước đó trên bộ thư
viện LFW
Qua bảng so sánh trên, ta có thể thấy mô hình DeepID2 khi sử dụng trên bộ thư
viện LFW có độ chính xác rất cao, lên tới hơn 99%. Với độ chính xác cao như vậy,
DeepID2 có thể đưa ra làm sản phẩm và thương mại hóa.
37
52. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.5.2 Mô hình DeepID3 (arXiv 2015)
Hình 2.12: Kiến trúc mạng của mô hình DeepID3
DeepID3 là mô hình nâng cấp của DeepID2+
Bảng 2.3: Kết quả so sánh của mô hình DeepID3 với các mô hình trước trên bộ thư viện LFW
Với bộ dữ liệu LFW năm 2015, ta có thể thấy DeepID3 đã có những cải tiến nhất
định so với DeepID2+, với độ chính xác được tăng cường lên tới 1%
38
53. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
2.5.3 Mô hình DeepFace (Facebook, CVPR 2014)
Sơ lược kiến trúc DeepFace: DeepFace sử dụng căn chỉnh 3D để xử lý khuôn mặt.
Sau đó đầu vào được bộ lọc tích chập-gộp chung, tiếp theo được xử lý bởi ba tầng được
kết nối cục bộ và hai tầng được kết nối đầy đủ. Màu sắc minh họa dựa trên đặc trưng được
xử lý ở mỗi tầng. Mạng bao gồm hơn 120 triệu tham số, trong đó hơn 95% đến từ các lớp
cục bộ và được kết nối đầy đủ.
Hình 2.13: Kiến trúc của DeepFace
Bảng 2.4: Kết quả của khi so sánh DeepFace với các công nghệ hiện đại trên bộ dữ liệu
LFW
Có thể thấy, mô hình DeepFace đạt kết quả rất cao, lên đến 0.95 tới 0.97, gần ở
mức tiệm cận con người.
2.5.4 Mô hình FaceNet (Google 2015)
FaceNet là một mô hình được tạo ra từ google, và được huấn luyện bởi 260 triệu
bức ảnh. FaceNet có 2 mô hình CNN: mô hình lấy cảm hứng từ Zeiler & Fergus, và mô
hình GoogLeNet.
39
54. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Hình 2.14: Hình ảnh: Mô hình lấy cảm hứng từ Zeiler & Fergus
Hình 2. 15 Mô hình GoogleNet
40
55. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bảng 2.5: Bảng so sánh hiệu suất của kiến trúc mạng trên FaceNet
Qua bảng trên ta có thể thấy kiến trúc NN2 và NN1 có độ chính xác cao nhất.
Bảng 2.6: Bảng so sánh độ chính xác dựa trên số lượng dữ liệu đào tạo
Quả bảng so sánh độ chính xác dựa trên dữ liệu đào tạo, ta có thể thấy độ chính xác
được cải thiện rõ rệt khi dữ liệu tăng lên đáng kể. Do đó, ngoài kiến trúc mạng hợp lý, dữ
liệu được sử dụng để đào tạo cũng là một nhân tố góp phần tạo nên độ chính xác cao cho
mô hình.
2.5.5 Mô hình Baidu (2015)
Mô hình Baidu, 2015, là mô hình được tạo ra bởi hãng Baidu, Trung Quốc. Với
nguồn lực và lượng thông tin cá nhân lớn, Baidu đã xây dựng được một hệ thống nhận
diện khuôn mặt với tỉ lệ lỗi rất thấp.
Hình 2.16: Tổng quan về cấu trúc CNN trên nhiều phần khuôn mặt của Baidu
41
56. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
Bảng 2.7: Tỉ lệ lỗi trên lượng dữ liệu khác nhau
Có thể thấy, ở mô hình của Baidu, với lượng người càng lớn và số khuôn mặt càng
nhiều, hệ thống càng trở nên chính xác.
2.6 Kết luận
Bài toán nhận dạng đã có từ rất lâu với nhiều phương pháp khác nhau. Tuy nhiên,
với các kỹ thuật mới, ta có thể thấy rằng độ chính xác của các phương pháp ngày càng
tăng trong khi chi phí tính toán ngày càng giảm.
Hình 2.17: Thống kê các mô hình, số lượng bộ dữ liệu sử dụng, và các mốc thời gian xuất bản
Qua cách thức hoạt động và các mô hình được sử dụng trong bài toán nhận dạng, ta
có thể thấy dữ liệu là chìa khóa rất quan trọng trong việc đào tạo. Nếu mô hình còn hạn
chế, nhưng lại có rất nhiều dữ liệu để đào tạo thì độ chính xác của hệ thống sẽ được cải
42
57. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
thiện ở mức đáng kể. Có thể thấy, các mô hình có độ chính xác cao trên 97% đều sử dụng
trên 100 nghìn ảnh để huẩn luyện. Ngoài ra, việc xử lý nhiều phần khuôn mặt cũng giúp
ích rất nhiều cho độ chính xác của nhận diện, tuy nhiên hệ thống sẽ cần số lượng tính toán
lớn hơn để có thể nhận diện.
Các phương pháp nhận dạng bằng mạng nơ ron tích chập hiện nay có độ sai số rất
nhỏ và nằm trong ngưỡng chấp nhận được. Nên việc áp dụng mạng nơ ron tích chập để
xây dựng một hệ thống nhận diện là hoàn toàn khả thi và có thể đáp ứng nhiều nhu cầu
khi chúng ta đang dần tiến tới cách mạng công nghiệp 4.0.
43
58. Dịch vụ viết thuê đề tài – KB Zalo/Tele 0917.193.864 – luanvantrust.com
Kham thảo miễn phí – Kết bạn Zalo/Tele mình 0917.193.864
CHƯƠNG 3.
SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP
TRONG NHẬN DẠNG ĐỐI TƯỢNG