SlideShare a Scribd company logo
1 of 25
DỰ ĐOÁN VỊ TRÍ TƯƠNG TÁC VỚI ADN TRONG CHUỖI PROTEIN BẰNG  PHƯƠNG PHÁP HỌC MÁY Giáo viên hướng dẫn:  PGS. TS. Từ Minh Phương Sinh viên thực hiện:  Nguyễn Thị Lan Phương
Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
Dự đoán tương tác với ADN trong chuỗi protein MKRESHKHAEQARRNRLAVALHELALIPAEWKQQN 1. Protein Mỗi kí tự biểu diễn một axit amin 2. Bài toán dự đoán tương tác với ADN trong chuỗi protein  MKRESHKHAEQARRNRLAVALHELALIPAEWKQQN Vị trí gắn với ADN
Phương pháp xác định tương tác giữa ADN và protein Các phương pháp Chụp X quang tinh thể Phân tích quang phổ  cộng hưởng từ hạt nhân Tin sinh học MKRRIRRERNKMAAAKSRNRRRELTDTL MKRRIRRERNKMAAAKSRNRRRELTDTL 0000001001101001110010000000
Phương pháp tin sinh học ,[object Object],[object Object],Trích xuất ra các đặc trưng Thuật toán phân loại  Bộ dự đoán tương tác giữa ADN và Protein
Một số ứng dụng hiện có ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],BindN DP-Bind BindN-RF
Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
Tập huấn luyện ,[object Object],[object Object],PDB Phức hợp ADN-protein Tính toán khoảng cách giữa  ADN và protein  3.5Å > ≤ Không gắn với ADN Gắn với ADN MKRRIRRERNKMAAAKSRNRRRELTDTL 0000001001101001110010000000
Trích chọn đặc trưng ,[object Object],Thông tin chuỗi (QARRNRLAVA) Cấu trúc thứ cấp (SHHHHTTTEEE) DSSP PSI-BLAST Véc tơ đặc trưng Thông tin tiến hóa
Thông tin tiến hóa Database 1A0A:A|PDBID|CHAIN|SEQUENCE 1AN4:A|PDBID|CHAIN|SEQUENCE 1HLO:A|PDBID|CHAIN|SEQUENCE 1NKP:A|PDBID|CHAIN|SEQUENCE 1J1V:A|PDBID|CHAIN|SEQUENCE  MKRESHKHAEQARRNRLAVALHELASLIPAE Sử dụng chương trình PSI-Blast  để lấy thông tin tiến hóa  VFNVVTQDMINKSTK PYRGHRF TKENVRILESWFAKNIENPYL GRPR PYRGHRF AINKHEQEQISRLLEKGHPRQQLAIIFGIGVS ALSDTERAQLDVMKLLNVSLHEMSR PYRGHR TKILKDPVSYGTS Các chuỗi con được bảo tồn chức năng có khả năng gắn với ADN cao hơn
Thông tin cấu trúc thứ cấp ,[object Object]
Mô hình dự đoán tương tác ADN và protein ,[object Object],Thông tin chuỗi (QARRNRLAVA) Cấu trúc thứ cấp (SHHHHTTTEEE) DSSP PSI-BLAST Véc tơ đặc trưng QARRNRLAVAL -----------P---------- Thông tin tiến hóa THUẬT TOÁN HỌC MÁY
Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
Phương pháp đề xuất Phương pháp dự đoán sử dụng thuật toán SVMs Phương pháp dự đoán sử dụng thuật toán CRFs Phương pháp dự đoán sử dụng kết hợp SVMs/CRFs Dự đoán tương tác giữa ADN và Protein
Phương pháp dự đoán sử dụng SVMs (Rn) (Rd) Rn  Rd
Phương pháp dự đoán sử dụng CRFs KHYRGVRQRPWGKFAAEIRDPAKNGARVWLGTFETAEDAALAYDRA 0011111010101000111010001010101100000000001000 Chuỗi dữ liệu X cần gán nhãn Chuỗi nhãn Y  Đặc trưng trạng thái: + thông tin chuỗi + cấu trúc thứ cấp + thông tin tiến hóa Đặc trưng chuyển đổi  giữa các nhãn: 1->0  0->1  1->1  0->0
Phương pháp dự đoán kết hợp SVMs/CRFs Tạo vectơ đặc trưng Phân loại bằng SVMs Tạo đặc trưng đầu vào Gán nhãn bằng CRFs Xuất kết quả ra màn hình KHYRGVRQRPWGKFAAEIRDPAKNGARVWLGTFETAEDAALAYDRAAFRMR 001111101010100011101000101010110000000000100000000 Cực đại hóa  biên độ phân tách Mô hình sự tương quan giữa các nhãn kề nhau
Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
Phương pháp thử nghiệm ,[object Object],[object Object],[object Object],[object Object],[object Object]
Tiêu chí đánh giá ,[object Object],[object Object],[object Object],[object Object]
Kết quả thử nghiệm
Ứng dụng dự đoán tương tác ADN và protein ,[object Object]
Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
Kết luận ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Em xin chân thành cảm ơn  thầy giáo và các bạn!

More Related Content

Viewers also liked

Studiu HR - Dezvoltare Durabila - Perspective Group
Studiu HR -  Dezvoltare Durabila -  Perspective GroupStudiu HR -  Dezvoltare Durabila -  Perspective Group
Studiu HR - Dezvoltare Durabila - Perspective GroupCorneliaPopa
 
Конкурентоспособность ОАО «Газпром» на европейском рынке газа
Конкурентоспособность ОАО «Газпром» на европейском рынке газаКонкурентоспособность ОАО «Газпром» на европейском рынке газа
Конкурентоспособность ОАО «Газпром» на европейском рынке газаDmitry Potapov
 
Exploring the fault finding capabilities of online testing in OSGi
Exploring the fault finding capabilities of online testing in OSGiExploring the fault finding capabilities of online testing in OSGi
Exploring the fault finding capabilities of online testing in OSGiKai Hackbarth
 
режущие инструменты
режущие инструментырежущие инструменты
режущие инструментыtjklegion
 
Security in OSGi applications: Robust OSGi Platforms, secure Bundles
Security in OSGi applications: Robust OSGi Platforms, secure BundlesSecurity in OSGi applications: Robust OSGi Platforms, secure Bundles
Security in OSGi applications: Robust OSGi Platforms, secure BundlesKai Hackbarth
 
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...eMadrid network
 
Imagenes
ImagenesImagenes
ImagenesPercy
 
ME 597 final ppt_Force Distance curves on Polyurethane foam
ME 597 final ppt_Force Distance curves on Polyurethane foamME 597 final ppt_Force Distance curves on Polyurethane foam
ME 597 final ppt_Force Distance curves on Polyurethane foamTejasvi Parupudi
 

Viewers also liked (10)

Studiu HR - Dezvoltare Durabila - Perspective Group
Studiu HR -  Dezvoltare Durabila -  Perspective GroupStudiu HR -  Dezvoltare Durabila -  Perspective Group
Studiu HR - Dezvoltare Durabila - Perspective Group
 
Конкурентоспособность ОАО «Газпром» на европейском рынке газа
Конкурентоспособность ОАО «Газпром» на европейском рынке газаКонкурентоспособность ОАО «Газпром» на европейском рынке газа
Конкурентоспособность ОАО «Газпром» на европейском рынке газа
 
Exploring the fault finding capabilities of online testing in OSGi
Exploring the fault finding capabilities of online testing in OSGiExploring the fault finding capabilities of online testing in OSGi
Exploring the fault finding capabilities of online testing in OSGi
 
режущие инструменты
режущие инструментырежущие инструменты
режущие инструменты
 
Kristen!
Kristen!Kristen!
Kristen!
 
Thesis S1140168
Thesis S1140168Thesis S1140168
Thesis S1140168
 
Security in OSGi applications: Robust OSGi Platforms, secure Bundles
Security in OSGi applications: Robust OSGi Platforms, secure BundlesSecurity in OSGi applications: Robust OSGi Platforms, secure Bundles
Security in OSGi applications: Robust OSGi Platforms, secure Bundles
 
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...
Seminario #eMadridNet sobre "CloudComputing". Cloud computing en entornos cor...
 
Imagenes
ImagenesImagenes
Imagenes
 
ME 597 final ppt_Force Distance curves on Polyurethane foam
ME 597 final ppt_Force Distance curves on Polyurethane foamME 597 final ppt_Force Distance curves on Polyurethane foam
ME 597 final ppt_Force Distance curves on Polyurethane foam
 

Similar to Du Doan Adn Binding Protein New

Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAY
Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAYĐề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAY
Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAYViết thuê trọn gói ZALO 0934573149
 
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...TÀI LIỆU NGÀNH MAY
 
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...https://www.facebook.com/garmentspace
 
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...https://www.facebook.com/garmentspace
 
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptx
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptxBTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptx
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptxNguyn616695
 

Similar to Du Doan Adn Binding Protein New (7)

Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu
Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâuDự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu
Dự đoán sự tương tác giữa các protein dựa trên kỹ thuật học sâu
 
Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAY
Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAYĐề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAY
Đề tài: Tiểu luận môn Nhập môn công nghệ sinh học Test kit, HAY
 
Luận án: Dẫn xuất flavonoid và hoạt tính gây độc lên tế bào Hela
Luận án: Dẫn xuất flavonoid và hoạt tính gây độc lên tế bào HelaLuận án: Dẫn xuất flavonoid và hoạt tính gây độc lên tế bào Hela
Luận án: Dẫn xuất flavonoid và hoạt tính gây độc lên tế bào Hela
 
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...
Khảo sát đột biến gen ret trên ca lâm sàng u sắc bào tuyến thượng thận mang t...
 
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
 
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
Nghiên cứu sự đa dạng di truyền của một số giống đậu tương có khả năng kháng ...
 
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptx
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptxBTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptx
BTL_L07_NHÓM-6_Đề-Tài-11-ppt.pptx
 

Recently uploaded

kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhkinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhdtlnnm
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfNguyen Thanh Tu Collection
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngYhoccongdong.com
 
CD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh choCD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh chonamc250
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...Nguyen Thanh Tu Collection
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-KhnhHuyn546843
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfhoangtuansinh1
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgsNmmeomeo
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...Nguyen Thanh Tu Collection
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoáCác điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoámyvh40253
 
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢImyvh40253
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfTrnHoa46
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...Nguyen Thanh Tu Collection
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanmyvh40253
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docxTHAO316680
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...Nguyen Thanh Tu Collection
 
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...Nguyen Thanh Tu Collection
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdfTrnHoa46
 

Recently uploaded (20)

kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhhkinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
kinh tế chính trị mác lênin chương hai và hàng hoá và sxxhh
 
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdfBỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
BỘ LUYỆN NGHE VÀO 10 TIẾNG ANH DẠNG TRẮC NGHIỆM 4 CÂU TRẢ LỜI - CÓ FILE NGHE.pdf
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
 
CD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh choCD21 Exercise 2.1 KEY.docx tieng anh cho
CD21 Exercise 2.1 KEY.docx tieng anh cho
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 7 GLOBAL SUCCESS (2 CỘ...
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
cac-cau-noi-tthcm.pdf-cac-cau-noi-tthcm-
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
 
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
3-BẢNG MÃ LỖI CỦA CÁC HÃNG ĐIỀU HÒA .pdf - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoáCác điều kiện bảo hiểm trong bảo hiểm hàng hoá
Các điều kiện bảo hiểm trong bảo hiểm hàng hoá
 
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
 
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
1.DOANNGOCPHUONGTHAO-APDUNGSTEMTHIETKEBTHHHGIUPHSHOCHIEUQUA (1).docx
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdf
 

Du Doan Adn Binding Protein New

  • 1. DỰ ĐOÁN VỊ TRÍ TƯƠNG TÁC VỚI ADN TRONG CHUỖI PROTEIN BẰNG PHƯƠNG PHÁP HỌC MÁY Giáo viên hướng dẫn: PGS. TS. Từ Minh Phương Sinh viên thực hiện: Nguyễn Thị Lan Phương
  • 2. Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
  • 3. Dự đoán tương tác với ADN trong chuỗi protein MKRESHKHAEQARRNRLAVALHELALIPAEWKQQN 1. Protein Mỗi kí tự biểu diễn một axit amin 2. Bài toán dự đoán tương tác với ADN trong chuỗi protein MKRESHKHAEQARRNRLAVALHELALIPAEWKQQN Vị trí gắn với ADN
  • 4. Phương pháp xác định tương tác giữa ADN và protein Các phương pháp Chụp X quang tinh thể Phân tích quang phổ cộng hưởng từ hạt nhân Tin sinh học MKRRIRRERNKMAAAKSRNRRRELTDTL MKRRIRRERNKMAAAKSRNRRRELTDTL 0000001001101001110010000000
  • 5.
  • 6.
  • 7. Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
  • 8.
  • 9.
  • 10. Thông tin tiến hóa Database 1A0A:A|PDBID|CHAIN|SEQUENCE 1AN4:A|PDBID|CHAIN|SEQUENCE 1HLO:A|PDBID|CHAIN|SEQUENCE 1NKP:A|PDBID|CHAIN|SEQUENCE 1J1V:A|PDBID|CHAIN|SEQUENCE MKRESHKHAEQARRNRLAVALHELASLIPAE Sử dụng chương trình PSI-Blast để lấy thông tin tiến hóa VFNVVTQDMINKSTK PYRGHRF TKENVRILESWFAKNIENPYL GRPR PYRGHRF AINKHEQEQISRLLEKGHPRQQLAIIFGIGVS ALSDTERAQLDVMKLLNVSLHEMSR PYRGHR TKILKDPVSYGTS Các chuỗi con được bảo tồn chức năng có khả năng gắn với ADN cao hơn
  • 11.
  • 12.
  • 13. Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
  • 14. Phương pháp đề xuất Phương pháp dự đoán sử dụng thuật toán SVMs Phương pháp dự đoán sử dụng thuật toán CRFs Phương pháp dự đoán sử dụng kết hợp SVMs/CRFs Dự đoán tương tác giữa ADN và Protein
  • 15. Phương pháp dự đoán sử dụng SVMs (Rn) (Rd) Rn Rd
  • 16. Phương pháp dự đoán sử dụng CRFs KHYRGVRQRPWGKFAAEIRDPAKNGARVWLGTFETAEDAALAYDRA 0011111010101000111010001010101100000000001000 Chuỗi dữ liệu X cần gán nhãn Chuỗi nhãn Y Đặc trưng trạng thái: + thông tin chuỗi + cấu trúc thứ cấp + thông tin tiến hóa Đặc trưng chuyển đổi giữa các nhãn: 1->0 0->1 1->1 0->0
  • 17. Phương pháp dự đoán kết hợp SVMs/CRFs Tạo vectơ đặc trưng Phân loại bằng SVMs Tạo đặc trưng đầu vào Gán nhãn bằng CRFs Xuất kết quả ra màn hình KHYRGVRQRPWGKFAAEIRDPAKNGARVWLGTFETAEDAALAYDRAAFRMR 001111101010100011101000101010110000000000100000000 Cực đại hóa biên độ phân tách Mô hình sự tương quan giữa các nhãn kề nhau
  • 18. Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
  • 19.
  • 20.
  • 21. Kết quả thử nghiệm
  • 22.
  • 23. Nội dung Dự đoán tương tác với ADN trong chuỗi protein 1 Mô hình dự đoán bằng phương pháp học máy 2 Thử nghiệm, đánh giá và Demo ứng dụng 4 Kết luận 5 Các phương pháp đề xuất 3
  • 24.
  • 25. Em xin chân thành cảm ơn thầy giáo và các bạn!

Editor's Notes

  1. Protein cấu tạo từ 20 loại axit amin, có thể được biểu diễn như một xâu kí tự Protein có thể cuộn lại thành cấu trúc phức tạp trong không gian Các axit amin của protein gắn với ADN tạo thành một dạng phức hợp protein-ADN Bài toán dự đoán tương tác với ADN trong chuỗi protein là bài toán xác định vị trí axit amin gắn với ADN trong chuỗi protein
  2. Chụp X-quang tinh thể Phân tích quang phổ cộng hưởng từ hạt nhân là hai phương pháp thực nghiệm có độ Chính xác tuyệt đối, tuy nhiên Chi phí cao và độ phức tạp lớn Không thể thực hiện trên quy mô lớn Phương pháp thứ hai là tin sinh học, áp dụng các phương pháp tính toán để dự đoán vị trí tương tác trong chuỗi protein. Phương pháp này có Độ chính xác chưa đạt được 100% Nhưng Giá thành rẻ và tốn ít thời gian Thực hiện trên quy mô lớn
  3. Để thực hiện phương pháp tin sinh học, cần một tập dữ liêu gồm các protein đã được xác định vị trí gắn với ADN Từ tập dữ liệu này ta trích xuất ra các đặc trưng phân biệt các axit amin có gắn với AND và các acit amin không gắn với AND Các đặc trưng này được đưa vào một một thuật tóan học máy, xây dựng một bộ dự đóan tương tác giữa AND và Protein
  4. Đây là một số ứng dụng có độ chính xác nhất hiện nay. các ứng dụng này đều sử dụng kĩ thuật cửa số trượt
  5. Để xây dựng mô hình dự đoán ta cần tập huấn luyện. Từ ngân hàng dữ liệu protein, ta lấy ra các phức hợp ADN-protein. Thực hiện tính toán khoảng cách giữa ADN và các axit amin trên chuỗi protein, nếu khoảng cách này nhỏ hơn hoặc bằng 3.5 angstrom thì axit amin có gắn với AND và ngược lại
  6. Ta thực hiện trích chọn đặc trưng từ tập dữ liệu. Ta dùng một cửa sổ trượt có kích thước là 11 để xác định thông tin chuỗi Hai đặc trưng khác được trích ra đó là thông tin tiến hóa và cấu trúc thứ cấp. Các đặc trưng này được trích xuất tạo ra véc tơ đặc trưng
  7. Trong các chuỗi protein thường có các chuỗi con được bảo tồn qua các thế hệ Chúng thường biểu hiện những chức năng sinh học quan trọng Người ta thấy các chuỗi con này có khả năng gắn với ADN cao hơn Đồ án sử dụng công cụ PSI-blast để trích xuất thông tin tiến hóa Chuỗi protein được so sánh với các chuỗi trong cơ sở dữ liệu từ đó xác định ra các chuỗi tương tự nhất Chương trình sẽ tính toán để tạo ra một ma trận trọng số đặc tả vị trí, ma trận này được sử dụng làm đặc trưng trong đồ án
  8. Cấu trúc thứ cấp là tương tác không gian giữa các gốc amino acid ở gần nhau trong chuỗi protein Các nghiên cứu chỉ rằng những chuỗi protein tương tự nhau nhưng có tương tác khác nhau với ADN khi có cấu trúc thứ cấp khác nhau Đồ án Sử dụng chương trình DSSP ( Define Secondary Structure of Proteins) để xác định cấu trúc thứ cấp cho các amino acid trong chuỗi
  9. Với kích thước cửa sổ trượt là 11 sẽ có tổng cộng 320 đặc trưng đầu vào.
  10. Ý tưởng là chuyển tập mẫu từ không gian biểu diễn Rn sang không gian Rd có số chiều lớn hơn để tìm một siêu phẳng tối ưu phân loại tập mẫu này Mặt siêu phẳng chia không gian vector đặc trưng thành hai phần, mỗi phần sẽ chứa các vector thuộc về một lớp Để xác định được một siêu phẳng tối ưu, phải bổ sung thêm điều kiện mặt siêu phẳng nghiệm phải có biên độ phân tách lớn nhất
  11. CRFs là một kỹ thuật học máy được ứng dụng để giải quyết vấn đề gán nhãn chuỗi dữ liệu. Trong bài toán dự đoán tương tác giữa ADN và Protein, chuỗi protein là chuỗi dữ liệu cần được gán nhãn, chuỗi nhãn là chuỗi các trạng thái có gắn hay không gắn với ADN của các axit amin trong chuỗi protein Tính ưu việt của CRFs là nó có thể tích hợp những đặc trưng trạng thái giàu giá trị và đặc trưng chuyển đổi giữa các nhãn. Xác suất của chuỗi nhãn sẽ được xác định bởi công thức xác suất điều kiện như sau:
  12. Thực tế các axit amin gắn với ADN thường tập hợp thành các chuỗi liền nhau. Người ta thấy rằng có sự tương quan giữa các axit amin này. Với hướng tiếp cận kết hợp hai thuật tóan học máy SVM và CRF, Mô hình dự đoán sẽ tận dụng được ưu điểm SVMs tối đa hóa biên độ giúp phân tách rõ ràng CRFs học sự tương quan giữa các nhãn đầu ra kề nhau giúp giải quyết sự nhập nhằng