AIw13_Exercises.pptx

•Download as PPTX, PDF•

0 likes•2 views

Nguyễn Tiến

Exercises

Education

Bài tập tuần 13
Link nộp, hạn nộp và hướng dẫn: xem “Exercise guidance.docx”

Bài tập 1: Cài đặt Cross-Entropy method để huấn luyện agent hạ cánh trong LunarLander-v2
environment.
Yêu cầu: Sử dụng các reward thresholds (reward bounds) và network architectures khác
nhau và so sánh kết quả. Dùng Monitor wrapper class để quay lại quá trình chạy thử.
Gợi ý: Có thể sử dụng incomplete code được cung cấp (file “[INCOMPLETE]
week13_cross_entropy_CartPole.py”) và bổ sung missing parts.
Bài tập 2: Nếu cài đặt Cross-Entropy method để huấn luyện agent leo dốc trong
MountainCar-v0 environment, thì thời gian huấn luyện đến khi agent thực hiện được nhiệm
vụ sẽ có thể mất nhiều giờ. Thời gian này dài hơn rất nhiều so với Bài tập 1 (khoảng dưới vài
chục phút) dù sử dụng cùng reward bounds và network architectures.
Hãy giải thích lý do.

Recently uploaded

TIỂU LUẬN MÔN PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌClamluanvan.net Viết thuê luận văn

Bài tập lớn môn Văn hóa kinh doanh và tinh thần khởi nghiệp Trình bày về triế...lamluanvan.net Viết thuê luận văn

ĐỀ KIỂM TRA CUỐI KÌ 2 BIÊN SOẠN THEO ĐỊNH HƯỚNG ĐỀ BGD 2025 MÔN TOÁN 11 - CÁN...Nguyen Thanh Tu Collection

Đào tạo, bồi dưỡng phát triển viên chức Đài Truyền hình Việt Namlamluanvan.net Viết thuê luận văn

Báo cáo tốt nghiệp Đánh giá thực trạng an toàn vệ sinh lao động và rủi ro lao...lamluanvan.net Viết thuê luận văn

22 ĐỀ THI THỬ TUYỂN SINH TIẾNG ANH VÀO 10 SỞ GD – ĐT THÁI BÌNH NĂM HỌC 2023-2...Nguyen Thanh Tu Collection

GIỮ GÌN VÀ PHÁT HUY GIÁ TRỊ MỘT SỐ BÀI HÁT DÂN CA CÁC DÂN TỘC BẢN ĐỊA CHO HỌC...lamluanvan.net Viết thuê luận văn

Phân tích báo cáo tài chính tại công ty TNHH xây dựng và thương mại Thịnh Anlamluanvan.net Viết thuê luận văn

VẤN ĐỀ 12 VI PHẠM HÀNH CHÍNH VÀ.pptxGingvin36HC

Nhân vật người mang lốt cóc trong truyện cổ tích thần kỳ Việt Namlamluanvan.net Viết thuê luận văn

35 ĐỀ LUYỆN THI ĐÁNH GIÁ NĂNG LỰC ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH NĂM ...Nguyen Thanh Tu Collection

QUẢN LÝ TRUNG TÂM GIÁO DỤC NGHỀ NGHIỆP – GIÁO DỤC THƯỜNG XUYÊN HUYỆN LẬP THẠC...lamluanvan.net Viết thuê luận văn

Hoàn thiện hoạt động kiểm soát rủi ro tín dụng trong cho vay doanh nghiệp tại...lamluanvan.net Viết thuê luận văn

Hoàn thiện công tác kiểm soát chi NSNN qua Kho bạc Nhà nước huyện Tri Tôn – t...lamluanvan.net Viết thuê luận văn

Vận dụng thi pháp học vào phân tích truyện ngắn Chiếc thuyền ...lamluanvan.net Viết thuê luận văn

Everybody Up 1 - Unit 5 - worksheet grade 1mskellyworkmail

30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection

CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN HIỆU QUẢ HOẠT ĐỘNG CỦA NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN...lamluanvan.net Viết thuê luận văn

TỔNG HỢP HƠN 100 ĐỀ THI THỬ TỐT NGHIỆP THPT HÓA HỌC 2024 - TỪ CÁC TRƯỜNG, TRƯ...Nguyen Thanh Tu Collection

Recently uploaded (20)

TIỂU LUẬN MÔN PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC

Bài tập lớn môn Văn hóa kinh doanh và tinh thần khởi nghiệp Trình bày về triế...

ĐỀ KIỂM TRA CUỐI KÌ 2 BIÊN SOẠN THEO ĐỊNH HƯỚNG ĐỀ BGD 2025 MÔN TOÁN 11 - CÁN...

Đào tạo, bồi dưỡng phát triển viên chức Đài Truyền hình Việt Nam

Báo cáo tốt nghiệp Đánh giá thực trạng an toàn vệ sinh lao động và rủi ro lao...

22 ĐỀ THI THỬ TUYỂN SINH TIẾNG ANH VÀO 10 SỞ GD – ĐT THÁI BÌNH NĂM HỌC 2023-2...

GIỮ GÌN VÀ PHÁT HUY GIÁ TRỊ MỘT SỐ BÀI HÁT DÂN CA CÁC DÂN TỘC BẢN ĐỊA CHO HỌC...

Phân tích báo cáo tài chính tại công ty TNHH xây dựng và thương mại Thịnh An

VẤN ĐỀ 12 VI PHẠM HÀNH CHÍNH VÀ.pptx

Nhân vật người mang lốt cóc trong truyện cổ tích thần kỳ Việt Nam

35 ĐỀ LUYỆN THI ĐÁNH GIÁ NĂNG LỰC ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH NĂM ...

QUẢN LÝ TRUNG TÂM GIÁO DỤC NGHỀ NGHIỆP – GIÁO DỤC THƯỜNG XUYÊN HUYỆN LẬP THẠC...

Hoàn thiện hoạt động kiểm soát rủi ro tín dụng trong cho vay doanh nghiệp tại...

Hoàn thiện công tác kiểm soát chi NSNN qua Kho bạc Nhà nước huyện Tri Tôn – t...

Vận dụng thi pháp học vào phân tích truyện ngắn Chiếc thuyền ...

Everybody Up 1 - Unit 5 - worksheet grade 1

30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...

CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN HIỆU QUẢ HOẠT ĐỘNG CỦA NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN...

TỔNG HỢP HƠN 100 ĐỀ THI THỬ TỐT NGHIỆP THPT HÓA HỌC 2024 - TỪ CÁC TRƯỜNG, TRƯ...

AIw13_Exercises.pptx

1. Bài tập tuần 13 Link nộp, hạn nộp và hướng dẫn: xem “Exercise guidance.docx”

2. Bài tập 1: Cài đặt Cross-Entropy method để huấn luyện agent hạ cánh trong LunarLander-v2 environment. Yêu cầu: Sử dụng các reward thresholds (reward bounds) và network architectures khác nhau và so sánh kết quả. Dùng Monitor wrapper class để quay lại quá trình chạy thử. Gợi ý: Có thể sử dụng incomplete code được cung cấp (file “[INCOMPLETE] week13_cross_entropy_CartPole.py”) và bổ sung missing parts. Bài tập 2: Nếu cài đặt Cross-Entropy method để huấn luyện agent leo dốc trong MountainCar-v0 environment, thì thời gian huấn luyện đến khi agent thực hiện được nhiệm vụ sẽ có thể mất nhiều giờ. Thời gian này dài hơn rất nhiều so với Bài tập 1 (khoảng dưới vài chục phút) dù sử dụng cùng reward bounds và network architectures. Hãy giải thích lý do.

AIw13_Exercises.pptx

Recommended

Recommended

More Related Content

More from Nguyễn Tiến

More from Nguyễn Tiến (20)

Recently uploaded

Recently uploaded (20)

AIw13_Exercises.pptx