- 프로젝트명 : 광산캐기
- 발표 제목 : Reinforcement Learning Tutorial for Minecraft
- 발표자: 이영무 - 네이버
- 내용 요약 : 강화학습을 이용해서 마인크래프트를 학습시켜보면서 마주쳤던 문제들을 공유하고 조금 더 쉽게 마인크래프트를 할 수 있도록 만들어진 환경을 소개합니다. 이런 환경으로 학습해 본 경험을 공유하여 마인크래프트를 학습하는 환경을 쉽게 접하는데 도움이 되었으면 합니다.
12. Malmo: Examples
● 많은 예제들이 있음
● 대부분이 룰 기반으로 환경을 품
● 딥러닝 예제는 들어있지 않음
● 강화학습 예제는 tabular-q-learning 하나 뿐임
● 그래도 있을 건 다 있다!
(ex. 환경의 속도를 변화, dynamic한 환경 구성 등)
15. 서버에서 말모 실행
● 도커를 이용해서
서버에서 실행할 수 있음
● Dockerfile 제공
(https://github.com/reinforce
ment-learning-
kr/minecraft_rl_tutorial/blob/
master/docker/Dockerfile)
● Docker guide 제공
18. Malmo의 단점
● 환경이 불안정한 경우가 많다.
○ 학습을 하다가 연결이 종료되는 경우 (윈도우)
○ 에피소드 종료 후 이미 client가 연결되어 있다면서 실행되지 않는 경우
● 컴퓨터의 성능에 따라 결과가 달라짐
○ 렌더링 속도에 따라 결과가 달라짐
○ 서버에서는 점수가 잘 나오지만 로컬에서 점수가 안나오는 경우도 있음
● 보기 편한 Document가 없다.