4. 소개
• 2048 게임은 학습하기 쉽고 정복하
기 어려운 게임
• 2048 게임 수행 인공지능 개발
• 접근성을 높이기 위해 웹 상에서
인공지능 구현
5. 시스템 설명
• 기존 2048 게임 인터페이스를 활용
• 화살표 키를 이용한 수동 조작이 가능
• 인공지능을 선택해 현재 상태에서 대신 게임
을 진행하게 한다.
6. 사용한 알고리즘
• 1. Monte Carlo Tree Search
• Value iteration
• 랜덤 정책으로 현재 상태를 평가하여 가장 좋은 행동을 찾는다.
• 2. Expectimax Search
• 트리 기반 적대적 탐색 알고리즘
• 플레이어는 점수의 기대값을 최대화, 컴퓨터는 최소화
7. 사용한 알고리즘
• 3. TD-Afterstate + N-Tuple Networks
• N-tuple networks: 타일 위에 n-tuple을 겹쳐 놓고,
해당 위치에 있는 타일의 값을 이용해 상태의
가치를 계산함
• 강화 학습의 일종인 Temporal Difference Learning
방법으로 학습 시킴
• Szubert, Marcin, and Wojciech Jaśkowski. "Temporal difference learning of n-tuple networks for
the game 2048." 2014 IEEE Conference on Computational Intelligence and Games. IEEE, 2014.
8. 사용한 알고리즘
• 4. CNN 지도학습
• 5층 합성곱 신경망을 현재 보드에 대한 특징 추출기로 사용함
• 보드를 4x4x16 이미지 데이터 처럼 인코딩하여 모델에 입력함
• 기존 SOTA 모델(N-tuple network 기반)의 플레이 기록을 학습 데이터로 사용
• Naoki Kondo, Kiminori Matsuzaki, Playing Game 2048 with Deep Convolutional Neural Networks
Trained by Supervised Learning, Journal of Information Processing, 2019, Volume 27, Pages 340-
347, Released on J-STAGE April 15, 2019, Online ISSN 1882-6652