SlideShare a Scribd company logo
1 of 15
시스템종합설계
최종 발표
GPS 음영지역내에서 드론의 장애물 회피
자율비행 알고리즘 개발
인천대학교 산업경영공학과 문 준 혁
김 희 주
양 승 지
2022.06.09(목)
지도교수 : 인천대학교 산업경영공학과 김재곤 교수님
팀 : R&D(Reinforcement & Drone)
Contents
Ⅰ 서론
Ⅱ 드론 자율비행 서비스 제안
Ⅲ 드론 자율비행 서비스 구현 및 결과
Ⅳ 결론 및 기대효과
1. 서론 | 제안 배경 및 목적
• 최근 대형 건축물 및 교량에 대한 균열 탐지 및 이상 징후 탐지의 중요성 증가
• 주기적 점검을 위한 드론 전문가 고용 및 사전 답사 비용 감소 기대
• 현 AI 드론의 연구는 다양한 센서를 부착하여 중량 증가(체공 시간 감소)를 야기
• 실시간 상황을 반영한 인공지능 기술을 활용하여 드론의 기동 체계 개발을 제안
• 중국 등 주변국에서는 인공지능을 활용한 드론 자율비행에 대한 연구를 활발히 진행 중
프로젝트 제안 배경
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
1
Unity
- 3D 및 2D 비디오 게임의 개발 환경을 제공하는 게임 엔진
- 3D 애니메이션과 건축 시각화, VR, AI 등 인터랙티브 콘텐츠 제작
- 게임 엔진시장의 45% 이상 차지
- 물리법칙 구현, 다양한 3D 모델 및 기능 구매 가능, 비교적
간단하게 환경 제작 가능
2
1. 서론 | 사용 프로그램 소개
Unity ML-agent
- 유니티를 이용한 인공지능 에이전트 학습을 지원하는 도구
- 유니티를 이용하여 환경제작
- 강화학습으로 에이전트가 다양한 경험을 수행하며 학습
- agent와 환경이 action, state, reward 정보를 주고받게 하는 도구
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
이전 연구
센서
 거리, 위치, 이미지 센서를 이용한
t시점의 정보 전달
t시점의 Action에 따른
t+1시점의 State를 환경에 전달
t+1 시점의 센서데이터 수집
t = t + 1
1. 서론 | 드론 자율비행 선행 연구
센서
 위치, 이미지 센서를 이용한
t시점의 정보 전달
t시점의 Action에 따른
t+1시점의 State를 환경에 전달
t+1 시점의 센서데이터 수집
t = t + 1
제안 드론 시스템
거리 센서 제거
(약 800g의 중량 감소)
3
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
1. 서론 | CNN 모델 거리 예측기법
• YOLO 알고리즘의 Loss Function을 LiDAR센서를 통해 수집한 실
제 거리값과 예측 거리값의 차이를 줄이는 방향으로 학습을 진행
• 기존 시스템과 아이디어의 차이점
딥러닝을 활용한 단안 카메라 기반 실시간 물체 검출 및 거리 추정
• 거리 센서의 탈착으로 인한 드론 체공 시간 증가
 강화학습 드론 스스로가 환경 내에서 발생되는 다양한 상황을 미리 학습하여 실
시간으로 의사결정 가능
 거리 측정 센서(LiDAR Sensor)의 탈착으로 인한 중량 감소  체공 시간 증가
 Mission 수행 시간 증가를 야기
 실시간 이미지 처리를 통한 거리 측정 알고리즘 구축
 드론 전문 인력 양성 및 고용비용 등의 절감.
4
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안
이미지 데이터 수집
(카메라)
Scan Object Detection
삼각측량을 통한 실시간
드론의 절대 좌표 측정
Embedded PC Drone
실시간 DATA
Object - Drone 거리 예측
RL Agent
의사결정결과 도출
Sensor Data
드론의 UWB Anchor와
부착된 UWB Tag센서 간
거리
Yolo Model
Environment
실제 환경
5
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안 | 좌표 측정 모델
 UWB 센서 : UWB Anchor센서와 UWB Tag 센서간의 거리를 넘겨주는 센서
 UWB Tag센서의 절대좌표(GPS활용)와 드론에 부착된 4개의 Anchor센서와의 거리를 원의 반지름을 통해 계산
R1
(𝑋𝐴1−𝑋𝑇)2
+ (𝑌𝐴1−𝑌𝑇)2
+ (𝑍𝐴1−𝑍𝑇)2
= (𝑅1)2
(𝑋𝐴2−𝑋𝑇)2 + (𝑌𝐴2−𝑌𝑇)2 + (𝑍𝐴2−𝑍𝑇)2 = (𝑅2)2
(𝑋𝐴3−𝑋𝑇)2
+ (𝑌𝐴3−𝑌𝑇)2
+ (𝑍𝐴3−𝑍𝑇)2
= (𝑅3)2
(𝑋𝐴4−𝑋𝑇)2 + (𝑌𝐴4−𝑌𝑇)2 + (𝑍𝐴4−𝑍𝑇)2 = (𝑅4)2
Distance(𝑋𝐴1, 𝑋𝐴2), Distance(𝑋𝐴1, 𝑋𝐴3)
Distance(𝑋𝐴2, 𝑋𝐴3), Distance(𝑋𝐴3, 𝑋𝐴4)
Distance = 30cm
UWB Tag(GPS 좌표)를 통해
드론의 X, Y, Z 계산
6
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
2. 드론 비행 서비스 제안 | 강화학습 Agent
START
<Camera>
이미지 데이터 수집
객체 Detection
<UWB>
Tag센서와 Anchor 센서
사이 거리 데이터 수집
드론의 절대좌표 측정
벽과의 충돌했는가?
드론의 Action(X, Y, Z, θ)을 취한다.
Reward 계산
If 5m < 거리 < 10m
+ Reward
Object와의 거리 > 30m
- Reward
큰 - reward
7
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
 State  Action  Reward
8
3. 드론 비행 서비스 구현| 강화학습 설정
• Drone agent의 위치 벡터
• Drone agent의 속도 벡터
• Drone agent의 각속도 벡터
• Drone agent의 각도 벡터
• 현재 색칠된 큐브 개수
• 현재 reward - 이전 reward 값
• Drone agent의 X, Y, Z 이동값
• Y축 기준의 rotation(θ) 값
• 이동값 = 연속적인 행동
X,Y,Z값을 -1~1 사이로 정규화
그 값을 드론의 추력값으로 사용
 드론 행동 결정
• 기본 리워드  -0.01
: 행동결정 시간 단축
• 거리값이 멀거나 벽에 부딪힌 경우
: reward = -100f
• 드론이 계속 같은 화면 찍는 경우
현재 리워드=이전 리워드
: -reward
• reward = 스캔한 영역의 큐브개수
= raycast가 hit한 큐브개수
= 빨간색으로 변한 큐브개수
• SetReward(reward)
 한 스텝의 결과로 도출되는 보상에
입력값을 더함
• 에피소드 시작할 때
Drone, 원기둥, reward 초기화
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
Unity 시뮬레이션 환경 구현
9
3. 드론 비행 서비스 구현| 시뮬레이션 환경
• 원기둥을 스캔하는 강화학습 모델 구상 중(Small Project)
강화학습을 정의하기 위해 원기둥 환경을 큐브 여러 개로 쪼갬
┗ raycast 가 닿는 cube를 빨간색으로 변환
 raycast 범위는 드론의 카메라가 보는 화면만큼
 전면이 빨간 cube로 바뀌도록 학습
state : 드론의 위치,속도,각속도 벡터 + 색칠된 큐브개수 차이
action : 드론의 움직이는 방향(x,y,z값) + 회전각도(θ)
reward : raycast가 hit한 cube 수(=빨간 cube의 개수)
• raycast
게임오브젝트의 원점에서 설정한 방향으로 Ray를 날려
설정한 거리 이내에 물체가 있는지 없는지 충돌감지
게임오브젝트 위치, 방향, 충돌정보, 거리 필요
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
학습과정
3. 드론 비행 서비스 구현| 결과
raycast에 닿은 큐브의 색을 빨간색으로 변환
= Drone의 카메라가 스캔하는 영역으로 지정
 빨간색으로 변한 큐브의 수를 reward로 설정
 학습을 빨간색영역을 증가시켜나가는 방향으로 진행
강화학습 알고리즘 : PPO
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
10
결과
3. 드론 비행 서비스 구현| 결과
• ppo 알고리즘의 epsilon값 수정
• max-steps 수 증가
• 드론 action 값 범위 조정
• state로 넣어주는 값 추가
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
11
강화학습 알고리즘 : PPO
최종 리워드  168.xx
원기둥 절반 이상을 drone agent가 스캔
추후 드론 agent 자체의 각도 추가  성능 향상 효과
4. 결론 및 기대효과
1. Drone agent 강화학습  reward 많이 받는 방향으로 학습  빨간색 큐브가 많아지도록 학습됨을 확인
2. Episode 수 증가에 따른 reward 값 증가
1. 현재 드론을 조종하기 위한 인력 필요 + 사람이 볼 수 있는 시야 내에서 직접 조종으로 인한 비효율성
 강화학습으로 개선가능 및 비용 감소 효과
2. 거리센서 제거  드론 주행시간 증가  작업 효율성 증가
3. 기업 경쟁력 향상 효과 및 실제 환경에 적용 하여 기업의 고정 소모비용 감소 효과
1. 실제 드론에 강화학습으로 학습된 agent를 적용할 수 있는 embedded PC를 부착하여 Lab Test 실행
2. 이후 Yolo Model을 활용하여 실제 환경에서 거리 값을 계산하며, 스캔할 대상인지 판별하는 모델 제작
12
드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
감사합니다

More Related Content

Similar to 시스템종합설계_R&D_최종발표자료.pptx

0425 꽃길만걷자 조
0425 꽃길만걷자 조0425 꽃길만걷자 조
0425 꽃길만걷자 조김 유정
 
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...Gyubin Son
 
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법Joo-Haeng Lee
 
고해상도 위성영상을 이용한 smart주제도 생성
고해상도 위성영상을 이용한 smart주제도 생성고해상도 위성영상을 이용한 smart주제도 생성
고해상도 위성영상을 이용한 smart주제도 생성Hyun Jik LEE
 
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개[대전AI포럼] 위성영상 분석 기술 개발 현황 소개
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개Taegyun Jeon
 
Odin_CCTV based population counting platform
Odin_CCTV based population counting platformOdin_CCTV based population counting platform
Odin_CCTV based population counting platformSangwook Park
 
A.I.S팀_산학프로젝트챌린지 (2).pptx
A.I.S팀_산학프로젝트챌린지 (2).pptxA.I.S팀_산학프로젝트챌린지 (2).pptx
A.I.S팀_산학프로젝트챌린지 (2).pptxssuser0e717a
 
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)Joo-Haeng Lee
 
지능 Baram 보고서
지능 Baram 보고서지능 Baram 보고서
지능 Baram 보고서NAVER D2
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강Minji Kang
 
인공지능 식별추적시스템 성능 검증 평가 사례
인공지능 식별추적시스템 성능 검증 평가 사례 인공지능 식별추적시스템 성능 검증 평가 사례
인공지능 식별추적시스템 성능 검증 평가 사례 IMQA
 
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화YoungSu Son
 
최종 3조 황색봉투_수거차량_최적화
최종 3조 황색봉투_수거차량_최적화 최종 3조 황색봉투_수거차량_최적화
최종 3조 황색봉투_수거차량_최적화 seunghwankim52
 
하둡-맵리듀스 튜닝 방법
하둡-맵리듀스 튜닝 방법하둡-맵리듀스 튜닝 방법
하둡-맵리듀스 튜닝 방법Yunsu Lee
 
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개Byeong-Hyeok Yu
 
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석재현 최
 
[완료]Beacon을 이용한 indoor_positioning_visualization_service
[완료]Beacon을 이용한 indoor_positioning_visualization_service[완료]Beacon을 이용한 indoor_positioning_visualization_service
[완료]Beacon을 이용한 indoor_positioning_visualization_servicealcoholithm
 
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptxLINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptxssuser20022f
 

Similar to 시스템종합설계_R&D_최종발표자료.pptx (20)

0425 꽃길만걷자 조
0425 꽃길만걷자 조0425 꽃길만걷자 조
0425 꽃길만걷자 조
 
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
[paper review] 손규빈 - Eye in the sky & 3D human pose estimation in video with ...
 
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
간단한 기구부와 결합한 공간증강현실 시스템의 샘플 기반 제어 방법
 
고해상도 위성영상을 이용한 smart주제도 생성
고해상도 위성영상을 이용한 smart주제도 생성고해상도 위성영상을 이용한 smart주제도 생성
고해상도 위성영상을 이용한 smart주제도 생성
 
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개[대전AI포럼] 위성영상 분석 기술 개발 현황 소개
[대전AI포럼] 위성영상 분석 기술 개발 현황 소개
 
Odin_CCTV based population counting platform
Odin_CCTV based population counting platformOdin_CCTV based population counting platform
Odin_CCTV based population counting platform
 
A.I.S팀_산학프로젝트챌린지 (2).pptx
A.I.S팀_산학프로젝트챌린지 (2).pptxA.I.S팀_산학프로젝트챌린지 (2).pptx
A.I.S팀_산학프로젝트챌린지 (2).pptx
 
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
공간증강현실을 이용한 곡선의 디자인 (HCI Korea 2013)
 
Flood
FloodFlood
Flood
 
지능 Baram 보고서
지능 Baram 보고서지능 Baram 보고서
지능 Baram 보고서
 
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 Ppt 선수강
 
인공지능 식별추적시스템 성능 검증 평가 사례
인공지능 식별추적시스템 성능 검증 평가 사례 인공지능 식별추적시스템 성능 검증 평가 사례
인공지능 식별추적시스템 성능 검증 평가 사례
 
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화
인공지능 식별추적시스템 실증랩 구축및 운영 - 평가모델 고도화
 
최종 3조 황색봉투_수거차량_최적화
최종 3조 황색봉투_수거차량_최적화 최종 3조 황색봉투_수거차량_최적화
최종 3조 황색봉투_수거차량_최적화
 
하둡-맵리듀스 튜닝 방법
하둡-맵리듀스 튜닝 방법하둡-맵리듀스 튜닝 방법
하둡-맵리듀스 튜닝 방법
 
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
공간정보 분야 드론 활용사례 및 오픈드론맵(OpenDroneMap) 소개
 
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석[pycon korea 2018]  드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
[pycon korea 2018] 드론 및 인공위성 영상을 이용한 태양광발전소 입지분석
 
[완료]Beacon을 이용한 indoor_positioning_visualization_service
[완료]Beacon을 이용한 indoor_positioning_visualization_service[완료]Beacon을 이용한 indoor_positioning_visualization_service
[완료]Beacon을 이용한 indoor_positioning_visualization_service
 
Jeongheetaek p
Jeongheetaek pJeongheetaek p
Jeongheetaek p
 
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptxLINC3.0 캡스톤디자인 경진대회_로운팀.pptx
LINC3.0 캡스톤디자인 경진대회_로운팀.pptx
 

시스템종합설계_R&D_최종발표자료.pptx

  • 1. 시스템종합설계 최종 발표 GPS 음영지역내에서 드론의 장애물 회피 자율비행 알고리즘 개발 인천대학교 산업경영공학과 문 준 혁 김 희 주 양 승 지 2022.06.09(목) 지도교수 : 인천대학교 산업경영공학과 김재곤 교수님 팀 : R&D(Reinforcement & Drone)
  • 2. Contents Ⅰ 서론 Ⅱ 드론 자율비행 서비스 제안 Ⅲ 드론 자율비행 서비스 구현 및 결과 Ⅳ 결론 및 기대효과
  • 3. 1. 서론 | 제안 배경 및 목적 • 최근 대형 건축물 및 교량에 대한 균열 탐지 및 이상 징후 탐지의 중요성 증가 • 주기적 점검을 위한 드론 전문가 고용 및 사전 답사 비용 감소 기대 • 현 AI 드론의 연구는 다양한 센서를 부착하여 중량 증가(체공 시간 감소)를 야기 • 실시간 상황을 반영한 인공지능 기술을 활용하여 드론의 기동 체계 개발을 제안 • 중국 등 주변국에서는 인공지능을 활용한 드론 자율비행에 대한 연구를 활발히 진행 중 프로젝트 제안 배경 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발 1
  • 4. Unity - 3D 및 2D 비디오 게임의 개발 환경을 제공하는 게임 엔진 - 3D 애니메이션과 건축 시각화, VR, AI 등 인터랙티브 콘텐츠 제작 - 게임 엔진시장의 45% 이상 차지 - 물리법칙 구현, 다양한 3D 모델 및 기능 구매 가능, 비교적 간단하게 환경 제작 가능 2 1. 서론 | 사용 프로그램 소개 Unity ML-agent - 유니티를 이용한 인공지능 에이전트 학습을 지원하는 도구 - 유니티를 이용하여 환경제작 - 강화학습으로 에이전트가 다양한 경험을 수행하며 학습 - agent와 환경이 action, state, reward 정보를 주고받게 하는 도구 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 5. 이전 연구 센서  거리, 위치, 이미지 센서를 이용한 t시점의 정보 전달 t시점의 Action에 따른 t+1시점의 State를 환경에 전달 t+1 시점의 센서데이터 수집 t = t + 1 1. 서론 | 드론 자율비행 선행 연구 센서  위치, 이미지 센서를 이용한 t시점의 정보 전달 t시점의 Action에 따른 t+1시점의 State를 환경에 전달 t+1 시점의 센서데이터 수집 t = t + 1 제안 드론 시스템 거리 센서 제거 (약 800g의 중량 감소) 3 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 6. 1. 서론 | CNN 모델 거리 예측기법 • YOLO 알고리즘의 Loss Function을 LiDAR센서를 통해 수집한 실 제 거리값과 예측 거리값의 차이를 줄이는 방향으로 학습을 진행 • 기존 시스템과 아이디어의 차이점 딥러닝을 활용한 단안 카메라 기반 실시간 물체 검출 및 거리 추정 • 거리 센서의 탈착으로 인한 드론 체공 시간 증가  강화학습 드론 스스로가 환경 내에서 발생되는 다양한 상황을 미리 학습하여 실 시간으로 의사결정 가능  거리 측정 센서(LiDAR Sensor)의 탈착으로 인한 중량 감소  체공 시간 증가  Mission 수행 시간 증가를 야기  실시간 이미지 처리를 통한 거리 측정 알고리즘 구축  드론 전문 인력 양성 및 고용비용 등의 절감. 4 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 7. 2. 드론 비행 서비스 제안 이미지 데이터 수집 (카메라) Scan Object Detection 삼각측량을 통한 실시간 드론의 절대 좌표 측정 Embedded PC Drone 실시간 DATA Object - Drone 거리 예측 RL Agent 의사결정결과 도출 Sensor Data 드론의 UWB Anchor와 부착된 UWB Tag센서 간 거리 Yolo Model Environment 실제 환경 5 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 8. 2. 드론 비행 서비스 제안 | 좌표 측정 모델  UWB 센서 : UWB Anchor센서와 UWB Tag 센서간의 거리를 넘겨주는 센서  UWB Tag센서의 절대좌표(GPS활용)와 드론에 부착된 4개의 Anchor센서와의 거리를 원의 반지름을 통해 계산 R1 (𝑋𝐴1−𝑋𝑇)2 + (𝑌𝐴1−𝑌𝑇)2 + (𝑍𝐴1−𝑍𝑇)2 = (𝑅1)2 (𝑋𝐴2−𝑋𝑇)2 + (𝑌𝐴2−𝑌𝑇)2 + (𝑍𝐴2−𝑍𝑇)2 = (𝑅2)2 (𝑋𝐴3−𝑋𝑇)2 + (𝑌𝐴3−𝑌𝑇)2 + (𝑍𝐴3−𝑍𝑇)2 = (𝑅3)2 (𝑋𝐴4−𝑋𝑇)2 + (𝑌𝐴4−𝑌𝑇)2 + (𝑍𝐴4−𝑍𝑇)2 = (𝑅4)2 Distance(𝑋𝐴1, 𝑋𝐴2), Distance(𝑋𝐴1, 𝑋𝐴3) Distance(𝑋𝐴2, 𝑋𝐴3), Distance(𝑋𝐴3, 𝑋𝐴4) Distance = 30cm UWB Tag(GPS 좌표)를 통해 드론의 X, Y, Z 계산 6 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 9. 2. 드론 비행 서비스 제안 | 강화학습 Agent START <Camera> 이미지 데이터 수집 객체 Detection <UWB> Tag센서와 Anchor 센서 사이 거리 데이터 수집 드론의 절대좌표 측정 벽과의 충돌했는가? 드론의 Action(X, Y, Z, θ)을 취한다. Reward 계산 If 5m < 거리 < 10m + Reward Object와의 거리 > 30m - Reward 큰 - reward 7 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 10.  State  Action  Reward 8 3. 드론 비행 서비스 구현| 강화학습 설정 • Drone agent의 위치 벡터 • Drone agent의 속도 벡터 • Drone agent의 각속도 벡터 • Drone agent의 각도 벡터 • 현재 색칠된 큐브 개수 • 현재 reward - 이전 reward 값 • Drone agent의 X, Y, Z 이동값 • Y축 기준의 rotation(θ) 값 • 이동값 = 연속적인 행동 X,Y,Z값을 -1~1 사이로 정규화 그 값을 드론의 추력값으로 사용  드론 행동 결정 • 기본 리워드  -0.01 : 행동결정 시간 단축 • 거리값이 멀거나 벽에 부딪힌 경우 : reward = -100f • 드론이 계속 같은 화면 찍는 경우 현재 리워드=이전 리워드 : -reward • reward = 스캔한 영역의 큐브개수 = raycast가 hit한 큐브개수 = 빨간색으로 변한 큐브개수 • SetReward(reward)  한 스텝의 결과로 도출되는 보상에 입력값을 더함 • 에피소드 시작할 때 Drone, 원기둥, reward 초기화 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 11. Unity 시뮬레이션 환경 구현 9 3. 드론 비행 서비스 구현| 시뮬레이션 환경 • 원기둥을 스캔하는 강화학습 모델 구상 중(Small Project) 강화학습을 정의하기 위해 원기둥 환경을 큐브 여러 개로 쪼갬 ┗ raycast 가 닿는 cube를 빨간색으로 변환  raycast 범위는 드론의 카메라가 보는 화면만큼  전면이 빨간 cube로 바뀌도록 학습 state : 드론의 위치,속도,각속도 벡터 + 색칠된 큐브개수 차이 action : 드론의 움직이는 방향(x,y,z값) + 회전각도(θ) reward : raycast가 hit한 cube 수(=빨간 cube의 개수) • raycast 게임오브젝트의 원점에서 설정한 방향으로 Ray를 날려 설정한 거리 이내에 물체가 있는지 없는지 충돌감지 게임오브젝트 위치, 방향, 충돌정보, 거리 필요 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발
  • 12. 학습과정 3. 드론 비행 서비스 구현| 결과 raycast에 닿은 큐브의 색을 빨간색으로 변환 = Drone의 카메라가 스캔하는 영역으로 지정  빨간색으로 변한 큐브의 수를 reward로 설정  학습을 빨간색영역을 증가시켜나가는 방향으로 진행 강화학습 알고리즘 : PPO 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발 10
  • 13. 결과 3. 드론 비행 서비스 구현| 결과 • ppo 알고리즘의 epsilon값 수정 • max-steps 수 증가 • 드론 action 값 범위 조정 • state로 넣어주는 값 추가 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발 11 강화학습 알고리즘 : PPO 최종 리워드  168.xx 원기둥 절반 이상을 drone agent가 스캔 추후 드론 agent 자체의 각도 추가  성능 향상 효과
  • 14. 4. 결론 및 기대효과 1. Drone agent 강화학습  reward 많이 받는 방향으로 학습  빨간색 큐브가 많아지도록 학습됨을 확인 2. Episode 수 증가에 따른 reward 값 증가 1. 현재 드론을 조종하기 위한 인력 필요 + 사람이 볼 수 있는 시야 내에서 직접 조종으로 인한 비효율성  강화학습으로 개선가능 및 비용 감소 효과 2. 거리센서 제거  드론 주행시간 증가  작업 효율성 증가 3. 기업 경쟁력 향상 효과 및 실제 환경에 적용 하여 기업의 고정 소모비용 감소 효과 1. 실제 드론에 강화학습으로 학습된 agent를 적용할 수 있는 embedded PC를 부착하여 Lab Test 실행 2. 이후 Yolo Model을 활용하여 실제 환경에서 거리 값을 계산하며, 스캔할 대상인지 판별하는 모델 제작 12 드론을 통한 음영지역내 강화학습 기반 주행 경로 추정 알고리즘 개발

Editor's Notes

  1. https://img0.yna.co.kr/etc/inner/KR/2021/06/04/AKR20210604169300072_01_i_P4.jpg
  2. https://www.koreascience.or.kr/article/JAKO201933751283944.pdf
  3. 앵커 : 기준이 되는 곳에 위치시키는 것 태그 : 앵커와의 거리를 재려고 이동하는 물체에 부착 태그가 전파를 쏘고 앵커가 그 전파를 받을 때 생기는 시간차로 두 지점사이의 거리를 구한다