Cnn project

CNN과 아두이노를 이용한 국가
별 글자분류
머신러닝 프로젝트
Machine Learning
Copyright 2018. 박성민 all rights reserved.
dueras@naver.com

1
2
3
4
5
6
7
8
목차
목표 & 목적
이미지 데이터
파이썬 코드
아두이노
이미지 회전
이미지 전처리
결론
배운점 & 느낀점
Machine Learning

목 표
글자 하나의 이미지와 CNN을 이용하여 국가별로 언어 분류하기
Machine Learning
동영상

목 적
이미지 데이터의 처리 방법을 알아보기 위해
CNN의 실습을 위하여
아두이노 공부를 위해서
Machine Learning

한글, 영어 알파벳, 일본어 히라가나 각 26개의 문자에 대하여 5개의 서로 다른 폰트를
가진 문자 이미지를 학습데이터로 사용. (언어당 130개의 이미지 이용)
언어 이미지 데이터
Machine Learning

언어별로 26개의 문자에 대해 5개의 폰트 문자 이미지 사용
한글 : 가, 긔, 냐, 더, 됐, 려, 모, 뵤, 수, 왁, 유, 즈, 총, 치, 컬, 콰, 퇘, 패, 헤, 혼, 롤, 짝, 원, 찬, 술, 약
(폰트 : 맑은고딕, 휴먼매직체, 궁서, HY얇은샘물M, HY견명조)
영어 알파벳 : A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z
(폰트 : 맑은고딕, cambria math, 궁서, HY얇은샘물M, HY견명조)
일본어 히라가나 : あ, い, う, え, お, か, き, く, け, こ, さ, し, す, せ, そ, た, ち, つ, て, と,な, に, ぬ, ね, の, は
(폰트 : HY견고딕, HY신명조, Aria Unicode MS, 궁서, 휴먼모음T)
언어 이미지 데이터
Machine Learning

Python code – Data.py
Machine Learning

Python code – Cnn_ard_project.py (CNN Part)
Machine Learning

Python code – Cnn_ard_project.py (Main Part – CNN train & test)
Machine Learning

Python code – Cnn_ard_project.py (Main Part – 아두이노 serial & camera)
Machine Learning

Python code – Cnn_ard_project.py (Main Part – real data classification)
Machine Learning

Arduino code – include & setup()
Machine Learning

Arduino code – servoFunc() [서보모터 작동위한 함수]
Machine Learning

Arduino code – loop() [서보모터 초기화 & serial 통신 & 서보모터 작동]
Machine Learning

Arduino code – loop() [서보모터 원위치로 초기화 하는 부분]
Machine Learning

Arduino 구조
Machine Learning
파란색 서보모터
myservo2
검은색 서보모터
myservo1
카메라

Arduino 구조
아두이노 배선 (왼쪽 모터가 myservo1, 오른쪽 모터가 myservo2)
Machine Learning

이미지 데이터 회전
이미지 데이터에 회전이 적용되기 전의 코드 - Data.py
Machine Learning

이미지 데이터 회전
이미지 데이터에 회전이 적용된 후의 코드 – Data.py
Machine Learning

이미지 데이터 회전 - 이유
Machine Learning
데이터의 양을 증가시켜 학습이 더 잘 이루어 지도록 하기 위해
실제 예측 시 회전 된 경우도 더 잘 예측할 수 있도록 하기 위해
데이터 회전을 시키지 않아도 학습 데이터에 대해서만은 학습이 잘 됨

이미지 데이터 2진화
이미지 데이터 2진화 전 후 비교
(2진화 전 후의 코드)
Machine Learning
이미지 데이터 2진화 하기 전
(흑 – 0, 백 – 255 의 값을 가진다.)
이미지 데이터 2진화 한 후
(흑 – 0, 백 – 1 의 값을 가진다.)

동일한 신경망, 학습 률 = 0.001, epoch = 15, batch = 64으로 학습시킨 결과.
2진화가 되지 않은 데이터에 대해서는 정확도가 0.3xxx 이후로 높아지지 않는다.
2진화가 된 데이터에 대해서는 15epoch동안 loss가 계속 감소하고 정확도 역시 높아진다.
Machine Learning
이미지 데이터 2진화 하기 전
이미지 데이터 2진화 한 후

Machine Learning
흑백이미지의 경우라서 2진화를 적용하였고 컬러이미지의 경우 정규화 등을 통
해 값의 차이가 크지 않은 일정 범위 안에 데이터가 분포 되도록 하면 된다. (ex.
0 ~ 1사이로 피처 값이 분포 되도록 함.)
위의 코드에서는 데이터의 2진화 기준으로 이미지 피처 값의 평균을 사용
했지만 상황에 따라 적절하다 싶은 값으로 변경하여 사용해도 된다.
2진화 전 데이터 피처 값이 0과 255로 검은색과 흰색간 값의 차이가 너무
크다. 그래서 convolution 적용할 경우 0의 값을 가진 흑색 피처 값의
영향력이 너무 적어 학습이 잘 이루어 지지 않음.(개인적인 견해)

결론(개인적인 견해)
Machine Learning
이미지 데이터에 대해서는 주변 픽셀 값들의 영향을 많이 받기 때문에
convolution을 사용하였고 주변 픽셀들간의 값 차이가 클 경우 학습이 잘 이루어
지지 않을 수 있기 때문에 학습에 사용한 흑백 이미지에 대해 2진화 하였다.
회전된 이미지의 데이터를 추가하지 않아도 학습 데이터에 대해서만은
학습이 잘 된다. 그러나 데이터의 양을 증가시켜 학습이 더 잘 이루어
지도록 하고 실제 예측 시 회전 된 경우도 더 잘 예측할 수 있도록 하기
위해 회전 된 이미지를 추가해 줬다.
이미지 데이터에 대해 회전만 적용한 것이 아니라 확대, 축소도 적용한 데
이터를 추가로 학습 하면 실생활에서 더 정확하게 예측 할 수 있다.

Machine Learning
배운점 & 느낀점
아두이노를 이용하여 실제 데이터에 대해 머신러닝으로 예측 해보았고 결과가 생각보다 좋게 나타났다.
머신러닝이 실제 사회에서도 적용 될 수 있다는 생각이 더욱 커졌다.
하나의 글자 이미지에 대해 분류하는 프로젝트를 진행 하였지만 윤곽 추출 등을 사용하여 여러
개의 글자로 이루어진 문장에 대해서도 국가별 언어 분류를 실행 할 수 있다.
(여러 언어가 섞여있는 문장의 경우 글자 수로 판별 하는 등의 방법 이용.)

THANK YOU
CNN Arduino Project
Machine Learning

Cnn project

Recommended

Recommended

More Related Content

Similar to Cnn project

Similar to Cnn project (20)

Cnn project