SlideShare a Scribd company logo
1 of 15
Download to read offline
Project Proposal
Team: Argo
B411051 김종욱
B471008 김지현
Sign language recognition translator
Sign language recognition translator
프로젝트 제목 : A Real-time Sign language recognition translator (실시간 수화 인식 번역기)
프로젝트 목적 : Gesture recognition과 신경망 모델(CNN, RNN) 활용
è 청각 장애인들의 의사소통을 돕는 AI 앱 / 소프트웨어 개발
Sign Language Recognition translator
개발 내용 및 방법
개발 내용
• 스마트폰의 카메라를 이용하여 수화 동작 인식
• 모바일 디바이스에서 추론이 가능하도록 머신 러닝 모델을 사용한 지능형 앱 구현
• 인식한 동작에 대한 결과를 텍스트로 화면에 출력
개발 환경
- iOS / MacOS(MacBook Pro 13 inch, 2018 과 MacBook Pro Retina 13 inch, Early 2015)
언어: C++ , Swift, Python
Development details and methods
- 개발 방법
신경망 모델 + OpenCV + Mediapipe + Core ML 활용
• 신경망 모델 training / test data 제작
• Hand detection을 위해 Google ML framework (Mediapipe) 사용
• CNN/RNN을 이용한 신경망 모델 제작
• Web Server를 만든 이후 학습이 완료된 신경망 모델을 Web Server에 구축함
• Apple ML framework (CoreML)을 사용하여 모바일 디바이스에 학습이 완료된 신경망 모델을 구축함
• 수화 인식률을 높이기 위한 다양한 테스트 시행
Development details and methods
Difficulties
Sign Language Recognition translator
예상되는 결과물
Gesture to Text or Audio
“
Simple UX/UI
동작을 인식할 구간을 카메라 버튼으로 지정
인식한 결과를 텍스트나 오디오로 출력
1. Take a video of
sign language
2. Train a machine
learning model
3. Recognize gestures and
display text on app
What time is it?
Project model flow
이 름 역할
김종욱
• 딥러닝 모델 분석 및 수정(영상데이터에서 단어 추출)
• 머신 러닝 모델 앱 통합 (CoreML 활용)
• 데이터 전처리(Hand detection API에서 들어오는 데이터를 처리하는 방법 구현)
• 웹 서버 구축
• 학습/테스트용 데이터 만들기
김지현
• iOS 앱 개발(UX/UI)
• 머신 러닝 모델 앱 통합 (CoreML 활용)
• Hand detection API수정(OpenAPI를 프로젝트의 방향에 알맞게 수정하는 작업이 필요)
• 문장 생성 언어 모델 분석 및 수정(추출된 단어를 이용하여 문장을 생성)
• 학습/테스트용 데이터 만들기
팀원 별 업무 분담 및 일정
Sign Language Recognition translator
현재까지 개발한 내용
현재까지 개발한 내용
1. 기존의 RNN과 CNN을 이용한 수화 인식 신경망 모델을 활용하여 (github 소스코드 참고)
수화 단어(아르헨티나) 12개를 학습시키고 결과값 도출
기존 모델 정확도 87.3%
è 기존의 수화 인식 신경망 모델 수정 / 개선이 필요
자체 제작한 데이터셋으로 학습 / 평가가 필요
현재까지 개발한 내용
2. Google의 hand tracking 오픈소스를 활용하여 손 인식 수행
아이폰에서 hand tracking 테스트
è 나오는 손의 좌표 값들의 사용 방법 연구 필요
Reference
• 수화 인식 신경망 모델 코드
https://github.com/hthuwal/sign-language-gesture-recognition
• Google AI에서 공개한 hand tracking 코드
https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md
Thank You

More Related Content

What's hot

멘탈모델 1-3장 자료
멘탈모델 1-3장 자료멘탈모델 1-3장 자료
멘탈모델 1-3장 자료beom kyun choi
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗BOAZ Bigdata
 
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案Hua Chu
 
Q Learning과 CNN을 이용한 Object Localization
Q Learning과 CNN을 이용한 Object LocalizationQ Learning과 CNN을 이용한 Object Localization
Q Learning과 CNN을 이용한 Object Localization홍배 김
 
From REINFORCE to PPO
From REINFORCE to PPOFrom REINFORCE to PPO
From REINFORCE to PPOWoong won Lee
 
Introduction to Tree-LSTMs
Introduction to Tree-LSTMsIntroduction to Tree-LSTMs
Introduction to Tree-LSTMsDaniel Perez
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우NAVER D2
 
Deprecating the state machine: building conversational AI with the Rasa stack...
Deprecating the state machine: building conversational AI with the Rasa stack...Deprecating the state machine: building conversational AI with the Rasa stack...
Deprecating the state machine: building conversational AI with the Rasa stack...PyData
 
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for UnrealKyu-sung Choi
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)BOAZ Bigdata
 
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlow
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlowHorovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlow
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlowDatabricks
 
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI ) 파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI ) Yunho Maeng
 
Python과 node.js기반 데이터 분석 및 가시화
Python과 node.js기반 데이터 분석 및 가시화Python과 node.js기반 데이터 분석 및 가시화
Python과 node.js기반 데이터 분석 및 가시화Tae wook kang
 
The concept of translational research and the role of hospital 2013-09-12 b...
The concept of translational research and the role of hospital   2013-09-12 b...The concept of translational research and the role of hospital   2013-09-12 b...
The concept of translational research and the role of hospital 2013-09-12 b...석관 김
 
딥러닝을 이용한 얼굴 인식
딥러닝을 이용한 얼굴 인식딥러닝을 이용한 얼굴 인식
딥러닝을 이용한 얼굴 인식if kakao
 
Trends_of_MLOps_tech_in_business
Trends_of_MLOps_tech_in_businessTrends_of_MLOps_tech_in_business
Trends_of_MLOps_tech_in_businessSANG WON PARK
 
Scrum Görsel Kılavuzu
Scrum Görsel KılavuzuScrum Görsel Kılavuzu
Scrum Görsel KılavuzuACM
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇BOAZ Bigdata
 
카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기if kakao
 

What's hot (20)

멘탈모델 1-3장 자료
멘탈모델 1-3장 자료멘탈모델 1-3장 자료
멘탈모델 1-3장 자료
 
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
제 19회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [COLLABO-AZ] : 고객 세그멘테이션 기반 개인 맞춤형 추천시스템 for 루빗
 
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案
TWJUG 2016 - Mogilefs, 簡約可靠的儲存方案
 
Q Learning과 CNN을 이용한 Object Localization
Q Learning과 CNN을 이용한 Object LocalizationQ Learning과 CNN을 이용한 Object Localization
Q Learning과 CNN을 이용한 Object Localization
 
From REINFORCE to PPO
From REINFORCE to PPOFrom REINFORCE to PPO
From REINFORCE to PPO
 
Introduction to Tree-LSTMs
Introduction to Tree-LSTMsIntroduction to Tree-LSTMs
Introduction to Tree-LSTMs
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
 
Deprecating the state machine: building conversational AI with the Rasa stack...
Deprecating the state machine: building conversational AI with the Rasa stack...Deprecating the state machine: building conversational AI with the Rasa stack...
Deprecating the state machine: building conversational AI with the Rasa stack...
 
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal
게임엔진과 공간정보 3D 콘텐츠 융합 : Cesium for Unreal
 
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)
제 17회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [힐링세포들] : MHTI (Mental Health Type Indicator)
 
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlow
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlowHorovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlow
Horovod: Uber’s Open Source Distributed Deep Learning Framework for TensorFlow
 
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI ) 파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
파이썬(Python) 으로 나만의 딥러닝 API 만들기 강좌 (Feat. AutoAI )
 
Python과 node.js기반 데이터 분석 및 가시화
Python과 node.js기반 데이터 분석 및 가시화Python과 node.js기반 데이터 분석 및 가시화
Python과 node.js기반 데이터 분석 및 가시화
 
Bleu vs rouge
Bleu vs rougeBleu vs rouge
Bleu vs rouge
 
The concept of translational research and the role of hospital 2013-09-12 b...
The concept of translational research and the role of hospital   2013-09-12 b...The concept of translational research and the role of hospital   2013-09-12 b...
The concept of translational research and the role of hospital 2013-09-12 b...
 
딥러닝을 이용한 얼굴 인식
딥러닝을 이용한 얼굴 인식딥러닝을 이용한 얼굴 인식
딥러닝을 이용한 얼굴 인식
 
Trends_of_MLOps_tech_in_business
Trends_of_MLOps_tech_in_businessTrends_of_MLOps_tech_in_business
Trends_of_MLOps_tech_in_business
 
Scrum Görsel Kılavuzu
Scrum Görsel KılavuzuScrum Görsel Kılavuzu
Scrum Görsel Kılavuzu
 
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
제 16회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [#인스타툰 팀] : 해시태그 기반 인스타툰 추천 챗봇
 
카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기카카오뱅크 모바일앱 개발 이야기
카카오뱅크 모바일앱 개발 이야기
 

Similar to 수화 인식 자동 번역 iOS 앱 프로젝트 제안서

안드로이드 개발하기_1st
안드로이드 개발하기_1st안드로이드 개발하기_1st
안드로이드 개발하기_1stEunGi Hong
 
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)Amazon Web Services Korea
 
모바일앱개발 교육자료
모바일앱개발 교육자료모바일앱개발 교육자료
모바일앱개발 교육자료JinHyuck Churn
 
차세대 웹비즈니스를 위한 "HTML5"
차세대 웹비즈니스를 위한 "HTML5"차세대 웹비즈니스를 위한 "HTML5"
차세대 웹비즈니스를 위한 "HTML5"Changhwan Yi
 
my activities before getting a job
my activities before getting a jobmy activities before getting a job
my activities before getting a jobDeo Kim
 
Web app service project
Web app service projectWeb app service project
Web app service projectJongmyoung Kim
 
포트폴리오 김규하
포트폴리오 김규하포트폴리오 김규하
포트폴리오 김규하GyooHa Kim
 
Android Developer JeongJaeyun
Android Developer JeongJaeyunAndroid Developer JeongJaeyun
Android Developer JeongJaeyunjaeyunjeong1
 
DzinnyPing(포트폴리오)-정재훈
DzinnyPing(포트폴리오)-정재훈DzinnyPing(포트폴리오)-정재훈
DzinnyPing(포트폴리오)-정재훈jung jaehun
 
황규영 포트폴리오
황규영 포트폴리오황규영 포트폴리오
황규영 포트폴리오Q_0
 
[Seoultech] Mobile Security & Security Testing(Eng)
[Seoultech] Mobile Security & Security Testing(Eng)[Seoultech] Mobile Security & Security Testing(Eng)
[Seoultech] Mobile Security & Security Testing(Eng)ri3box
 
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)Amazon Web Services Korea
 
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼MarketingUracle
 
하이브리드 앱 개발 개요
하이브리드 앱 개발 개요하이브리드 앱 개발 개요
하이브리드 앱 개발 개요Sohee Jeong
 
React native development
React native developmentReact native development
React native developmentSangSun Park
 
2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence 2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence Jong MIn Yu
 
15.ai term project_final
15.ai term project_final15.ai term project_final
15.ai term project_final호상 장
 
Mid-term Report
Mid-term ReportMid-term Report
Mid-term ReportJongHyoun
 
하이브리드 앱(Hybrid App)
하이브리드 앱(Hybrid App)하이브리드 앱(Hybrid App)
하이브리드 앱(Hybrid App)Changhwan Yi
 
Vip detection sensor
Vip detection sensorVip detection sensor
Vip detection sensorchs71
 

Similar to 수화 인식 자동 번역 iOS 앱 프로젝트 제안서 (20)

안드로이드 개발하기_1st
안드로이드 개발하기_1st안드로이드 개발하기_1st
안드로이드 개발하기_1st
 
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)
AWS CLOUD 2018- Amazon DeepLens와 컴퓨터 비전 딥러닝 어플리케이션 활용 (강정희 솔루션즈 아키텍트)
 
모바일앱개발 교육자료
모바일앱개발 교육자료모바일앱개발 교육자료
모바일앱개발 교육자료
 
차세대 웹비즈니스를 위한 "HTML5"
차세대 웹비즈니스를 위한 "HTML5"차세대 웹비즈니스를 위한 "HTML5"
차세대 웹비즈니스를 위한 "HTML5"
 
my activities before getting a job
my activities before getting a jobmy activities before getting a job
my activities before getting a job
 
Web app service project
Web app service projectWeb app service project
Web app service project
 
포트폴리오 김규하
포트폴리오 김규하포트폴리오 김규하
포트폴리오 김규하
 
Android Developer JeongJaeyun
Android Developer JeongJaeyunAndroid Developer JeongJaeyun
Android Developer JeongJaeyun
 
DzinnyPing(포트폴리오)-정재훈
DzinnyPing(포트폴리오)-정재훈DzinnyPing(포트폴리오)-정재훈
DzinnyPing(포트폴리오)-정재훈
 
황규영 포트폴리오
황규영 포트폴리오황규영 포트폴리오
황규영 포트폴리오
 
[Seoultech] Mobile Security & Security Testing(Eng)
[Seoultech] Mobile Security & Security Testing(Eng)[Seoultech] Mobile Security & Security Testing(Eng)
[Seoultech] Mobile Security & Security Testing(Eng)
 
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)
Amazon Rekognition을 이용하여 인공지능 안면 인식 키오스크 만들기 - 강정희 (AWS 솔루션즈 아키텍트)
 
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼
Enterprise mobile standard, morpheus 모피어스 모바일 표준 플랫폼
 
하이브리드 앱 개발 개요
하이브리드 앱 개발 개요하이브리드 앱 개발 개요
하이브리드 앱 개발 개요
 
React native development
React native developmentReact native development
React native development
 
2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence 2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence
 
15.ai term project_final
15.ai term project_final15.ai term project_final
15.ai term project_final
 
Mid-term Report
Mid-term ReportMid-term Report
Mid-term Report
 
하이브리드 앱(Hybrid App)
하이브리드 앱(Hybrid App)하이브리드 앱(Hybrid App)
하이브리드 앱(Hybrid App)
 
Vip detection sensor
Vip detection sensorVip detection sensor
Vip detection sensor
 

More from Anna Kim

Eccploit solution
Eccploit solutionEccploit solution
Eccploit solutionAnna Kim
 
iOS App development for sign language recognition
iOS App development for sign language recognitioniOS App development for sign language recognition
iOS App development for sign language recognitionAnna Kim
 
챗봇(Chatbot) 서비스 구축하기 | 개발 예시
챗봇(Chatbot) 서비스 구축하기 | 개발 예시 챗봇(Chatbot) 서비스 구축하기 | 개발 예시
챗봇(Chatbot) 서비스 구축하기 | 개발 예시 Anna Kim
 
HS애드 숨고 IMC전략 제안서
HS애드 숨고 IMC전략 제안서HS애드 숨고 IMC전략 제안서
HS애드 숨고 IMC전략 제안서Anna Kim
 
경제성장률과 GDP 갭 관계
경제성장률과 GDP 갭 관계경제성장률과 GDP 갭 관계
경제성장률과 GDP 갭 관계Anna Kim
 

More from Anna Kim (6)

Rdma 1
Rdma 1Rdma 1
Rdma 1
 
Eccploit solution
Eccploit solutionEccploit solution
Eccploit solution
 
iOS App development for sign language recognition
iOS App development for sign language recognitioniOS App development for sign language recognition
iOS App development for sign language recognition
 
챗봇(Chatbot) 서비스 구축하기 | 개발 예시
챗봇(Chatbot) 서비스 구축하기 | 개발 예시 챗봇(Chatbot) 서비스 구축하기 | 개발 예시
챗봇(Chatbot) 서비스 구축하기 | 개발 예시
 
HS애드 숨고 IMC전략 제안서
HS애드 숨고 IMC전략 제안서HS애드 숨고 IMC전략 제안서
HS애드 숨고 IMC전략 제안서
 
경제성장률과 GDP 갭 관계
경제성장률과 GDP 갭 관계경제성장률과 GDP 갭 관계
경제성장률과 GDP 갭 관계
 

수화 인식 자동 번역 iOS 앱 프로젝트 제안서

  • 1. Project Proposal Team: Argo B411051 김종욱 B471008 김지현 Sign language recognition translator
  • 2. Sign language recognition translator 프로젝트 제목 : A Real-time Sign language recognition translator (실시간 수화 인식 번역기) 프로젝트 목적 : Gesture recognition과 신경망 모델(CNN, RNN) 활용 è 청각 장애인들의 의사소통을 돕는 AI 앱 / 소프트웨어 개발
  • 3. Sign Language Recognition translator 개발 내용 및 방법
  • 4. 개발 내용 • 스마트폰의 카메라를 이용하여 수화 동작 인식 • 모바일 디바이스에서 추론이 가능하도록 머신 러닝 모델을 사용한 지능형 앱 구현 • 인식한 동작에 대한 결과를 텍스트로 화면에 출력 개발 환경 - iOS / MacOS(MacBook Pro 13 inch, 2018 과 MacBook Pro Retina 13 inch, Early 2015) 언어: C++ , Swift, Python Development details and methods
  • 5. - 개발 방법 신경망 모델 + OpenCV + Mediapipe + Core ML 활용 • 신경망 모델 training / test data 제작 • Hand detection을 위해 Google ML framework (Mediapipe) 사용 • CNN/RNN을 이용한 신경망 모델 제작 • Web Server를 만든 이후 학습이 완료된 신경망 모델을 Web Server에 구축함 • Apple ML framework (CoreML)을 사용하여 모바일 디바이스에 학습이 완료된 신경망 모델을 구축함 • 수화 인식률을 높이기 위한 다양한 테스트 시행 Development details and methods
  • 7. Sign Language Recognition translator 예상되는 결과물
  • 8. Gesture to Text or Audio “ Simple UX/UI 동작을 인식할 구간을 카메라 버튼으로 지정 인식한 결과를 텍스트나 오디오로 출력
  • 9. 1. Take a video of sign language 2. Train a machine learning model 3. Recognize gestures and display text on app What time is it? Project model flow
  • 10. 이 름 역할 김종욱 • 딥러닝 모델 분석 및 수정(영상데이터에서 단어 추출) • 머신 러닝 모델 앱 통합 (CoreML 활용) • 데이터 전처리(Hand detection API에서 들어오는 데이터를 처리하는 방법 구현) • 웹 서버 구축 • 학습/테스트용 데이터 만들기 김지현 • iOS 앱 개발(UX/UI) • 머신 러닝 모델 앱 통합 (CoreML 활용) • Hand detection API수정(OpenAPI를 프로젝트의 방향에 알맞게 수정하는 작업이 필요) • 문장 생성 언어 모델 분석 및 수정(추출된 단어를 이용하여 문장을 생성) • 학습/테스트용 데이터 만들기 팀원 별 업무 분담 및 일정
  • 11. Sign Language Recognition translator 현재까지 개발한 내용
  • 12. 현재까지 개발한 내용 1. 기존의 RNN과 CNN을 이용한 수화 인식 신경망 모델을 활용하여 (github 소스코드 참고) 수화 단어(아르헨티나) 12개를 학습시키고 결과값 도출 기존 모델 정확도 87.3% è 기존의 수화 인식 신경망 모델 수정 / 개선이 필요 자체 제작한 데이터셋으로 학습 / 평가가 필요
  • 13. 현재까지 개발한 내용 2. Google의 hand tracking 오픈소스를 활용하여 손 인식 수행 아이폰에서 hand tracking 테스트 è 나오는 손의 좌표 값들의 사용 방법 연구 필요
  • 14. Reference • 수화 인식 신경망 모델 코드 https://github.com/hthuwal/sign-language-gesture-recognition • Google AI에서 공개한 hand tracking 코드 https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md