SlideShare a Scribd company logo
1 of 79
Page 1
응용서비스에 따른 인공지능
기술 연구 이슈
임채균
지식공학 및 집단지성 연구실 (KECI Lab.)
KAIST 전산학부
2017. 10. 25.
Page 2
Contents
 연구실 소개
• 연구실 개요
• 연구실 구성원
 Intelligent Personal Agent
• 개인화된 상황 기반 뉴스 추천 기술 연구
• 주도적 어시스턴트를 위한 의도분석 및 이벤트 제안 기술 연구
• 헬스케어와 웰빙을 위한 개인화 플래닝 & 스케줄링 기술 개발 연구
 ExoBrain and Chatbot
• 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발
• 과제 지능형 대화 서비스를 위한 화용 및 문맥 분석 기반 대화 솔루션 개발
 Healthcare
• 모바일 스마트폰 환경에서 개인화된 상황인지형 헬스케어 서비스 에이전트
• 현장전문가의 경험지식 획득 및 활용을 위한 경험지식플랫폼 개발 연구
• 대학생 정신건강 관리 앱 개발
 Vision and Image Processing
• 유비쿼터스 보안 센서 네트워크를 이용한 지능형 헬스케어 감시시스템
• IoT 기반 도로위험기상정보 생산 및 활용기술 고도화
 Super-computing
• HPC 환경 기반 Deep learning 기술 적용 및 최적화 모델 연구
Page 3
• Intelligent personal assistant
• Experience mining and reuse
• AI planning and scheduling
• Recommender systems
• Medical/health informatics
• Clinical decision support
• Bioinformatics
• Text mining & topic modeling
• Social trends analysis
• Sentiment/emotion analysis
• Intent recognition
• Vision & activity recognition
• Deep learning architecture
• Natural language Q&A
• Temporal info. extraction
• Natural language paraphrase
• User adapted dictionary
Intelligent
Language
Tech.
Applications
of AI & KE
Knowledge Engineering & Collective Intelligence Laboratory
VISION
1. Innovative applications of AI & KE
2. Collective intelligence/deep learning
3. Natural language Q&A
4. Medical/health informatics
Collective
Intelligence,
Deep
Learning
[Web] http://kecilab.kaist.ac.kr
Page 4
Research Overview
Page 5
연구실 구성원
 Faculty & staff
• Professor: 최호진(Ho-Jin Choi)
• Secretary: 신유진
 Students
• Ph.D (full-time): 김한규, 오교중, 임채균, 현종환
• Ph.D (part-time): 박찬규
• Master: 이동건, 고병수, 한승호, 박찬용, Li Zhun,
이영준, 이혜영
Page 6
Intelligent Personal Agent
Page 7
[삼성전자 전략산학패키지 – 1차]
개인화된 상황 기반 뉴스 추천 연구
Page 8
연구 개요
 뉴스 문서 내/외 정보를 통한 사용자 성향 파악 및 뉴스 추천
뉴스 문서 외 정보 분석을 통한 뉴스 추천
SNS 내 활동 내용뉴스 카테고리 별 선택 정보
데이터 수집 및 전처리 과정
뉴스 종류 분석
(카테고리 분석)
뉴스 문서 분석
(뉴스 내 주요 키워드)
사용자 문서 분석
(사용자 성향 분석)
추천 만족도 비교 분석
+SNS
뉴스 추천뉴스 추천
사용자 별 선호 키워드 정보
선호 키워드,
사회적 관계망
정치적 성향
열람 뉴스 문서 분석을 통한 뉴스 추천
RSS Email SNSWeb
• 뉴스 문서 분석을 통한 토픽 기반 뉴스
추천
• 뉴스 종류 분석을 통한 뉴스 추천
뉴스 문서 분석을 통한 뉴스 추천
• 사용자 문서(SNS, SMS, Email) 기반 단어
분석 및 뉴스 추천
• 소셜네트워크 분석 기반 뉴스 추천
사용자 성향 기반 뉴스 추천
Page 9
[삼성전자 전략산학패키지 – 2차]
주도적 어시스턴트를 위한 의도분석 및
이벤트 제안 기술 연구
Page 10
연구 개요
홍길동
휴가/레져
사교
교육/훈련
건강
종교
쇼핑
외식
비즈니스
Cars Land
Disneyland Park
리뷰 내 방문의도 분석
관광지 리뷰
DB
관광지
관광지 리뷰
Attraction Network
2013.06 Universal Studio
2014.02 Disneyland Paris
아이들을 데려가기에
좋은 곳… 작은 동물들
… 교육 및 정서 발달…
맘껏 뛰어 놀 수 있는
…
관심사
과거 기록
• 시간: 2015.03.22
• 위치: Tarzan’s Treehouse
• 행동: walking
현재 상황 다음 행선지 제안:
Cars Land
Page 11
[삼성전자 전략산학패키지 – 3차]
헬스케어와 웰빙을 위한 개인화 플래닝
& 스케줄링 기술 개발 연구
Page 12
연구 개요
피트니스 트래커 시계열 센서 데이터 측정
Time in minute
걸음수
Time in minute
칼로리소모량
Time in minute
심박수
스마트폰
상황정보/활동도 기반 라이프 로깅
행동인식/활동도
모델 학습
활동도 예측
시간
활동도
예측
측정
Input:측정된 시계열 데이터
Output: 학습 데이터
측정값
학습 모델
ID Time Location Actions Score
… … … … …
4 12:00~12:05 실외, 교내 Walking 0.90
5 12:00~12:25 실내, 식당 - 0.20
6 12:25~12:30 실외, 교내 Walking 0.85
7 12:30~19:15 실내, 연구실 - 0.10
8 19:15~20:00 실외, 교외 Running 0.15
스마트폰 소지방식,
상황 정보
(위치, 행동) 활동도 기반 시간 로그 정보상황 정보 수집
위치 정보 행동 정보
추천 운동: 도수체조, 스트레칭
알림
센서
데이터
시계열
데이터
시간
테이블
운동
가능 시간
운동 추천 시간: 15분
운동 가능 후보 시간대 추천상황 인지형
건강 관련 컨텐츠 추천
Page 13
ExoBrain and Chatbot
Page 14
[미래창조과학부 엑소브레인 (2단계)]
휴먼 지식증강 서비스를 위한 지능진화형
WiseQA 플랫폼 기술 개발
• 시공간정보추출
• 패러프레이징
Page 15
엑소브레인(Exobrain) 프로젝트
 엑소브레인(외뇌, Exobrain): 내 몸 바깥에 있는 인공 두뇌라는 뜻
Page 16
특집 장학퀴즈 엑소브레인 우승
http://news.khan.co.kr/kh_news/khan_art_view.html?artid=201611202054015&code=100100
Page 17 : 개선 : 신규개발
자연어 심층
이해 및 학습 기술
자율학습 기반
지능진화형 QA 기술
신규언어지식 적응형
학습 기술
온라인 무한학습
언어지식 프레임워크
단어 의미 애매성 해소
통계기반 학습용
언어자원 관리/검증
형태소 분석 기술 개체명 인식
구문분석
시공간 정보 추출
시맨틱 프레임 추출
개체간 generic
관계추출
하이브리드
참조해결
대용어 탐지 및 복원
속셩별 감성분석 세부분류 감성분석
정답 유형 인식
질의가설 추출/
인식
사용자모델, 문맥 기반
질의 신뢰도 분석
자연어 질의 분류
자연어
질의분할
질의 엔티티
시맨틱프레임 생성
최적응답전략 생성기술
정답후보 multiple
hypothesis 생성
정답 합성 및 융합
엔티티 유형
추론
다중 지식베이스 기반
정답 근거 제시
이질소스 기반 정답후보
생성
다중증거 기반
정답추론/신뢰도 측정
다중정보 색인/검색
QA지식 자율학습 기술
핵심 세부기술 분류
Page 18
예시
시공간 정보 추출 연구 개요
: 자연어 문장에서 시간 및 사건 어휘를 찾고, 이들간의 관계 정보를 추출하는 것
문장에 출현하는 단어의 절대적 시간 정보 및 사건 정보
시간/사건 어휘 간의 다양한 시간적 관계 정보
• 공간 정보 추출
: 자연어 문장에서 공간 어휘를 찾고, 이들간의 관계 정보를 추출하는 것
문장에 출현하는 단어의 절대적 혹은 상대적인 지리적 위치 정보
공간 어휘 간의 위상/방향/거리/경로 등 다양한 관계 정보
[철수]trajector는 [지난 주]timex3 에 [부산]path[S][에서]motionSignal [서울]path[E][로]motionSignal [이사했다.]
공간 Relation 2 : {철수, 이사했다, 서울[to]}
공간 Relation 1 : {철수, 이사했다, 부산[from]}
motion,
event
시간 Relation 1 : {철수, 이사했다, 지난 주[2017-W14]}
• 시간 정보 추출
Page 19
시간 정보 추출 방법
• 시간 정보 추출 흐름도
시간 정보 추출 블록
입력 문장 철수는 어제 카이스트에 입학했다.
언어 분석 결과
형태소 분석 결과 : 철수/NNG 는/JX 어제/NNG 카이스트/NNP 에/JKB
입학/NNG 하/XSV 았/EP 다/EF ./SF
개체명 인식 결과 : 카이스트/OGG_EDUCATION
의존구문분석 결과 : 0 : 철수는/NP_SBJ/head=3
1 : 어제/NP/head=2
2 : 카이스트에/NP_AJT/head=3/mod={1}
3 : 입학했다./VP/head=-1/mod={0,2}
TIMEX3 추출
EVENT,
MAKEINSTANCE 추출
TLINK 추출
시간 정보 추출 결과
TIMEX3 { id=TIME_S0_t0, text=“어제“ type=DATE, value=2017-10-24, begin=2, end=2 }
EVENT { id=TIME_S0_e0, text=“입학하“ class=OCCURRENCE, begin=5, end=6 }
MAKEINSTANCE { id=TIME_S0_ei0, eventID=TIME_S0_e0,
polarity=POS, tense=PAST, pos=VERB }
TLINK { id=TIME_tl0, relType=INCLUDES,
eventInstanceID=TIME_S0_t0, relatedToTime=TIME_S0_ei0 }
철수 는 [어제]TIMEX3 카이스트 에 [입학 하]EVENT 았 다 .
TLINK
SPOTL 변환
{ 철수, 입학하다, 카이스트, 2017 − 10 − 24, 𝜙 }
S P O T L
Page 20
시간 추출 – 연구결과 데모
 데모페이지: http://143.248.55.244/demo.html
Page 21
질문함의 생성 및 평가 연구 개요
광종의 업적 중 하나로 본래 양민이었으나 호족 세력에 의해 불법으로 노비가 된 자를 다시
양민으로 환원시키기 위해 만든 법률은 무엇일까?
• 입력 문장
• 질문함의 문장
광종의 공적 중 한가지로 애당초 양민이었으나 호족 세력에 의해 불법으로 노비가 된 사람
을 다시 양민으로 되돌리기 위해 만든 법은 무엇일까?
“질문 문장과 의미가 같고, 문법적으로 완벽한 함의문장의 생성 및 평가”
의미보존성
(1~6)
문법정확성
(1~6)
어휘비유사성
(1~6)
표현대중성
(1~6)
통합 평가결과
(1~6)
평가 점수 5 6 2 4 5
• 연구 목적
• Q&A 시스템에서 같은 의미의 어휘로 치환을 통한 질의량 증가 [M. and S. Soubbotin, 2001]
• Watson Q&A 시스템에서도 문법적으로 알맞는 문장을 생성 [M. Wang, et al. 2007]
• 자주 쓰는 표현으로 문장을 변형함으로써 IR에서의 결과 향상 [J. Kim, et al. 2016]
• 접근 방법 및 사용 기술
• Statistical Machine Translation(SMT)의 함의(Entailment) 기술
• 한글-영문 병렬 말뭉치에서 함의 어휘/절 추출 및 학습
• Paraphrasing의 추출(extraction)과 생성(generation) 기술
• WiseWorldNet(WWN)을 이용한 어휘 치환(lexical replacement) 후보 탐색
• 기계학습 기반의 언어모델 학습을 통한 문장 생성
Page 22
질문함의 생성 및 평가 데모
[원 문장]
과거 중국에서는 이 금속을 섭취하면 불로장생한다고 믿어 황제들이 조금씩 복용해 중독되는 경우가 많았다.
미나마타병의 원인이 되는 이 금속은 무엇일까?
[함의문장]
옛날 중국에서는 그 철을 복용하면 불로장생한다고 있어 군주들이 서서히 복용해 중독되는 문제가 많았다.
미나마타병의 요인이 있는 그 철은 어떤 것 일까?
Page 23
문장/문단/문서 유사도 분석
한국어 문장
엑소브레인(Exobrain)은 “내 몸 바깥에 있는 인공 두뇌”라는 뜻으로 ‘세계 최고인공지
능 기술 선도’라는 비전을 달성하기 위하여 미래창조과학부 소프트웨어 분야의 국가
혁신기술 개발형 R&D 과제이다. …
엑소브레인 은 내 몸 바깥 에 …
…
의미기반 형태소임베딩
BidirectionalGRU
Sentence
dense vector
Morpheme
vector
Word attention
BidirectionalGRU
Paragraph
dense vector
Sentence attention
…
문장 접속 관계
(순접, 역접, 병렬,
진행형, 설명,
선택, 전환)에 따른
문단 의미 벡터 보정
문장/문단
dense vector
(의미적/구조적)
평가 방법 구체화
부정 표현에 따른
문장 의미 벡터 보정
예시) 질문문장: ‘몸 바깥의 뇌’라는 뜻의
미래창조과학부 R&D 과제는 무엇인가?
RNN
Document
dense vector
…
Paragraph attention
문단 구성에 따른
문서 의미 벡터 보정
문장-문단
유사도 분석
문단-문단 유사도 분석
내용 전개 방법
(정의, 비고, 대조,
분류, 분석, 예시)에
따른 의미 벡터 보정
문서 B문서 A
Paragraph dense vector
extraction model
Sentence dense vector
extraction model
Document dense vector
extraction model
문서 벡터 간의 유사도 측정
Page 24
[ICT R&D 바우처 지원사업]
과제 지능형 대화 서비스를 위한
화용 및 문맥 분석 기반 대화 솔루션 개발
Page 25
연구 목표
 챗봇 구현 및 요소 기술 연구
Originated by Christos
NLP
(NLU/NLG)
Counseling
Emotion
recognitionPsychiatry
Mental Healthcare
Emotion
I can not sleep for
a few days.
How long have you
been unable to
sleep?
I think it has been
about two weeks.
There was a
deadline last week.
It looks like
insomnia caused by
lethargy.
You've been under
a lot of stress for
about two weeks.
Page 26
출처: [Fluid, The North Face XPS(Expert Personal Shopper), 2015.10]
옷 입는 목적, 옷 입는 시기, 성별에 대해
자연어 문장으로 응답
옷 입는 목적, 입는 시기에 대한 날씨 정보를
종합하여 최적의 상품 추천
추가 질문을 통해 상품 추천 구체화
출처: [데일리인텔리전스(Leevi), DAVinCi Bot, 2017.02]
자연어 처리/챗봇 솔루션 보험심사 및 대출심사 시스템으로 적용
연간 부도율 3%
대출심사 승인율 20% 이상
은행, 증권, 유통 등 20 업체 도입 검토 중
등 4개 업체
PoC 완료
금융업 사례 (주관기관 서비스)
지능형 대화 서비스 현황
Page 27
사업명
사업기간
지능형 대화 서비스를 위한 화용 및 문맥 분석 기반 대화 솔루션 개발
2017. 4. 1. - 2018. 3. 31.
개발 목표 “자연어 대화에서 화용과 문맥의 깊은 이해를 통하여 대화의 주제와 목적을 정확하게 분석하고,
주제와 목적에 적합한 응답과 정서적인 대화를 생성하는 지능형 대화 솔루션”
연구 개요
Page 28
 개체명 인식과 의미모호성
제거를 통한 개체명 사전
확장
 자주 등장하는 개체명 (상
품명, 지명, 날짜) 인식 개선
 의존구문 분석을 통한 의
미역 인식
 기계학습 기반 한국어 의
존구문 분석 기술 적용 및
개선
 대화 서비스에 특화된 의
미역 인식 기술 개발
최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발
(세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화
(세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술
(세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술
세부 연구 주제 1
Page 29
최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발
(세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화
(세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술
(세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술
 대화의 함의 분석을 통한
대화 도메인 분류
 문장의 함의 정보 분석을
통한 대화 도메인 유사도
측정
 서비스 별 대화 군집화 및
도메인 카테고리 정의 도
구 개발
 대화를 위한 발화 의도 분
류 체계 설계 및 데이터 수
집
 발화 의도 분류 모델 학습
및 분류기 개발
 상대시간 표현 주석언어
설계 및 주석 말뭉치 구축
 상대시간 표현을 위한
TIMEX3 추출 모듈 개발
세부 연구 주제 2
Page 30
최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발
(세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화
(세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술
(세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술
 서비스 대응을 위한 템플
릿 기반 선질문과 응답 등
목적 대화 생성
 대화 문맥을 고려한 선질
문을 통한 추가 대응 정보
수집
 서비스 별 대화 도메인 카
테고리에 따른 대응 템플
릿 정의
 사람과의 정서적 소통을
위한 기계학습 기반 일반
대화 생성
 대화 도메인과 문맥을 고
려한 기계학습 기반 응답
문장 생성 모델(decoder) 학
습
 유머러스한 데이터 수집과
학습을 통한 정서적인 응
답 생성 모델 구현
세부 연구 주제 3
Page 31
Healthcare
Page 32
[NCRC 국가핵심연구센터-시스템바이오정보의학연구센터]
모바일 스마트폰 환경에서 개인화된 상황인
지형 헬스케어 서비스 에이전트
Page 33
Middleware
Integrative analyses
OCS PACS EMR LIS Seq. Exp. Prot. Tissue CGH
HL-7
DICOM
CDA
LOINC
BSML
MAGE
MIAPE
TMA
?
SNP
HapMap
2DPage
ProtChip
Tissue
MA
BAC
Chip
Phenomic Self Extractor Genomic Self Extractor
Clinical Genomics
BioData Acquisition
Pattern
Recognizer
DNA
Chip
Transformer
XML Binder
DBConnector
HL-7 / CDA Protocols
Hospital
caBIO
EVS caDSR
CRF CDE/CTEP
caCORE
IDE
Foundation Self
Warehouse
유방암
Application
폐암
Application
혈액암
Application
Legacy System
Authentication/Authorization
Interface
자료 수용기
CGI-
gateway
WebServer
XML-Validation
Ontology-Enhancement
Data Indexing
Clinical Trials
Knowledge Base
XML
CGI-gateway
Retrieval
engine
Query
Constructor
Clinical Research
& Clinical Trial KB
Application
Processor
Search engine
Statistical analysis
Visualization
Simulation
Communications
Workflow
Middleware
Ontology Server
Vocabulary Server
Taxonomy Server
Public Bio-DBs
Simulated Self
Individuated Second Self
Foundation Self
Molecular & Cellular Foundations of Self
Ubiquitous Self
Life Logs and Distributed Collaborations
Genomic Self: Translational Bioinformatics
for Genomic Health and Molecular Medicine
Phenomic Self: Data and Measurement driven
Discovery and Understanding of Human Disorders
Physiomic Self: Multi-scale Modeling of Physical and
Physiological Systems of Human Body
Semantic Self: Ontological Representation
and Engineering of Health Avatar
Augmented Self: Multi-modal Assessment and
Treatment to Retain and Enhance Human Performance
Connected Self: Life Logs and Stream-
Type Data Mining for Health Protection
Distributed Self: Customized and Context-aware
Healthcare Service Agents in Smart Phone Environment
Digital Self
Page 34
Fall Detection 에이전트 내용 및 특성
1) 낙상 : 급격한 신체 움직임의 일정한 패턴
2) 서비스
- 낙상으로 인한, “응급상황”인지 파악
- 비상연락망 연결 조치
- 낙상 통계 표시
3) 방문기록의 수집방법
- 개인 스마트폰 센서
(자이로 센서, 가속도 센서) 이용
4) 낙상 인지 모듈
- Decision tree 기반 알고리즘
- 주기적 업데이트 : 모듈 파라메터 배포
시나리오 개략도
Fall
Client
Trained
Decision tree
Real-time
sensor data
Classification
Server
Sensor
data
Trained
Decision tree
Training
protocol
Page 35
Fall detector
Statistics
See friends
Medical info.
Settings
See friends
Statistics
My fall-log
Edit a period
OK
Medical info.
My current
situation
- Weak point :
5 times fall/emergency
last week.
CLICK : Good equipments
for fall(emergency)!
(2$ / 1 month)
Settings
Edit Profile
- Gender : Male
- Age : 25
- Name : 한반도
Edit ID/PASSWD
- ID : NCRC01
- PASSWD : ********
Confirm
Last 3
weeks
Call list
오승택 normal
차동재 Emergency,
NOW!
김경훈 normal
CLICK : Good equipments
for fall(emergency)!
(2$ / 1 month)
Statistics
3 Months
Weeks0
Confirm
See friends
차동재
in Emergency!
Fall Detection 에이전트 UI
Page 36
Lifestyle Manager for Obesity 에이전트 내용 및 특성
1) 방문기록: {사용자ID, 09:00~10:30, 사무실, 업무}
2) 행동: 방문장소의 영향을 받음
(e.g., 짜장면 집에 가서 스테이크를 시켜먹진 않는다)
3) Lifestyle = 방문기록 모음
4) 서비스
- 사용자 방문기록 표시
- 사용자 방문기록 기반 분석서비스
5) 방문기록의 수집방법
- 개인 스마트폰 센서(Wifi) 이용
- Wifi 신호 기반 논리적 장소 인지
6) 분석서비스
- 장기간 수집된 데이터 기반 사용자
Lifestyle 조언 서비스
- BMI 변화량에 기반한 사용자 간
경쟁의식 고취
User model
Lifestyle trie
User profile
시나리오 개략도
Page 37
* 기본화면
1) 각종 센서 On/Off 가능
2) 내부 컴포넌트 실행 가능
* 첫 화면(Tab-1)
1) Wifi 리스트 표시
2) 현재 논리적 위치 표시
3) 현재 위치한 논리적 장소
등록
* 첫 화면(Tab-1)에서
버튼 눌렀을 때,
1) 새로운 논리적 장소 등록
(카테고리 지정)
2) 기존의 장소를 수정 가능
Lifestyle Manager for Obesity 에이전트 UI
Page 38
* Tab-2
1) 설정한 날짜에 해당
하는 방문 정보 표시
* Tab-3
1) 설정한 “연도”에 해당하는
카테고리 별 누적 시간(min)
차트 표시
* Tab-4
1) 등록된 장소 목록 표시
* Tab-5
1) 각종 환경설정 기능들 망라
(특히, 통계치 업데이트 버튼은
차후에 자동으로 업데이트 되는
방식으로 확장 예정)
Lifestyle Manager for Obesity 에이전트 UI (cont’d)
Page 39
한글 트위터 데이터 기반의 감정분석 기술 고도화
 긍정적 컨텐츠 추천을 위한 한글 트위터의 감정표현 자질 정의
 Ekman의 6가지 감정 분류를 활용한 한글 트위터 감정분석 모델 구축
• 긍/부정 외에도 세분화된 감정을 분석 가능
3
9
Feature Resources
Emotion lexicons Emotion word lists based on modified TF-IDF
Punctuations
Question, exclamation, question/exclamation
mixed, full stop, comma, tilde
Fine-grained emoticons and symbols Emoticon-Emotion lists
Korean emotion letters Laughing. crying, mental chaos
Korean exclamations of surprise List of Korean exclamations of surprise
Korean swear words List of Korean swear word
Page 40
한글 트위터 감정분석 기술 응용 – 2015 MERS 관련 트윗 분석
 실제 트윗 데이터에 감정분석 기술을 적용하여 대중의 감성 변화 추이를 관찰
 대상 데이터: 2015년 MERS (Middle East Respiratory Syndrome) 유행 당시의 트윗
• 수집 방법: Twiteer Streaming API 활용, “메르스”에 대한 쿼리 검색결과 데이터 수집
• 수집 기간: 2015년 6월 5일 ~ 30일 (25일 간)
• 전처리: RT(리트윗), URL 링크, 답글만 포함된 트윗 데이터 제외
• 전체 데이터: 145,098 unique tweets
 감정 분포 및 변화 추이
Page 41
Qualitative Analysis
Date News Article Emotion Tweet Example
6.6
메르스 첫 감염자 아내 '완치
'… 첫 퇴원 사례
Happiness
오~굿뉴스가 있네요~첫번째환자아내분이 완치되어 퇴원을 했다네요~오~메르스에 걸려
도 건강한 사람은 자유치유가능하다고 하니 다행이네요~그래도 걸려서 고생하는것보다 지
금처럼 건강한게 좋은거니까 몸관리 잘하시길~~!!!!^^
6.9
임신부가 메르스 첫 양성 "치
료 어떻게...
Sadness
Disgust
Fear
아... 임산부 메르스 환자 발생했다고ㅜㅜ... 다들 걱정이지만 제일 걱정되는 분들이 임신중
인 여성분이었는데... 약이 아기한테 어떤 영향을 줄 지 모르니ㅠㅠ
6.11
3차 메르스 유행 우려, 90번
환자·양천메디힐·창원SK
Sadness 메르스 창원에서 어떤 할머니께서 양성반응이.. 다들조심 ㅠㅠㅠ
6.16
대구 첫 메르스 확진 환자, 시
추가 조사…잠복기 지난 뒤 이
상증세?
Surprise 뭐 머 대구 ㅂ메르스터졋어?????
6.23
메르스 책임 통감 이재용 국민
사과
Anger 삼성이 메르스 사태 관련 사과를 이재용이 직접했다. 근데 정부는 절대 사과를 하지 않는다.
6.25
박 대통령, 국회법 개정안 거
부권 행사…정치권 질타
Anger
오늘(25일) 박근혜 대통령이 국무회의에서 '국회법개정안' 거부권 행사를 강행하면 야당은
메르스 관련 특별법과 민생개혁 입법을 제외한 어떤 새누리당 법안도 합의해서는 안될 것!
세월호 참사 진실 감추려고 국회법개정안까지 거부하는 대통령은 탄핵해야!
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5 05-Jun
06-Jun
07-Jun
08-Jun
09-Jun
10-Jun
11-Jun
12-Jun
13-Jun
14-Jun
15-Jun
16-Jun
17-Jun
18-Jun
19-Jun
20-Jun
21-Jun
22-Jun
23-Jun
24-Jun
25-Jun
26-Jun
27-Jun
28-Jun
29-Jun
30-Jun
Anger
Fear
Happiness
Disgust
Sadness
Surprise
Page 42
긍정적 컨텐츠 추천을 위한 에이전트 개발
 긍정 컨텐츠 생성자 목록 관리
• 긍정적 메시지 작성 비중이 높은 사용자 식별 및 관리
• 한글 트위터 데이터에 대한 감정분석 결과 활용
• 해당 사용자들을 룩업 테이블로 관리
 긍정 컨텐츠 추적 및 DB 구축
• 룩업 테이블의 사용자들이 작성하는 긍정적인 컨텐츠 수집
• 조건 1: 뉴스, 블로그, 이미지, 동영상 등에 대한 외부 링크를 포함
• 조건 2: 메시지의 내용이 긍정적으로 분류
 컨텐츠 추천 기능
• 타 사용자에게 긍정 컨텐츠 DB 기반의 새로운 컨텐츠 추천
4
2
Page 43
긍정적 컨텐츠 추천을 위한 에이전트 개발 (cont’d)
4
3
긍정 컨텐츠 수집 (서버) 컨텐츠 추천 (클라이언트)
Page 44
[산업기술평가관리원]
경험지식플랫폼 - 현장전문가의 경험지식 획
득 및 활용을 위한 경험지식플랫폼 개발 연구
Page 45
경험지식플랫폼 개발
Page 46
과제 개관
 현장전문가(의사/임상병리사/운동처방사)의 효율적인 의사결정을 지원하
는 사례기반의 자가학습형 경험지식플랫폼 개발
Page 47
시스템 동작도
Page 48
혈액종합검사 절차적 경험 지식 획득 및 소견 추론
혈종검사
DB
검사
결과
의사/임상 병리학자
지식 베이스
(RDR)
Case Base
(사례 베이스)
소견 생성/수정/삭제
혈액종합검사 시스템
소견 판단의 근거
검사자 A의 혈종 검사 결과
새로운
검사 결과
소견 추론 엔진
Inference
새로운 소견 생성
의사/임상 병리학자
소견판단지식및소견검토
새로운
검사 항목
새로운
소견 판단
기준
기존 시스템에 소견 반영
Page 49
당일 상황을 반영한 운동 추천
• (1단계) 운동 계획 후보 생성
• 제약 조건을 주어 당일 운동 계획에 사용될 운동 수 줄이기
• CSP (Constraint Satisfaction Problem)
• (2단계) 운동 계획 후보 간 우선순위 부여
• (안1) 기존 계획 유사: 높은 우선순위; 기존 계획 상이: 낮은 우선순위
• (안2) Preference constraints 또는 Ordering constraints
정보 종류 항목 제약조건
기본 정보
주근육 Constraint 1) 당일 운동의 주근육은 기존 운동의 주근육과 적어도 하나 이상 일치함
운동 중복 Constraint 2) 당일 운동 중복 없음
신체 정보 성별 Constraint 3) 당일 운동의 주요 성별은 고객의 성별에 부합함
상황 정보
컨
디
션
피로 Constraint 4) 당일 운동의 분류는 고객 피로 누적인 경우, 근력 운동이 아님
통증 Constraint 5) 당일 운동의 주근육은 고객의 통증 근육과 일치하지 않음
운동 기구 Constraint 6) 당일 운동의 운동 기구는 사용 가능함
운동 공간 Constraint 7) 당일 운동의 운동 공간은 확보됨
선호 정보 난이도 Constraint 8) 당일 운동의 난이도는 고객의 난이도 보다 낮거나 같음
Page 50
[삼성사회정신건강연구소]
대학생 정신건강 관리 앱 개발
Page 51
연구 목표
 대학생 정신건강 관리 어플리케이션 개발
• 간단하고 효과적인 사회심리적 스트레스 대처법 및 정신건강
관리에 관심 있는 모든 국내 대학생 및 대학생 정신건강 서비스
관련 종사자
대상
• 국내 대학생들에게 접근이 용이한 모바일 앱 기반 정신건강 서
비스를 제공함으로써 대학생 정신건강 문제 예방 및 관리 촉진,
대학 캠퍼스 내 정신건강서비스 보급 문제 완화
목적
• Evidence-based: 정신의학 및 심리학 전문가들이 구성하는
근거-기반 콘텐츠
• Immediate & Ongoing: 스트레스 상황 시 즉각적 대처 및
지속적 정신건강 관리 프로그램
• Tailored: 사용자 데이터 기반 맞춤형 서비스
• Engaging: 인터랙티브 콘텐츠 및 사용자-친화적 인터페이스
주요 특징
Page 52
연구 주제 1
 정신심리상담 챗봇
• 가벼운 대화로 환자의 기분을 전환시켜줄 수 있는 정신심리상담 챗봇 개발
• 챗봇을 사용하여 심리상담사/정신과 의사의 업무량을 줄일 수 있음
대화형 플랫폼 (웹/앱)
응답자
(전문가-임상심리사, 정신과 의사 등)
대화형 말뭉치
(정신심리상담)
도메인 전문 지식
(정신과 온톨로지)
대화형
어시스턴트
(정신심리상담)
대화 쓰레드 A
(정신심리상담 내용)
최근에 두통이 자주 생기셨나요?
요즘 입맛이 없고, 낮에 매우 졸립고, 조
금만 움직여도 매우 피곤한데, 밤에 잠
을 잘못 자네요
대화 입력
(텍스트/음성)
상담자 A
(사용자)
네, 그리고 잠을 자도 개운하지 않아서
자꾸 늦잠을 자게 되요.
그렇군요.
제가 뭘 어떡하면 좋을까요.
네, 무기력증의 증상이시네요.
식사 잘 챙겨 드시구요, 몸을 활동적이
게 바꿔야 합니다. 하루 30분 산책을
해보도록 하세요.
대화 입력
(텍스트/음성)
대화 쓰레드 B
(정신심리상담 내용)
대
화
분
석
학
습
도메인 지식 제공
증상  진단 
해결 방안
추론 정보
대화 입력
(텍스트/음성)
대화형 말뭉치
(정신심리상담)대화형 말뭉치
(정신심리상담)
대
화
지
원
상담자 B
(사용자)
몸에 기운이 없고, 피곤함을 느낄 때가
많네요.
대화 입력
(텍스트/음성)
추가 증상: 두통이 발생 하십니까?
네, 또 좀처럼 잠을 이룰 수가 없어요.
기존의 무기력증(번아웃증후군) 상담 사
례와 유사한 증상입니다.
네, 무기력증의 증상이시네요.
해결 방안과 관련된 전문 정보:
http://www.yesmental.or.kr/...
참고 바랍니다.
대
화
분
석
학
습
운동이 제일 좋은 방법이지만 취미생활에
몰두하는 방법도 좋습니다.
웹 정보
수집
Page 53
연구 주제 2
 정신심리상담을 위한 감정 인식 기술
• 목소리/SNS 로그 데이터로부터 사용자의 감정을 인식하는 감정인식 기술 개발
• 사용자의 감정에 따라 개인에게 적합한 정신건강 증진 프로그램 추천
Multi-model
based
Psychiatric
Counseling
Service
Ethical judgment
model
···
···
Response for
unethical
behavior
oice
deo
ext
sense
Generalization Categorization
Personalization
ARTMAP (Adaptive Reasoning Theory MAP)
bi-ARTMAP, ARAM (Mirror neurons imitation)LSTM
Emotional
response
Datafortheemotionrecognition
Page 54
앱 개발 결과
 설문조사를 통한 사용자 정신건강 상태 데이터 수집
• 심리학 전문가가 설계한 문항을 통해 앱 사용자 정신건강 상태 파악 및 수집
• PHQ-9(9문항 환자 건강관련 설문조사), GAD-7(7문항 불안장애관련 설문조
사) 등 심리학 분야에서 검증된 정신건강 평가 지표 사용
Page 55
앱 개발 결과 (cont’d)
 기분 모니터링 기법을 통한 사용자 정신건강 상태 데이터 수집
• 사용자가 직접 현재 기분을 입력하도록 유도하여 정신건강 상태 데이터 수집
• 기분 입력은 날짜 별로 입력할 수 있음
• 현재 기분 뿐만 아니라 식욕/수면 등 건강 상태도 입력 가능
Page 56
앱 개발 결과 (cont’d)
 채팅기반 대화 플랫폼 탑재를 통한 사용자-상담사 대화 데이터 수집
• 전문 심리 상담사가 정신질환 환자와 원격으로 대화할 수 있는 채팅 플랫폼
제공
• 채팅 플랫폼을 통해 고민 상담 및 정신건강 증진 프로그램 수행 가능
• 채팅 플랫폼에서 수집된 대화 데이터를 사용하여 챗봇 개발
Page 57
Vision and Image Processing
Page 58
[기상청]
IoT 기반 도로위험기상정보 생산 및 활용
기술 고도화
Page 59
연구개발 개요
 목표
• IoT 기반 고해상도 도로경로별 기상정보 생산 기술 고도화
 핵심기술
• 고정식/이동식 관측 장비의 값을 사용하여 딥러닝 학습 모형, 데이터 패턴 분석 군집화 기
술을 고도화하고, 기상정보 생산의 정확도를 높이는 것
CCTV
Edge, 명도
CCTV영상
학습모형개발
다중ROI 패턴 그래프
군집화
RWIS장비
이동식 관측 차량
추출
변환 Deep Learning 학습 모형 개발
기상관측값
부산대 보유 기자재
1단계 구축 설치
rain
snow
snow
snow
snow
snow
Page 60
연구내용
 CCTV 영상 기반 위험기상정보 생산 알고리즘 개선
 IoT 기반 장비 데이터 분석을 위한 딥러닝 학습 모델 개발
◦ 장비 별(CCTV, Rain sensor 등) 데이터 선택 및 전처리 방법 정의
◦ 장비 별 위험기상정보 생산을 위한 딥러닝 모델 설계 및 학습
◦ 학습된 딥러닝 모델을 통한 장비별 위험기상정보 생산
Page 61
연구내용 (cont’d)
 CCTV 영상 기반 위험기상정보 생산 알고리즘 개선
 기상정보의 정량적 수치 예측 어려움
◦ 이미지의 배경 부분은 기상정보 생산에 노이즈가 되어 성능 저하 우려
기술적 문제
 CCTV 영상 데이터의 time-series 정보를 고려하기 위한 CNN과 RNN의 결합
◦ CNN은 각 프레임으로 부터 feature maps 추출
◦ RNN은 추출된 특징의 time-series 정보 분석
 CNN/RNN모델 각각의 특징을 고려한 고도화된 학습 기법 필요
해결 방안
• CNN: Convolutional Neural Network
• RNN: Recurrent Neural Network
Page 62
연구내용 (cont’d)
 CCTV 영상 기반 위험기상정보 생산 알고리즘 개선
 기존 CNN은 정적인 이미지만 분석 가능
◦ CCTV 영상 데이터의 time-series 정보 손실로 인한 정확도 감소 우려
기술적 문제
 CCTV 영상 데이터의 time-series 특징을 이용한 전처리 방법 적용
 연속된 프레임(frame) 간의 차이값 사용
◦ 강우량에 따른 빗줄기 움직임 및 밀도 차이 극대화
◦ 이미지 내 배경 및 차량의 영향 최소화
 상기 전처리 이미지를 활용해 CCTV 영상에 특화된 딥러닝 모델 학습
해결 방안
Page 63
연구내용 (cont’d)
 CCTV 영상 기반 위험기상정보 생산 알고리즘 개선
 CCTV 영상 내 객체에 따라 날씨정보 결정에 대한 영향력이 다름
◦ E.g.) 우천 → 어둡고 흐린 하늘 영역; 폭설 → 흰색 비중이 증가한 도로 영역
기술적 문제
 낮밤, 날씨 등을 고려한 image segmentation 적용
 각 CCTV 영상데이터에 특화된 object identification 기법
◦ 장기적 영상 학습을 통해, 해당 촬영지역의 환경 변화에 강한(robust) 모델 학습
 객체 별 영향력에 따라 차등적 가중치 적용
해결 방안
Page 64
[KUSTAR-KAIST 국제공동연구]
유비쿼터스 보안 센서 네트워크를 이용한
지능형 헬스케어 감시시스템
Page 65
Project Overview
To design and develop a distributed, intelligent
multi-sensor healthcare system for monitoring
and caring people in a hospital or in a silver town
Multi-sensor healthcare systems
1 Social healthcare
Fall alarm system
Home-based rehabilitation assistant
2
3
Page 66
Past researches & Activities
INTENSIVE SURVEYS
- An Intelligent Multi-Sensor Surveillance System for Elderly Care
- Fall Detection Systems for Elderly Care
- Healthcare Monitoring Systems for the Elderly
ACTION RECOGNITION USING TWO KINECTS
- More tolerant to erroneous skeletons
- More accurate in action recognition
OBJECT RECOGNITION ON IMAGES
- A new assumption that object follows Gaussian distribution with mean of image center
- Unsupervised algorithm
OBJECT COLORIZATION ON IMAGES
- A new randomized algorithm for object colorization
- More realistic colorization given colors of a target object
INVESTIGATION OF PARAMETER APPROXIMATION IN DEEP LEARNING
- Relationship between the order of data classes and the parameter approximation
- Restricted Boltzmann Machines (RBMs) using Contrastive Divergence (CD) algorithm
1
ACTIVITIES
- Student internship to KECI lab.
(1) Omar Mohamed(18 June – 29 July 2013)
(2) Nujood Alkendi (16 June – 25 July 2014)
- KU Undergraduate students’ visit to KAIST : 11 June 2013
2
Hand
wavin
g
Page 67
Topic 1: Social Healthcare
Visit logs – Where, How long, Why visit?
Calorie logs – How much calorie income/consume?
BMI logs – How much fat are you?
Three logs
Page 68
Topic 2: Fall Alarm System
Surveillance system
Room 1
68
Camera 1 Room 2Camera 2
Patient A
Room 3Camera 3
Doctor A
Wireless AP 1
Wireless AP 2
Wireless AP 3
• Patient B : Room 1 (FALL)
• Nurse A : Room 2 (OK)
Nurse A
Patient C
Patient B
Room 1 Room 2 Room 3
Alarm!
1 Fall accident!
2 Detection
3 Alarm
4 Human Action
Inform
the risky
situation
Report
Detect fall
using the
accelerometer,
gyroscope,
…
Fall detection
Detect the location
using the Wifi
finger prints
Location detection
Page 69
Topic 3: Home-Based Rehabilitation Assistant
You must come
everyday to
the hospital for
therapy
…but Doctor, this
hospital is very far
from my home..
…but Doctor, I
must go to work
from 9 to 6…but Doctor, I
don’t have anyone
to take me to the
hospital everyday..
… Home-based
Rehabilitation
Assistant
Page 70
Topic 3: Home-Based Rehabilitation Assistant (cont’d)
1
Show examples of
therapy motion
(ground truth)
2
Assess the
patient’s
motion
3
Give real-
time
feedback
Please lift
your ankle
more
4 Report the
results to
the doctor
Basis modules:
• Real-time motion
prediction
• Expert system
Page 71
Topic 3: Home-Based Rehabilitation Assistant (cont’d)
Skeleton
fusion
Action
recognition
Reference
mapping
Camera1
skeletal data
Fusion skeletal
data
Camera2
skeletal data
Improving human action recognition using fusion of
skeletal data from two RGB-D cameras
Objectives: Fusion methods:
View-invariant action recognition system:
X
Z
Y
… Temporal model:
Sequence of action-
words
Classification:
KNN + DTWAction-frame model:
Histogram of body cubes
Results:
• Perform fusion of skeletal
data from two cameras.
• Use fusion skeletal data
for recognizing action.
• Evaluate :
• Recognition accuracy
• Performance in action
prediction
• Substitutive fusion
• Fusion by averaging
• Fusion data gave ~10% improvement in
accuracy.
• No significant improvement in action prediction
Page 72
Super-computing
Page 73
[KAIST-KISTI 협력연구]
국가 슈퍼컴퓨터 개발을 위한 기반 기술 공동 연구
HPC 환경 기반 DEEP Learning
기술 적용 및 최적화 모델 연구
Page 74
KSITI-KAIST 공동연구과제 개요
 국가 슈퍼컴퓨터 개발을 위한 기반 기술 공동 연구
• A Collaborative Research for National Supercomputer Development
 연구목표
• 저전력 고성능(LP-HPC) 슈퍼컴퓨터 자체 개발을 위한 요소 기술을 확보
• 미래 AI형 슈퍼컴퓨터 개발 및 운영에 활용할 수 있는 핵심 기술을 개발 추진
Page 75
HPC 환경에서 딥러닝 연구의 주요 이슈
 Deep learning 과 HPC 의 관계
• 복잡한 구조의 artificial neural network(ANN) 모델을
big scale data으로부터 기계학습하기 위한 고성능의
computing power 가 필요
 Computing power를 증진시키기 위한 접근 방법
• Scaling out: Using multiple machines in a large cluster to increase the available
computing power
• Scaling up: Leveraging graphics processing units (GPUs), which can perform
more arithmetic than typical CPUs
 HPC 시스템에서 deep learning 학습 시 어려운 점
• Communications bottlenecks (Hardware challenge)
• Infiniband: 기존의 bus 방식에서 탈피, 장비 사이를 직렬 P2P 방식으로 연결, HCA
(host chnnel adapter) 카드와 전용 스위치로 구성
• Managing computation and communication (Software challenge)
• 많은 연구에서 computation을 최적화 하기 위한 방법들이 제안됨 [Hinton 2006]
• 많은 GPU 사용을 위한 알고리즘과 언어구조 차원의 접근 방법 필요 (e.g. CuDA)
E.g.
Deep Neural Network(DNN)
Page 76
연구주제
HPC 환경에 최적화된 DNN 모델 구축을
위한 hyperparameter tuning
병렬 프로그래밍 기술을 활용한 Deep
Neural Network (DNN)의 학습 속도 개선
을 위한 근사 추정 기술 연구
Deep learning
model training
HPC based parallel programming
학습 단계에 따른 오류율 추적을 통한
DNN 학습 적합도 분석 및 과적합 판정
RMSE
Iteration
Well-trained
Validation set
Training set
Bayesian
Approximation
Dropout
Overfitting
Less training time More accuracy Finding optimized model
Mini-batch
Page 77
Parallelism 기법
◦ Same model to trains on different
data subset
◦ No synchronize between GPUs in
forward computing
◦ Parameter gradients computed from
different GPUs must be
synchronized in back propagation
 Data parallelism  Model parallelism  Data + Model parallelism
◦ Each computational node is responsible
for parts of the large deep neural
network model by training the same
data samples
◦ The communication happens between
computational nodes when the input of
a neural is from the output of the other
computational node
◦ Because of communication expense,
model parallelism is often worse than
data parallelism
◦ Model parallelism could get a good
performance with large number of neuron
activities. Data parallelism is efficient with
large number of weights
◦ The convolutional layer takes up more than
90% computation and 5% of parameters,
while the fully connected layer consists of
95% parameters and 5-10% computation
◦ Using data parallelism for convolutional
layer and model parallelism for fully
connected layer
Page 78
Ensemble learning과 Dropout
◦ Training set에서 random으로 sampling하여
Bootstrap sample들을 생성
◦ 이들을 서로 다른 Classification model을 이용
하여 Predictions을 도출
◦ 각 Predictions들을 Voting하여 다수의 결과를 최
종 Prediction으로 선정
 Ensemble learning - Bagging
◦ Training set을 Mini-batch로 나눠 Training
◦ 각 Training step마다 Drop되는 unit들이 다르기
때문에 서로 다른 모델로 Training
◦ 다수의 Training과 Validation을 통해 최적의
hyper-parameter를 선택
 Dropout
Page 79
Thank You

More Related Content

Similar to 응용서비스에 따른 인공지능기술 연구이슈

빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
 
제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개
Chang-yong Jung
 
7 프레임 워크와_방법론
7 프레임 워크와_방법론7 프레임 워크와_방법론
7 프레임 워크와_방법론
atelier t*h
 

Similar to 응용서비스에 따른 인공지능기술 연구이슈 (20)

빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
디지털 전환이 가져올 교육의 변화와 인공지능의 역할 (2021년 마지막 업데이트)
디지털 전환이 가져올 교육의 변화와 인공지능의 역할 (2021년 마지막 업데이트)디지털 전환이 가져올 교육의 변화와 인공지능의 역할 (2021년 마지막 업데이트)
디지털 전환이 가져올 교육의 변화와 인공지능의 역할 (2021년 마지막 업데이트)
 
29th Meetup 실습 설명 및 실습 자료 링크
29th Meetup 실습 설명 및 실습 자료 링크29th Meetup 실습 설명 및 실습 자료 링크
29th Meetup 실습 설명 및 실습 자료 링크
 
마인즈랩소개자료 20150616
마인즈랩소개자료 20150616마인즈랩소개자료 20150616
마인즈랩소개자료 20150616
 
제1장 정보검색소개
제1장 정보검색소개제1장 정보검색소개
제1장 정보검색소개
 
AI 유저리서치를 할 수 있을까?
AI 유저리서치를 할 수 있을까?AI 유저리서치를 할 수 있을까?
AI 유저리서치를 할 수 있을까?
 
Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보Memento, 그 사람에 대한 모든 정보
Memento, 그 사람에 대한 모든 정보
 
Memento
MementoMemento
Memento
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
Process for Big Data Analysis
Process for Big Data AnalysisProcess for Big Data Analysis
Process for Big Data Analysis
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수
 
Log-based User Behavior Analysis
Log-based User Behavior AnalysisLog-based User Behavior Analysis
Log-based User Behavior Analysis
 
7 프레임 워크와_방법론
7 프레임 워크와_방법론7 프레임 워크와_방법론
7 프레임 워크와_방법론
 
hcik 2017 튜토리얼; 인공지능으로 사용자 리서치
hcik 2017 튜토리얼; 인공지능으로 사용자 리서치hcik 2017 튜토리얼; 인공지능으로 사용자 리서치
hcik 2017 튜토리얼; 인공지능으로 사용자 리서치
 
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
코로나 이후, 반중정서는 과연 심화되었을까 - 강태영(언더스코어)
 
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
20150331 msr outreach media_roundtable_deck_연세대강홍구교수_음성합성
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망
 
소프트웨어교육론 전체
소프트웨어교육론 전체소프트웨어교육론 전체
소프트웨어교육론 전체
 
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
[한국IBM] 엔터프라이즈 AI 검색엔진 Watson Discovery 소개자료
 

More from HELENA LEE

로봇저널리즘이 어쩌다 핀테크에 가게 됐는가? - 로봇저널리즘 비즈니스 모델
로봇저널리즘이 어쩌다 핀테크에 가게 됐는가?  - 로봇저널리즘 비즈니스 모델로봇저널리즘이 어쩌다 핀테크에 가게 됐는가?  - 로봇저널리즘 비즈니스 모델
로봇저널리즘이 어쩌다 핀테크에 가게 됐는가? - 로봇저널리즘 비즈니스 모델
HELENA LEE
 

More from HELENA LEE (11)

2020 EU cleantech 2nd phase - Air Tree Cloth by drones to clean sky
2020 EU cleantech 2nd phase - Air Tree Cloth by drones to clean sky2020 EU cleantech 2nd phase - Air Tree Cloth by drones to clean sky
2020 EU cleantech 2nd phase - Air Tree Cloth by drones to clean sky
 
추천시스템 구축을 위한 빅데이터 분석기법과 사례
추천시스템 구축을 위한 빅데이터 분석기법과 사례추천시스템 구축을 위한 빅데이터 분석기법과 사례
추천시스템 구축을 위한 빅데이터 분석기법과 사례
 
로봇저널리즘이 어쩌다 핀테크에 가게 됐는가? - 로봇저널리즘 비즈니스 모델
로봇저널리즘이 어쩌다 핀테크에 가게 됐는가?  - 로봇저널리즘 비즈니스 모델로봇저널리즘이 어쩌다 핀테크에 가게 됐는가?  - 로봇저널리즘 비즈니스 모델
로봇저널리즘이 어쩌다 핀테크에 가게 됐는가? - 로봇저널리즘 비즈니스 모델
 
8월 24일 인공지능사업화 세미나: IoT 구조물 변위 모니터링 솔루션 - 하이테크
8월 24일 인공지능사업화 세미나: IoT 구조물 변위 모니터링 솔루션 - 하이테크8월 24일 인공지능사업화 세미나: IoT 구조물 변위 모니터링 솔루션 - 하이테크
8월 24일 인공지능사업화 세미나: IoT 구조물 변위 모니터링 솔루션 - 하이테크
 
8월 24일 인공지능사업화 세미나: 미세먼지 모니터링 솔루션 - 과학기술분석센타
8월 24일 인공지능사업화 세미나: 미세먼지 모니터링 솔루션 - 과학기술분석센타8월 24일 인공지능사업화 세미나: 미세먼지 모니터링 솔루션 - 과학기술분석센타
8월 24일 인공지능사업화 세미나: 미세먼지 모니터링 솔루션 - 과학기술분석센타
 
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
 
8월 24일 인공지능사업화 세미나: 빅데이터로 그리는 비즈니스 지도 - 오픈메이트
8월 24일 인공지능사업화 세미나: 빅데이터로 그리는 비즈니스 지도 - 오픈메이트8월 24일 인공지능사업화 세미나: 빅데이터로 그리는 비즈니스 지도 - 오픈메이트
8월 24일 인공지능사업화 세미나: 빅데이터로 그리는 비즈니스 지도 - 오픈메이트
 
8월 24일 인공지능사업화 세미나: 유동인구 빅데이터 딥러닝을 활용한 신규매장 방문자 수 예측 솔루션 - 초록소프트
8월 24일 인공지능사업화 세미나: 유동인구 빅데이터 딥러닝을 활용한 신규매장 방문자 수 예측 솔루션 - 초록소프트8월 24일 인공지능사업화 세미나: 유동인구 빅데이터 딥러닝을 활용한 신규매장 방문자 수 예측 솔루션 - 초록소프트
8월 24일 인공지능사업화 세미나: 유동인구 빅데이터 딥러닝을 활용한 신규매장 방문자 수 예측 솔루션 - 초록소프트
 
8월 24일 인공지능 사업화 세미나: IoT 스마트팩토리 솔루션 - 스태프프로젝트
8월 24일 인공지능 사업화 세미나: IoT 스마트팩토리 솔루션 - 스태프프로젝트8월 24일 인공지능 사업화 세미나: IoT 스마트팩토리 솔루션 - 스태프프로젝트
8월 24일 인공지능 사업화 세미나: IoT 스마트팩토리 솔루션 - 스태프프로젝트
 
8월 24일 인공지능사업화 세미나: 인공지능 IIoT솔루션 - 엔키아
8월 24일 인공지능사업화 세미나: 인공지능 IIoT솔루션 - 엔키아8월 24일 인공지능사업화 세미나: 인공지능 IIoT솔루션 - 엔키아
8월 24일 인공지능사업화 세미나: 인공지능 IIoT솔루션 - 엔키아
 
Cyclic open innovation framework with big data of cities
Cyclic open innovation framework with big data of citiesCyclic open innovation framework with big data of cities
Cyclic open innovation framework with big data of cities
 

응용서비스에 따른 인공지능기술 연구이슈

  • 1. Page 1 응용서비스에 따른 인공지능 기술 연구 이슈 임채균 지식공학 및 집단지성 연구실 (KECI Lab.) KAIST 전산학부 2017. 10. 25.
  • 2. Page 2 Contents  연구실 소개 • 연구실 개요 • 연구실 구성원  Intelligent Personal Agent • 개인화된 상황 기반 뉴스 추천 기술 연구 • 주도적 어시스턴트를 위한 의도분석 및 이벤트 제안 기술 연구 • 헬스케어와 웰빙을 위한 개인화 플래닝 & 스케줄링 기술 개발 연구  ExoBrain and Chatbot • 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발 • 과제 지능형 대화 서비스를 위한 화용 및 문맥 분석 기반 대화 솔루션 개발  Healthcare • 모바일 스마트폰 환경에서 개인화된 상황인지형 헬스케어 서비스 에이전트 • 현장전문가의 경험지식 획득 및 활용을 위한 경험지식플랫폼 개발 연구 • 대학생 정신건강 관리 앱 개발  Vision and Image Processing • 유비쿼터스 보안 센서 네트워크를 이용한 지능형 헬스케어 감시시스템 • IoT 기반 도로위험기상정보 생산 및 활용기술 고도화  Super-computing • HPC 환경 기반 Deep learning 기술 적용 및 최적화 모델 연구
  • 3. Page 3 • Intelligent personal assistant • Experience mining and reuse • AI planning and scheduling • Recommender systems • Medical/health informatics • Clinical decision support • Bioinformatics • Text mining & topic modeling • Social trends analysis • Sentiment/emotion analysis • Intent recognition • Vision & activity recognition • Deep learning architecture • Natural language Q&A • Temporal info. extraction • Natural language paraphrase • User adapted dictionary Intelligent Language Tech. Applications of AI & KE Knowledge Engineering & Collective Intelligence Laboratory VISION 1. Innovative applications of AI & KE 2. Collective intelligence/deep learning 3. Natural language Q&A 4. Medical/health informatics Collective Intelligence, Deep Learning [Web] http://kecilab.kaist.ac.kr
  • 5. Page 5 연구실 구성원  Faculty & staff • Professor: 최호진(Ho-Jin Choi) • Secretary: 신유진  Students • Ph.D (full-time): 김한규, 오교중, 임채균, 현종환 • Ph.D (part-time): 박찬규 • Master: 이동건, 고병수, 한승호, 박찬용, Li Zhun, 이영준, 이혜영
  • 7. Page 7 [삼성전자 전략산학패키지 – 1차] 개인화된 상황 기반 뉴스 추천 연구
  • 8. Page 8 연구 개요  뉴스 문서 내/외 정보를 통한 사용자 성향 파악 및 뉴스 추천 뉴스 문서 외 정보 분석을 통한 뉴스 추천 SNS 내 활동 내용뉴스 카테고리 별 선택 정보 데이터 수집 및 전처리 과정 뉴스 종류 분석 (카테고리 분석) 뉴스 문서 분석 (뉴스 내 주요 키워드) 사용자 문서 분석 (사용자 성향 분석) 추천 만족도 비교 분석 +SNS 뉴스 추천뉴스 추천 사용자 별 선호 키워드 정보 선호 키워드, 사회적 관계망 정치적 성향 열람 뉴스 문서 분석을 통한 뉴스 추천 RSS Email SNSWeb • 뉴스 문서 분석을 통한 토픽 기반 뉴스 추천 • 뉴스 종류 분석을 통한 뉴스 추천 뉴스 문서 분석을 통한 뉴스 추천 • 사용자 문서(SNS, SMS, Email) 기반 단어 분석 및 뉴스 추천 • 소셜네트워크 분석 기반 뉴스 추천 사용자 성향 기반 뉴스 추천
  • 9. Page 9 [삼성전자 전략산학패키지 – 2차] 주도적 어시스턴트를 위한 의도분석 및 이벤트 제안 기술 연구
  • 10. Page 10 연구 개요 홍길동 휴가/레져 사교 교육/훈련 건강 종교 쇼핑 외식 비즈니스 Cars Land Disneyland Park 리뷰 내 방문의도 분석 관광지 리뷰 DB 관광지 관광지 리뷰 Attraction Network 2013.06 Universal Studio 2014.02 Disneyland Paris 아이들을 데려가기에 좋은 곳… 작은 동물들 … 교육 및 정서 발달… 맘껏 뛰어 놀 수 있는 … 관심사 과거 기록 • 시간: 2015.03.22 • 위치: Tarzan’s Treehouse • 행동: walking 현재 상황 다음 행선지 제안: Cars Land
  • 11. Page 11 [삼성전자 전략산학패키지 – 3차] 헬스케어와 웰빙을 위한 개인화 플래닝 & 스케줄링 기술 개발 연구
  • 12. Page 12 연구 개요 피트니스 트래커 시계열 센서 데이터 측정 Time in minute 걸음수 Time in minute 칼로리소모량 Time in minute 심박수 스마트폰 상황정보/활동도 기반 라이프 로깅 행동인식/활동도 모델 학습 활동도 예측 시간 활동도 예측 측정 Input:측정된 시계열 데이터 Output: 학습 데이터 측정값 학습 모델 ID Time Location Actions Score … … … … … 4 12:00~12:05 실외, 교내 Walking 0.90 5 12:00~12:25 실내, 식당 - 0.20 6 12:25~12:30 실외, 교내 Walking 0.85 7 12:30~19:15 실내, 연구실 - 0.10 8 19:15~20:00 실외, 교외 Running 0.15 스마트폰 소지방식, 상황 정보 (위치, 행동) 활동도 기반 시간 로그 정보상황 정보 수집 위치 정보 행동 정보 추천 운동: 도수체조, 스트레칭 알림 센서 데이터 시계열 데이터 시간 테이블 운동 가능 시간 운동 추천 시간: 15분 운동 가능 후보 시간대 추천상황 인지형 건강 관련 컨텐츠 추천
  • 14. Page 14 [미래창조과학부 엑소브레인 (2단계)] 휴먼 지식증강 서비스를 위한 지능진화형 WiseQA 플랫폼 기술 개발 • 시공간정보추출 • 패러프레이징
  • 15. Page 15 엑소브레인(Exobrain) 프로젝트  엑소브레인(외뇌, Exobrain): 내 몸 바깥에 있는 인공 두뇌라는 뜻
  • 16. Page 16 특집 장학퀴즈 엑소브레인 우승 http://news.khan.co.kr/kh_news/khan_art_view.html?artid=201611202054015&code=100100
  • 17. Page 17 : 개선 : 신규개발 자연어 심층 이해 및 학습 기술 자율학습 기반 지능진화형 QA 기술 신규언어지식 적응형 학습 기술 온라인 무한학습 언어지식 프레임워크 단어 의미 애매성 해소 통계기반 학습용 언어자원 관리/검증 형태소 분석 기술 개체명 인식 구문분석 시공간 정보 추출 시맨틱 프레임 추출 개체간 generic 관계추출 하이브리드 참조해결 대용어 탐지 및 복원 속셩별 감성분석 세부분류 감성분석 정답 유형 인식 질의가설 추출/ 인식 사용자모델, 문맥 기반 질의 신뢰도 분석 자연어 질의 분류 자연어 질의분할 질의 엔티티 시맨틱프레임 생성 최적응답전략 생성기술 정답후보 multiple hypothesis 생성 정답 합성 및 융합 엔티티 유형 추론 다중 지식베이스 기반 정답 근거 제시 이질소스 기반 정답후보 생성 다중증거 기반 정답추론/신뢰도 측정 다중정보 색인/검색 QA지식 자율학습 기술 핵심 세부기술 분류
  • 18. Page 18 예시 시공간 정보 추출 연구 개요 : 자연어 문장에서 시간 및 사건 어휘를 찾고, 이들간의 관계 정보를 추출하는 것 문장에 출현하는 단어의 절대적 시간 정보 및 사건 정보 시간/사건 어휘 간의 다양한 시간적 관계 정보 • 공간 정보 추출 : 자연어 문장에서 공간 어휘를 찾고, 이들간의 관계 정보를 추출하는 것 문장에 출현하는 단어의 절대적 혹은 상대적인 지리적 위치 정보 공간 어휘 간의 위상/방향/거리/경로 등 다양한 관계 정보 [철수]trajector는 [지난 주]timex3 에 [부산]path[S][에서]motionSignal [서울]path[E][로]motionSignal [이사했다.] 공간 Relation 2 : {철수, 이사했다, 서울[to]} 공간 Relation 1 : {철수, 이사했다, 부산[from]} motion, event 시간 Relation 1 : {철수, 이사했다, 지난 주[2017-W14]} • 시간 정보 추출
  • 19. Page 19 시간 정보 추출 방법 • 시간 정보 추출 흐름도 시간 정보 추출 블록 입력 문장 철수는 어제 카이스트에 입학했다. 언어 분석 결과 형태소 분석 결과 : 철수/NNG 는/JX 어제/NNG 카이스트/NNP 에/JKB 입학/NNG 하/XSV 았/EP 다/EF ./SF 개체명 인식 결과 : 카이스트/OGG_EDUCATION 의존구문분석 결과 : 0 : 철수는/NP_SBJ/head=3 1 : 어제/NP/head=2 2 : 카이스트에/NP_AJT/head=3/mod={1} 3 : 입학했다./VP/head=-1/mod={0,2} TIMEX3 추출 EVENT, MAKEINSTANCE 추출 TLINK 추출 시간 정보 추출 결과 TIMEX3 { id=TIME_S0_t0, text=“어제“ type=DATE, value=2017-10-24, begin=2, end=2 } EVENT { id=TIME_S0_e0, text=“입학하“ class=OCCURRENCE, begin=5, end=6 } MAKEINSTANCE { id=TIME_S0_ei0, eventID=TIME_S0_e0, polarity=POS, tense=PAST, pos=VERB } TLINK { id=TIME_tl0, relType=INCLUDES, eventInstanceID=TIME_S0_t0, relatedToTime=TIME_S0_ei0 } 철수 는 [어제]TIMEX3 카이스트 에 [입학 하]EVENT 았 다 . TLINK SPOTL 변환 { 철수, 입학하다, 카이스트, 2017 − 10 − 24, 𝜙 } S P O T L
  • 20. Page 20 시간 추출 – 연구결과 데모  데모페이지: http://143.248.55.244/demo.html
  • 21. Page 21 질문함의 생성 및 평가 연구 개요 광종의 업적 중 하나로 본래 양민이었으나 호족 세력에 의해 불법으로 노비가 된 자를 다시 양민으로 환원시키기 위해 만든 법률은 무엇일까? • 입력 문장 • 질문함의 문장 광종의 공적 중 한가지로 애당초 양민이었으나 호족 세력에 의해 불법으로 노비가 된 사람 을 다시 양민으로 되돌리기 위해 만든 법은 무엇일까? “질문 문장과 의미가 같고, 문법적으로 완벽한 함의문장의 생성 및 평가” 의미보존성 (1~6) 문법정확성 (1~6) 어휘비유사성 (1~6) 표현대중성 (1~6) 통합 평가결과 (1~6) 평가 점수 5 6 2 4 5 • 연구 목적 • Q&A 시스템에서 같은 의미의 어휘로 치환을 통한 질의량 증가 [M. and S. Soubbotin, 2001] • Watson Q&A 시스템에서도 문법적으로 알맞는 문장을 생성 [M. Wang, et al. 2007] • 자주 쓰는 표현으로 문장을 변형함으로써 IR에서의 결과 향상 [J. Kim, et al. 2016] • 접근 방법 및 사용 기술 • Statistical Machine Translation(SMT)의 함의(Entailment) 기술 • 한글-영문 병렬 말뭉치에서 함의 어휘/절 추출 및 학습 • Paraphrasing의 추출(extraction)과 생성(generation) 기술 • WiseWorldNet(WWN)을 이용한 어휘 치환(lexical replacement) 후보 탐색 • 기계학습 기반의 언어모델 학습을 통한 문장 생성
  • 22. Page 22 질문함의 생성 및 평가 데모 [원 문장] 과거 중국에서는 이 금속을 섭취하면 불로장생한다고 믿어 황제들이 조금씩 복용해 중독되는 경우가 많았다. 미나마타병의 원인이 되는 이 금속은 무엇일까? [함의문장] 옛날 중국에서는 그 철을 복용하면 불로장생한다고 있어 군주들이 서서히 복용해 중독되는 문제가 많았다. 미나마타병의 요인이 있는 그 철은 어떤 것 일까?
  • 23. Page 23 문장/문단/문서 유사도 분석 한국어 문장 엑소브레인(Exobrain)은 “내 몸 바깥에 있는 인공 두뇌”라는 뜻으로 ‘세계 최고인공지 능 기술 선도’라는 비전을 달성하기 위하여 미래창조과학부 소프트웨어 분야의 국가 혁신기술 개발형 R&D 과제이다. … 엑소브레인 은 내 몸 바깥 에 … … 의미기반 형태소임베딩 BidirectionalGRU Sentence dense vector Morpheme vector Word attention BidirectionalGRU Paragraph dense vector Sentence attention … 문장 접속 관계 (순접, 역접, 병렬, 진행형, 설명, 선택, 전환)에 따른 문단 의미 벡터 보정 문장/문단 dense vector (의미적/구조적) 평가 방법 구체화 부정 표현에 따른 문장 의미 벡터 보정 예시) 질문문장: ‘몸 바깥의 뇌’라는 뜻의 미래창조과학부 R&D 과제는 무엇인가? RNN Document dense vector … Paragraph attention 문단 구성에 따른 문서 의미 벡터 보정 문장-문단 유사도 분석 문단-문단 유사도 분석 내용 전개 방법 (정의, 비고, 대조, 분류, 분석, 예시)에 따른 의미 벡터 보정 문서 B문서 A Paragraph dense vector extraction model Sentence dense vector extraction model Document dense vector extraction model 문서 벡터 간의 유사도 측정
  • 24. Page 24 [ICT R&D 바우처 지원사업] 과제 지능형 대화 서비스를 위한 화용 및 문맥 분석 기반 대화 솔루션 개발
  • 25. Page 25 연구 목표  챗봇 구현 및 요소 기술 연구 Originated by Christos NLP (NLU/NLG) Counseling Emotion recognitionPsychiatry Mental Healthcare Emotion I can not sleep for a few days. How long have you been unable to sleep? I think it has been about two weeks. There was a deadline last week. It looks like insomnia caused by lethargy. You've been under a lot of stress for about two weeks.
  • 26. Page 26 출처: [Fluid, The North Face XPS(Expert Personal Shopper), 2015.10] 옷 입는 목적, 옷 입는 시기, 성별에 대해 자연어 문장으로 응답 옷 입는 목적, 입는 시기에 대한 날씨 정보를 종합하여 최적의 상품 추천 추가 질문을 통해 상품 추천 구체화 출처: [데일리인텔리전스(Leevi), DAVinCi Bot, 2017.02] 자연어 처리/챗봇 솔루션 보험심사 및 대출심사 시스템으로 적용 연간 부도율 3% 대출심사 승인율 20% 이상 은행, 증권, 유통 등 20 업체 도입 검토 중 등 4개 업체 PoC 완료 금융업 사례 (주관기관 서비스) 지능형 대화 서비스 현황
  • 27. Page 27 사업명 사업기간 지능형 대화 서비스를 위한 화용 및 문맥 분석 기반 대화 솔루션 개발 2017. 4. 1. - 2018. 3. 31. 개발 목표 “자연어 대화에서 화용과 문맥의 깊은 이해를 통하여 대화의 주제와 목적을 정확하게 분석하고, 주제와 목적에 적합한 응답과 정서적인 대화를 생성하는 지능형 대화 솔루션” 연구 개요
  • 28. Page 28  개체명 인식과 의미모호성 제거를 통한 개체명 사전 확장  자주 등장하는 개체명 (상 품명, 지명, 날짜) 인식 개선  의존구문 분석을 통한 의 미역 인식  기계학습 기반 한국어 의 존구문 분석 기술 적용 및 개선  대화 서비스에 특화된 의 미역 인식 기술 개발 최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발 (세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화 (세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술 (세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술 세부 연구 주제 1
  • 29. Page 29 최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발 (세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화 (세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술 (세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술  대화의 함의 분석을 통한 대화 도메인 분류  문장의 함의 정보 분석을 통한 대화 도메인 유사도 측정  서비스 별 대화 군집화 및 도메인 카테고리 정의 도 구 개발  대화를 위한 발화 의도 분 류 체계 설계 및 데이터 수 집  발화 의도 분류 모델 학습 및 분류기 개발  상대시간 표현 주석언어 설계 및 주석 말뭉치 구축  상대시간 표현을 위한 TIMEX3 추출 모듈 개발 세부 연구 주제 2
  • 30. Page 30 최종목표: 자연어 처리 기술 고도화 및 지능형 대화 서비스 요소 기술 개발 (세부주제 1) 의미와 화용 분석을 통한 자연어 처리 솔루션 고도화 (세부주제 2) 지능형 대화 서비스를 위한 자연어 질의 이해 기술 (세부주제 3) 사람-기계 대화를 위한 자연어 응답 생성) 기술  서비스 대응을 위한 템플 릿 기반 선질문과 응답 등 목적 대화 생성  대화 문맥을 고려한 선질 문을 통한 추가 대응 정보 수집  서비스 별 대화 도메인 카 테고리에 따른 대응 템플 릿 정의  사람과의 정서적 소통을 위한 기계학습 기반 일반 대화 생성  대화 도메인과 문맥을 고 려한 기계학습 기반 응답 문장 생성 모델(decoder) 학 습  유머러스한 데이터 수집과 학습을 통한 정서적인 응 답 생성 모델 구현 세부 연구 주제 3
  • 32. Page 32 [NCRC 국가핵심연구센터-시스템바이오정보의학연구센터] 모바일 스마트폰 환경에서 개인화된 상황인 지형 헬스케어 서비스 에이전트
  • 33. Page 33 Middleware Integrative analyses OCS PACS EMR LIS Seq. Exp. Prot. Tissue CGH HL-7 DICOM CDA LOINC BSML MAGE MIAPE TMA ? SNP HapMap 2DPage ProtChip Tissue MA BAC Chip Phenomic Self Extractor Genomic Self Extractor Clinical Genomics BioData Acquisition Pattern Recognizer DNA Chip Transformer XML Binder DBConnector HL-7 / CDA Protocols Hospital caBIO EVS caDSR CRF CDE/CTEP caCORE IDE Foundation Self Warehouse 유방암 Application 폐암 Application 혈액암 Application Legacy System Authentication/Authorization Interface 자료 수용기 CGI- gateway WebServer XML-Validation Ontology-Enhancement Data Indexing Clinical Trials Knowledge Base XML CGI-gateway Retrieval engine Query Constructor Clinical Research & Clinical Trial KB Application Processor Search engine Statistical analysis Visualization Simulation Communications Workflow Middleware Ontology Server Vocabulary Server Taxonomy Server Public Bio-DBs Simulated Self Individuated Second Self Foundation Self Molecular & Cellular Foundations of Self Ubiquitous Self Life Logs and Distributed Collaborations Genomic Self: Translational Bioinformatics for Genomic Health and Molecular Medicine Phenomic Self: Data and Measurement driven Discovery and Understanding of Human Disorders Physiomic Self: Multi-scale Modeling of Physical and Physiological Systems of Human Body Semantic Self: Ontological Representation and Engineering of Health Avatar Augmented Self: Multi-modal Assessment and Treatment to Retain and Enhance Human Performance Connected Self: Life Logs and Stream- Type Data Mining for Health Protection Distributed Self: Customized and Context-aware Healthcare Service Agents in Smart Phone Environment Digital Self
  • 34. Page 34 Fall Detection 에이전트 내용 및 특성 1) 낙상 : 급격한 신체 움직임의 일정한 패턴 2) 서비스 - 낙상으로 인한, “응급상황”인지 파악 - 비상연락망 연결 조치 - 낙상 통계 표시 3) 방문기록의 수집방법 - 개인 스마트폰 센서 (자이로 센서, 가속도 센서) 이용 4) 낙상 인지 모듈 - Decision tree 기반 알고리즘 - 주기적 업데이트 : 모듈 파라메터 배포 시나리오 개략도 Fall Client Trained Decision tree Real-time sensor data Classification Server Sensor data Trained Decision tree Training protocol
  • 35. Page 35 Fall detector Statistics See friends Medical info. Settings See friends Statistics My fall-log Edit a period OK Medical info. My current situation - Weak point : 5 times fall/emergency last week. CLICK : Good equipments for fall(emergency)! (2$ / 1 month) Settings Edit Profile - Gender : Male - Age : 25 - Name : 한반도 Edit ID/PASSWD - ID : NCRC01 - PASSWD : ******** Confirm Last 3 weeks Call list 오승택 normal 차동재 Emergency, NOW! 김경훈 normal CLICK : Good equipments for fall(emergency)! (2$ / 1 month) Statistics 3 Months Weeks0 Confirm See friends 차동재 in Emergency! Fall Detection 에이전트 UI
  • 36. Page 36 Lifestyle Manager for Obesity 에이전트 내용 및 특성 1) 방문기록: {사용자ID, 09:00~10:30, 사무실, 업무} 2) 행동: 방문장소의 영향을 받음 (e.g., 짜장면 집에 가서 스테이크를 시켜먹진 않는다) 3) Lifestyle = 방문기록 모음 4) 서비스 - 사용자 방문기록 표시 - 사용자 방문기록 기반 분석서비스 5) 방문기록의 수집방법 - 개인 스마트폰 센서(Wifi) 이용 - Wifi 신호 기반 논리적 장소 인지 6) 분석서비스 - 장기간 수집된 데이터 기반 사용자 Lifestyle 조언 서비스 - BMI 변화량에 기반한 사용자 간 경쟁의식 고취 User model Lifestyle trie User profile 시나리오 개략도
  • 37. Page 37 * 기본화면 1) 각종 센서 On/Off 가능 2) 내부 컴포넌트 실행 가능 * 첫 화면(Tab-1) 1) Wifi 리스트 표시 2) 현재 논리적 위치 표시 3) 현재 위치한 논리적 장소 등록 * 첫 화면(Tab-1)에서 버튼 눌렀을 때, 1) 새로운 논리적 장소 등록 (카테고리 지정) 2) 기존의 장소를 수정 가능 Lifestyle Manager for Obesity 에이전트 UI
  • 38. Page 38 * Tab-2 1) 설정한 날짜에 해당 하는 방문 정보 표시 * Tab-3 1) 설정한 “연도”에 해당하는 카테고리 별 누적 시간(min) 차트 표시 * Tab-4 1) 등록된 장소 목록 표시 * Tab-5 1) 각종 환경설정 기능들 망라 (특히, 통계치 업데이트 버튼은 차후에 자동으로 업데이트 되는 방식으로 확장 예정) Lifestyle Manager for Obesity 에이전트 UI (cont’d)
  • 39. Page 39 한글 트위터 데이터 기반의 감정분석 기술 고도화  긍정적 컨텐츠 추천을 위한 한글 트위터의 감정표현 자질 정의  Ekman의 6가지 감정 분류를 활용한 한글 트위터 감정분석 모델 구축 • 긍/부정 외에도 세분화된 감정을 분석 가능 3 9 Feature Resources Emotion lexicons Emotion word lists based on modified TF-IDF Punctuations Question, exclamation, question/exclamation mixed, full stop, comma, tilde Fine-grained emoticons and symbols Emoticon-Emotion lists Korean emotion letters Laughing. crying, mental chaos Korean exclamations of surprise List of Korean exclamations of surprise Korean swear words List of Korean swear word
  • 40. Page 40 한글 트위터 감정분석 기술 응용 – 2015 MERS 관련 트윗 분석  실제 트윗 데이터에 감정분석 기술을 적용하여 대중의 감성 변화 추이를 관찰  대상 데이터: 2015년 MERS (Middle East Respiratory Syndrome) 유행 당시의 트윗 • 수집 방법: Twiteer Streaming API 활용, “메르스”에 대한 쿼리 검색결과 데이터 수집 • 수집 기간: 2015년 6월 5일 ~ 30일 (25일 간) • 전처리: RT(리트윗), URL 링크, 답글만 포함된 트윗 데이터 제외 • 전체 데이터: 145,098 unique tweets  감정 분포 및 변화 추이
  • 41. Page 41 Qualitative Analysis Date News Article Emotion Tweet Example 6.6 메르스 첫 감염자 아내 '완치 '… 첫 퇴원 사례 Happiness 오~굿뉴스가 있네요~첫번째환자아내분이 완치되어 퇴원을 했다네요~오~메르스에 걸려 도 건강한 사람은 자유치유가능하다고 하니 다행이네요~그래도 걸려서 고생하는것보다 지 금처럼 건강한게 좋은거니까 몸관리 잘하시길~~!!!!^^ 6.9 임신부가 메르스 첫 양성 "치 료 어떻게... Sadness Disgust Fear 아... 임산부 메르스 환자 발생했다고ㅜㅜ... 다들 걱정이지만 제일 걱정되는 분들이 임신중 인 여성분이었는데... 약이 아기한테 어떤 영향을 줄 지 모르니ㅠㅠ 6.11 3차 메르스 유행 우려, 90번 환자·양천메디힐·창원SK Sadness 메르스 창원에서 어떤 할머니께서 양성반응이.. 다들조심 ㅠㅠㅠ 6.16 대구 첫 메르스 확진 환자, 시 추가 조사…잠복기 지난 뒤 이 상증세? Surprise 뭐 머 대구 ㅂ메르스터졋어????? 6.23 메르스 책임 통감 이재용 국민 사과 Anger 삼성이 메르스 사태 관련 사과를 이재용이 직접했다. 근데 정부는 절대 사과를 하지 않는다. 6.25 박 대통령, 국회법 개정안 거 부권 행사…정치권 질타 Anger 오늘(25일) 박근혜 대통령이 국무회의에서 '국회법개정안' 거부권 행사를 강행하면 야당은 메르스 관련 특별법과 민생개혁 입법을 제외한 어떤 새누리당 법안도 합의해서는 안될 것! 세월호 참사 진실 감추려고 국회법개정안까지 거부하는 대통령은 탄핵해야! 0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5 05-Jun 06-Jun 07-Jun 08-Jun 09-Jun 10-Jun 11-Jun 12-Jun 13-Jun 14-Jun 15-Jun 16-Jun 17-Jun 18-Jun 19-Jun 20-Jun 21-Jun 22-Jun 23-Jun 24-Jun 25-Jun 26-Jun 27-Jun 28-Jun 29-Jun 30-Jun Anger Fear Happiness Disgust Sadness Surprise
  • 42. Page 42 긍정적 컨텐츠 추천을 위한 에이전트 개발  긍정 컨텐츠 생성자 목록 관리 • 긍정적 메시지 작성 비중이 높은 사용자 식별 및 관리 • 한글 트위터 데이터에 대한 감정분석 결과 활용 • 해당 사용자들을 룩업 테이블로 관리  긍정 컨텐츠 추적 및 DB 구축 • 룩업 테이블의 사용자들이 작성하는 긍정적인 컨텐츠 수집 • 조건 1: 뉴스, 블로그, 이미지, 동영상 등에 대한 외부 링크를 포함 • 조건 2: 메시지의 내용이 긍정적으로 분류  컨텐츠 추천 기능 • 타 사용자에게 긍정 컨텐츠 DB 기반의 새로운 컨텐츠 추천 4 2
  • 43. Page 43 긍정적 컨텐츠 추천을 위한 에이전트 개발 (cont’d) 4 3 긍정 컨텐츠 수집 (서버) 컨텐츠 추천 (클라이언트)
  • 44. Page 44 [산업기술평가관리원] 경험지식플랫폼 - 현장전문가의 경험지식 획 득 및 활용을 위한 경험지식플랫폼 개발 연구
  • 46. Page 46 과제 개관  현장전문가(의사/임상병리사/운동처방사)의 효율적인 의사결정을 지원하 는 사례기반의 자가학습형 경험지식플랫폼 개발
  • 48. Page 48 혈액종합검사 절차적 경험 지식 획득 및 소견 추론 혈종검사 DB 검사 결과 의사/임상 병리학자 지식 베이스 (RDR) Case Base (사례 베이스) 소견 생성/수정/삭제 혈액종합검사 시스템 소견 판단의 근거 검사자 A의 혈종 검사 결과 새로운 검사 결과 소견 추론 엔진 Inference 새로운 소견 생성 의사/임상 병리학자 소견판단지식및소견검토 새로운 검사 항목 새로운 소견 판단 기준 기존 시스템에 소견 반영
  • 49. Page 49 당일 상황을 반영한 운동 추천 • (1단계) 운동 계획 후보 생성 • 제약 조건을 주어 당일 운동 계획에 사용될 운동 수 줄이기 • CSP (Constraint Satisfaction Problem) • (2단계) 운동 계획 후보 간 우선순위 부여 • (안1) 기존 계획 유사: 높은 우선순위; 기존 계획 상이: 낮은 우선순위 • (안2) Preference constraints 또는 Ordering constraints 정보 종류 항목 제약조건 기본 정보 주근육 Constraint 1) 당일 운동의 주근육은 기존 운동의 주근육과 적어도 하나 이상 일치함 운동 중복 Constraint 2) 당일 운동 중복 없음 신체 정보 성별 Constraint 3) 당일 운동의 주요 성별은 고객의 성별에 부합함 상황 정보 컨 디 션 피로 Constraint 4) 당일 운동의 분류는 고객 피로 누적인 경우, 근력 운동이 아님 통증 Constraint 5) 당일 운동의 주근육은 고객의 통증 근육과 일치하지 않음 운동 기구 Constraint 6) 당일 운동의 운동 기구는 사용 가능함 운동 공간 Constraint 7) 당일 운동의 운동 공간은 확보됨 선호 정보 난이도 Constraint 8) 당일 운동의 난이도는 고객의 난이도 보다 낮거나 같음
  • 51. Page 51 연구 목표  대학생 정신건강 관리 어플리케이션 개발 • 간단하고 효과적인 사회심리적 스트레스 대처법 및 정신건강 관리에 관심 있는 모든 국내 대학생 및 대학생 정신건강 서비스 관련 종사자 대상 • 국내 대학생들에게 접근이 용이한 모바일 앱 기반 정신건강 서 비스를 제공함으로써 대학생 정신건강 문제 예방 및 관리 촉진, 대학 캠퍼스 내 정신건강서비스 보급 문제 완화 목적 • Evidence-based: 정신의학 및 심리학 전문가들이 구성하는 근거-기반 콘텐츠 • Immediate & Ongoing: 스트레스 상황 시 즉각적 대처 및 지속적 정신건강 관리 프로그램 • Tailored: 사용자 데이터 기반 맞춤형 서비스 • Engaging: 인터랙티브 콘텐츠 및 사용자-친화적 인터페이스 주요 특징
  • 52. Page 52 연구 주제 1  정신심리상담 챗봇 • 가벼운 대화로 환자의 기분을 전환시켜줄 수 있는 정신심리상담 챗봇 개발 • 챗봇을 사용하여 심리상담사/정신과 의사의 업무량을 줄일 수 있음 대화형 플랫폼 (웹/앱) 응답자 (전문가-임상심리사, 정신과 의사 등) 대화형 말뭉치 (정신심리상담) 도메인 전문 지식 (정신과 온톨로지) 대화형 어시스턴트 (정신심리상담) 대화 쓰레드 A (정신심리상담 내용) 최근에 두통이 자주 생기셨나요? 요즘 입맛이 없고, 낮에 매우 졸립고, 조 금만 움직여도 매우 피곤한데, 밤에 잠 을 잘못 자네요 대화 입력 (텍스트/음성) 상담자 A (사용자) 네, 그리고 잠을 자도 개운하지 않아서 자꾸 늦잠을 자게 되요. 그렇군요. 제가 뭘 어떡하면 좋을까요. 네, 무기력증의 증상이시네요. 식사 잘 챙겨 드시구요, 몸을 활동적이 게 바꿔야 합니다. 하루 30분 산책을 해보도록 하세요. 대화 입력 (텍스트/음성) 대화 쓰레드 B (정신심리상담 내용) 대 화 분 석 학 습 도메인 지식 제공 증상  진단  해결 방안 추론 정보 대화 입력 (텍스트/음성) 대화형 말뭉치 (정신심리상담)대화형 말뭉치 (정신심리상담) 대 화 지 원 상담자 B (사용자) 몸에 기운이 없고, 피곤함을 느낄 때가 많네요. 대화 입력 (텍스트/음성) 추가 증상: 두통이 발생 하십니까? 네, 또 좀처럼 잠을 이룰 수가 없어요. 기존의 무기력증(번아웃증후군) 상담 사 례와 유사한 증상입니다. 네, 무기력증의 증상이시네요. 해결 방안과 관련된 전문 정보: http://www.yesmental.or.kr/... 참고 바랍니다. 대 화 분 석 학 습 운동이 제일 좋은 방법이지만 취미생활에 몰두하는 방법도 좋습니다. 웹 정보 수집
  • 53. Page 53 연구 주제 2  정신심리상담을 위한 감정 인식 기술 • 목소리/SNS 로그 데이터로부터 사용자의 감정을 인식하는 감정인식 기술 개발 • 사용자의 감정에 따라 개인에게 적합한 정신건강 증진 프로그램 추천 Multi-model based Psychiatric Counseling Service Ethical judgment model ··· ··· Response for unethical behavior oice deo ext sense Generalization Categorization Personalization ARTMAP (Adaptive Reasoning Theory MAP) bi-ARTMAP, ARAM (Mirror neurons imitation)LSTM Emotional response Datafortheemotionrecognition
  • 54. Page 54 앱 개발 결과  설문조사를 통한 사용자 정신건강 상태 데이터 수집 • 심리학 전문가가 설계한 문항을 통해 앱 사용자 정신건강 상태 파악 및 수집 • PHQ-9(9문항 환자 건강관련 설문조사), GAD-7(7문항 불안장애관련 설문조 사) 등 심리학 분야에서 검증된 정신건강 평가 지표 사용
  • 55. Page 55 앱 개발 결과 (cont’d)  기분 모니터링 기법을 통한 사용자 정신건강 상태 데이터 수집 • 사용자가 직접 현재 기분을 입력하도록 유도하여 정신건강 상태 데이터 수집 • 기분 입력은 날짜 별로 입력할 수 있음 • 현재 기분 뿐만 아니라 식욕/수면 등 건강 상태도 입력 가능
  • 56. Page 56 앱 개발 결과 (cont’d)  채팅기반 대화 플랫폼 탑재를 통한 사용자-상담사 대화 데이터 수집 • 전문 심리 상담사가 정신질환 환자와 원격으로 대화할 수 있는 채팅 플랫폼 제공 • 채팅 플랫폼을 통해 고민 상담 및 정신건강 증진 프로그램 수행 가능 • 채팅 플랫폼에서 수집된 대화 데이터를 사용하여 챗봇 개발
  • 57. Page 57 Vision and Image Processing
  • 58. Page 58 [기상청] IoT 기반 도로위험기상정보 생산 및 활용 기술 고도화
  • 59. Page 59 연구개발 개요  목표 • IoT 기반 고해상도 도로경로별 기상정보 생산 기술 고도화  핵심기술 • 고정식/이동식 관측 장비의 값을 사용하여 딥러닝 학습 모형, 데이터 패턴 분석 군집화 기 술을 고도화하고, 기상정보 생산의 정확도를 높이는 것 CCTV Edge, 명도 CCTV영상 학습모형개발 다중ROI 패턴 그래프 군집화 RWIS장비 이동식 관측 차량 추출 변환 Deep Learning 학습 모형 개발 기상관측값 부산대 보유 기자재 1단계 구축 설치 rain snow snow snow snow snow
  • 60. Page 60 연구내용  CCTV 영상 기반 위험기상정보 생산 알고리즘 개선  IoT 기반 장비 데이터 분석을 위한 딥러닝 학습 모델 개발 ◦ 장비 별(CCTV, Rain sensor 등) 데이터 선택 및 전처리 방법 정의 ◦ 장비 별 위험기상정보 생산을 위한 딥러닝 모델 설계 및 학습 ◦ 학습된 딥러닝 모델을 통한 장비별 위험기상정보 생산
  • 61. Page 61 연구내용 (cont’d)  CCTV 영상 기반 위험기상정보 생산 알고리즘 개선  기상정보의 정량적 수치 예측 어려움 ◦ 이미지의 배경 부분은 기상정보 생산에 노이즈가 되어 성능 저하 우려 기술적 문제  CCTV 영상 데이터의 time-series 정보를 고려하기 위한 CNN과 RNN의 결합 ◦ CNN은 각 프레임으로 부터 feature maps 추출 ◦ RNN은 추출된 특징의 time-series 정보 분석  CNN/RNN모델 각각의 특징을 고려한 고도화된 학습 기법 필요 해결 방안 • CNN: Convolutional Neural Network • RNN: Recurrent Neural Network
  • 62. Page 62 연구내용 (cont’d)  CCTV 영상 기반 위험기상정보 생산 알고리즘 개선  기존 CNN은 정적인 이미지만 분석 가능 ◦ CCTV 영상 데이터의 time-series 정보 손실로 인한 정확도 감소 우려 기술적 문제  CCTV 영상 데이터의 time-series 특징을 이용한 전처리 방법 적용  연속된 프레임(frame) 간의 차이값 사용 ◦ 강우량에 따른 빗줄기 움직임 및 밀도 차이 극대화 ◦ 이미지 내 배경 및 차량의 영향 최소화  상기 전처리 이미지를 활용해 CCTV 영상에 특화된 딥러닝 모델 학습 해결 방안
  • 63. Page 63 연구내용 (cont’d)  CCTV 영상 기반 위험기상정보 생산 알고리즘 개선  CCTV 영상 내 객체에 따라 날씨정보 결정에 대한 영향력이 다름 ◦ E.g.) 우천 → 어둡고 흐린 하늘 영역; 폭설 → 흰색 비중이 증가한 도로 영역 기술적 문제  낮밤, 날씨 등을 고려한 image segmentation 적용  각 CCTV 영상데이터에 특화된 object identification 기법 ◦ 장기적 영상 학습을 통해, 해당 촬영지역의 환경 변화에 강한(robust) 모델 학습  객체 별 영향력에 따라 차등적 가중치 적용 해결 방안
  • 64. Page 64 [KUSTAR-KAIST 국제공동연구] 유비쿼터스 보안 센서 네트워크를 이용한 지능형 헬스케어 감시시스템
  • 65. Page 65 Project Overview To design and develop a distributed, intelligent multi-sensor healthcare system for monitoring and caring people in a hospital or in a silver town Multi-sensor healthcare systems 1 Social healthcare Fall alarm system Home-based rehabilitation assistant 2 3
  • 66. Page 66 Past researches & Activities INTENSIVE SURVEYS - An Intelligent Multi-Sensor Surveillance System for Elderly Care - Fall Detection Systems for Elderly Care - Healthcare Monitoring Systems for the Elderly ACTION RECOGNITION USING TWO KINECTS - More tolerant to erroneous skeletons - More accurate in action recognition OBJECT RECOGNITION ON IMAGES - A new assumption that object follows Gaussian distribution with mean of image center - Unsupervised algorithm OBJECT COLORIZATION ON IMAGES - A new randomized algorithm for object colorization - More realistic colorization given colors of a target object INVESTIGATION OF PARAMETER APPROXIMATION IN DEEP LEARNING - Relationship between the order of data classes and the parameter approximation - Restricted Boltzmann Machines (RBMs) using Contrastive Divergence (CD) algorithm 1 ACTIVITIES - Student internship to KECI lab. (1) Omar Mohamed(18 June – 29 July 2013) (2) Nujood Alkendi (16 June – 25 July 2014) - KU Undergraduate students’ visit to KAIST : 11 June 2013 2 Hand wavin g
  • 67. Page 67 Topic 1: Social Healthcare Visit logs – Where, How long, Why visit? Calorie logs – How much calorie income/consume? BMI logs – How much fat are you? Three logs
  • 68. Page 68 Topic 2: Fall Alarm System Surveillance system Room 1 68 Camera 1 Room 2Camera 2 Patient A Room 3Camera 3 Doctor A Wireless AP 1 Wireless AP 2 Wireless AP 3 • Patient B : Room 1 (FALL) • Nurse A : Room 2 (OK) Nurse A Patient C Patient B Room 1 Room 2 Room 3 Alarm! 1 Fall accident! 2 Detection 3 Alarm 4 Human Action Inform the risky situation Report Detect fall using the accelerometer, gyroscope, … Fall detection Detect the location using the Wifi finger prints Location detection
  • 69. Page 69 Topic 3: Home-Based Rehabilitation Assistant You must come everyday to the hospital for therapy …but Doctor, this hospital is very far from my home.. …but Doctor, I must go to work from 9 to 6…but Doctor, I don’t have anyone to take me to the hospital everyday.. … Home-based Rehabilitation Assistant
  • 70. Page 70 Topic 3: Home-Based Rehabilitation Assistant (cont’d) 1 Show examples of therapy motion (ground truth) 2 Assess the patient’s motion 3 Give real- time feedback Please lift your ankle more 4 Report the results to the doctor Basis modules: • Real-time motion prediction • Expert system
  • 71. Page 71 Topic 3: Home-Based Rehabilitation Assistant (cont’d) Skeleton fusion Action recognition Reference mapping Camera1 skeletal data Fusion skeletal data Camera2 skeletal data Improving human action recognition using fusion of skeletal data from two RGB-D cameras Objectives: Fusion methods: View-invariant action recognition system: X Z Y … Temporal model: Sequence of action- words Classification: KNN + DTWAction-frame model: Histogram of body cubes Results: • Perform fusion of skeletal data from two cameras. • Use fusion skeletal data for recognizing action. • Evaluate : • Recognition accuracy • Performance in action prediction • Substitutive fusion • Fusion by averaging • Fusion data gave ~10% improvement in accuracy. • No significant improvement in action prediction
  • 73. Page 73 [KAIST-KISTI 협력연구] 국가 슈퍼컴퓨터 개발을 위한 기반 기술 공동 연구 HPC 환경 기반 DEEP Learning 기술 적용 및 최적화 모델 연구
  • 74. Page 74 KSITI-KAIST 공동연구과제 개요  국가 슈퍼컴퓨터 개발을 위한 기반 기술 공동 연구 • A Collaborative Research for National Supercomputer Development  연구목표 • 저전력 고성능(LP-HPC) 슈퍼컴퓨터 자체 개발을 위한 요소 기술을 확보 • 미래 AI형 슈퍼컴퓨터 개발 및 운영에 활용할 수 있는 핵심 기술을 개발 추진
  • 75. Page 75 HPC 환경에서 딥러닝 연구의 주요 이슈  Deep learning 과 HPC 의 관계 • 복잡한 구조의 artificial neural network(ANN) 모델을 big scale data으로부터 기계학습하기 위한 고성능의 computing power 가 필요  Computing power를 증진시키기 위한 접근 방법 • Scaling out: Using multiple machines in a large cluster to increase the available computing power • Scaling up: Leveraging graphics processing units (GPUs), which can perform more arithmetic than typical CPUs  HPC 시스템에서 deep learning 학습 시 어려운 점 • Communications bottlenecks (Hardware challenge) • Infiniband: 기존의 bus 방식에서 탈피, 장비 사이를 직렬 P2P 방식으로 연결, HCA (host chnnel adapter) 카드와 전용 스위치로 구성 • Managing computation and communication (Software challenge) • 많은 연구에서 computation을 최적화 하기 위한 방법들이 제안됨 [Hinton 2006] • 많은 GPU 사용을 위한 알고리즘과 언어구조 차원의 접근 방법 필요 (e.g. CuDA) E.g. Deep Neural Network(DNN)
  • 76. Page 76 연구주제 HPC 환경에 최적화된 DNN 모델 구축을 위한 hyperparameter tuning 병렬 프로그래밍 기술을 활용한 Deep Neural Network (DNN)의 학습 속도 개선 을 위한 근사 추정 기술 연구 Deep learning model training HPC based parallel programming 학습 단계에 따른 오류율 추적을 통한 DNN 학습 적합도 분석 및 과적합 판정 RMSE Iteration Well-trained Validation set Training set Bayesian Approximation Dropout Overfitting Less training time More accuracy Finding optimized model Mini-batch
  • 77. Page 77 Parallelism 기법 ◦ Same model to trains on different data subset ◦ No synchronize between GPUs in forward computing ◦ Parameter gradients computed from different GPUs must be synchronized in back propagation  Data parallelism  Model parallelism  Data + Model parallelism ◦ Each computational node is responsible for parts of the large deep neural network model by training the same data samples ◦ The communication happens between computational nodes when the input of a neural is from the output of the other computational node ◦ Because of communication expense, model parallelism is often worse than data parallelism ◦ Model parallelism could get a good performance with large number of neuron activities. Data parallelism is efficient with large number of weights ◦ The convolutional layer takes up more than 90% computation and 5% of parameters, while the fully connected layer consists of 95% parameters and 5-10% computation ◦ Using data parallelism for convolutional layer and model parallelism for fully connected layer
  • 78. Page 78 Ensemble learning과 Dropout ◦ Training set에서 random으로 sampling하여 Bootstrap sample들을 생성 ◦ 이들을 서로 다른 Classification model을 이용 하여 Predictions을 도출 ◦ 각 Predictions들을 Voting하여 다수의 결과를 최 종 Prediction으로 선정  Ensemble learning - Bagging ◦ Training set을 Mini-batch로 나눠 Training ◦ 각 Training step마다 Drop되는 unit들이 다르기 때문에 서로 다른 모델로 Training ◦ 다수의 Training과 Validation을 통해 최적의 hyper-parameter를 선택  Dropout