SlideShare a Scribd company logo
구조화된 모형학습을 위한 분산처리 기반기술
개발
임요한
선도연구센터 SRC
1
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
I
II
III
IV
연구의 주제 및 성격
연구의 선도성
연구의 융합성
연구 실적 목록
V 향후 계획
목차
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
구조화된 모형학습을 위한 분산처리 기반기술 개발
자료에 내재된 구조를 활용하면 보다 효율적인 통계적 추론 및 고속 계산이 가능. 추론 과정
을 병렬화된 알고리즘으로 근사, 구현하여 고차원 대용량 자료 분석에 적용
연구의 주제 및 성격 – 구조화된 모형학습을 위한 분산처리 기반기술 개발
1단계: 구조가 있는
자료의 모델링
4단계: 실제 데이터
적용
3단계: 고성능 분산
처리 컴퓨팅 구현
2단계: 병렬
알고리즘 개발
[Modeling
Structured Data]
[Parallel Algorithm]
[Distributed
Computing]
[Application]
Fused LASSO
시공간 –
Hidden Markov
Random Field
𝐴𝑥 = 𝑏, 𝐴 is a
structured
matrix
Composite
likelihood
Hadoop /
MapReduce
GPU
시공간자료
대용량 Omics
자료
뇌과학 자료
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
구조화된 모형학습을 위한 분산처리 기반기술 개발
• Fused LASSO 병렬화 절차 개발 : 현존하는 가장 빠른 알고리즘으로 현재 1-D까지 진행, 2-D에서도
근원적 단계부터 개선중
• 시공간– Hidden Markov Random Field의 Block Maximum Likelihood Estimator 제안 : 통계적 효율성이
이론적으로 증명된 composite likelihood 기반의 estimator를 제안
연구의 선도성 – 거대자료로부터 지식을 창출하기 위해 병렬화기법으로 효율성 극대화
연구주제의 선도성 연구방법의 선도성
계산 효율성이 떨어져 거대
자료에 대한 통계 모형 적합이
곤란
기존 연구 한계
통계적 효율성이 이론적으로
증명된 composite likelihood
기반의 estimator를 적용
새로운 통계적 방법론을
이용하여 데이터 분석
과정에서의 효율성을 극대화
연구성과의 선도성
브레인스토밍 등 전문가의
비과학적 방법론에 의존
데이터 분석의 효율성 극대화
기존 연구 한계
이론적으로 검증된 기법 적용
기존 연구 한계
복잡한 거대자료를 첨단
기법으로 분석하여 지식-
정보화 사회의 선도적 지식
창출
거대자료를 이용한 지식 창출
효율성에 대한 이론적인
측면의 검증 부족
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
구조화된 모형학습을 위한 분산처리 기반기술 개발
• 거대자료로부터 효율적으로 지식을 창출하기 위해, 이론적 배경인 기반 기술 지식과 구체적 알고
리즘을 제공하는 과학적∙공학적 방법론의 융합성 강조
연구의 융합성 – 기반 이론 및 기술 개발 단계부터 실제 적용과의 융합성 고려
연구 주제의 융합성
구조화된 모형
학습의 분산처리 기술 및
통계패키지 개발
의학, 기상학
 데이터 분석
알고리즘의
기초이론 개발
통계학
 고성능 컴퓨팅
기반기술 제공
컴퓨터 과학
 스펙트럼 자료, 뇌자료,
시공간 기상 자료 등
거대자료 및 지식 제공
 실제 활용가치 점검
연구 과정의 융합성
알고리즘 구현을 위한
고성능 컴퓨팅 기반 기술
개발
알고
리즘
및
패키지
개발
컴퓨팅
기반
기술
개발
고성능 알고리즘의 이론
확립 및 데이터 분석 협동
연구 주관
알고리즘 개발(통계학)
기술 개발(컴퓨터과학)
알고리즘 및 기반 기술 개발, 지식 창
출 등 전분야에서 타 팀들과 협업
통계패키지(SRC-stat)를
통한 자료분석 툴박스 제공
거대자료를 이용하여
새로운 지식 창출
지식
창출
지식 창출(의학,기상학)
연구 인력의 융합성
 복잡한 통계 모형의 효율적인 계산
방법에 대한 연구 수행
 다양한 분야의 통계 분석 모형 개발
통계학(임요한 교수 연구팀)
각 분야의 전문 지식과 풍부한 경험을
갖춘 우수 연구 인력들이 협업
 병렬처리 기법 등 첨단 고성능
컴퓨팅 기반 기술 연구 수행
컴퓨터공학(xxx교수 연구팀)
 고해상도 뇌영상 자료, 시공간 기상
자료 등에 대한 연구 수행
의학(김유경교수 연구팀) 및
기상학(오희석/이재용교수 연구팀)
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
구조화된 모형학습을 위한 분산처리 기반기술 개발
• 주제와 관련된 다양한 연구를 진행하였으며, 초기의 이론적 기반에 대한 연구 단계를 거쳐 다른 팀
들과의 공동연구 단계로 확대∙발전시킬 예정
연구 실적 목록 – 학술지 실적
논문명 게재연월 저널명 구분
Input permutation method to detect active voxels in fMRI study 201212 Magnetic Resonance Imaging SCIE
Parameter estimation in the spatial auto-logistic model with
varying independent subblocks
201212
Computational Statistics &
Data Analysis
SCIE
Distinguishing between genotoxic and non-genotoxic
hepatocarcinogens by gene expression profiling and
bioinformatic pathway analysis
201310 Scientific Reports SCIE
Investigating the different mechanisms of genotoxic and non-
genotoxic carcinogens by a gene set analysis
201401 PLoS ONE SCIE
Senescing human bone-marrow-derived clonal mesenchymal
stem cells have altered lysophospholipid composition and
functionality
201403
Journal of Proteome
Research
SCI
Detection of Pancreatic Cancer Biomarkers Using Mass
Spectrometry
201411 Cancer Informatics -
Asymptotically efficient parameter estimation in hidden Markov
spatio-temporal random fields
201501 Statistica Sinica SCI
High-dimensional fused lasso regression using majorization-
minimization and parallel processing
201503
Journal of Computational and
Graphical Statistics
SCIE
Two Sample Test for High Dimensional Partially Paired Data 게재승인
Journal of
Applied Statistics
SCIE
Some properties of generalized fused lasso and its applications
to high dimensional data
게재승인
Journal of Korean
Statistical Society
SCIE
임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발
구조화된 모형학습을 위한 분산처리 기반기술 개발
• 분산처리 기반기술 개발은 현재 3단계 과정 중 2단계 과제를 진행 중에 있으며, 이를 바탕으로 대용
량 고차원 자료 분석을 위한 자료 분석 툴박스를 개발하는 한편, 이를 실제 자료 분석에 적용하여
새로운 지식을 창출할 계획
향후 계획 – 추진 로드맵
진행 완료
1단계
(2011~2013)
진행중
2단계
(2014~2015)
기획중3단계
(2016~2017)
알고리즘에 대한 이론적 기반 확립
 Fused LASSO 분산학습에 대한 이론 개발
 시공간 정보를 반영한 MLE 등에 대한 일반이론 개발
이론적 기반의 확장, 알고리즘 구현
 컴퓨팅 기술 기반을 활용하여 Fused LASSO 1-D 직렬구조의 분산학습
알고리즘 및 시공간 HMRF 모형 추정 알고리즘 구현
 병렬처리 기법 개발을 위한 prototype 구현
이론 고도화, 자료 분석 툴박스 개발 및 대용량자료를 이용한 새로운 지식 창출
 분산처리 이론을 1-D 직렬구조에서 2-D 병렬구조로 확장
 R라이브러리 개발 및 SRC-stat에 공급
 개발된 알고리즘을 대용량 고차원 자료에 적용하여 새로운 지식 창출

More Related Content

What's hot

Src슬라이드(1총괄2세부) 오희석
Src슬라이드(1총괄2세부) 오희석Src슬라이드(1총괄2세부) 오희석
Src슬라이드(1총괄2세부) 오희석
SRCDSC
 
Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경
SRCDSC
 
Src슬라이드(1총괄1세부)이영조3
Src슬라이드(1총괄1세부)이영조3Src슬라이드(1총괄1세부)이영조3
Src슬라이드(1총괄1세부)이영조3
SRCDSC
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출
SRCDSC
 
Src슬라이드(1총괄1세부)이영조2
Src슬라이드(1총괄1세부)이영조2Src슬라이드(1총괄1세부)이영조2
Src슬라이드(1총괄1세부)이영조2
SRCDSC
 
Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트
SRCDSC
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
datasciencekorea
 
Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)
Don Chang
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형
datasciencekorea
 
계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.
Han Woo PARK
 
웹보메트릭스02 1
웹보메트릭스02 1웹보메트릭스02 1
웹보메트릭스02 1Inho Cho
 
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
Open Cyber University of Korea
 

What's hot (12)

Src슬라이드(1총괄2세부) 오희석
Src슬라이드(1총괄2세부) 오희석Src슬라이드(1총괄2세부) 오희석
Src슬라이드(1총괄2세부) 오희석
 
Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경Src슬라이드(3총괄2세부) 김유경
Src슬라이드(3총괄2세부) 김유경
 
Src슬라이드(1총괄1세부)이영조3
Src슬라이드(1총괄1세부)이영조3Src슬라이드(1총괄1세부)이영조3
Src슬라이드(1총괄1세부)이영조3
 
데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출데이터과학의 정의와 대표과제 도출
데이터과학의 정의와 대표과제 도출
 
Src슬라이드(1총괄1세부)이영조2
Src슬라이드(1총괄1세부)이영조2Src슬라이드(1총괄1세부)이영조2
Src슬라이드(1총괄1세부)이영조2
 
Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트Src10대 과제 - 1. 총괄파트
Src10대 과제 - 1. 총괄파트
 
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
데이터에 포함된 동적 패턴의 탐색과 해석을 위한 협업적 탐험 플랫폼 -최진혁
 
Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)Machine learning and deep learning (AiBB Lab)
Machine learning and deep learning (AiBB Lab)
 
농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형농업 빅데이터를 활용한 병해충 발생 예측 모형
농업 빅데이터를 활용한 병해충 발생 예측 모형
 
계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.계량정보분석 해외사례 조사분석.
계량정보분석 해외사례 조사분석.
 
웹보메트릭스02 1
웹보메트릭스02 1웹보메트릭스02 1
웹보메트릭스02 1
 
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
디지털 전환과 교육 혁신 지원을 위한 에듀테크 국제 표준화 동향
 

Viewers also liked

Machine learning in spam
Machine learning in spamMachine learning in spam
Machine learning in spam
Tae Young Lee
 
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
Terry Cho
 
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...zukun
 
Lecture18 xing
Lecture18 xingLecture18 xing
Lecture18 xing
Tianlu Wang
 
Naive ML Overview
Naive ML OverviewNaive ML Overview
Naive ML Overview
Chul Ju Hong
 
언어의 변천사를 통해 바라본 Python
언어의 변천사를 통해 바라본 Python언어의 변천사를 통해 바라본 Python
언어의 변천사를 통해 바라본 Python
Tae Young Lee
 
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
SOYEON KIM
 
Spm12를 이용한 fmri analysis
Spm12를 이용한 fmri analysisSpm12를 이용한 fmri analysis
Spm12를 이용한 fmri analysis
Tae Young Lee
 
Basic Understanding of the Deep
Basic Understanding of the DeepBasic Understanding of the Deep
Basic Understanding of the Deep
Mad Scientists
 
Reproducibility and automation of machine learning process
Reproducibility and automation of machine learning processReproducibility and automation of machine learning process
Reproducibility and automation of machine learning process
Denis Dus
 
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011devCAT Studio, NEXON
 
Neural network의 변천사 이태영
Neural network의 변천사 이태영Neural network의 변천사 이태영
Neural network의 변천사 이태영
Tae Young Lee
 
Sns(social network service)
Sns(social network service)Sns(social network service)
Sns(social network service)
Tae Young Lee
 
The other sensory systems
The other sensory systemsThe other sensory systems
The other sensory systems
Tae Young Lee
 
Machine Learning in Magento 2
Machine Learning in Magento 2Machine Learning in Magento 2
Machine Learning in Magento 2
Alexander Makeev
 
Google analytics in business
Google analytics in businessGoogle analytics in business
Google analytics in business
Tae Young Lee
 

Viewers also liked (16)

Machine learning in spam
Machine learning in spamMachine learning in spam
Machine learning in spam
 
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
 
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...
CVPR2010: Sparse Coding and Dictionary Learning for Image Analysis: Part 4: R...
 
Lecture18 xing
Lecture18 xingLecture18 xing
Lecture18 xing
 
Naive ML Overview
Naive ML OverviewNaive ML Overview
Naive ML Overview
 
언어의 변천사를 통해 바라본 Python
언어의 변천사를 통해 바라본 Python언어의 변천사를 통해 바라본 Python
언어의 변천사를 통해 바라본 Python
 
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
Pathways-Driven Sparse Regression Identifies Pathways and Genes Associated wi...
 
Spm12를 이용한 fmri analysis
Spm12를 이용한 fmri analysisSpm12를 이용한 fmri analysis
Spm12를 이용한 fmri analysis
 
Basic Understanding of the Deep
Basic Understanding of the DeepBasic Understanding of the Deep
Basic Understanding of the Deep
 
Reproducibility and automation of machine learning process
Reproducibility and automation of machine learning processReproducibility and automation of machine learning process
Reproducibility and automation of machine learning process
 
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011
오승준, 사회적 기술이 프로그래머 인생을 바꿔주는 이유, NDC2011
 
Neural network의 변천사 이태영
Neural network의 변천사 이태영Neural network의 변천사 이태영
Neural network의 변천사 이태영
 
Sns(social network service)
Sns(social network service)Sns(social network service)
Sns(social network service)
 
The other sensory systems
The other sensory systemsThe other sensory systems
The other sensory systems
 
Machine Learning in Magento 2
Machine Learning in Magento 2Machine Learning in Magento 2
Machine Learning in Magento 2
 
Google analytics in business
Google analytics in businessGoogle analytics in business
Google analytics in business
 

Similar to Src슬라이드(1총괄1세부) 임요한

머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
Byoung-Hee Kim
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수
Hye-rim Jang
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview
chanyoonkim
 
Campus Network Analysis
Campus Network AnalysisCampus Network Analysis
Campus Network AnalysisEugine Kang
 
의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3guestb89ff8
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
Open Cyber University of Korea
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
Suntae Kim
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
Suntae Kim
 
Ust소개자료 2009.09
Ust소개자료 2009.09Ust소개자료 2009.09
Ust소개자료 2009.09wongeun18
 
파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)
SK(주) C&C - 강병호
 
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
Daehee Han
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
Myungjin Lee
 
[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례
kosena
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
ABRC_DATA
 
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
ABRC_DATA
 
Eated patents curating system for coporation with cosine similarity
Eated patents curating system for coporation with cosine similarityEated patents curating system for coporation with cosine similarity
Eated patents curating system for coporation with cosine similarity
GAINHONG
 
진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망
메가트렌드랩 megatrendlab
 
데이터베이스활용기술전망
데이터베이스활용기술전망데이터베이스활용기술전망
데이터베이스활용기술전망
Hansung University
 
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
Kwang Woo NAM
 
2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx
승형 이
 

Similar to Src슬라이드(1총괄1세부) 임요한 (20)

머신러닝의 개념과 실습
머신러닝의 개념과 실습머신러닝의 개념과 실습
머신러닝의 개념과 실습
 
황승원 포항공대 교수
황승원 포항공대 교수황승원 포항공대 교수
황승원 포항공대 교수
 
[FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview [FAST CAMPUS] 1강 data science overview
[FAST CAMPUS] 1강 data science overview
 
Campus Network Analysis
Campus Network AnalysisCampus Network Analysis
Campus Network Analysis
 
의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
 
과학데이터와연구소재
과학데이터와연구소재과학데이터와연구소재
과학데이터와연구소재
 
Ust소개자료 2009.09
Ust소개자료 2009.09Ust소개자료 2009.09
Ust소개자료 2009.09
 
파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)파이썬으로 익히는 딥러닝 기본 (18년)
파이썬으로 익히는 딥러닝 기본 (18년)
 
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
뉴럴웍스 이미지 인식 AI 암진단AI 대장암, 위암
 
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
빅 데이터 환경의 고급 분석 기법과 지원 기술 동향 (Advanced Analytics and Technologies for Big Data)
 
[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례[코세나, kosena] 금융권의 머신러닝 활용사례
[코세나, kosena] 금융권의 머신러닝 활용사례
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
 
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
[중소기업형 인공지능/빅데이터 기술 심포지엄] 대용량 거래데이터 분석을 위한 서버인프라 활용 사례
 
Eated patents curating system for coporation with cosine similarity
Eated patents curating system for coporation with cosine similarityEated patents curating system for coporation with cosine similarity
Eated patents curating system for coporation with cosine similarity
 
진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망진화형 지식처리 인공지능 기술의 동향과 산업전망
진화형 지식처리 인공지능 기술의 동향과 산업전망
 
데이터베이스활용기술전망
데이터베이스활용기술전망데이터베이스활용기술전망
데이터베이스활용기술전망
 
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
세월호/ 타이타닉호 사고의 빅 데이터 방법론적 분석
 
2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx2020 k hackers-startup club_presentation_final version.pptx
2020 k hackers-startup club_presentation_final version.pptx
 

Src슬라이드(1총괄1세부) 임요한

  • 1. 구조화된 모형학습을 위한 분산처리 기반기술 개발 임요한 선도연구센터 SRC 1
  • 2. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 I II III IV 연구의 주제 및 성격 연구의 선도성 연구의 융합성 연구 실적 목록 V 향후 계획 목차
  • 3. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 구조화된 모형학습을 위한 분산처리 기반기술 개발 자료에 내재된 구조를 활용하면 보다 효율적인 통계적 추론 및 고속 계산이 가능. 추론 과정 을 병렬화된 알고리즘으로 근사, 구현하여 고차원 대용량 자료 분석에 적용 연구의 주제 및 성격 – 구조화된 모형학습을 위한 분산처리 기반기술 개발 1단계: 구조가 있는 자료의 모델링 4단계: 실제 데이터 적용 3단계: 고성능 분산 처리 컴퓨팅 구현 2단계: 병렬 알고리즘 개발 [Modeling Structured Data] [Parallel Algorithm] [Distributed Computing] [Application] Fused LASSO 시공간 – Hidden Markov Random Field 𝐴𝑥 = 𝑏, 𝐴 is a structured matrix Composite likelihood Hadoop / MapReduce GPU 시공간자료 대용량 Omics 자료 뇌과학 자료
  • 4. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 구조화된 모형학습을 위한 분산처리 기반기술 개발 • Fused LASSO 병렬화 절차 개발 : 현존하는 가장 빠른 알고리즘으로 현재 1-D까지 진행, 2-D에서도 근원적 단계부터 개선중 • 시공간– Hidden Markov Random Field의 Block Maximum Likelihood Estimator 제안 : 통계적 효율성이 이론적으로 증명된 composite likelihood 기반의 estimator를 제안 연구의 선도성 – 거대자료로부터 지식을 창출하기 위해 병렬화기법으로 효율성 극대화 연구주제의 선도성 연구방법의 선도성 계산 효율성이 떨어져 거대 자료에 대한 통계 모형 적합이 곤란 기존 연구 한계 통계적 효율성이 이론적으로 증명된 composite likelihood 기반의 estimator를 적용 새로운 통계적 방법론을 이용하여 데이터 분석 과정에서의 효율성을 극대화 연구성과의 선도성 브레인스토밍 등 전문가의 비과학적 방법론에 의존 데이터 분석의 효율성 극대화 기존 연구 한계 이론적으로 검증된 기법 적용 기존 연구 한계 복잡한 거대자료를 첨단 기법으로 분석하여 지식- 정보화 사회의 선도적 지식 창출 거대자료를 이용한 지식 창출 효율성에 대한 이론적인 측면의 검증 부족
  • 5. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 구조화된 모형학습을 위한 분산처리 기반기술 개발 • 거대자료로부터 효율적으로 지식을 창출하기 위해, 이론적 배경인 기반 기술 지식과 구체적 알고 리즘을 제공하는 과학적∙공학적 방법론의 융합성 강조 연구의 융합성 – 기반 이론 및 기술 개발 단계부터 실제 적용과의 융합성 고려 연구 주제의 융합성 구조화된 모형 학습의 분산처리 기술 및 통계패키지 개발 의학, 기상학  데이터 분석 알고리즘의 기초이론 개발 통계학  고성능 컴퓨팅 기반기술 제공 컴퓨터 과학  스펙트럼 자료, 뇌자료, 시공간 기상 자료 등 거대자료 및 지식 제공  실제 활용가치 점검 연구 과정의 융합성 알고리즘 구현을 위한 고성능 컴퓨팅 기반 기술 개발 알고 리즘 및 패키지 개발 컴퓨팅 기반 기술 개발 고성능 알고리즘의 이론 확립 및 데이터 분석 협동 연구 주관 알고리즘 개발(통계학) 기술 개발(컴퓨터과학) 알고리즘 및 기반 기술 개발, 지식 창 출 등 전분야에서 타 팀들과 협업 통계패키지(SRC-stat)를 통한 자료분석 툴박스 제공 거대자료를 이용하여 새로운 지식 창출 지식 창출 지식 창출(의학,기상학) 연구 인력의 융합성  복잡한 통계 모형의 효율적인 계산 방법에 대한 연구 수행  다양한 분야의 통계 분석 모형 개발 통계학(임요한 교수 연구팀) 각 분야의 전문 지식과 풍부한 경험을 갖춘 우수 연구 인력들이 협업  병렬처리 기법 등 첨단 고성능 컴퓨팅 기반 기술 연구 수행 컴퓨터공학(xxx교수 연구팀)  고해상도 뇌영상 자료, 시공간 기상 자료 등에 대한 연구 수행 의학(김유경교수 연구팀) 및 기상학(오희석/이재용교수 연구팀)
  • 6. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 구조화된 모형학습을 위한 분산처리 기반기술 개발 • 주제와 관련된 다양한 연구를 진행하였으며, 초기의 이론적 기반에 대한 연구 단계를 거쳐 다른 팀 들과의 공동연구 단계로 확대∙발전시킬 예정 연구 실적 목록 – 학술지 실적 논문명 게재연월 저널명 구분 Input permutation method to detect active voxels in fMRI study 201212 Magnetic Resonance Imaging SCIE Parameter estimation in the spatial auto-logistic model with varying independent subblocks 201212 Computational Statistics & Data Analysis SCIE Distinguishing between genotoxic and non-genotoxic hepatocarcinogens by gene expression profiling and bioinformatic pathway analysis 201310 Scientific Reports SCIE Investigating the different mechanisms of genotoxic and non- genotoxic carcinogens by a gene set analysis 201401 PLoS ONE SCIE Senescing human bone-marrow-derived clonal mesenchymal stem cells have altered lysophospholipid composition and functionality 201403 Journal of Proteome Research SCI Detection of Pancreatic Cancer Biomarkers Using Mass Spectrometry 201411 Cancer Informatics - Asymptotically efficient parameter estimation in hidden Markov spatio-temporal random fields 201501 Statistica Sinica SCI High-dimensional fused lasso regression using majorization- minimization and parallel processing 201503 Journal of Computational and Graphical Statistics SCIE Two Sample Test for High Dimensional Partially Paired Data 게재승인 Journal of Applied Statistics SCIE Some properties of generalized fused lasso and its applications to high dimensional data 게재승인 Journal of Korean Statistical Society SCIE
  • 7. 임요한 | 구조화된 모형학습을 위한 분산처리 기반기술 개발 구조화된 모형학습을 위한 분산처리 기반기술 개발 • 분산처리 기반기술 개발은 현재 3단계 과정 중 2단계 과제를 진행 중에 있으며, 이를 바탕으로 대용 량 고차원 자료 분석을 위한 자료 분석 툴박스를 개발하는 한편, 이를 실제 자료 분석에 적용하여 새로운 지식을 창출할 계획 향후 계획 – 추진 로드맵 진행 완료 1단계 (2011~2013) 진행중 2단계 (2014~2015) 기획중3단계 (2016~2017) 알고리즘에 대한 이론적 기반 확립  Fused LASSO 분산학습에 대한 이론 개발  시공간 정보를 반영한 MLE 등에 대한 일반이론 개발 이론적 기반의 확장, 알고리즘 구현  컴퓨팅 기술 기반을 활용하여 Fused LASSO 1-D 직렬구조의 분산학습 알고리즘 및 시공간 HMRF 모형 추정 알고리즘 구현  병렬처리 기법 개발을 위한 prototype 구현 이론 고도화, 자료 분석 툴박스 개발 및 대용량자료를 이용한 새로운 지식 창출  분산처리 이론을 1-D 직렬구조에서 2-D 병렬구조로 확장  R라이브러리 개발 및 SRC-stat에 공급  개발된 알고리즘을 대용량 고차원 자료에 적용하여 새로운 지식 창출

Editor's Notes

  1. 2