SlideShare a Scribd company logo
마이크로소프트연구소
인재 육성 플랫폼
교수 협력 사례 발표
황승원 (포항공대 컴퓨터공학과)
마이크로소프트연구소와의 협업 영역
커리큘럼 혁신
• 교재 및 수업 개발
• 커리큘럼 자원제공
• 초청강연
인재육성
• 인턴십
• 박사과정 펠로우십
• 패컬티 펠로우십
연구협력
• 연구 주제별
프로젝트
• 패컬티 특별
프로젝트
• 방문 연구원
프로그램
학술교류
• 연례교수회의
• 21세기 컴퓨팅 컨퍼
런스
• 지역 별 워크샵
컴퓨터 공학의 발전 과학적 발견과 연구 가속화 차세대 공학도 육성
마이크로소프트연구소와의 협업 소개
연구 내용 요약: Data(-driven) Intelligence
• 기존 검색 결과에 지능을 더함
• 지능은 웹 사용자들에 의해 자동적으로 훈련되며 계속적으로 진화
• 검색뿐 아니라 모든 소프트웨어의 공통 지능 역할을 함
연구 내용 요약: Data(-driven) Intelligence
• 제품사례: Microsoft Spartan/Cortana, Wearable device
구글 지식그래프
연구협력 분야에서의 협업
• 지식 그래프 구축
• 지식 번역 (자연어그룹 협업, 사례#1)
ACL, EMNLP, ACM TOIS, IEEE TKDE 등 저명 학회 및 저널 게재
• 지식 확장 (데이터베이스그룹 협업, 사례 #2)
ICDE, VLDB, VLDB Journal 등 저명 학회 및 저널 게재
• 플랫폼으로서의 검색
• 성능 예측 및 선택적 가속화 (시스템그룹 협업, 사례#3)
Bing 검색엔진 적용, SIGIR, WSDM 저명 학회 학술상
• 특이점
• 학술교류(토양)– 다양한 그룹에의 노출 (3그룹, 10명의 연구원과 협업)
• 공동 연구 프로젝트(씨앗) 방문연구원 및 인턴쉽 프로그램을 통해 지속성
과 영향력 증대
인재육성 분야에서의 협업
선발 과정 인턴 기간 인턴 이후
공동 연구를 진행하면서 연구자로서의 통
합적 평가를 통해 인턴십 선발
지속적 멘토링 제공
인턴십이 끝나도 멘토링이 지속된다
기간 중 공동 연구 진행, 공동 멘토링을 통한 학생 역량 강화
기간 후 협력 지속을 통해 새로운 주제 발굴, 장기적 선순환
아시아(6m): 5명, 레드몬드(3m): 4명, 펠로우: 2명, 3 PhDs
커리큘럼 분야에서의 협업
• 인재육성 협업의 수혜범위를 전체로 확대
• 교육환경에서 다루기 힘든 큰 코드를 교육에 활용 가능
• 윈도우 코드를 운영체제 강의에 활용
• 윈도우 아키텍트의 강연, 저서 등을 교육교재로 활용
• 대학 간 교재개발 교류 및 공유
• Azure 사용을 통해 빅 데이터를 교육에 활용 가능
• 대규모 소셜네트워크의 분석 가능
• 병렬화를 통한 가속화 프로젝트
마이크로소프트연구소와의 협업의 특징
• 주제 선정의 자율성
• 학술교류를 통해 다양한 분야의 전문가와 협업 지원
• 인턴쉽을 통한 학생 공동 멘토링 및 협력 지속
• 학교에서 얻기 힘든 규모의 데이터와 시스템 사용 기회
• 저명 학회 등 학문적 수월성 독려
• 연구 결과를 제품화 하는 경험
연구 내용 상세 소개
사례 #1 지식 확장
Microsoft는 유명한 개체이므로 지식이 잘 구축되어있지만…
어려운 자연어 문제
사례 #2 지식 번역
• 자동번역을 어색하게 만드는 주범, 자연어분야 오래된 골치거리
• 微软[weiruan]은 mary와 달리 발음상 유사성 없음
두 문제는 사실상 동일한 문제이다
#1 #2
부트스트래핑 기법
• 1단계: Mary와 같이 확실한 번역쌍으로 초기화
• 2단계: Microsoft의 경우 관련 개체들의 번역쌍 점수를 전파
• 3단계: 2단계를 더 이상 변화가 없을때까지 반복함
Rij
Rij
번역과 확장 모두에서 제품의 성능을 능가
• 기존 제품은 발음유사도가 크거나, 기번역
쌍이 존재하는 잘 알려진 개체에 대해서만
좋은 성능을 보임
• 부트스트래핑 기법을 통해 잘 알려진 개체
의 높은 정확도를 덜 알려진 개체에 전파
하여 비슷한 수준으로 끌어올림
0
10
20
30
40
50
60
70
80
기존 제품 새로운 방법
잘 알려진 개체
덜 알려진 개체
사례 #3 플랫폼으로서의 지능
• 다양한 소프트웨어에서 끊임없이 검색이 일어남
• 검색어의 복잡도와 관계없이 고르게 즉각적인 결과 필요
“Microsoft
”
Long
Short
비용예측 자원관리자
Prediction model
데이터 지능 활용
• 검색어 중요도(idf) 및 점수 분포(min, max, var, ..)를
근거로 유추
Inverted index for “Microsoft”
Processing Not evaluated
Doc 1 Doc 2 Doc 3 ……. Doc N-2 Doc N-1 Doc N
Docs sorted by static rankHighest Lowest
Web documents
……. …….
• 검색어 외의 복잡도 요소를 모델링하고 예측함
검색엔진 기능 모델링
<Fields related to query execution plan>
rank=BM25F
enablefresh=1 partialmatch=1
language=en location=us
….
<Fields related to search keywords>
Redmond (MS or Microsoft)
Bing 제품화: 50% 효율향상
50
100
150
200
50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950
ResponseTime(ms)
Query Arrival Rate (QPS)
Sequential Degree=3
Predictive
50% throughput increase
향후 협업 계획 및 발전 방향
• IoT 검색 플랫폼
• 지식의 생성 및 질의가 위치를 가진 기기에서 이루어짐
• 질의어에 시공간의 의미가 더해질때, 검색 성능 최적화, 예측, 및 가속을 위
한 연구협업 진행 중
Q&A

More Related Content

What's hot

GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
keunbong kwak
 
Sharing development experience of educational apps for the hard of hearing (P...
Sharing development experience of educational apps for the hard of hearing (P...Sharing development experience of educational apps for the hard of hearing (P...
Sharing development experience of educational apps for the hard of hearing (P...
Youngki Moon
 
[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽
NAVER D2
 
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
NAVER D2
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
태현 임
 
2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence 2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence
Jong MIn Yu
 
Deep learning hands on (딥러닝 실습 특강)
Deep learning hands on (딥러닝 실습 특강)Deep learning hands on (딥러닝 실습 특강)
Deep learning hands on (딥러닝 실습 특강)
Alex G. Lee, Ph.D. Esq. CLP
 
파이썬과 자연어 3 | 문장구조
파이썬과 자연어 3 | 문장구조파이썬과 자연어 3 | 문장구조
파이썬과 자연어 3 | 문장구조
김용범 | 무영인터내쇼날
 
Rumor detection on social media
Rumor detection on social mediaRumor detection on social media
Rumor detection on social media
segwangkim
 
파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석
김용범 | 무영인터내쇼날
 
[222]대화 시스템 서비스 동향 및 개발 방법
[222]대화 시스템 서비스 동향 및 개발 방법[222]대화 시스템 서비스 동향 및 개발 방법
[222]대화 시스템 서비스 동향 및 개발 방법
NAVER D2
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
NAVER D2
 
전자회로설계(강의계획서)2014-1
전자회로설계(강의계획서)2014-1전자회로설계(강의계획서)2014-1
전자회로설계(강의계획서)2014-1Yong Heui Cho
 
파이썬과 자연어 2 | Sentence
파이썬과 자연어 2 | Sentence 파이썬과 자연어 2 | Sentence
파이썬과 자연어 2 | Sentence
김용범 | 무영인터내쇼날
 
자연어2 | 1차강의
자연어2 | 1차강의자연어2 | 1차강의
자연어2 | 1차강의
김용범 | 무영인터내쇼날
 
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
NAVER D2
 
인공지능 방법론 - Deep Learning 쉽게 이해하기
인공지능 방법론 - Deep Learning 쉽게 이해하기인공지능 방법론 - Deep Learning 쉽게 이해하기
인공지능 방법론 - Deep Learning 쉽게 이해하기
Byoung-Hee Kim
 

What's hot (17)

GloVe:Global vectors for word representation
GloVe:Global vectors for word representationGloVe:Global vectors for word representation
GloVe:Global vectors for word representation
 
Sharing development experience of educational apps for the hard of hearing (P...
Sharing development experience of educational apps for the hard of hearing (P...Sharing development experience of educational apps for the hard of hearing (P...
Sharing development experience of educational apps for the hard of hearing (P...
 
[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽[214]베이지안토픽모형 강병엽
[214]베이지안토픽모형 강병엽
 
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
[221] 딥러닝을 이용한 지역 컨텍스트 검색 김진호
 
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
임태현, Text-CNN을 이용한 Sentiment 분설모델 구현
 
2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence 2012 3 qp_hybrid algorithm optimization with artificial intelligence
2012 3 qp_hybrid algorithm optimization with artificial intelligence
 
Deep learning hands on (딥러닝 실습 특강)
Deep learning hands on (딥러닝 실습 특강)Deep learning hands on (딥러닝 실습 특강)
Deep learning hands on (딥러닝 실습 특강)
 
파이썬과 자연어 3 | 문장구조
파이썬과 자연어 3 | 문장구조파이썬과 자연어 3 | 문장구조
파이썬과 자연어 3 | 문장구조
 
Rumor detection on social media
Rumor detection on social mediaRumor detection on social media
Rumor detection on social media
 
파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석파이썬을 활용한 자연어 분석
파이썬을 활용한 자연어 분석
 
[222]대화 시스템 서비스 동향 및 개발 방법
[222]대화 시스템 서비스 동향 및 개발 방법[222]대화 시스템 서비스 동향 및 개발 방법
[222]대화 시스템 서비스 동향 및 개발 방법
 
[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우[226]대용량 텍스트마이닝 기술 하정우
[226]대용량 텍스트마이닝 기술 하정우
 
전자회로설계(강의계획서)2014-1
전자회로설계(강의계획서)2014-1전자회로설계(강의계획서)2014-1
전자회로설계(강의계획서)2014-1
 
파이썬과 자연어 2 | Sentence
파이썬과 자연어 2 | Sentence 파이썬과 자연어 2 | Sentence
파이썬과 자연어 2 | Sentence
 
자연어2 | 1차강의
자연어2 | 1차강의자연어2 | 1차강의
자연어2 | 1차강의
 
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
[222]딥러닝을 활용한 이미지 검색 포토요약과 타임라인 최종 20161024
 
인공지능 방법론 - Deep Learning 쉽게 이해하기
인공지능 방법론 - Deep Learning 쉽게 이해하기인공지능 방법론 - Deep Learning 쉽게 이해하기
인공지능 방법론 - Deep Learning 쉽게 이해하기
 

Similar to 황승원 포항공대 교수

Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
Amazon Web Services Korea
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
Open Cyber University of Korea
 
Portfolio - 김창학
Portfolio - 김창학Portfolio - 김창학
Portfolio - 김창학
창학 김
 
의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3guestb89ff8
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈
HELENA LEE
 
부스트캠프 2020 설명회 발표자료
부스트캠프 2020 설명회 발표자료부스트캠프 2020 설명회 발표자료
부스트캠프 2020 설명회 발표자료
CONNECT FOUNDATION
 
클라우드서비스(강의계획서,2018-1)
클라우드서비스(강의계획서,2018-1)클라우드서비스(강의계획서,2018-1)
클라우드서비스(강의계획서,2018-1)
Yong Heui Cho
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
Eun Yu
 
UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑
Dongsik Yang
 
about Programmer 2018
about Programmer 2018about Programmer 2018
about Programmer 2018
Kenu, GwangNam Heo
 
Src슬라이드(1총괄1세부) 임요한
Src슬라이드(1총괄1세부) 임요한Src슬라이드(1총괄1세부) 임요한
Src슬라이드(1총괄1세부) 임요한
SRCDSC
 
학교에선 알려주지 않는 오픈소스이야기 - 박치완님
학교에선 알려주지 않는 오픈소스이야기 - 박치완님학교에선 알려주지 않는 오픈소스이야기 - 박치완님
학교에선 알려주지 않는 오픈소스이야기 - 박치완님
NAVER D2
 
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
Kevin Kim
 
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래2013 공개SW데이 발표 - 구름IDE의 발자취와 미래
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래Sung-tae Ryu
 
MS Project 활용 프로젝트 관리 실무 교육 안내
MS Project 활용 프로젝트 관리 실무 교육 안내MS Project 활용 프로젝트 관리 실무 교육 안내
MS Project 활용 프로젝트 관리 실무 교육 안내
웅찬 남
 
ISTE Live 2022 브리핑 리포트
ISTE Live 2022 브리핑 리포트ISTE Live 2022 브리핑 리포트
ISTE Live 2022 브리핑 리포트
Open Cyber University of Korea
 
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
한국디자인진흥원 공공서비스디자인PD
 
2014 0330-intel.education 정현준
2014 0330-intel.education 정현준2014 0330-intel.education 정현준
2014 0330-intel.education 정현준
Hyun Jun Jung
 
B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용NAVER D2
 
Portfolio2
Portfolio2Portfolio2
Portfolio2
창학 김
 

Similar to 황승원 포항공대 교수 (20)

Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
Case Study를 통해 본 데이터사이언스 협업 플랫폼의 필요성 (옥주영 컨설턴트, Hancom MDS) :: AWS Techforum ...
 
학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망학습분석(Learning Analytics) 활용 가능성 및 전망
학습분석(Learning Analytics) 활용 가능성 및 전망
 
Portfolio - 김창학
Portfolio - 김창학Portfolio - 김창학
Portfolio - 김창학
 
의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3의대컨소시엄 소개 자료 3
의대컨소시엄 소개 자료 3
 
응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈응용서비스에 따른 인공지능기술 연구이슈
응용서비스에 따른 인공지능기술 연구이슈
 
부스트캠프 2020 설명회 발표자료
부스트캠프 2020 설명회 발표자료부스트캠프 2020 설명회 발표자료
부스트캠프 2020 설명회 발표자료
 
클라우드서비스(강의계획서,2018-1)
클라우드서비스(강의계획서,2018-1)클라우드서비스(강의계획서,2018-1)
클라우드서비스(강의계획서,2018-1)
 
Week1 ot
Week1 otWeek1 ot
Week1 ot
 
UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑UI/UX 개선을 위한 빠른 프로토타이핑
UI/UX 개선을 위한 빠른 프로토타이핑
 
about Programmer 2018
about Programmer 2018about Programmer 2018
about Programmer 2018
 
Src슬라이드(1총괄1세부) 임요한
Src슬라이드(1총괄1세부) 임요한Src슬라이드(1총괄1세부) 임요한
Src슬라이드(1총괄1세부) 임요한
 
학교에선 알려주지 않는 오픈소스이야기 - 박치완님
학교에선 알려주지 않는 오픈소스이야기 - 박치완님학교에선 알려주지 않는 오픈소스이야기 - 박치완님
학교에선 알려주지 않는 오픈소스이야기 - 박치완님
 
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
개방형 혁신 연구개발 프로젝트를 위한 거버넌스 구축
 
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래2013 공개SW데이 발표 - 구름IDE의 발자취와 미래
2013 공개SW데이 발표 - 구름IDE의 발자취와 미래
 
MS Project 활용 프로젝트 관리 실무 교육 안내
MS Project 활용 프로젝트 관리 실무 교육 안내MS Project 활용 프로젝트 관리 실무 교육 안내
MS Project 활용 프로젝트 관리 실무 교육 안내
 
ISTE Live 2022 브리핑 리포트
ISTE Live 2022 브리핑 리포트ISTE Live 2022 브리핑 리포트
ISTE Live 2022 브리핑 리포트
 
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
해외 서비스디자인 교육 현황 및 서비스디자인 툴킷 조사 결과 보고서
 
2014 0330-intel.education 정현준
2014 0330-intel.education 정현준2014 0330-intel.education 정현준
2014 0330-intel.education 정현준
 
B6 문맥인식기술활용
B6 문맥인식기술활용B6 문맥인식기술활용
B6 문맥인식기술활용
 
Portfolio2
Portfolio2Portfolio2
Portfolio2
 

황승원 포항공대 교수

  • 1. 마이크로소프트연구소 인재 육성 플랫폼 교수 협력 사례 발표 황승원 (포항공대 컴퓨터공학과)
  • 2. 마이크로소프트연구소와의 협업 영역 커리큘럼 혁신 • 교재 및 수업 개발 • 커리큘럼 자원제공 • 초청강연 인재육성 • 인턴십 • 박사과정 펠로우십 • 패컬티 펠로우십 연구협력 • 연구 주제별 프로젝트 • 패컬티 특별 프로젝트 • 방문 연구원 프로그램 학술교류 • 연례교수회의 • 21세기 컴퓨팅 컨퍼 런스 • 지역 별 워크샵 컴퓨터 공학의 발전 과학적 발견과 연구 가속화 차세대 공학도 육성
  • 4. 연구 내용 요약: Data(-driven) Intelligence • 기존 검색 결과에 지능을 더함 • 지능은 웹 사용자들에 의해 자동적으로 훈련되며 계속적으로 진화 • 검색뿐 아니라 모든 소프트웨어의 공통 지능 역할을 함
  • 5. 연구 내용 요약: Data(-driven) Intelligence • 제품사례: Microsoft Spartan/Cortana, Wearable device 구글 지식그래프
  • 6. 연구협력 분야에서의 협업 • 지식 그래프 구축 • 지식 번역 (자연어그룹 협업, 사례#1) ACL, EMNLP, ACM TOIS, IEEE TKDE 등 저명 학회 및 저널 게재 • 지식 확장 (데이터베이스그룹 협업, 사례 #2) ICDE, VLDB, VLDB Journal 등 저명 학회 및 저널 게재 • 플랫폼으로서의 검색 • 성능 예측 및 선택적 가속화 (시스템그룹 협업, 사례#3) Bing 검색엔진 적용, SIGIR, WSDM 저명 학회 학술상 • 특이점 • 학술교류(토양)– 다양한 그룹에의 노출 (3그룹, 10명의 연구원과 협업) • 공동 연구 프로젝트(씨앗) 방문연구원 및 인턴쉽 프로그램을 통해 지속성 과 영향력 증대
  • 7. 인재육성 분야에서의 협업 선발 과정 인턴 기간 인턴 이후 공동 연구를 진행하면서 연구자로서의 통 합적 평가를 통해 인턴십 선발 지속적 멘토링 제공 인턴십이 끝나도 멘토링이 지속된다 기간 중 공동 연구 진행, 공동 멘토링을 통한 학생 역량 강화 기간 후 협력 지속을 통해 새로운 주제 발굴, 장기적 선순환 아시아(6m): 5명, 레드몬드(3m): 4명, 펠로우: 2명, 3 PhDs
  • 8. 커리큘럼 분야에서의 협업 • 인재육성 협업의 수혜범위를 전체로 확대 • 교육환경에서 다루기 힘든 큰 코드를 교육에 활용 가능 • 윈도우 코드를 운영체제 강의에 활용 • 윈도우 아키텍트의 강연, 저서 등을 교육교재로 활용 • 대학 간 교재개발 교류 및 공유 • Azure 사용을 통해 빅 데이터를 교육에 활용 가능 • 대규모 소셜네트워크의 분석 가능 • 병렬화를 통한 가속화 프로젝트
  • 9. 마이크로소프트연구소와의 협업의 특징 • 주제 선정의 자율성 • 학술교류를 통해 다양한 분야의 전문가와 협업 지원 • 인턴쉽을 통한 학생 공동 멘토링 및 협력 지속 • 학교에서 얻기 힘든 규모의 데이터와 시스템 사용 기회 • 저명 학회 등 학문적 수월성 독려 • 연구 결과를 제품화 하는 경험
  • 11. 사례 #1 지식 확장 Microsoft는 유명한 개체이므로 지식이 잘 구축되어있지만… 어려운 자연어 문제
  • 12. 사례 #2 지식 번역 • 자동번역을 어색하게 만드는 주범, 자연어분야 오래된 골치거리 • 微软[weiruan]은 mary와 달리 발음상 유사성 없음
  • 13. 두 문제는 사실상 동일한 문제이다 #1 #2
  • 14. 부트스트래핑 기법 • 1단계: Mary와 같이 확실한 번역쌍으로 초기화 • 2단계: Microsoft의 경우 관련 개체들의 번역쌍 점수를 전파 • 3단계: 2단계를 더 이상 변화가 없을때까지 반복함 Rij Rij
  • 15. 번역과 확장 모두에서 제품의 성능을 능가 • 기존 제품은 발음유사도가 크거나, 기번역 쌍이 존재하는 잘 알려진 개체에 대해서만 좋은 성능을 보임 • 부트스트래핑 기법을 통해 잘 알려진 개체 의 높은 정확도를 덜 알려진 개체에 전파 하여 비슷한 수준으로 끌어올림 0 10 20 30 40 50 60 70 80 기존 제품 새로운 방법 잘 알려진 개체 덜 알려진 개체
  • 16. 사례 #3 플랫폼으로서의 지능 • 다양한 소프트웨어에서 끊임없이 검색이 일어남 • 검색어의 복잡도와 관계없이 고르게 즉각적인 결과 필요 “Microsoft ” Long Short 비용예측 자원관리자 Prediction model
  • 17. 데이터 지능 활용 • 검색어 중요도(idf) 및 점수 분포(min, max, var, ..)를 근거로 유추 Inverted index for “Microsoft” Processing Not evaluated Doc 1 Doc 2 Doc 3 ……. Doc N-2 Doc N-1 Doc N Docs sorted by static rankHighest Lowest Web documents ……. …….
  • 18. • 검색어 외의 복잡도 요소를 모델링하고 예측함 검색엔진 기능 모델링 <Fields related to query execution plan> rank=BM25F enablefresh=1 partialmatch=1 language=en location=us …. <Fields related to search keywords> Redmond (MS or Microsoft)
  • 19. Bing 제품화: 50% 효율향상 50 100 150 200 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 ResponseTime(ms) Query Arrival Rate (QPS) Sequential Degree=3 Predictive 50% throughput increase
  • 20. 향후 협업 계획 및 발전 방향 • IoT 검색 플랫폼 • 지식의 생성 및 질의가 위치를 가진 기기에서 이루어짐 • 질의어에 시공간의 의미가 더해질때, 검색 성능 최적화, 예측, 및 가속을 위 한 연구협업 진행 중
  • 21. Q&A