Your SlideShare is downloading. ×
0
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
B6 문맥인식기술활용
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

B6 문맥인식기술활용

1,360

Published on

0 Comments
5 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,360
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
93
Comments
0
Likes
5
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  1. 문맥인식기술의 활용- 판, 싸이블로그의 관렦글,태그 추천의 방법을 알아봅니다2011.10.18SKComms/ 기술연구소 / MI팀 정시앙
  2. 목차• 용어 설명• 서비스 예시• 시스템 구조• 이론 배경• 주요 난제• 프로젝트 추구 방향• 적용 현황• Q&A
  3. Context(문맥이란?) Context(circumstances) •유비쿼터스 컴퓨팅과 관련하여 사용자와 다른 사용자, 시스템, 혹은 디바이스의 애 . 플리케이션 간 상호 작용에 영향을 미치는 사람, 장소, 사물, 개체, 시간 등 상황 (situation)의 특징을 규정하는 정보 Context(surrounding words) • 누군가에 의해 저작된 텍스트 (단어군집, 문장, 문단, 문서) 단위의 정보 • 문맥, 맥락, 행간, 문장의 젂후관계
  4. Data Mining이란? predictive tasks : classification descriptive tasks : clustering Artificial Intelligence Statistics Data Mining Machine Learning Pattern Recognition Database Technology, Parallel Computing, Distributed Computing 출처:Introduction to Data Mining (PANG-NING TAN etc.)
  5. 문맥 인식(Context Awareness) 시스템 관렦 학습 대상 문맥 인식 문서 문서 Learner 시스템 학습 태그 그 Query 문맥 인식 문서 추론 Matcher 시스템 카테고리 중복 문서• Machine Learning 과 통계적 기법을 이용• Query문서의 문맥(Context)를 분석해 연관성(relevance)이 높은 컨텐츠, 태그를 추천하는 시스템
  6. 문맥 인식 시스템의 서비스 예시 제목과 본문 내용 을 이용하여, 관렦 동영상 추천
  7. 시스템 Flow Learner Matcher 학습 대상 Query 문서 문서 Feature Service Server Preprocessing Extraction ServiceServer Service Server WEB API/XML Feature Extraction Matching Learning 관렦문서 태그 Learned Data
  8. Feature Extraction - Term Vector Model
  9. 학습 덤프 저장 및 검색 - 역색인 (inverted index) Inverted Index term document Deview 1 30학습 Term문서 Extraction 개발자 1 15 30 화이팅 15
  10. 주요 난제 품질 처리속도• 학습 결과에 따라 품질 • 실제 서비스 적용하기 차이가 발생 위해서는 처리 속도가 (Garbage in , Garbage out) 중요• 자연어 처리 기술의 Trade Off • 빠른 시간 내에 많은 핚계 문서 처리 필요• 서비스 별로 품질 튜닝 포인트가 다름
  11. 프로젝트의 추구방향 Text Mining Development 속도를 고려핚 Main Memory학습 문서 정제, 선별 기반의 자료구조단어 정제 다양핚 알고리즘을 적용하기서비스 고려핚 품질 튜닝 위핚 설계 (디자인 패턴)관렦 자연어처리 기술 확보 다양핚 적용 서비스 위핚 유연핚 구조(공통 프레임웍 사용)
  12. 적용 서비스 서비스 기능 관련글 추천 관련동영상 추천 관련글 추천 태그 추천 관련글 추천 관련글 추천
  13. 적용현황 – 판 관렦 동영상 추천 원본 동영상의 제목과 본문 내용을 이용하여, 동일 프로그램의 다른 회차 방송을 추천
  14. 적용현황 – 판 관렦글 추천 원본 글의 제목과 내용을 이용하여 관렦글 추천
  15. 적용현황 – 싸이블로그 ‘싸이의 추천글’ - 원본 글의 제목과 내용을 이용하여 관렦글 추천
  16. 적용현황 – 싸이블로그 태그 추천 사용자가 입력핚 글의 내용을 바탕으로 연관 태그 추천
  17. 적용현황 – 이글루스 관렦글 자동검색 기존 컨텐츠의 정보성 강화, 유사 컨텐츠간 횡적 이동 가능
  18. 적용 사례 – 네이트 뉴스 이슈 클러스터링 뉴스 이슈 클러스터 관렦 기사 뉴스이슈 클러스터 확장 효과
  19. Q&A
  20. 감사합니다

×