네이버 시맨틱 영화 검색

4,155 views

Published on

얼마전에 오픈한 네이버랩 시맨틱 영화검색 서비스를 소개합니다. 시맨틱웹 기술을 영화 데이터베이스 검색에 적용하였습니다. 현재 한국형 포털에서는 검색의 만족도를 높이기 위해 많은 노력과 비용을 들여 양질의 컨텐츠 DB를 자체 구축하고 있습니다. 하지만 현재의 컨텐츠 DB에 대한 검색은 매우 제한적입니다. 대부분 한 단어 검색 또는 제한된 패턴의 검색만 가능합니다. 많은 비용을 들여 구축한 컨텐츠인 만큼 더 많이 검색 결과로 노출될 필요가 있고, 더 많이 활용될 필요가 있습니다. 시맨틱 영화검색은 이러한 목적을 가지고 영화 컨텐츠 DB에 대해 새로운 검색 방법과 검색 인터페이스를 실험한 결과입니다.

Published in: Education, Technology
0 Comments
6 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,155
On SlideShare
0
From Embeds
0
Number of Embeds
520
Actions
Shares
0
Downloads
152
Comments
0
Likes
6
Embeds 0
No embeds

No notes for slide

네이버 시맨틱 영화 검색

  1. 1. 1<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />시맨틱웹과네이버랩시맨틱 영화검색<br />2009년시맨틱 웹 컨퍼런스<br />주관: 웹사이언스 워크그룹<br />주최: 웹사이언스 워크그룹, 국립중앙도서관<br />2009.12.04<br />강병주 NHN㈜<br />
  2. 2. Contents<br />2<br />제1부 데이터베이스 검색<br />제2부 시맨틱웹과 데이터베이스 검색<br />제3부 네이버랩시맨틱 영화검색<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  3. 3. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />3<br />요약<br />1.<br />이제 데이터베이스 검색이 아니라 데이터베이스 정보검색이다.<br />2.<br />시맨틱웹(데이터 웹)은 데이터베이스 정보검색 시대를 열 것이다.<br />3.<br />시맨틱 영화검색은 데이터베이스 정보검색을 가능성을 위한 실험이다.<br />
  4. 4. 데이터베이스 검색<br />제1부<br />4<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  5. 5. 데이터베이스 검색<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />5<br />
  6. 6. 검색 = 웹 검색<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />6<br />
  7. 7. Web Search<br />비정형 텍스트 데이터 검색<br />7<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  8. 8. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />8<br />웹 이전<br />웹 이후<br />텍스트 검색<br />데이터베이스 검색<br />
  9. 9. 웹 검색 시대에는…<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />9<br />텍스트검색<br />데이터베이스 검색<br />
  10. 10. Enterprise Search<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />10<br />
  11. 11. 한국 포털에서 데이터베이스 검색<br />컨텐츠 검색<br />11<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />스마트 파인더<br />
  12. 12. 음악 DB<br />네이버컨텐츠DB<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />12<br />음악 DB<br />영화 DB<br />요리 DB<br />자동차 DB<br />부동산 DB<br />인물 DB<br />맛집DB<br />책 DB<br />
  13. 13. 13<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  14. 14. 컨텐츠 검색의 한계<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />14<br />대부분 한 단어 질의에 대해서만 작동<br />
  15. 15. 스마트 파인더<br />전형적인 양식 기반의 질의 인터페이스<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />15<br />
  16. 16. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />16<br />
  17. 17. 스마트 파인더의 한계<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />17<br />한정된 패턴의 질의만 가능<br />
  18. 18. 데이터베이스 검색의 딜레마<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />18<br />
  19. 19. 데이터베이스에는 정보가<br /> 있지만 검색할 방법이 없어 !<br />19<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  20. 20. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />20<br />대만 여자 배우<br />중국 여자 배우<br />청룡영화제 여우주연상<br />가수 출신 한국 배우<br />
  21. 21. 문제는 검색 인터페이스<br />검색 인터페이스가 병목점이다.<br />검색 인터페이스<br />21<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  22. 22. Unstructured data<br />for human<br />Structured data<br />for machine<br />22<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  23. 23. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />23<br />Structured data is boring and useless.<br />
  24. 24. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />24<br />Unstructured data is sexy.<br />
  25. 25. 데이터베이스 질의 인터페이스<br />사용성이 높아야 한다<br />25<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />1.<br />2.<br />질의 표현력이 높아야 한다<br />3.<br />범용성이 높아야 한다<br />
  26. 26. 사용성, 표현력, 범용성<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />26<br />사용성<br />표현력<br />범용성<br />
  27. 27. 데이터베이스 질의 인터페이스의 3가지 유형<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />27<br />Form-based Interface<br />스마트 파인더<br />Natural Language Interface<br />시맨틱 영화검색 (오브젝트 검색)<br />Visual Interface<br />시맨틱 영화검색 ( GQI )<br />
  28. 28. 낮은 사용성과 낮은범용성<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />28<br />사용성<br />표현력<br />범용성<br />Form-based Interface<br />높다<br />낮다<br />낮다<br />Natural Language Interface<br />낮다<br />높다<br />낮다<br />Visual Interface<br />낮다<br />높다<br />낮다<br />
  29. 29. 시맨틱웹 기술로 범용성을 높인다.<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />29<br />사용성<br />표현력<br />범용성<br />Form-based Interface<br />높다<br />낮다<br />낮다<br />Natural Language Interface<br />낮다<br />높다<br />높다<br />Visual Interface<br />낮다<br />높다<br />높다<br />어려운 문제<br />RDF 기술<br />
  30. 30. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />30<br />데이터베이스 검색 결과<br />기존 통검<br />검색 결과<br />
  31. 31. 제2부<br />시맨틱 웹과 데이터베이스 검색<br />31<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  32. 32. Semantic Web 비전<br />I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize.<br />32<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />- Tim Berners-Lee, 1999<br />
  33. 33. 시맨틱 웹<br />웹에 있는 정보를<br />자동으로 처리하기 위한 웹<br />33<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  34. 34. 시맨틱 웹<br />We need structured data on the Web.<br />34<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  35. 35. 왜 데이터베이스 검색인가?<br />웹에 구조화된 데이터,<br />공개 데이터베이스가 증가하고 있다.<br />35<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  36. 36. Open Data<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />36<br />Open Source<br />Open API<br />Open Data<br />
  37. 37. Activities Promoting Open Data<br />Linking Open Data<br />Open Data in Science<br />Freebase<br />Science Commons<br />Free Our Data<br />The Open Knowledge Foundation<br />Blue Obelisk<br />Research Data Canada<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />37<br />
  38. 38. Linked Data Cloud<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />38<br />
  39. 39. 데이터의 구조화<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />39<br />RDFa: The Semantic Web’s missing link<br />[Mark Birbeck, SemTech 2009]<br />
  40. 40. 구조화된 데이터는 매우 많다<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />40<br />[Scott Brinker, 2009]<br />
  41. 41. 정보 검색 VS. 데이터베이스 검색<br />41<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />Matching 방식<br />정보 검색<br />Partial Matching<br />데이터베이스 검색<br />Exact Matching<br />
  42. 42. 데이터베이스 정보검색<br />데이터베이스 데이터에 대한 정보검색<br />42<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  43. 43. 정보검색의대중화 조건<br />데이터가 매우 매우 많아야 한다.<br />43<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />검색이 아주 쉬워야 한다.<br />
  44. 44. 데이터베이스 검색은 어렵다.<br />44<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />
  45. 45. 근본적인 문제<br />45<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />기계는 자연어를 이해하지 못한다 !<br />데이터베이스<br />
  46. 46. 내부 데이터베이스 검색<br />46<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />사용자는 데이터베이스<br />구조를 알 필요 없이<br />자연어로 검색 가능<br />데이터베이스<br />번역<br />
  47. 47. 시맨틱 웹 기술의 역할<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />47<br />영화 DB 1<br />Open<br />번역 1<br />영화 DB 2<br />Open<br />번역 2<br />Open<br />영화 DB 3<br />번역 3<br />
  48. 48. 데이터베이스 정보검색<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />48<br />영화 DB 1<br />영화 DB 2<br />“일본 애니메이션 영화”<br />영화 DB 3<br />
  49. 49. World Wide Web<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />49<br />Decentralized Control<br />
  50. 50. Ontology Problem<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />50<br />
  51. 51. 과거에는 왜?<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />51<br />
  52. 52. Web<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />52<br />
  53. 53. 정보 검색<br />정보검색 시대의 도래<br /> 텍스트 검색 + 웹 웹 검색<br />53<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />데이터베이스 검색 + 웹 데이터 웹 검색<br />
  54. 54. 제3부<br />54<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />시맨틱 영화검색<br />
  55. 55. 기조<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />55<br />시맨틱 영화검색은 <br />오브젝트 검색<br />인물<br />국가<br />학교<br />회사<br />영화제<br />영화<br />
  56. 56. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />56<br />문서 검색 VS. 오브젝트검색<br />
  57. 57. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />57<br />질의도 오브젝트 단위로 하고<br />검색 결과도 오브젝트 단위로<br />
  58. 58. 시맨틱 영화검색의 특징<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />58<br />의미가 결정된 오브젝트 단위로 검색<br />오브젝트 검색<br />1<br />자연어 모호성 최소화<br />길고 복잡한 질의가 가능하다.<br />길고 복잡한 질의<br />2<br />“스파이더맨 출연 한국 배우 ”<br />정답을 요구하는 질의에 대해 정답을 찾아준다<br />정답 검색<br />3<br />“박찬욱 감독 영화”, “올드보이 주연 배우”<br />두 개의 오브젝트 사이에 의미 있는 관계를 찾아준다.<br />관계 검색<br />4<br />“봉준호 송강호”, “김혜수 김동현”<br />집합으로 집합을 찾는 검색<br />집합 기반 검색<br />5<br />“한국 여자 감독 영화”<br />
  59. 59. 시맨틱 영화검색의 특징<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />59<br />새로운 발견<br />다양한 의미 해석<br />6<br />“봉준호 영화”, “타짜 배역”<br />정의된 모든 속성의 조합으로 검색<br />속성 검색<br />7<br />“2007 일본 액션 영화”<br />실재 DB에 존재하지 않는 정보를 추론 규칙으로 추론<br />추론 검색<br />8<br />“피터폰다 가족”<br />자연어 형식으로 질의 가능<br />자연어 검색<br />9<br />“부산 출신 감독”<br />특정 오브젝트에 대해 관련 속성 정보들이 정리되어 나옴<br />컨텐츠 검색<br />10<br />“해운대”<br />
  60. 60. 시맨틱 자동 완성<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />60<br />
  61. 61. 시맨틱 자동 완성(2)<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />61<br />1차 자동 완성<br />2차 자동 완성<br />
  62. 62. 시맨틱검색어 추천 <br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />62<br />확장 검색어 추천: 온톨로지를 이용한 기계적인 키워드 확장<br />연관 검색어 추천: <br />키워드와 관련 높은 영화인-영화인, 영화-영화인, 영화-영화 추천<br />
  63. 63. GQI<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />63<br />
  64. 64. 결론<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />64<br />1.<br />이제 데이터베이스 검색이 아니라 데이터베이스 정보검색이다.<br />2.<br />시맨틱웹(데이터 웹)은 데이터베이스 정보검색 시대를 열 것이다.<br />3.<br />시맨틱 영화검색은 데이터베이스 정보검색을 가능성을 위한 실험이다.<br />
  65. 65. Profile<br />2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)<br />65<br />강병주<br />Byung-Ju KANG<br />소속: NHN(주)<br />주요관심분야: 시맨틱웹, 집단지성, 정보검색, 자연어처리<br />개인블로그: 시맨틱웹과 집단지성<br />http://blog.naver.com/semanian<br />이메일: bjkang@nhn.com<br />

×