얼마전에 오픈한 네이버랩 시맨틱 영화검색 서비스를 소개합니다. 시맨틱웹 기술을 영화 데이터베이스 검색에 적용하였습니다. 현재 한국형 포털에서는 검색의 만족도를 높이기 위해 많은 노력과 비용을 들여 양질의 컨텐츠 DB를 자체 구축하고 있습니다. 하지만 현재의 컨텐츠 DB에 대한 검색은 매우 제한적입니다. 대부분 한 단어 검색 또는 제한된 패턴의 검색만 가능합니다. 많은 비용을 들여 구축한 컨텐츠인 만큼 더 많이 검색 결과로 노출될 필요가 있고, 더 많이 활용될 필요가 있습니다. 시맨틱 영화검색은 이러한 목적을 가지고 영화 컨텐츠 DB에 대해 새로운 검색 방법과 검색 인터페이스를 실험한 결과입니다.
2. Contents 2 제1부 데이터베이스 검색 제2부 시맨틱웹과 데이터베이스 검색 제3부 네이버랩시맨틱 영화검색 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
3. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 3 요약 1. 이제 데이터베이스 검색이 아니라 데이터베이스 정보검색이다. 2. 시맨틱웹(데이터 웹)은 데이터베이스 정보검색 시대를 열 것이다. 3. 시맨틱 영화검색은 데이터베이스 정보검색을 가능성을 위한 실험이다.
4. 데이터베이스 검색 제1부 4 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
29. 시맨틱웹 기술로 범용성을 높인다. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 29 사용성 표현력 범용성 Form-based Interface 높다 낮다 낮다 Natural Language Interface 낮다 높다 높다 Visual Interface 낮다 높다 높다 어려운 문제 RDF 기술
30. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 30 데이터베이스 검색 결과 기존 통검 검색 결과
31. 제2부 시맨틱 웹과 데이터베이스 검색 31 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
32. Semantic Web 비전 I have a dream for the Web [in which computers] become capable of analyzing all the data on the Web – the content, links, and transactions between people and computers. A ‘Semantic Web’, which should make this possible, has yet to emerge, but when it does, the day-to-day mechanisms of trade, bureaucracy and our daily lives will be handled by machines talking to machines. The ‘intelligent agents’ people have touted for ages will finally materialize. 32 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) - Tim Berners-Lee, 1999
33. 시맨틱 웹 웹에 있는 정보를 자동으로 처리하기 위한 웹 33 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
34. 시맨틱 웹 We need structured data on the Web. 34 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
35. 왜 데이터베이스 검색인가? 웹에 구조화된 데이터, 공개 데이터베이스가 증가하고 있다. 35 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주)
36. Open Data 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 36 Open Source Open API Open Data
37. Activities Promoting Open Data Linking Open Data Open Data in Science Freebase Science Commons Free Our Data The Open Knowledge Foundation Blue Obelisk Research Data Canada 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 37
55. 기조 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 55 시맨틱 영화검색은 오브젝트 검색 인물 국가 학교 회사 영화제 영화
56. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 56 문서 검색 VS. 오브젝트검색
57. 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 57 질의도 오브젝트 단위로 하고 검색 결과도 오브젝트 단위로
58. 시맨틱 영화검색의 특징 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 58 의미가 결정된 오브젝트 단위로 검색 오브젝트 검색 1 자연어 모호성 최소화 길고 복잡한 질의가 가능하다. 길고 복잡한 질의 2 “스파이더맨 출연 한국 배우 ” 정답을 요구하는 질의에 대해 정답을 찾아준다 정답 검색 3 “박찬욱 감독 영화”, “올드보이 주연 배우” 두 개의 오브젝트 사이에 의미 있는 관계를 찾아준다. 관계 검색 4 “봉준호 송강호”, “김혜수 김동현” 집합으로 집합을 찾는 검색 집합 기반 검색 5 “한국 여자 감독 영화”
59. 시맨틱 영화검색의 특징 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 59 새로운 발견 다양한 의미 해석 6 “봉준호 영화”, “타짜 배역” 정의된 모든 속성의 조합으로 검색 속성 검색 7 “2007 일본 액션 영화” 실재 DB에 존재하지 않는 정보를 추론 규칙으로 추론 추론 검색 8 “피터폰다 가족” 자연어 형식으로 질의 가능 자연어 검색 9 “부산 출신 감독” 특정 오브젝트에 대해 관련 속성 정보들이 정리되어 나옴 컨텐츠 검색 10 “해운대”
60. 시맨틱 자동 완성 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 60
61. 시맨틱 자동 완성(2) 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 61 1차 자동 완성 2차 자동 완성
62. 시맨틱검색어 추천 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 62 확장 검색어 추천: 온톨로지를 이용한 기계적인 키워드 확장 연관 검색어 추천: 키워드와 관련 높은 영화인-영화인, 영화-영화인, 영화-영화 추천
64. 결론 2009년 시맨틱웹 컨퍼런스 - 네이버랩 시맨틱 영화검색 – 강병주 NHN(주) 64 1. 이제 데이터베이스 검색이 아니라 데이터베이스 정보검색이다. 2. 시맨틱웹(데이터 웹)은 데이터베이스 정보검색 시대를 열 것이다. 3. 시맨틱 영화검색은 데이터베이스 정보검색을 가능성을 위한 실험이다.