Semantic web Open Seminar
“시맨틱 웹과 인공지능 기술 동향 및 구현사례”
Technology Trends for
LOD and Semantic Web
2010. 07.26
이 경 일
목 차
1. 시맨틱 웹 개요
• 5관점 시맨틱 웹
• 웹 데이터 상호운용
• 기업 데이터 상호운용
• 지식 공유와 표현
2. 시맨틱 웹 기술 동향
Page 1
2. 시맨틱 웹 기술 동향
• 표준화 동향
• 기술 발전 동...
Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Se...
시맨틱시맨틱 웹웹
지능형 에이전트온톨로지 (OWL)
시맨틱 웹 개념
Page 3
시맨틱시맨틱 웹웹
[[[데이터의데이터의데이터의 웹웹웹]]]
의미 메타데이터 (RDF) 주석 달린 웹 (RDFa,HTML5)
• URI , RDF 기반 데이터의 웹
• 의미 주석 달린 웹 (RDFa)
5관점 시맨틱 웹
Page 4
• 온톨로지와 술어논리
• OWL과 DL
• 추론과 계획, 의사결정
• 전문가 시스템, 상황인지
• 데이터 상호운...
WWWWWWWWW
웹 데이터 공유와 상호운용?
Page 5
WWWWWWWWW
50/60Hz
100/110/120/125/127/200/210/220/230/240V
웹 데이터 공유와 상호운용?
Page 6
subscribing
billing
phone call
m-commerce
content usage
promotion
기업 데이터 공유와 상호운용?
Page 7
location
CRM
기업 데이터 공유와 상호운용?
Page 8
자연 언어
(Natural Language)
글로 쓰여진 사람의 말 : “지구는 타원 궤도로 태양을 돌고 있다”
시각 언어
(Visual Language)
그림, 구조도, 흐름도, 설계도 등 시각적으로 지식을 표현
주석...
“기업에 종사하는 종업원은 사람들이고, 기업과 종업원은 모두 법적 존재이다.
기업은 직원들을 위해 여행 예약을 할 수 있다. 여행은 한국 내 도시, 혹 미국의
도시를 오고 가는 비행기 혹은 기차를 통해 가능하다. 기업들...
법적 존재
사람 기업 도시
위치
여행
kindOf
kindOf
endsIn
startFrom
books
법적 존재
사람 기업
subclssOf
사람 기업
subclssOf
instanceOf
법적 존재
이름
고유번호
성...
Technology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTec...
OWL2 ?
• 2004년 RDF/S와 OWL의 첫 표준 발표
• OWL 기반의 상용 기술 개발 중 대용량 처리 등 어려움 직면
• OWL DL은 종종 다항 시간에 답을 내지 못하는 문제 있음
• W3C는 2009년 말...
OWL2 ?
프로파일 특 징
OWL2 EL
• 클래스 혹은 속성이 대단히 많은 응용에 적합
• EL의 제약 조건과 공리만을 사용하면, 많은 수의 클래스
와 속성을 가진 온톨로지에 대해서 다항시간 내에 결정
가능 추론 가...
The Future of RDF??
• W3C에서 RDF Next Steps 워크샵 개최 (June 26, 2010)
• 향후 Working Group에서 진행해야할 중요 주제로 다음의 5가지 선정
– Adding su...
The Future of RDF??
Page 16
The Future of RDF??
• TBL에 뒤늦게 Workshop에 참여, 자신의 소신 밝힘
– Cleaning up the RDF model
– Extending the RDF model to allow N3
–...
HTML5
• The canvas element for immediate mode 2D drawing.
• Timed media playback
• Offline storage database (offline web a...
Scalability
Performace
시맨틱 기술의 발전
Page 19
Performace
Expressivity
Data
Dynamics
<성능 평가 지표>
Scalability
Telco
UbiComp
SocialNet
년 도 성 능
2005
• 500M triples
시맨틱 기술의 발전 : 대용량 처리
Page 20
Expressivity
Telco
Enterprise
...
Scalability
SocialNet
Telco
UbiComp
년 도 성 능
• 500M triples
시맨틱 기술의 발전 : 질의 속도
Page 21
Performance
SocialNet
Telco
Enterpri...
Scalability
SocialNet
Telco
UbiComp 년 도 성 능
• 500M triples
시맨틱 기술의 발전 : 로딩 속도
Page 22
Data Dynamics
SocialNet
Enterprise
S...
2004 (V 1.2)
시맨틱 기술의 발전 : 추론 속도
Page 23
2004 (V 1.2)
2006 (V 1.5)
2008 (V 2.0)
ScalabilityScalabilityScalability
ScalabilityScalabilityScalability
???
시맨틱 기술 최적화 방안?
Page 24
ExpressivityExpressivityExp...
Enhanced algorithm
Materialization
Distributed Computing
Without
Optimization
After
Optimization
시맨틱 기술 최적화 방안?
Page 25
Ap...
Algorithm Materialization
Query
Medical
E. Search
Social Net
Mobile
Ubiquitous
시맨틱 기술 최적화 방안?
Page 26
Distribution
Approxi...
• W3C의 LOD(Linking Open Data)
프로젝트를 통한 시맨틱 웹 기반의
공개 데이터 연계
• URI와 SPARQL EndPoint 적용,
LOD project : Linking Open Data
Page...
LOD project : Linking Open Data
Page 28
• Use URIs as names for things
• Use HTTP URIs so that people can look up those names.
• When someone looks up a URI, prov...
Linked Data and Gov. Data
Page 30
https://www.knowledge.go.kr/jsp/pissc/publicInfo.jsp http://www.egovframe.go.kr/Egovcmm.jsp
Gov. Open Data in Korea ???
Pa...
Open Graph : FaceBook
Page 32
Yahoo, NYT and Best Buy
Page 33
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@Prefix skos: <http://www.w3....
Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Ne...
시맨틱 검색 ?
Semantic Web Search
vs.
Page 35
vs.
Semantic Search
시맨틱 웹 검색
Page 36
Web 1.0 Web 2.0 Web 3.0? : Semantic Web ??
검색 소셜 네트워크 연결, 발견 예측, 추론
정 보 사 람 지 식 지 능
2000 2005 2010 2015 2020
시맨틱 검색 : 연결과 ...
• 자연 언어
• 시각 언어
• 정보 태깅
“기업에 종사하는 종업원은 사람들이고,
기업과 종업원은 모두 법적 존재이다. 기
업은 직원들을 위해 여행 예약을 할 수
• 시맨틱 넷
• 규칙과 논리
• 확률 통계
?
시맨틱 ...
유 형 설 명
1
의미모호성
해소 검색
• 시장(mayor, market, hunger), 말(speech, horse, checker, end) 등의 용어 의미를
구분해 색인, 검색 시 의미에 따른 분류 수행
• 개체...
시맨틱 소셜 네트워크 분석
Page 40
맺음말
Page 41
Thank you!
Upcoming SlideShare
Loading in...5
×

Technology Trends for LOD and Semantic Web

1,573

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,573
On Slideshare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
24
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Technology Trends for LOD and Semantic Web

  1. 1. Semantic web Open Seminar “시맨틱 웹과 인공지능 기술 동향 및 구현사례” Technology Trends for LOD and Semantic Web 2010. 07.26 이 경 일
  2. 2. 목 차 1. 시맨틱 웹 개요 • 5관점 시맨틱 웹 • 웹 데이터 상호운용 • 기업 데이터 상호운용 • 지식 공유와 표현 2. 시맨틱 웹 기술 동향 Page 1 2. 시맨틱 웹 기술 동향 • 표준화 동향 • 기술 발전 동향 • LOD 동향 • RDFa 활용 동향 3. 향후 발전 전망
  3. 3. Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again?Semantic Web, again? Page 2
  4. 4. 시맨틱시맨틱 웹웹 지능형 에이전트온톨로지 (OWL) 시맨틱 웹 개념 Page 3 시맨틱시맨틱 웹웹 [[[데이터의데이터의데이터의 웹웹웹]]] 의미 메타데이터 (RDF) 주석 달린 웹 (RDFa,HTML5)
  5. 5. • URI , RDF 기반 데이터의 웹 • 의미 주석 달린 웹 (RDFa) 5관점 시맨틱 웹 Page 4 • 온톨로지와 술어논리 • OWL과 DL • 추론과 계획, 의사결정 • 전문가 시스템, 상황인지 • 데이터 상호운용성 • 트리플과 그래프 • 시맨틱 검색, 마이닝 • 정보 추천, 정보 발견
  6. 6. WWWWWWWWW 웹 데이터 공유와 상호운용? Page 5 WWWWWWWWW 50/60Hz 100/110/120/125/127/200/210/220/230/240V
  7. 7. 웹 데이터 공유와 상호운용? Page 6
  8. 8. subscribing billing phone call m-commerce content usage promotion 기업 데이터 공유와 상호운용? Page 7 location CRM
  9. 9. 기업 데이터 공유와 상호운용? Page 8
  10. 10. 자연 언어 (Natural Language) 글로 쓰여진 사람의 말 : “지구는 타원 궤도로 태양을 돌고 있다” 시각 언어 (Visual Language) 그림, 구조도, 흐름도, 설계도 등 시각적으로 지식을 표현 주석, 태깅 (Tagging) 개체에 연관된 키워드, 기호, 이미지 등을 부착해 지식을 표현 기호 언어 (Symbolic Language) 수학 등을 포함해 기호로 표현된 지식 : x2/a2 + y2/b2 = 1 의사 결정 나무 (Decision Tree) 복잡한 의사 결정을 위해 구성된 나무 모양의 그래프 구조 사람 지식 공유? 지식 표현! Page 9 (Decision Tree) 규칙 (Rules) 인간 지식을 여러 규칙들의 조건부 결합으로 표현 데이터베이스 (Database System) 개체와 관계로 구성된 테이블 형태의 지식 표현 체계 논리 언어 (Logical Language) 논리 기호, 연산을 통한 지식 표현 : Woman ≡ Person ∩ Female 프레임 언어 (Frame Language) 값 혹은 타 프레임의 포인터를 저장한 슬롯들로 지식 표현 시맨틱 네트워크 (Semantic Network) 개념간의 의미적 관계를 그래프 구조로 구성한 지식 표현 통계적 지식 (Statistical Knowledge) 확률과 통계에 기반한 지식 표현, 기계 학습 기술 접목 가능 기계
  11. 11. “기업에 종사하는 종업원은 사람들이고, 기업과 종업원은 모두 법적 존재이다. 기업은 직원들을 위해 여행 예약을 할 수 있다. 여행은 한국 내 도시, 혹 미국의 도시를 오고 가는 비행기 혹은 기차를 통해 가능하다. 기업들과 출장지는 도시에 위치하고 있다. 솔트룩스는 홍길동을 위해 서울과 뉴욕 왕복 항공편인 OZ510을 예약하였다.” 자연 언어 지식의 표현 Page 10 규칙 언어 (규칙) 만약 누군가가 날고 있다면, 여행중인 것이다. (규칙) 만약 누군가의 여행이 한 회사에서 예약되었다면, 그는 그 회사의 종업원이다. (규칙 추가) 만약 동일 국가의 근거리 여행이라면, 종업원은 기차를 이용해야 한다. (추론) 비행 예약이 되어 있는 홍길동은 솔트룩스의 종업원이다 (추론) OZ510은 미국과 한국을 오가는 비행편이다.
  12. 12. 법적 존재 사람 기업 도시 위치 여행 kindOf kindOf endsIn startFrom books 법적 존재 사람 기업 subclssOf 사람 기업 subclssOf instanceOf 법적 존재 이름 고유번호 성별 나이 업종 주소지 사람 기업 subclssOf instanceOf 법적 존재 이름 (필수) 고유번호 (필수) 성별 ⊆ {남,녀} 나이 > 25 업종 주소지 ⊂ 서울 DISJOINT 온톨로지(Ontology) 지식의 표현 Page 11 종업원 홍길동 솔트룩스 비행기 기차 한국 도시 미국 도시 뉴욕 서울 OZ510 kindOf instnaceOf instanceOf instanceOf instanceOf participatesIn instanceOf 종업원 홍길동 솔트룩스 subclssOf instanceOf instanceOf 종업원 #3502 #4831 subclssOf instanceOf instanceOf 직급 홍길동 37 과장 P12345 남자 솔트룩스 서울 삼성동 C98765 소프트웨어 종업원 #3502 #4831 subclssOf instanceOf instanceOf 직급 ≠ 임원 홍길동 37 과장 P12345 남자 솔트룩스 서울 삼성동 C98765 소프트웨어 (a) 시맨틱 네트워크 (b) (a) + 프레임(프로퍼티) (c) (b) + 논리 제약 온톨로지(Ontology)
  13. 13. Technology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology TrendsTechnology Trends Page 12
  14. 14. OWL2 ? • 2004년 RDF/S와 OWL의 첫 표준 발표 • OWL 기반의 상용 기술 개발 중 대용량 처리 등 어려움 직면 • OWL DL은 종종 다항 시간에 답을 내지 못하는 문제 있음 • W3C는 2009년 말, OWL 2 표준을 통해 산업계의 요구사항 수용 • OWL 2는 세가지 프로파일을 정의함으로 다항시간 내 추론 가능 Page 13
  15. 15. OWL2 ? 프로파일 특 징 OWL2 EL • 클래스 혹은 속성이 대단히 많은 응용에 적합 • EL의 제약 조건과 공리만을 사용하면, 많은 수의 클래스 와 속성을 가진 온톨로지에 대해서 다항시간 내에 결정 가능 추론 가능 • 인스턴스가 대단히 많은, A-Box 추론 성능이 중요한 응용 Page 14 OWL2 QL • 인스턴스가 대단히 많은, A-Box 추론 성능이 중요한 응용 에서 권고 • 기존의 RDB와 결합해 사용 가능한 장점을 가짐. • QL 질의는 모두 SQL로 변환 가능, 표현력이 낮은 단점 OWL2 RL • 상대적으로 적은 표현력 손실과 대용량 처리가 동시 필요 할 때 권고 • 온톨로지의 일관성 점검(consistency check)과 포함관계 (subsumption) 추론이 가능하며, 동시에 규칙 기반 추론 을 적용할 수 있는 장점 보유
  16. 16. The Future of RDF?? • W3C에서 RDF Next Steps 워크샵 개최 (June 26, 2010) • 향후 Working Group에서 진행해야할 중요 주제로 다음의 5가지 선정 – Adding support for graph identification (such as with named graphs) – Fixing known errors and shortcomings in the specifications – Standardizing Turtle – A syntax related to Turtle to support for embedded/named graphs – Standardizing an RDF serialization based on JSON Page 15
  17. 17. The Future of RDF?? Page 16
  18. 18. The Future of RDF?? • TBL에 뒤늦게 Workshop에 참여, 자신의 소신 밝힘 – Cleaning up the RDF model – Extending the RDF model to allow N3 – Extending N3 – Ontologies on top of N3 – Extending N3 Including RIF features • N3와 관련된 강력한 의지 표현! Page 17 <#pat> <#knows> <#jo> . <#pat> <#age> 24 . <#pat> <#age> 24; <#eyecolor> "blue" . <#al> <#age> 3; <#eyecolor> "green" . <#jo> <#age> 5; <#eyecolor> "green" . age eyecolor pat 24 blue al 3 green jo 5 green {?x family:parent ?y. ?y family:brother ?z} => {?x family:uncle ?z}.
  19. 19. HTML5 • The canvas element for immediate mode 2D drawing. • Timed media playback • Offline storage database (offline web applications) • Document editing • Drag-and-drop • Cross-document messaging • Browser history management Page 18 Browser history management • MIME type and protocol handler registration • Microdata • Geolocation • Local SQL Database[17]. Web SQL Database • Indexed hierarchical key-value store http://www.chromeexperiments.com/http://www.chromeexperiments.com/http://www.chromeexperiments.com/http://www.chromeexperiments.com/
  20. 20. Scalability Performace 시맨틱 기술의 발전 Page 19 Performace Expressivity Data Dynamics <성능 평가 지표>
  21. 21. Scalability Telco UbiComp SocialNet 년 도 성 능 2005 • 500M triples 시맨틱 기술의 발전 : 대용량 처리 Page 20 Expressivity Telco Enterprise Search Medical SocialNet 2005 • 500M triples • OWL DLP 2009 • 10B triples • OWL DL Horst
  22. 22. Scalability SocialNet Telco UbiComp 년 도 성 능 • 500M triples 시맨틱 기술의 발전 : 질의 속도 Page 21 Performance SocialNet Telco Enterprise Search Medical 2005 • 500M triples • 1~40S (LUBM1000) 2009 • 10B triples • 0.01~5S (LUBM1000)
  23. 23. Scalability SocialNet Telco UbiComp 년 도 성 능 • 500M triples 시맨틱 기술의 발전 : 로딩 속도 Page 22 Data Dynamics SocialNet Enterprise Search Medical 2005 • 500M triples • 15KTPS 2009 • 10B triples • 50KTPS , >200KTPS
  24. 24. 2004 (V 1.2) 시맨틱 기술의 발전 : 추론 속도 Page 23 2004 (V 1.2) 2006 (V 1.5) 2008 (V 2.0)
  25. 25. ScalabilityScalabilityScalability ScalabilityScalabilityScalability ??? 시맨틱 기술 최적화 방안? Page 24 ExpressivityExpressivityExpressivity ExpressivityExpressivityExpressivity ???
  26. 26. Enhanced algorithm Materialization Distributed Computing Without Optimization After Optimization 시맨틱 기술 최적화 방안? Page 25 Approximation Lean KR model Query optimization + Query/Data Cache
  27. 27. Algorithm Materialization Query Medical E. Search Social Net Mobile Ubiquitous 시맨틱 기술 최적화 방안? Page 26 Distribution ApproximationLean KR model Query Optimization (+ Cache)
  28. 28. • W3C의 LOD(Linking Open Data) 프로젝트를 통한 시맨틱 웹 기반의 공개 데이터 연계 • URI와 SPARQL EndPoint 적용, LOD project : Linking Open Data Page 27 • URI와 SPARQL EndPoint 적용, 현재 4.2 billion 이상의 트리플 • 바이오, 공간정보, 위키피디아 등 방대한 데이터 연결 (142M links) • 최근 data.gov, data.gov.uk 등 국가 DB 공개/활용 촉진
  29. 29. LOD project : Linking Open Data Page 28
  30. 30. • Use URIs as names for things • Use HTTP URIs so that people can look up those names. • When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) • Include links to other URIs. so that they can discover more things. • 다양한 Sparql Endpoints 참조 : http://esw.w3.org/SparqlEndpoints Linked Data and SPARQL Endpoints Page 29 <Content negotiation Process>
  31. 31. Linked Data and Gov. Data Page 30
  32. 32. https://www.knowledge.go.kr/jsp/pissc/publicInfo.jsp http://www.egovframe.go.kr/Egovcmm.jsp Gov. Open Data in Korea ??? Page 31
  33. 33. Open Graph : FaceBook Page 32
  34. 34. Yahoo, NYT and Best Buy Page 33 @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @Prefix skos: <http://www.w3.org/2004/02/skos/core#> . <http://topics.nytimes.com/top/reference/timestopics/people/b/ray_bradbury#concept> a skos:Concept; skos:prefLabel "Bradbury, Ray"; skos:broader <http://topics.nytimes.com/top/reference/timestopics/people#concept>; skos:inScheme <http://topics.nytimes.com/top/reference/timestopics#conceptScheme> .
  35. 35. Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ?Next Steps ? Page 34
  36. 36. 시맨틱 검색 ? Semantic Web Search vs. Page 35 vs. Semantic Search
  37. 37. 시맨틱 웹 검색 Page 36
  38. 38. Web 1.0 Web 2.0 Web 3.0? : Semantic Web ?? 검색 소셜 네트워크 연결, 발견 예측, 추론 정 보 사 람 지 식 지 능 2000 2005 2010 2015 2020 시맨틱 검색 : 연결과 발견! Page 37 정보 처리 정보 분석 지식 공유 수집, 관찰 연결, 재조직 발견분석
  39. 39. • 자연 언어 • 시각 언어 • 정보 태깅 “기업에 종사하는 종업원은 사람들이고, 기업과 종업원은 모두 법적 존재이다. 기 업은 직원들을 위해 여행 예약을 할 수 • 시맨틱 넷 • 규칙과 논리 • 확률 통계 ? 시맨틱 검색 : 연결과 발견! Page 38 업은 직원들을 위해 여행 예약을 할 수 있다. 여행은 한국 내 도시, 혹 미국의 도 시를 오고 가는 비행기 혹은 기차를 통해 가능하다. 기업들과 출장지는 도시에 위 치하고 있다. 솔트룩스는 홍길동을 위해 서울과 뉴욕 왕복 항공편인 OZ510을 예 약하였다.” 키워드 검색 시맨틱 검색 ?
  40. 40. 유 형 설 명 1 의미모호성 해소 검색 • 시장(mayor, market, hunger), 말(speech, horse, checker, end) 등의 용어 의미를 구분해 색인, 검색 시 의미에 따른 분류 수행 • 개체명 인식, 시맨틱 어노테이션, 용어 군집, 온톨로지 기술 등 적용 2 어휘 개념 확장 검색 • 핸드폰=휴대폰=셀룰라폰, 과일⊃사과∋부사, 정치인⊃대통령∋이명박 등의 개념 적 상하위 관계, 동의어/유의어 관계, 인스턴스 등을 확장 검색 • 시소러스(워드넷) 및 온톨로지 활용, 질의 시 포함관계 추론 가능 • 온톨로지 파퓰레이션 등 자동화 기술 통한 자동 구축 가능 솔트룩스.대표이사, 솔트룩스.주소, 솔트룩스.제품 등과 같이 검색 대상 개체의 구 시맨틱 검색의 유형 Page 39 3 개체 특징 확장 검색 • 솔트룩스.대표이사, 솔트룩스.주소, 솔트룩스.제품 등과 같이 검색 대상 개체의 구 체적 특징들에 대해 확장 검색할 수 있는 기능 • 트리플 관점에서 보면 predicate를 통한 정보 네비게이션 형태를 취함 • 구축된 온톨로지를 활용하거나, 텍스트로부터 부분 구문분석(partial parsing)을 통 해 관련 정보를 자동 추출 가능(네이트 시맨틱 검색 유형) 4 연관 주제 확장 검색 • 천안함-침몰-어뢰, 장동건-고소영-결혼 등과 같이 연관된 주제들을 연결해 확장 검 색할 수 있는 기능 • 특정 주제를 둘러싼 컨텍스트와 트랜드 이해를 목적으로 함 • 공기어분석, LSA, 토픽랭크 등의 분석 기법 적용 5 의도 기반 검색 • 냉면-맛집/요리법/역사, 청담동-교통/식당/카페 등, 사용자의 검색 의도에 따른 목 적 주제를 제시하는 검색 • 사용자 로그 등 검색 패턴 분석을 통해 주제에 따른 사용자 의도 발견, 주제별 인 덱싱
  41. 41. 시맨틱 소셜 네트워크 분석 Page 40
  42. 42. 맺음말 Page 41
  43. 43. Thank you!
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×