URI와 RDF에 기반한 분산 데이터의 연계는 기본적으로 그래프 구조를 가지게 된다. 최근에는 RDF 그래프의 생성과 질의 뿐 아니라, 그래프 마이닝에 대해 많은 관심과연구가 진행되고 있다. 본 발표에서는 소셜 네트워크를 RDF 그래프로 표현하고, 이를 마이닝, 추론 함으로, 어떻게 대용량 소셜 네트워크를 효과적 분석할 수있는지 설명한다. 특히, 휴대전화 통화에 기반한 모바일 소셜 네트워크와 e-mail 지식 네트워크 분석이 시맨틱 웹 표준하에 어떻게 구현 가능한지 그 사례 소개와시연을 보인다.
16. 자동화 방법은 없을까????LG 소유 애니콜 소유 WinCE 제품 사이언 제품 햅틱 블랙잭 탑재
17. 어휘 통계 활용 (공기 분석) 삼성전자는 휴대폰햅틱을 새롭게 출시를 하였다. 햅틱은 풀 터치폰 기능을 가지고 있고, 애니콜브랜드 중 가장 고가의 제품이 될 것으로 보인다. 삼성전자 핸드폰 시장에 새로운 바람이 불고 있다. 특히, 고가 핸드폰 중 햅틱과 iPhone이 터치폰 이라는 새로운 기능으로 고객을 유혹한다. 휴대폰 핸드폰 애니콜 햅틱
21. 증분 문서에 대한 실시간 갱신? : T_TLSA(Latent Semantic Analysis) PLSA(Probabilistic Latent Semantic Analysis)
22. 발전된 알고리즘 : TopicRank 특성 벡터 추출/색인 문서 집합 선정 : VSM Word Co-occurrence 분석 systems compatibility Criteria systems nonstrict types linear natural numbers constraints inequations Upper diophantine solutions equations bounds algorithms components set strict minimal construction 토픽 클러스터링 토픽간의 네트워크 구성
23. 전자제품 생산자 기업 하위어 핸드폰 소유 휴대단말기 동의어 브랜드 휴대폰 모바일폰 제품 하위어 동의어 삼성 삼성 휴대전화 하위어 블랙잭 LG 소유 LG 터치폰 스마트폰 탑재 애니콜 O/S 애니콜 소유 WinCE WinCE 제품 사이언 사이언 제품 햅틱 햅틱 블랙잭 탑재 용어의 개념과 관계를 이해 개체명/관계 인식
24. 이제 “사람들의 관계”를 연결하자 Dijkstra’s algorithm O( | E | + | V | log | V | ) 가족, 동료, 부서, 동아리 정보소통의 중심, 매개자 빨리 사람 찾기 Density, n-Clan, n-Clique Degree, Closeness Betweenness Centrality Shortest Path Algorithms gjk: j와k 사이에 존재하는 최단 경로 수 gjk(i) : j와 k 경로 중 i를 경유하는 수) vk: weighting of relation n : number of relations g : total number of entity
54. 개인/조직 정보 획득 능력Building and Managing Social Network 사람 조직 지역 사건 서비스 Collecting Social Information Social Resource Provisioning API Social Resource Collection Framework e-Mail 학력/경력정보 외부DB연동 웹 크롤링 수동 입력 기본인력정보 블로그/뉴스 실적정보 (논문/특허 등) PIMS 연동 LOD 연동 모바일 연동 외부SNS
55. 사례 : 아울림 서비스 토픽 클러스터링기술을 적용, 웹에서 추출된 지식을 연결하고, 그 연관관계를 밝힘으로 사용자에게 통찰력을 제공 Powered by [IN2]Discovery & RDF
56. 사례 : LG전자 특허 및 지식맵 분석 한국, 일본, 미국(영어권)의 특허 3000만건을 분석하여, 기술 주제 별 특허 맵을 자동 생성, 연관/선행 특허를 자동 분석 ① ① ※ 특정 특허 문서에 마우스 커서를 올려 놓으면 선택 특허에 대한 상세 정보 표시 링크 : 분류명(분류 체계 및 기타 관련 용어) 중심특허 중심특허 Powered by [IN2]Discovery & RDF
57. 80 GB 분석결과 S-KMS 전송 각 분석대상의 update 부분만 선별하여 분석실행 KMS 운영DB 분석결과 (인덱스) 분석모듈 - Top N - 추이분석 - 관계분석 미국특허 DB 100 GB 결과 DB 5 GB 400 GB 인덱스 재구성 KMS 첨부파일 논문DB 논문 기술문서DB XML 데이터 국내특허DB DB변환 기술문서 10 GB 10 GB 사례 : 삼성전자 신기술센싱 삼성전자 KMS의 비정형 정보과 특허, 논문 등 외부의 비정형 정보를 통합 분석하여, 새로운 지식, 기술을 발견하고, 이를 분석하도록 지원 Powered by [IN2]Discovery & RDF
58. 사례 : 삼성전자 신기술센싱 Powered by [IN2]Discovery & RDF
59. 사례 : KISTI 학술 지식 네트워크 분석 논문에 대해서 국가, 기관, 저자 등 분석 대상을 설정하고, 개체 간 존재하는 동시출현 패턴과 지식 네트워크를 분석 Powered by [IN2]Discovery & RDF
60. 사례 : Discovery 쌈지 e-mail과 첨부 문서에 기반한 기반한 시맨틱 소셜 네트워크 및 지식 유통 구조분석 시스템 쌈지 정보네트워크 데이터정제 데이터요약 1차네트워크구성 업무긴밀도 및 중심성 분석 SOR API 2차네트워크구성 시간대별 연결성 분석 Instantiator Query & Reasoning 개체명추출 주제별 관계성분석 Triple Store Powered by [IN2]Discovery & OWL
106. Major Activity Area* Maximum Condition Example IFReceiver’s Age is bigger by more than 20, SEX is woman and she pay for Caller THENshe will be mother.
107. 사례 : KT 모바일SNA , 선호 분석 Extend social relationships * Social Relationship Ontology 50 Classes 58 Relationships 15 Properties 57 Rules Intimacy Analysis Profile Identification Discovery Basic Social Relationship Reasoning Social Relationship Profile Analysis Call Location Analysis
108. 사례 : KT 모바일SNA , 선호 분석 Using Implicit User Behavior CDR Analysis Collect CDR Extract Company Name Classify Business Type Map Business Types to Preference Classes Measure Preference based on Frequency Content / Service Domain Preference URL Analysis Collect URL Access Log Classify URL Domain Extract Services from URL Extract URL properties Analysis property values Content / Service Preference Map values to Preference Classes Search Keyword Analysis Collect Search Log Extract Search Keyword Classify Search Keyword Map Search Keyword to Preference Classes Content / Service Preference Indentify Target Services Membership Card Usage Analysis Collect CDR Extract Company Name Classify Business Type Map Business Types to Preference Classes Measure Preference based on Frequency Content / Service Domain Preference Analysis Implicit User Behavior Discovery Personal Preference Discovery Social Preference Classification User Behavior Analysis Explicit User Behavior Clustering Personal Preference Discovery Representative Group Preference
109. 사례 : KT 모바일SNA , 선호 분석 User Behavior and Personal Preference Legacy History Preference Classification User Behavior Classification User Preference Content and Service Classification CDE History Mapping Mapping People Bee Singer genre baseball Sport brand anycall samsung … … … Analysis Implicit User Behavior Discovery Personal Preference Discovery Social Preference Classification User Behavior Analysis Explicit User Behavior Clustering Personal Preference Discovery Representative Group Preference
110. 사례 : KT 모바일SNA , 선호 분석 Start Personalized Dynamic UI Tour Shopping VOD with Ad. Mobile Search Stock Advertisement Powered by [IN2]Discovery & OWL
121. Current State of the Art of Technology UbiComp UbiComp Scalability Scalability Telco Telco Social Net Social Net Enterprise Search Enterprise Search Medical Medical Expressivity Performance UbiComp UbiComp Telco Scalability Search Telco Performance Social Net Enterprise Search Medical Social Net Medical Data Dynamics Expressivity
123. How to move Maginot Lines? Scalability Scalability ? Expressivity Expressivity
124. 6 Solutions Current State of the Art Improved Results Enhanced algorithm Materialization Distributed Computing Approximation Lean KR model Query optimization + Query/Data Cache
125. Medical E. Search Social Net Mobile UbiComp Wining Strategies Materialization Algorithm Query Optimization (+ Cache) Distribution Approximation Lean KR model
126. 결 언 Cost based Biz Model Differentiation based Biz Model Customer’s Benefit or Profitability Intelligence/Reasoning Interoperability Trap Price “ Customer's Benefit > Price > Cost ”
127. “Thank you for your attention.” 보다 상세한 설명이 필요하시면… 이경일 tony@saltlux.com 010-9123-0081 in2.saltlux.com , www.saltlux.com