시맨틱 소셜 네트워크 분석 사례 소개

  • 8,177 views
Uploaded on

URI와 RDF에 기반한 분산 데이터의 연계는 기본적으로 그래프 구조를 가지게 된다. 최근에는 RDF 그래프의 생성과 질의 뿐 아니라, 그래프 마이닝에 대해 많은 관심과연구가 진행되고 있다. 본 발표에서는 소셜 네트워크를 RDF 그래프로 표현하고, 이를 마이닝, 추론 함으로, 어떻게 대용량 소셜 네트워크를 효과적 분석할 수있는지 설명한다. 특히, 휴대전화 …

URI와 RDF에 기반한 분산 데이터의 연계는 기본적으로 그래프 구조를 가지게 된다. 최근에는 RDF 그래프의 생성과 질의 뿐 아니라, 그래프 마이닝에 대해 많은 관심과연구가 진행되고 있다. 본 발표에서는 소셜 네트워크를 RDF 그래프로 표현하고, 이를 마이닝, 추론 함으로, 어떻게 대용량 소셜 네트워크를 효과적 분석할 수있는지 설명한다. 특히, 휴대전화 통화에 기반한 모바일 소셜 네트워크와 e-mail 지식 네트워크 분석이 시맨틱 웹 표준하에 어떻게 구현 가능한지 그 사례 소개와시연을 보인다.

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
  • http://vimeo.com/8092629
    Are you sure you want to
    Your message goes here
  • 시맨틱
    Are you sure you want to
    Your message goes here
No Downloads

Views

Total Views
8,177
On Slideshare
0
From Embeds
0
Number of Embeds
5

Actions

Shares
Downloads
443
Comments
2
Likes
13

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 시맨틱소셜 네트워크 분석
    2009.12.04 이 경 일 tony@saltlux.com
  • 2. Linked World
  • 3. 연결된 세상 : Web
    Web
  • 4. 연결된 세상 : Brain
    Brain
  • 5. 연결된 세상 : People
    People
  • 6. 연결된 세상 : Wordnet
    WordNet
  • 7. 연결된 세상 : Mobile
  • 8. 연결된 세상 : Ontology
    Ontoloy
  • 9. 연결된 세상 : LOD
    Data
  • 10. 지식의 공유와 전파
    • 예기치 못한 일들이 한 순간에 폭발하는 세계…
    • 11. Network + Message (Information) + Context
  • 연결된 지식과 사람 그리고 통찰력
  • 12. 오늘의 주제 : Semantic Social Network
    Social Network
    Informational Network
    SNA
    Text Mining
    Semantic Social Network Analysis
  • 13. SSNA Technology Stack
  • 14. 시맨틱 네트워크 그리고 시맨틱 검색
  • 15. 전자제품
    생산자
    기업
    하위어
    핸드폰
    소유
    휴대단말기
    동의어
    브랜드
    모바일폰
    하위어
    동의어
    휴대전화
    하위어
    터치폰
    스마트폰
    탑재
    O/S
    시맨틱 네트워크 어떻게 만들 것인가?
    휴대폰
    제품
    삼성
    • 이 복잡한 체계를 어떻게 구축, 저장하지?
    • 16. 자동화 방법은 없을까????
    LG
    소유
    애니콜
    소유
    WinCE
    제품
    사이언
    제품
    햅틱
    블랙잭
    탑재
  • 17. 어휘 통계 활용 (공기 분석)
    삼성전자는 휴대폰햅틱을 새롭게 출시를 하였다. 햅틱은 풀 터치폰 기능을 가지고 있고, 애니콜브랜드 중 가장 고가의 제품이 될 것으로 보인다.
    삼성전자
    핸드폰 시장에 새로운 바람이 불고 있다. 특히, 고가 핸드폰 중 햅틱과 iPhone이 터치폰 이라는 새로운 기능으로 고객을 유혹한다.
    휴대폰
    핸드폰
    애니콜
    햅틱
  • 18. 혹시 ‘뜻’도 구별?
    프랑스
    LCD
    보르도
    보르도
    와인
    TV
    포도
    삼성
  • 19. 어휘 통계적 의미 분석 : LSA, PLSA
    • Singular Value Decomposition
    {A}={U}{S}{V}T
    • Dimension Reduction
    {~A}~={~U}{~S}{~V}T
    • Probabilistic LSA
    • 20. 방대한 매트릭스 계산 : 메모리와 시간
    • 21. 증분 문서에 대한 실시간 갱신? : T_T
    LSA(Latent Semantic Analysis)
    PLSA(Probabilistic Latent Semantic Analysis)
  • 22. 발전된 알고리즘 : TopicRank
    특성 벡터 추출/색인
    문서 집합 선정 : VSM
    Word Co-occurrence 분석
    systems
    compatibility
    Criteria
    systems
    nonstrict
    types
    linear
    natural
    numbers
    constraints
    inequations
    Upper
    diophantine
    solutions
    equations
    bounds
    algorithms
    components
    set
    strict
    minimal
    construction
    토픽 클러스터링
    토픽간의 네트워크 구성
  • 23. 전자제품
    생산자
    기업
    하위어
    핸드폰
    소유
    휴대단말기
    동의어
    브랜드
    휴대폰
    모바일폰
    제품
    하위어
    동의어
    삼성
    삼성
    휴대전화
    하위어
    블랙잭
    LG
    소유
    LG
    터치폰
    스마트폰
    탑재
    애니콜
    O/S
    애니콜
    소유
    WinCE
    WinCE
    제품
    사이언
    사이언
    제품
    햅틱
    햅틱
    블랙잭
    탑재
    용어의 개념과 관계를 이해
    개체명/관계 인식
  • 24. 이제 “사람들의 관계”를 연결하자
    Dijkstra’s algorithm
    O( | E | + | V | log | V | )
    가족, 동료,
    부서, 동아리
    정보소통의
    중심, 매개자
    빨리 사람
    찾기
    Density,
    n-Clan, n-Clique
    Degree, Closeness
    Betweenness
    Centrality
    Shortest Path
    Algorithms
    gjk: j와k 사이에 존재하는 최단 경로 수
    gjk(i) : j와 k 경로 중 i를 경유하는 수)
    vk: weighting of relation
    n : number of relations
    g : total number of entity
  • 25. 인물 – 주제 상관성 분석
    인물
    조직
    업무
    온톨로지
    장소
    제품
    이벤트
  • 26. 주제별 중심성 판단
    3
    1
    ^ ^
    ^ ^
    주제별(개체별)
    In-Degree / Out-Degree 분석
    2
    4
    1
    2
    3
    4
    ^ ^
    ^ ^
    3
    2
  • 27. 주제별 업무 긴밀성 판단
    주제별(개체별)
    주관적/객관적 지표 분석
    ^ ^
    ^ ^
  • 28. 통합 시스템의 구성
    Services and Applications
    Communication Services
    Community Services
    Media Services
    Integrated Personal Identity
    • Mobile Media
    • 29. IPTV 등과 연계
    • 30. Open ID based SSO
    • 31. 지역 기반 포털 연동
    • 32. 부산시/구 서비스 연동
    • 33. 메신저 연동
    • 34. 이메일 자동 발송
    Service Enabling
    (Platform API)
    OpenSocial API
    Semantic Social Networking API
    Search and Discovery
    • 관계 가치 분석인지 가치, 공유 가치, 행위 가치
    • 45. 파편적 네트워크의 연결
    • 46. 온톨로지 추론을 통한 확장
    • 47. 네트워크 및 하위 네트워크 발견
    • 48. 네트워크 중심성
    • 49. 네트워크 구속력, 자율성, 단결성
    • 50. 네트워크 계층 구조
    • 51. 개인/조직 인맥
    • 52. 개인/조직 활동력
    • 53. 개인/조직 영향력
    • 54. 개인/조직 정보 획득 능력
    Building and Managing Social Network
    사람
    조직
    지역
    사건
    서비스
    Collecting Social Information
    Social Resource Provisioning API
    Social Resource Collection Framework
    e-Mail
    학력/경력정보
    외부DB연동
    웹 크롤링
    수동 입력
    기본인력정보
    블로그/뉴스
    실적정보
    (논문/특허 등)
    PIMS 연동
    LOD 연동
    모바일 연동
    외부SNS
  • 55. 사례 : 아울림 서비스
    토픽 클러스터링기술을 적용, 웹에서 추출된 지식을 연결하고, 그 연관관계를 밝힘으로 사용자에게 통찰력을 제공
    Powered by [IN2]Discovery & RDF
  • 56. 사례 : LG전자 특허 및 지식맵 분석
    한국, 일본, 미국(영어권)의 특허 3000만건을 분석하여, 기술 주제 별 특허 맵을 자동 생성, 연관/선행 특허를 자동 분석


    ※ 특정 특허 문서에 마우스 커서를 올려 놓으면 선택 특허에 대한 상세 정보 표시
    링크 : 분류명(분류 체계 및 기타 관련 용어)
    중심특허
    중심특허
    Powered by [IN2]Discovery & RDF
  • 57. 80 GB
    분석결과 S-KMS 전송
    각 분석대상의 update 부분만 선별하여 분석실행
    KMS 운영DB
    분석결과 (인덱스)
    분석모듈
    - Top N
    - 추이분석
    - 관계분석
    미국특허 DB
    100 GB
    결과 DB
    5 GB
    400 GB
    인덱스 재구성
    KMS 첨부파일
    논문DB
    논문
    기술문서DB
    XML 데이터
    국내특허DB
    DB변환
    기술문서
    10 GB
    10 GB
    사례 : 삼성전자 신기술센싱
    삼성전자 KMS의 비정형 정보과 특허, 논문 등 외부의 비정형 정보를
    통합 분석하여, 새로운 지식, 기술을 발견하고, 이를 분석하도록 지원
    Powered by [IN2]Discovery & RDF
  • 58. 사례 : 삼성전자 신기술센싱
    Powered by [IN2]Discovery & RDF
  • 59. 사례 : KISTI 학술 지식 네트워크 분석
    논문에 대해서 국가, 기관, 저자 등 분석 대상을 설정하고, 개체 간 존재하는 동시출현 패턴과 지식 네트워크를 분석
    Powered by [IN2]Discovery & RDF
  • 60. 사례 : Discovery 쌈지
    e-mail과 첨부 문서에 기반한 기반한 시맨틱 소셜
    네트워크 및 지식 유통 구조분석 시스템
    쌈지
    정보네트워크
    데이터정제
    데이터요약
    1차네트워크구성
    업무긴밀도 및 중심성 분석
    SOR API
    2차네트워크구성
    시간대별 연결성 분석
    Instantiator
    Query & Reasoning
    개체명추출
    주제별 관계성분석
    Triple Store
    Powered by [IN2]Discovery & OWL
  • 61. 사례 : Discovery 쌈지
    Powered by [IN2]Discovery & OWL
  • 62. 사례 : 부산지식네트워크 (BKMnet)
    “창조적 지식 도시 부산”달성 위해, 신뢰도 높은 시맨틱소셜 네트워크의 구축과 분석, 검색 서비스를 제공함으로 전문가 발굴과 지식 소통 활성화
    • 일반인 멘토링 서비스
    • 63. 전문가 인사/동정/부고 뉴스
    • 64. 인기 검색 인물 태그 서비스
    • 65. 전문가 인물뉴스서비스
    • 66. 전문가들 SNS 서비스
    • 67. JOINS 인물 DB 연계 서비스
    “창조적 지식 도시 부산 구현”
    • 경제발전을 비롯한 부산의 각 기업, 기관, 시민들이 성공적인 사업 및 업무 발전을 위해 활용할 수 있는 대상
    검색 서비스 구현
    참여 서비스 구현
    지식인의 발굴 및 활용
    • 자원간의 연관 관계를 파악하고 의미적 구조를 규명하여 개인화 서비스 구현
    • 68. 전문가 DB 및 검색 서비스를 이용하여 SNS 및 각종 커뮤니티 서비스 제공
    • 69. 부산 SNS 서비스
    • 70. 부산 R&D 정보, 언론의 인사/동정/부고 정보 등
    • 71. 전문가 멘토링 서비스 의뢰
    • 72. 전문가 저작물에 대한 비평 태그 작성
    • 73. 일반인 SNS 서비스
    • 74. 부산 SNS 서비스
    • 75. Friendster, Linknow유사 서비스
    전문가DB
    논문,특허실적
    주제별 콘텐츠
    부산 지식 네트워크
    (BKMnet)
  • 76. 사례 : 부산지식네트워크 (BKMnet)
    Powered by [IN2]Discovery & OWL
  • 77. promotion
    m-commerce
    billing
    phone call
    subscribing
    content usage
    location
    CRM
    사례 : KT 모바일SNA , 선호 분석
    • 모바일 서비스 개인화
    • 78. 모바일컨텐트 추천
    • 79. 모바일사회망 분석
    • 80. 상황인지 서비스
    “모바일 데이터 상호운용”
  • 81. Application Services Contents
    AS Information Collector
    HTTP on the IMS Network
    Legacy Network
    IMS Network
    IMS Gateway
    User Device
    Dynamic UI & Contents Generator
    Intelligent and Unified Notification Gateway
    CDR
    (Call Detailed Record)
    Membership Service History
    Content Service History
    User Profile
    Content Recommendation Agent
    Legacy Data Collector
    Subscriber Information Extractor & Analyzer
    Content Recommender
    Reco. Rule Repository
    Social Relationship KB
    User Preference KB
    Contents Metadata Repository
    Content Reco. KB
    사례 : KT 모바일SNA , 선호 분석
    • Intelligent Mobile Service Platform based on IMS(IP Multimedia Subsystem)
  • Legacy Data
    Discovery Social Relationship
    CDR
    (Call Detail Record)
    Intimacy Analysis
    Profile Identification
    Discovery Basic Social Relationship
    Reasoning Social Relationship
    Profile Analysis
    Membership Service History
    Call Location Analysis
    Content Service History
    Discovery User Preference
    Analysis Implicit User Behavior
    Discovery Personal Preference
    Discovery Social Preference
    User Profile
    Classification User Behavior
    Analysis Explicit User Behavior
    Clustering Personal Preference
    Discovery Representative Group Preference
    User Devices
    Awareness of User Context
    Reasoning User Intension
    User Behavior History
    Location
    (from Cell and GPS)
    User Preference
    Preference and Contents Mapping
    Weather
    (from Ext. Service)
    User Context
    User Context
    Time
    (from System Clock)
    Event driven Triggering
    Scenario based Rule
    사례 : KT 모바일SNA , 선호 분석
    • Knowledge Discovery from 2G/3G Legacy Data
  • 사례 : KT 모바일SNA , 선호 분석
    Major Activity Area
    Major Residential Area
    attend
    Profile
    attend
    Profile
    attend
    lives in
    lives in
    Pay for
    attend
    attend
    Profile
    Call
    Call
    Call
    Profile
    Call
    Profile
    Call
    Call
    lives in
    Profile
    Profile
    Family
    Friends
  • 96. 사례 : KT 모바일SNA , 선호 분석
    Building Intimacy Network
    Intimacy Score =
    α * Subject_Score * β * Object_Score
    Subject Score
    • based on comparing all receivers of a caller
    Object Score
     based on comparing all receivers of all caller
    Intimacy Analysis
    Profile Identification
    Discovery Basic Social Relationship
    Reasoning Social Relationship
    Profile Analysis
    Call Location Analysis
    Subject Score
    (6,9)  54
    [Typical social network measure of ties (Brass, 1995a)]
    (8.5, 4)  34
    Object Score
    [Scoring Method]
  • 97. 사례 : KT 모바일SNA , 선호 분석
    Discover social relationships and Build Social Network
    Minimum and Maximum Condition Analysis
    Inference Condition Analysis
    Relationship Conflict Mediation
    friend
    Father
    Intimacy Analysis
    Sister
    Mother
    Profile Identification
    Discovery Basic Social Relationship
    Reasoning Social Relationship
    Profile Analysis
    Call Location Analysis
    * Minimum Condition Example
    IF Receiver’s Last Name is same and Major Residential Area is same THENtheir relationship will be family.
    * Important Variables
    * Maximum Condition Example
    IFReceiver’s Age is bigger by more than 20, SEX is woman and she pay for Caller
    THENshe will be mother.
  • 107. 사례 : KT 모바일SNA , 선호 분석
    Extend social relationships
    * Social Relationship Ontology
    50 Classes
    58 Relationships
    15 Properties
    57 Rules
    Intimacy Analysis
    Profile Identification
    Discovery Basic Social Relationship
    Reasoning Social Relationship
    Profile Analysis
    Call Location Analysis
  • 108. 사례 : KT 모바일SNA , 선호 분석
    Using Implicit User Behavior
    CDR Analysis
    Collect CDR
    Extract Company Name
    Classify Business Type
    Map Business Types to Preference Classes
    Measure Preference based on Frequency
    Content / Service Domain Preference
    URL
    Analysis
    Collect URL Access Log
    Classify URL Domain
    Extract Services from URL
    Extract URL properties
    Analysis property values
    Content / Service Preference
    Map values to Preference Classes
    Search Keyword
    Analysis
    Collect Search Log
    Extract Search Keyword
    Classify Search Keyword
    Map Search Keyword to Preference Classes
    Content / Service Preference
    Indentify Target Services
    Membership Card Usage
    Analysis
    Collect CDR
    Extract Company Name
    Classify Business Type
    Map Business Types to Preference Classes
    Measure Preference based on Frequency
    Content / Service Domain Preference
    Analysis Implicit User Behavior
    Discovery Personal Preference
    Discovery Social Preference
    Classification User Behavior
    Analysis Explicit User Behavior
    Clustering Personal Preference
    Discovery Representative Group Preference
  • 109. 사례 : KT 모바일SNA , 선호 분석
    User Behavior and Personal Preference
    Legacy History
    Preference Classification
    User Behavior Classification
    User Preference
    Content and Service Classification
    CDE History
    Mapping
    Mapping
    People
    Bee
    Singer
    genre
    baseball
    Sport
    brand
    anycall
    samsung



    Analysis Implicit User Behavior
    Discovery Personal Preference
    Discovery Social Preference
    Classification User Behavior
    Analysis Explicit User Behavior
    Clustering Personal Preference
    Discovery Representative Group Preference
  • 110. 사례 : KT 모바일SNA , 선호 분석
    Start
    Personalized Dynamic UI
    Tour
    Shopping
    VOD with Ad.
    Mobile Search
    Stock
    Advertisement
    Powered by [IN2]Discovery & OWL
  • 111. 사례 : KT 모바일SNA , 선호 분석
    Samsung
    SPH-M4800
    Online Contents Recommendation
    Offline Advertisement Recommendation
    Online Advertisement Recommendation
    Powered by [IN2]Discovery & OWL
  • 112. Lessons Learned
  • 113. 시맨틱 웹을 바라보는 5개의시각
    확장된 웹
    • URI , RDF 기반 데이터의 웹
    • 114. 의미 주석 달린 웹 (RDFa)
    지식 표현
    인공 지능
    • 온톨로지와 술어논리
    • 115. OWL과 DL
    • 116. 추론과 계획, 의사결정
    • 117. 전문가 시스템, 상황인지
    메타데이터
    정보 검색
    • 트리플과 그래프
    • 118. 데이터 상호 운용성
    • 119. 시맨틱 검색, 마이닝
    • 120. 정보 추천, 정보 발견
  • 2D World
    (13C, Marco Polo)
    3D World
    (After Columbus)
    4D World
    (Semantic World)
    Scalability
    Performace
    Data
    Dynamics
    Expressivity
    4 Dimensions of Semantic World
  • 121. Current State of the Art of Technology
    UbiComp
    UbiComp
    Scalability
    Scalability
    Telco
    Telco
    Social Net
    Social Net
    Enterprise
    Search
    Enterprise
    Search
    Medical
    Medical
    Expressivity
    Performance
    UbiComp
    UbiComp
    Telco
    Scalability
    Search
    Telco
    Performance
    Social Net
    Enterprise
    Search
    Medical
    Social
    Net
    Medical
    Data Dynamics
    Expressivity
  • 122. Challenging levels
    Enterprise
    Search
    Social Net
    Mobile
    UbiComp
    Medical
  • 123. How to move Maginot Lines?
    Scalability
    Scalability
    ?
    Expressivity
    Expressivity
  • 124. 6 Solutions
    Current
    State of the Art
    Improved
    Results
    Enhanced algorithm
    Materialization
    Distributed Computing
    Approximation
    Lean KR model
    Query optimization
    + Query/Data Cache
  • 125. Medical
    E. Search
    Social Net
    Mobile
    UbiComp
    Wining Strategies
    Materialization
    Algorithm
    Query
    Optimization
    (+ Cache)
    Distribution
    Approximation
    Lean KR model
  • 126. 결 언
    Cost based Biz Model
    Differentiation based Biz Model
    Customer’s Benefit
    or Profitability
    Intelligence/Reasoning
    Interoperability
    Trap
    Price
    “ Customer's Benefit > Price > Cost ”
  • 127. “Thank you for
    your attention.”
    보다 상세한 설명이 필요하시면…
    이경일
    tony@saltlux.com 010-9123-0081
    in2.saltlux.com , www.saltlux.com