Graph Database Meetup in Korea #6. Graph Database 5 Offerings_ AssetManager (그래프 데이터베이스 활용사례_ 기업 자산 관리)
국내 유일 그래프 데이터베이스 연구 개발 전문 기업, <비트나인> 주최로 진행된
그래프 데이터베이스 밋업(Meetup) 6번째! Graph Database 5 Offerings_ AssetManager (기업 자산 관리)" 입니다.
그래프 데이터베이스가 제공하는 5가지 핵심 오퍼링(5 Offerings) 중 “Asset Manager(Asset Management)”의 이론 소개 및 적용 분야 등에 대하여 소개 드렸습니다.
☞ 발표 영상 보러가기: https://www.youtube.com/playlist?list=PLGp3huJbWNDhQT4aBCS13udGhYnIc1GnO
☞ 밋업 참가 신청 하러가기: https://www.meetup.com/ko-KR/graphdatabase/
☞ 이메일 문의: hnkim@bitnine.net
☞ 그래프 데이터베이스 솔루션 AgensGraph 직접 사용해 보기: https://bitnine.net/
Graph Database Meetup in Korea #6. Graph Database 5 Offerings_ AssetManager (그래프 데이터베이스 활용사례_ 기업 자산 관리)
1. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
Bitnine
Oct. 2018
Meetup
AssetManager
2. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
AssetManager
1. Overview
2. Theory
3. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
I. Overview
4. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
Discovery(발견)___________
4
Characteristics of 5 offerings of GDB
비트나인은 AgensGraph 기반의 5가지 핵심 오퍼링 중 Pattern Detection을 아래와 같이 정의하고 상세화 함
Visualization, monitoring
and management
of complex enterprise
Analyzing massive
documents and discover
insights from unstructured
data
Proactive pattern detection
from network behaviors for
threat analysis and crime
investigation
Distributed ledger, transaction
and user monitoring for
operational excellence of
private Blockchain
Supporting for user’s
decision for specific domains
by subjective probability
algorithm
AssetManager TextMiner PatternDetector ChainKeeper DecisionTutor
Value
Offering
Definition
Graph
Theory
Representation(표현) Inference(추론)
Offering oriented fundamental value of GDB
Offerings oriented specific domain data
Offerings oriented specific analysis technique
Node Edge Graph Node Edge & Treemapping Graph Node Edge Graph Node Edge Graph Node Edge Graph
Motif extraction Motif extraction
Similarity Similarity
Statistical Method Statistical Method
Community Detection Community Detection Community Detection
Centrality Centrality Centrality Centrality
MST MST
Shortest Path Shortest Path
Text Mining
Time Series Time Series
Bayesian
Pattern Detection
Clustering & Classification
Ranking
Other Statistics
Network
5. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
AgensGraph
AgensBrowser
Discovery(발견)___________
5
Offering - AssetManager
비트나인은 AgensGraph 기반의 5가지 핵심 오퍼링 중 Pattern Detection을 아래와 같이 정의하고 상세화 함
Visualization, monitoring
and management
of complex enterprise
Analyzing massive
documents and discover
insights from unstructured
data
Proactive pattern detection
from network behaviors for
threat analysis and crime
investigation
Distributed ledger, transaction
and user monitoring for
operational excellence of
private Blockchain
Supporting for user’s
decision for specific domains
by subjective probability
algorithm
AssetManager TextMiner PatternDetector ChainKeeper DecisionTutor
Value
Offering
Definition
Graph
Theory
Target
Industry
• Manufacturing
• Utility & Telco
• Healthcare
• Education
• Government
• Banking, Card
• Banking, card
• Logistics
• Education
• Retail
Representation(표현) Inference(추론)
ssss
Node Edge Graph Node Edge & Treemapping Graph Node Edge Graph Node Edge Graph Node Edge Graph
Motif extraction Motif extraction
Centrality Centrality Centrality Centrality
MST MST MST
Shortest Path Shortest Path
Time Series Time Series
Community Detection Community Detection Community Detection
Text Mining
Similarity Similarity
Statistical Method Statistical Method
Bayesian
6. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
Scope of Asset Management
Asset Management의 대상과 범위는 상당히 광범위하나, ISO에서는 자산관리와 관련한 표준 ISO 55000 및 IT
자산관리 관련 표준 19770을 제시하고 있음
Definition of Management System
“A Management System is the way in which an
organization manages the inter-related parts of its
business to achieve its objectives”
- definition from ISO.org
ISO/IEC 19770-1
• The International Standard for IT Asset Management
• A process framework to support corporate governance
requirements and ensure effective support for IT
service management overall
ISO Standard related Asset Management
• ISO 27001 (Information Security)
• ISO 20000-1 (IT Service Management)
• ISO 9000 (Quality Management)
• ISO 55001 (Asset Management)
• Refer : ISO/IEC, ISO19770-1:2017 - A new standard for IT Asset Management, 2018 May
7. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
Needed Output Gathering – exporting Schema
Facility SCM IOT…Data
Acquisition
Data
Collection
Extracting
Data
Level 1
Data
Pre-Processing
Data
Storing
Integrating
Data
Aggregation and Correlation
Web-Based Storage Associated Data
Level 2
Data
Information
Data
Analysis
Data
Processing
Analyzing
Data
Discovered patterns by object (asset)
Statistics
Machine
Learning
Data Mining
Level 3
Data
Interpretation
Data
Visualization
Interoperating
Data
Human-Computer Interaction
(User Friendly Interface)
Level 4 Data
Input/Output
Graph
View
Secured
Data
Knowledge
Wisdom
• Refer : Ibrahim K. F., et al. (2017). “BIM Big Data system architecture for asset management: a conceptual framework".
In: Proc. Lean & Computing in Construction Congress (LC3) 를 인용하여 재구성함
Graph, Big Data and Asset Management
Big Data frameworks for Asset Management
빅데이터 환경에서의 Asset Management를 그래프 기술과 연계하면, 아래와 같은 “그래프 기반 논리아키텍처”
를 구성할 수 있음
1
2
3
4
5
관리하고자 하는 자산 대상에
따른 정형, 비정형
목표 데이터 수집
그래프 기반 데이터의 저장 및
연관 데이터 통합
통계 및 인공지능 기술 기반의
데이터 정제 및 패턴 분석
관리 목적에 적합한 시각화
및 인사이트 제공
* ISO 55000 또는 19770-1 기반
횡전개 가능
그래프 기반 AssetManager
8. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
II. Theory
9. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 9
The most important thing in asset management
AssetManager의 Performance는 Domain data의 Graph 모델링 성패에 달려있음
● DESIGN PATTERNS
○ Tags and Categories
○ Multi Level Tree
○ R-Tree (spatial)
○ Check anti-pattern
● Chaos
○ 계획없이 사용한 GDB의 최후
10. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 10
The most important thing in asset management
AssetManager의 Performance는 Domain data의 Graph 모델링 성패에 달려있음
● DESIGN PATTERNS
○ Tags and Categories
○ Multi Level Tree
○ R-Tree (spatial)
○ Check anti-pattern
● Chaos
○ 계획없이 사용한 GDB의 최후
Low
performance
High performance
11. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 11
Introduction to the graph model
Graph database의 data model로는 다음 세가지 유형이 대표적임
Property graph Triple stores Hypergraphdata model
Database
12. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 12
Property graph model의 구성요소는 다음과 같이 노드, 링크, 프로퍼티로 구성됨
Elements of the property graph model
Node
Relationship
● 노드는 엔터티를 나타냄
○ 노드는 프로퍼티를 포함할 수 있음
● 관계는 노드쌍 간의 연결선(link, edge)임
○ 링크를 통하여 그래프 구조가 표현됨
Properties
● 프로퍼티는 노드 또는 링크의 값임
○ 프로퍼티를 통하여 추가적인 정보를 제공할 수 있음
Company
name: Bitnine
Product
name: AgensGraph
Release
since: Jan. 2017
Node
Relationship
Property
Label
13. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 13
RDB GDB
자료출처 : Neo4J
Table = Label
Row = Node or Vertex
Column = Property
Relation = Edge or Relationship
Remind the difference between RDB and GDB
14. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 14
아주 잘 정제된 RDB data model은 RDB와 GDB의 구조적 차이로부터 단순히 모델을 바꾸는것이 가능함
Basic graph data modeling - RDB to GDB
RDB
GDB
Principle Rule
1. table은 label로 변경
2. foreign key는 제거
3. JOIN table은 edge로 변환하고 JOIN table내 속성값은 edge속성으로 입력
15. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 15
Hands on - Flight booking system
Basic graph data modeling - RDB to GDB
16. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 16
Hands on - Flight booking system
Basic graph data modeling - RDB to GDB
Users
Email
Bookings
Booking_ID
Booking_date
Passengers
Passenger_ID
Name
Gender
Age
Flights
Code
Booked
BP_Relationships
Same person
Journeys
ID of journey
Date of journey
17. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 17
백지장에서 모델링하는 경우 기본 룰은 다음과 같음
Basic graph data modeling - Fundamental rules
● Node는 실존하는 객체(엔티티), Edge는 구조(엔티티간의 관계 및 의미)를 표현
(있는 그대로 표현함)
● Bidirectional 한 관계 또한 하나로만 표현함
(프로퍼티를 이용한 방향규칙을 만드는 것을 권장, 규칙없이 무작위로 한쪽만 표현한다면
-[]- or ←[]→를 이용하여 쿼리)
● 능동-수동 관계는 양방향으로 모두 표현하지 말고 하나만 표현함
● Edge property는 관계의 강도 또는 관계의 속성, 혹은 메타데이터를 나타나게 함
● Node property는 엔티티의 속성이나 메타데이터를 나타나게 함
Bitnine AgensGraph
develop
developed by
PostgreSQLAgensGraph
similarity
similarity
18. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 18
다음과 같은 상황에서는 예외적으로 기본 룰을 무시할 수 있음
Basic graph data modeling - Exceptions
● 다수 노드간의 하나의 관계가 발생하는 시스템의 경우 관계 노드를 생성함
(논리적 node의 생성, Hypergraph system)
● Bayesian network modeling의 경우(이 경우 완전히 모델링 방식이 다름)
● 만약 실체하는 그래프 관계가 # of Nodes ≪ # of Edges 라면 linegraph
변환을 활용하여 GDB modeling 함 (dense node pattern 문제)
※ Line graph: 원래 그래프의 Vertex-Edge관계를 Edge-Vertex관계로 치환한 그래프
Linegraph
Linegraph 역변환
19. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 19
추가적으로 다음의 사항을 참고하면 좋은 모델링이 가능함
Basic graph data modeling - Tips
● Graph data model 과 Network visualization은
별개로 생각하라 (Database is not visualizer)
● 웬만하면 Edge는 줄이고 프로퍼티로 해결할
것 (무분별한 Node 및 Edge 생성 자제)
● 로그성 데이터는 GDB보다 RDB쪽이 낫다
(e.g. data center monitoring)
● Too long string attribute 또한 RDB쪽이 낫다
(e.g. description of entity, Hybrid 쿼리 이용)
Date Entity Data
2013-12-15 Sever1 Event1
2013-12-25 Sever1 Event2
2014-01-05 Sever1 Event3
2013-01-15 Sever1 Event4
name: bond
address: Fake add
name: bond
address: Fake add
20. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 20
다음의 좀 더 깊게 생각해 볼 사항 또한 있음
Basic graph data modeling - Further considerations
● Fine grain label이 generic label with
property보다 computing 측면에서 나음
● 너무 많은 종류의 프로퍼티로 인해 노드의 덩치가
커지는 경우라면 edge로 분리하는게 나을 수 있음
(Rich properties problem)
● unconnected graph는 GDB를 쓸 필요가 없음
(Anti-pattern problem)
● 목적에 맞는 모델링을 하는것이 중요하다
(쿼리튜닝까지 고려한 모델링 필요)
name: bond
address1: Fake add1
address2: Fake add2
address3: Fake add3
name: bond
address: Fake add1
address: Fake add2
address: Fake add3
21. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 21
다음의 내용은 상황에 따라서 잘 취사선택해야할 문제임
Basic graph data modeling - Dilemmas
● Fine grain label vs Generic label with property
● 프로퍼티 처리 vs 새로운 노드로 분기
name: bond
address1: Fake add1
address2: Fake add2
address3: Fake add3
name: bond
address: Fake add1
address: Fake add2
address: Fake add3
어느정도까지 전자 혹은 후자를 선택하여야 하는가?
22. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved. 22
Final comment on Asset manager
Complex assets are our world!
Device signal
Logistics OmicsHuman resources
23. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
24. ⓒ 2018 by Bitnine Co, Ltd. All Rights Reserved.
24