01
활용방안
How to apply
knowledgegraph
technologies
in our domain
활용사례
Use cases of
knowledge graphs
소개
a knowledge base
that uses a graph-
structured data model
02 03
3.
지식그래프 소개
01 aknowledge base
that uses a graph-structured data model
4.
지식 (Knowledge)
교육, 학습,숙련 등을 통해 사람이 재활용할 수 있는 정보와 기술 등을 포괄하는 의미
understanding, integrated, actionable
contextual, synthesized, learning
useful, organized, structured
signals, know-nothing
지식
knowledge
데이터
data
정보
information
지혜
wisdom
given context,
becomes
given meaning,
becomes
given insight,
becomes
DIKW 피라미드, IT위키, https://itwiki.kr/w/DIKW_%ED%94%BC%EB%9D%BC%EB%AF%B8%EB%93%9C
5.
지식표현
(Knowledge Representation)
지식을 컴퓨터시스템이 사용할 수 있도록 가공 및 표현하기 위한 방법
표현방법 예시
사람의 자연어
아리스토텔레스는 사람이다.
사람은 죽는다.
명제논리
Propositional Logic
하나의 문장을
하나의 기호로 표현
P: 아리스토텔레스는 사람이다.
Q: 사람은 죽는다.
1차논리
First Order Logic
객체와 관계를 이용하여
지식을 표현
사람(아리스토텔레스)
∀x 사람(x) → 죽는다(x)
지식그래프 (Knowledge Graph)
그래프구조의 데이터 모델을 사용하는 지식베이스
● 특정 주제영역에 대해 유연한 형태의 지식표현
● 개체들과 의미적인 형태의 관계 정의
● 의미를 기반으로 한 추론 지원
currently 95,223,664 items
850 million facts (triples) in 2021-06 release
Knowledge graph, Wikipedia, https://en.wikipedia.org/wiki/Knowledge_graph
9.
지식그래프 전망
Hype Cyclefor Artificial Intelligence 2021
Hype Cycle for Artificial Intelligence 2020
2 Megatrends Dominate the Gartner Hype Cycle for Artificial Intelligence, Gartner, 2020.
Marco van der Hoeven, Gartner publishes Hype Cycle for Artificial Intelligence 2021, Rockingrobots, 2021.
데이터에 대한 활용
관계형데이터베이스 지식그래프
형식 행과 열로 구성된 테이블 구조 노드와 관계
관계 테이블 사이의 단순한 참조관계 각각의 관계에 의미정보를 부여한 표현
복합 질의 테이블 사이의 복잡한 조인 연산 그래프 탐색을 활용한 빠른 질의 처리
활용 영역 트랜잭션 위주의 연산이 필요한 영역
이상 탐지와 추천 엔진과 같이
복잡한 관계 중심의 데이터 영역
구조
이름 잔액 고객구분
이명진 1억 골드스타
김하나 3억 MVP스타
구분 KB평점
골드스타 2,000점 이상
MVP스타 10,000점 이상
이명진
골드스타
1억
2,000점 이상
김하나
3억
MVP스타
10,000점 이상
고객
잔액
잔액
등급
등급
기준
기준
is-a
is-a
주거래
Kara E. Joyce, Graph database vs. relational database: Key differences, TechTarget, 2021.
12.
데이터에 대한 활용(실험결과)
KB금융그룹 자산운용 Digitalization을 위해 구축된 문서 및 키워드 데이터셋을 활용한 비교 실험
문서 키워드
hasKeyword
문서ID URL 문서ID 키워드
MySQL (RDB) Virtuoso (GraphDB)
테스트 하드웨어
vCPU * 4ea
16GB MEM
SSD 600GB
vCPU * 4ea
32GB MEM
SSD 350GB
질의 성능 평가
(각각 7일, 30일 기간 탐색)
8.3 sec, 191.1 sec 1,102 msec, 7,287 msec
문서 1,510,428 키워드 4,660,719 문서-키워드 맵핑 약 2.7 억
13.
분산된 데이터의 통합
On-Prem및 클라우드 환경에 분산된 데이터의 효과적인 통합 및 활용
Cloud
On-Prem
interlinking
(logical relationship)
Knowledge Graph Standards (RDF, RDFS, OWL, SPARQL, …)
Knowledge Graph based Data Virtualization (logical integration)
14.
분산된 데이터의 통합
DataSources
Data Types
Unstructured Data
Semi-structured Data
Structured Data
Virtual Knowledge Graph
{
:
:
}
Direct Mapping R2RML
Mapping Layer
Enterprise Applications Apps Search Reports BI Other
Kendall Clark, What is a Knowledge Graph?, Stardog, 2020.
15.
추론을 통한 지식의확장
기존의 지식으로부터 새로운 지식을 발견해 내어 지식을 확장하는 것
고객A
고객B
10억
고객
MVP스타
5억
등급
is-a
is-a
잔액
기준금액
is-a
부모
규칙1: 잔액(고객, ?x) AND 기준금액(MVP스타, ?y) AND (?x > ?y) → 등급(고객, MVP스타)
규칙2: 등급(고객, MVP스타) AND 부모(고객, 고객) → 잠재등급(고객, MVP스타)
등급
잠재등급
지식 기반 (자연어)검색
Knowledge Graph
Search Results
군인이 가입할 수 있는 적금은?
가입대상
객체
가입하다
관계
예적금
객체
가입대상 예적금
가입하다
SELECT ?적금
WHERE {
?적금 가입하다 군인 .
}
18.
가족 관계를 바탕으로잠재 MVP스타 고객 발견 (예시)
지식그래프 분석 및 딥러닝
이름 자산 부모이름 부모자산
A 100만원 B 1,000만원
X 1,000만원 Y 10억원
테이블 기반 분석 그래프 기반 분석
A B C D
부모 부모 부모
1,000만원
100만원 10억원 100억원
자산 자산 자산 자산
1 hop 2 hop 3 hop 8 hop
…
19.
설명가능한 인공지능 (XAI,Explainable AI)
Inference factor
identification
Explaining
the reasons for
findings
Basis formation
Explaining
the basis for
findings
Reason
Basis
Deep Tensor
Knowledge Graph
Input Output
Features are
automatically generated
Both findings &
reasons are output
Knowledge graph explains
the basis from input to findings
Findings Inference
factors
+
Propagation
Backpro-
pargation
Classification
errors
Class
A Class
B
a b c d e f
Why AI Got the Answer -Explainable AI Showing Bases-, Fujitsu Blog, https://blog.global.fujitsu.com/fgb/2019-08-01/why-ai-got-the-answer-explainable-ai-showing-bases/
지식그래프 활용 기업
Themost value-creating companies in the world are using knowledge graphs
Company name Location Industry
Change in market cap
2009 ~ 2018 ($bn)
Market cap
2018 ($bn)
1 Apple United States Technology 757 851
2 Amazon.com United States Consumer Services 670 701
3 Alphabet United States Technology 609 719
4 Microsoft Corp United States Technology 540 703
5 Tencent Holdings China Technology 483 496
6 Facebook United States Technology 383 464
7 Berkshire Hathaway United States Financial 385 492
8 Alibaba China Consumer Services 302 470
9 JPMorgan Chase United States Financial 275 375
10 Bank of America United States Financial 263 307
Alan Morrison, Data-centric design and the knowledge graph, PwC, 2019.
22.
IT 공룡들의 지식그래프
Datamodel Size of the graph Development stage
Microsoft
The types of entities, relations, and
attributes in the graph are defined in
an ontology.
~2 billion primary entities,
~55 billion facts
Actively used in
products
Google
Strongly typed entities, relations with
domain and range inference
1 billion entities,
70 billion assertions
Actively used in
products
Facebook
All of the attributes and relations are
structured and strongly typed, and
optionally indexed to enable efficient
retrieval, search, and traversal.
~50 million primary entities,
~500 million assertions
Actively used in
products
eBay
Entities and relation, well-structured
and strongly typed
Expect around 100 million
products, >1 billion triples
Early stages of
development and
deployment
IBM
Entities and relations with evidence
information associated with them.
Various sizes. Proven on
scales documents >100
million, relationships >5
billion, entities >100 million
Actively used in
products and
by clients
NatashaNoy, Yuqing Gao, AnshuJain,Anant Narayanan, AlanPatterson,and JamieTaylor,Industry-scaleknowledge graphs: lessonsand challenges,Communicationsof the ACM,Vol. 62 (8), 2019.
23.
국내 IT 플랫폼기업의 지식그래프
인물 정보
방송, 영화, 웹툰 등의 콘텐츠
공감 TALK
문화재 정보
교육 정보
금융(예금/적금/CMA) 정보
경제지표
동물(강아지, 고양이) 정보
전시회 및 공연장 정보
…
24.
Intuit Tax KnowledgeEngine
(스마트하고 개인화된 TurboTax AI)
▪ Pain point
• 800개 이상의 세금 양식 및 45개 주 별 추가 세금 양식을 설명하고 해석하는 7만 페이지 이상의 규정
• 매년 세금을 내는데 89억 시간을 소비하는 것으로 추산
▪ Solution
user
data
TurboTax UI
Rendering
Tax Knowlede
Engine
What is still
Missing?
What is
Wrong?
Explanations
Calc Graph
Completeness
Graph
add/update
When tax is not
complete
When tax is
complete
Grow over time
Tax Knowledge Graph
Jay Yu, Intuit Tax Knowledge Engine: Practical AI for a Smarter and More Personalized TurboTax, Intuit Blog, 2020.
25.
Intuit Tax KnowledgeEngine
(스마트하고 개인화된 TurboTax AI)
Calc Knowledge Graph Completeness Graph
Jay Yu, Intuit Tax Knowledge Engine: Practical AI for a Smarter and More Personalized TurboTax, Intuit Blog, 2020.
26.
JPMorgan Chase &Co.
Company Knowledge Graph
Apoorv Saxena, Application of Knowledge Graphs, Stanford University CS520, 2020.
Edgar Meij, Understanding News Using the Bloomberg Knowledge Graph, Speaker Deck, 2019.
● 써드파티(3rd Party) 기업들의
데이터들과 내부 고객 데이터를
활용하여 기업 지식그래프 구축
● 공급사슬(supply chain) 네트워크를
통해 기업의 위험 환경 측정
지식그래프 구축과 활용
Bloomberg Knowledge Graph
27.
JPMorgan Chase &Co.
Company Knowledge Graph
Apoorv Saxena, Application of Knowledge Graphs, Stanford University CS520, 2020.
▪ Link traversal
• 보잉(Boeing)이 재정적인 문제에 빠질 경우 공급사와 판매사는 누구이며, 그 중 JPMC의 고객은 누구인가?
• 그들 중 대출을 신청한 기업이 있으며, 해당 기업들의 수익 중 몇 퍼센트가 보잉에서 발생하는가?
▪ PageRank application
• 어떤 스타트업이 가장 영향력 있는 투자자들로부터 투자를 받았는가?
▪ Weak link detection
• 항공 산업의 공급망에 취약한 연결 관계를 가지고 있는 기업은 어디인가?
▪ Graph embedding & Node similarity
• Okta와 가장 유사한 기업은 어디인가?
▪ Link prediction
• 향후에 어떤 회사들과 새로운 관계가 맺어질 수 있는가?
▪ Community detection
• 어떤 투자자 그룹이 공동 투자를 수행하고 있는가?
28.
JPMorgan Chase &Co.
Fraud Detection
Apoorv Saxena, Application of Knowledge Graphs, Stanford University CS520, 2020.
29.
Customer 360°
● 기업내외부에 분산되어 있는 고객
데이터
● 고객 정보를 보유한 시스템 별
이질적인 운영 환경
● 다른 형식 및 표현방법과 식별체계로
인한 통합의 어려움
● 다양한 데이터 출처로부터 고객
정보에 대한 통합
● 비즈니스 파트너와의 데이터 통합을
통한 단일화된 뷰 제공
● 고객 데이터에 대한 공유 및 신뢰성
확보
AS-IS TO-BE
30.
Customer 360° inCapital One
~200% +14~24%
Knowledge Graph Pilot Improves Data Quality While Providing a Customer 360 View, https://www.youtube.com/watch?v=ABN2377ER_A&list=PLAiy7NYe9U2Gjg-600CTV1HGypiF95d_D
31.
금융 지식의 표현
FIBO,Financial Industry Business Ontology
금융산업에서의 금융상품, 비즈니스 엔티티 및 프로세스를 위한 지식그래프 모델
▪ Business Entities
• 금융 산업회사, 규제기관 등 금융 도메인과 관련된 모든 개체
▪ Securities
• 상장지수증권 및 펀드를 포함한 금융상품의 개념을 기술
▪ Loan
• 대출 상품 및 대출 계약과 관련된 개념 모델
▪ Derivatives
• 옵션, 선물, 선도, 스왑 등 파생상품 기술
▪ Market Data
• 부채, 수익률 등 금융 시장과 관련된 개념 모델
▪ Corporate Actions
• 주식 제공 및 분할, 배당금 등 기업 행위에 대한 모델
Business
Entities
Securities
Loans
Market Data
Corporate
Actions Metadata
Derivatives
Mike Bennett, Financial Industry Semantics and Ontologies, https://www.slideshare.net/MikeHypercube1/financial-industry-business-ontologies
32.
금융 지식의 표현
FIBOin Deutsche Bank
Shannon Walker, The Semantic Bank with FIBO, https://www.youtube.com/watch?v=IKFHklf94lo&t=261s
▪ Status
• Regulatory Pressure
• Silo-based, Outsourced Organization
• Short Term View
▪ to Data-driven Culture
• Regulatory Compliance
• Integrated Aligned Data Partnerships
• Long Term Sustainability
Market Data Consolidation
33.
CREDITS: This presentationtemplate was
created by Slidesgo, including icons by Flaticon,
and infographics & images by Freepik.
THANKS!
Do you have any questions?
Myungjin Lee (Ph.D. / Deputy General Manager)
myungjinlee@kbfg.com
+82 2 2073 2472
kbfg.com
34.
References
• DIKW 피라미드,IT위키, https://itwiki.kr/w/DIKW_%ED%94%BC%EB%9D%BC%EB%AF%B8%EB%93%9C
• Giuseppe Futia, Knowledge Graphs at a Glance, Medium, 2020.
• Knowledge graph, Wikipedia, https://en.wikipedia.org/wiki/Knowledge_graph
• 2 Megatrends Dominate the Gartner Hype Cycle for Artificial Intelligence, Gartner, 2020.
• Marco van der Hoeven, Gartner publishes Hype Cycle for Artificial Intelligence 2021, Rockingrobots, 2021.
• Kara E. Joyce, Graph database vs. relational database: Key differences, TechTarget, 2021.
• Kendall Clark, What is a Knowledge Graph?, Stardog, 2020.
• Why AI Got the Answer -Explainable AI Showing Bases-, Fujitsu Blog, https://blog.global.fujitsu.com/fgb/2019-08-01/why-ai-got-the-answer-
explainable-ai-showing-bases/
• Natasha Noy, Yuqing Gao, Anshu Jain, Anant Narayanan, Alan Patterson, and Jamie Taylor, Industry-scale knowledge graphs: lessons
and challenges, Communications of the ACM, Vol. 62 (8), 2019.
• Jay Yu, Intuit Tax Knowledge Engine: Practical AI for a Smarter and More Personalized TurboTax, Intuit Blog, 2020.
• Alan Morrison, Data-centric design and the knowledge graph, PwC, 2019.
• Apoorv Saxena, Application of Knowledge Graphs, Stanford University CS520, 2020.
• Edgar Meij, Understanding News Using the Bloomberg Knowledge Graph, Speaker Deck, 2019.
• Mike Bennett, Financial Industry Semantics and Ontologies, https://www.slideshare.net/MikeHypercube1/financial-industry-business-
ontologies
• Shannon Walker, The Semantic Bank with FIBO, https://www.youtube.com/watch?v=IKFHklf94lo&t=261s
• Knowledge Graph Pilot Improves Data Quality While Providing a Customer 360 View,
https://www.youtube.com/watch?v=ABN2377ER_A&list=PLAiy7NYe9U2Gjg-600CTV1HGypiF95d_D