SlideShare a Scribd company logo
인피니플럭스
sjkim@infiniFlux.com
•IT를 구성하는 서버, 네트워크장치, 어플리케이션 등이
자신들의 상황(변화)을 실시간으로 끊임없이 방출하는
데이터로서 빅데이터를 구성하는 대부분의 데이터 형태
(http://en.wikipedia.org/wiki/Machine-generated_data)
데이터 특징
•초당 수 십만건 이상 로그 데이터 생성 (완전한 빅데이터)
• 시계열 특성 (시간순 데이터 중요도 차이 큼)
• Append-Only 저장소 특징
• 위험 예측 및 방지를 위한
실시간 데이터 분석 및 통계 요구
In-Memory
DBMS
Disk Based
DBMS
Columnar
DBMS
Search Engine Time-Series
Columnar
DBMS
대표 솔루션 알티베이스 오라클 Sybase IQ splunk iFluxTM
실시간 인덱스 ☆
(고성능)
X
(느림)
X
(매우 느림)
△ ☆
(고성능)
저장 공간 X
(메모리 제약)
△
(압축없음)
☆
(고압축)
O
(저압축)
☆
(고압축)
실시간 검색 X X X ☆
(패턴 검색)
☆
(패턴 검색)
통계 분석 성능 ☆ △ ☆
(탁월한 분석)
X
(SQL 없음)
☆
(탁월한 분석)
Machine Data 환경
• Sensor Device 개수 매년 30% 증가 (2020년 약 500억개, IBM)
• Mobile Traffic 증가량 매년 평균 78% (매킨지)
Challenges
• 실시간 저장-인덱싱 : 초당 50만건 이상 트래픽
• 저장 공간 : 무한히 증가하는 데이터, 저장공간 효율화
• 실시간 검색 : 데이터 패턴에 실시간 대한 조건 검색 엔진
• 통계 처리 : 수시간 ~ 수개월의 데이터 분석 처리
Columnar
DBMS
기술
In-Memory
DBMS
기술
실시간
검색 엔진
기술
iFluxTM
 실시간 저장 및 인덱싱 이슈
◦ 초당 50만건 이상 트래픽 지원
◦ How?
 시계열 특성을 이용한 Data-Append
 Time-based partition 기법 이용 (부분 인덱싱)
 Data Mover 개념
 고효율/저비용 비트맵 인덱스 구조
 저장 공간 이슈 (수십 ~ 수백배 실시간 압축)
◦ 인덱스 압축 – Bitmap index 내부의 다양한 비트 압축 알고리즘 사용
◦ 데이터 압축 – Columnar DBMS에서의 다양한 Dictionary 기반 압축 알고리즘
 실시간 검색 이슈
◦ Keyword bitmap index (일종의 inverted-index)를 실시간 구성 및 검색 (POC
완료)
◦ 시간 역순으로 Memory Window 구성 (최근 데이터를 가장 빠르게 검색)
 대규모 통계 질의
◦ TPC-H 레벨의 SQL 지원
◦ Columnar 구조의 통계 질의 성능 극대화
 Cardinality 특성 및 압축 기반 I/O 비용 최소화, 검색 효율 최대
HTTP
iFlux
Server
Shard-1 Shard-2 Shard-N. . .
iFlux
WebServer
IPC
Log
Client
Insert
Restful API
Log Files
User
Application
TCP/IP
TCP/IP
Browser Client
iFlux Client
 1주일간 상위 트래픽 사용자의 이름과 트래픽 정보 구하기
SPL
table duration=1w ssl-flow | stats sum(eval(tx_bytes+rx_bytes)) as
total, sum(tx_bytes) as tx, sum(rx_bytes) as rx by login | lookup sslplus login as
login_name output name | replace login is null "알 수 없음" | sort limit=30 -total |
fields name, login, tx, rx, total
SQL
SELECT sslplus.name, nvl(ssl-flow.login, "알 수 없음"), sum(tx_bytes) as tx,
sum(rx_bytex) as rx, sum(tx_bytes + rx_bytes) as total
FROM ssl-flow, RIGHT OUTER JOIN sslplus ON ssl-flow.login = sslplus.login
WHERE _time > sysdate - 7
GROUP BY ssl-flow.login
ORDER BY total DESC
LIMIT 30;
어떤 것이 더 개발하고, 알아보기 쉬울까요?

More Related Content

What's hot

Hadoop설명
Hadoop설명Hadoop설명
Hadoop설명Ji Hoon Lee
 
234 deview2013 김형준
234 deview2013 김형준234 deview2013 김형준
234 deview2013 김형준NAVER D2
 
Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum DNA
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
Gruter
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
Gruter
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
Gruter
 
빅데이터 구축 사례
빅데이터 구축 사례빅데이터 구축 사례
빅데이터 구축 사례
Taehyeon Oh
 

What's hot (8)

Hadoop설명
Hadoop설명Hadoop설명
Hadoop설명
 
234 deview2013 김형준
234 deview2013 김형준234 deview2013 김형준
234 deview2013 김형준
 
Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012Daum내부 Hadoop 활용 사례 | Devon 2012
Daum내부 Hadoop 활용 사례 | Devon 2012
 
Big data
Big dataBig data
Big data
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: SNS 서비스 아키텍쳐 구축 사례
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 인터넷 쇼핑몰의 실시간 분석 플랫폼 구축 사례
 
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
GRUTER가 들려주는 Big Data Platform 구축 전략과 적용 사례: 보안 로그 분석을 위한 빅데이터 시스템 구축 사례
 
빅데이터 구축 사례
빅데이터 구축 사례빅데이터 구축 사례
빅데이터 구축 사례
 

Viewers also liked

3차보고서 20150106
3차보고서 201501063차보고서 20150106
3차보고서 20150106Joung Hun Youm
 
Splunk mint 소개
Splunk mint 소개Splunk mint 소개
Splunk mint 소개
JunMyoung(준명) Youn(연)
 
실시간 빅데이터와 머신 데이터
실시간 빅데이터와 머신 데이터실시간 빅데이터와 머신 데이터
실시간 빅데이터와 머신 데이터
김 한도
 
Splunk 교육자료 v1.2
Splunk 교육자료 v1.2Splunk 교육자료 v1.2
Splunk 교육자료 v1.2
JunMyoung(준명) Youn(연)
 
Introduction to column oriented databases
Introduction to column oriented databasesIntroduction to column oriented databases
Introduction to column oriented databases
ArangoDB Database
 
Splunk 적용 검토
Splunk 적용 검토Splunk 적용 검토
Splunk 적용 검토
Daeyong Shin
 
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
김 한도
 

Viewers also liked (7)

3차보고서 20150106
3차보고서 201501063차보고서 20150106
3차보고서 20150106
 
Splunk mint 소개
Splunk mint 소개Splunk mint 소개
Splunk mint 소개
 
실시간 빅데이터와 머신 데이터
실시간 빅데이터와 머신 데이터실시간 빅데이터와 머신 데이터
실시간 빅데이터와 머신 데이터
 
Splunk 교육자료 v1.2
Splunk 교육자료 v1.2Splunk 교육자료 v1.2
Splunk 교육자료 v1.2
 
Introduction to column oriented databases
Introduction to column oriented databasesIntroduction to column oriented databases
Introduction to column oriented databases
 
Splunk 적용 검토
Splunk 적용 검토Splunk 적용 검토
Splunk 적용 검토
 
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
Big Data Myth 1. 우리 회사엔 빅데이터가 없어요
 

Similar to I flux 소개-slideshare

AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
Amazon Web Services Korea
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
eungjin cho
 
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
Amazon Web Services Korea
 
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
Amazon Web Services Korea
 
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
Amazon Web Services Korea
 
Elastic Stack & Data pipeline
Elastic Stack & Data pipelineElastic Stack & Data pipeline
Elastic Stack & Data pipeline
Jongho Woo
 
정보보호통합플랫폼 기술 트렌드
정보보호통합플랫폼 기술 트렌드정보보호통합플랫폼 기술 트렌드
정보보호통합플랫폼 기술 트렌드
Logpresso
 
SQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouseSQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouse
NAVER Engineering
 
Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014
Gruter
 
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018 AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018 Amazon Web Services Korea
 
Infiniflux introduction
Infiniflux introductionInfiniflux introduction
Infiniflux introduction
InfiniFlux Korea
 
Windows 성능모니터를 이용한 SQL Server 성능 분석
Windows 성능모니터를 이용한 SQL Server 성능 분석Windows 성능모니터를 이용한 SQL Server 성능 분석
Windows 성능모니터를 이용한 SQL Server 성능 분석
Sung wook Kang
 
(120128) #fitalk sql server forensics
(120128) #fitalk   sql server forensics(120128) #fitalk   sql server forensics
(120128) #fitalk sql server forensics
INSIGHT FORENSIC
 
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
Amazon Web Services Korea
 
지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기
Ted Won
 
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
Jemin Huh
 
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
Amazon Web Services Korea
 
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
Amazon Web Services Korea
 
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
Amazon Web Services Korea
 
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
Seoro Kim
 

Similar to I flux 소개-slideshare (20)

AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
AWS Summit Seoul 2015 - 게임 서비스 혁신을 위한 데이터 분석
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
 
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
20140528 AWS Meister BlackBelt - Amazon Kinesis (Korean)
 
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
 
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
Amazon kinesis와 elasticsearch service로 만드는 실시간 데이터 분석 플랫폼 :: 박철수 :: AWS Summi...
 
Elastic Stack & Data pipeline
Elastic Stack & Data pipelineElastic Stack & Data pipeline
Elastic Stack & Data pipeline
 
정보보호통합플랫폼 기술 트렌드
정보보호통합플랫폼 기술 트렌드정보보호통합플랫폼 기술 트렌드
정보보호통합플랫폼 기술 트렌드
 
SQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouseSQream DB, GPU-accelerated data warehouse
SQream DB, GPU-accelerated data warehouse
 
Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014Vectorized processing in_a_nutshell_DeView2014
Vectorized processing in_a_nutshell_DeView2014
 
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018 AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
AWS 기반의 대용량 실시간 스트리밍 데이터 분석 아키텍처 패턴::김필중::AWS Summit Seoul 2018
 
Infiniflux introduction
Infiniflux introductionInfiniflux introduction
Infiniflux introduction
 
Windows 성능모니터를 이용한 SQL Server 성능 분석
Windows 성능모니터를 이용한 SQL Server 성능 분석Windows 성능모니터를 이용한 SQL Server 성능 분석
Windows 성능모니터를 이용한 SQL Server 성능 분석
 
(120128) #fitalk sql server forensics
(120128) #fitalk   sql server forensics(120128) #fitalk   sql server forensics
(120128) #fitalk sql server forensics
 
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
AWS 신규 데이터 분석 서비스 - QuickSight, Kinesis Firehose 등 (양승도) :: re:Invent re:Cap ...
 
지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기
 
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
서비스 모니터링 구현 사례 공유 - Realtime log monitoring platform-PMon을 ...
 
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
 
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
AWS Lambda를 기반으로한 실시간 빅테이터 처리하기
 
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
미디어 저장의 새로운 패러다임 - 김기완 :: 미디어 커스토머 데이
 
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
IBM Storage for AI - NVMe & Spectrum Scale 기술을 탑재한 ESS3000
 

More from Andrew Sungjin Kim

04 워터폴모델-개발프로세스
04 워터폴모델-개발프로세스04 워터폴모델-개발프로세스
04 워터폴모델-개발프로세스
Andrew Sungjin Kim
 
지식 공유 시스템
지식 공유 시스템지식 공유 시스템
지식 공유 시스템
Andrew Sungjin Kim
 
소프트웨어 개발 프로세스 배경 설명
소프트웨어 개발 프로세스 배경 설명소프트웨어 개발 프로세스 배경 설명
소프트웨어 개발 프로세스 배경 설명
Andrew Sungjin Kim
 
소프트웨어 개발 세미나 소개
소프트웨어 개발 세미나 소개소프트웨어 개발 세미나 소개
소프트웨어 개발 세미나 소개
Andrew Sungjin Kim
 
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
Andrew Sungjin Kim
 
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
Andrew Sungjin Kim
 

More from Andrew Sungjin Kim (6)

04 워터폴모델-개발프로세스
04 워터폴모델-개발프로세스04 워터폴모델-개발프로세스
04 워터폴모델-개발프로세스
 
지식 공유 시스템
지식 공유 시스템지식 공유 시스템
지식 공유 시스템
 
소프트웨어 개발 프로세스 배경 설명
소프트웨어 개발 프로세스 배경 설명소프트웨어 개발 프로세스 배경 설명
소프트웨어 개발 프로세스 배경 설명
 
소프트웨어 개발 세미나 소개
소프트웨어 개발 세미나 소개소프트웨어 개발 세미나 소개
소프트웨어 개발 세미나 소개
 
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
InfiniFlux vs influxdb 비교 테스트 결과 2016 12월-v2
 
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
Infiniflux vs influxdb 비교 테스트 결과 2016 12월-v2
 

I flux 소개-slideshare

  • 2. •IT를 구성하는 서버, 네트워크장치, 어플리케이션 등이 자신들의 상황(변화)을 실시간으로 끊임없이 방출하는 데이터로서 빅데이터를 구성하는 대부분의 데이터 형태 (http://en.wikipedia.org/wiki/Machine-generated_data) 데이터 특징 •초당 수 십만건 이상 로그 데이터 생성 (완전한 빅데이터) • 시계열 특성 (시간순 데이터 중요도 차이 큼) • Append-Only 저장소 특징 • 위험 예측 및 방지를 위한 실시간 데이터 분석 및 통계 요구
  • 3. In-Memory DBMS Disk Based DBMS Columnar DBMS Search Engine Time-Series Columnar DBMS 대표 솔루션 알티베이스 오라클 Sybase IQ splunk iFluxTM 실시간 인덱스 ☆ (고성능) X (느림) X (매우 느림) △ ☆ (고성능) 저장 공간 X (메모리 제약) △ (압축없음) ☆ (고압축) O (저압축) ☆ (고압축) 실시간 검색 X X X ☆ (패턴 검색) ☆ (패턴 검색) 통계 분석 성능 ☆ △ ☆ (탁월한 분석) X (SQL 없음) ☆ (탁월한 분석) Machine Data 환경 • Sensor Device 개수 매년 30% 증가 (2020년 약 500억개, IBM) • Mobile Traffic 증가량 매년 평균 78% (매킨지) Challenges • 실시간 저장-인덱싱 : 초당 50만건 이상 트래픽 • 저장 공간 : 무한히 증가하는 데이터, 저장공간 효율화 • 실시간 검색 : 데이터 패턴에 실시간 대한 조건 검색 엔진 • 통계 처리 : 수시간 ~ 수개월의 데이터 분석 처리
  • 5.  실시간 저장 및 인덱싱 이슈 ◦ 초당 50만건 이상 트래픽 지원 ◦ How?  시계열 특성을 이용한 Data-Append  Time-based partition 기법 이용 (부분 인덱싱)  Data Mover 개념  고효율/저비용 비트맵 인덱스 구조  저장 공간 이슈 (수십 ~ 수백배 실시간 압축) ◦ 인덱스 압축 – Bitmap index 내부의 다양한 비트 압축 알고리즘 사용 ◦ 데이터 압축 – Columnar DBMS에서의 다양한 Dictionary 기반 압축 알고리즘  실시간 검색 이슈 ◦ Keyword bitmap index (일종의 inverted-index)를 실시간 구성 및 검색 (POC 완료) ◦ 시간 역순으로 Memory Window 구성 (최근 데이터를 가장 빠르게 검색)  대규모 통계 질의 ◦ TPC-H 레벨의 SQL 지원 ◦ Columnar 구조의 통계 질의 성능 극대화  Cardinality 특성 및 압축 기반 I/O 비용 최소화, 검색 효율 최대
  • 6. HTTP iFlux Server Shard-1 Shard-2 Shard-N. . . iFlux WebServer IPC Log Client Insert Restful API Log Files User Application TCP/IP TCP/IP Browser Client iFlux Client
  • 7.  1주일간 상위 트래픽 사용자의 이름과 트래픽 정보 구하기 SPL table duration=1w ssl-flow | stats sum(eval(tx_bytes+rx_bytes)) as total, sum(tx_bytes) as tx, sum(rx_bytes) as rx by login | lookup sslplus login as login_name output name | replace login is null "알 수 없음" | sort limit=30 -total | fields name, login, tx, rx, total SQL SELECT sslplus.name, nvl(ssl-flow.login, "알 수 없음"), sum(tx_bytes) as tx, sum(rx_bytex) as rx, sum(tx_bytes + rx_bytes) as total FROM ssl-flow, RIGHT OUTER JOIN sslplus ON ssl-flow.login = sslplus.login WHERE _time > sysdate - 7 GROUP BY ssl-flow.login ORDER BY total DESC LIMIT 30; 어떤 것이 더 개발하고, 알아보기 쉬울까요?