Recommended
PDF
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
PDF
[236] 카카오의데이터파이프라인 윤도영
PPTX
PPTX
PPTX
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
PDF
Elastic Search (엘라스틱서치) 입문
PDF
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
PDF
PDF
PDF
PDF
PDF
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
PDF
MySQL・PostgreSQLだけで作る高速あいまい全文検索システム
PDF
インラインSVGをつかって地図っぽいものをつくってみる
PPTX
PDF
엘라스틱서치, 로그스태시, 키바나
PDF
[야생의 땅: 듀랑고] 서버 아키텍처 - SPOF 없는 분산 MMORPG 서버
PDF
Apache Kafka 0.11 の Exactly Once Semantics
PDF
AWS Black Belt Online Seminar 2017 Amazon Kinesis
PDF
Performance Tuning RocksDB for Kafka Streams' State Stores (Dhruba Borthakur,...
PDF
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
PDF
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
PDF
PDF
PDF
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
PDF
PDF
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
PDF
PDF
More Related Content
PDF
[MLOps KR 행사] MLOps 춘추 전국 시대 정리(210605)
PDF
[236] 카카오의데이터파이프라인 윤도영
PPTX
PPTX
PPTX
[DevGround] 린하게 구축하는 스타트업 데이터파이프라인
PDF
Elastic Search (엘라스틱서치) 입문
PDF
Spark + S3 + R3를 이용한 데이터 분석 시스템 만들기
PDF
What's hot
PDF
PDF
PDF
PDF
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
PDF
MySQL・PostgreSQLだけで作る高速あいまい全文検索システム
PDF
インラインSVGをつかって地図っぽいものをつくってみる
PPTX
PDF
엘라스틱서치, 로그스태시, 키바나
PDF
[야생의 땅: 듀랑고] 서버 아키텍처 - SPOF 없는 분산 MMORPG 서버
PDF
Apache Kafka 0.11 の Exactly Once Semantics
PDF
AWS Black Belt Online Seminar 2017 Amazon Kinesis
PDF
Performance Tuning RocksDB for Kafka Streams' State Stores (Dhruba Borthakur,...
PDF
데이터 분석에 필요한 기본 개념: 지표, Funnel 등 데이터를 이해하기 위한 멘탈 모델(Mental Model)
PDF
Spark 의 핵심은 무엇인가? RDD! (RDD paper review)
PDF
PDF
PDF
20191120 AWS Black Belt Online Seminar Amazon Managed Streaming for Apache Ka...
PDF
PDF
Amazon Kinesis Analytics によるストリーミングデータのリアルタイム分析
PDF
At least onceってぶっちゃけ問題の先送りだったよね #kafkajp
Similar to Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기
PDF
PDF
PPT
PDF
PPTX
PPTX
PDF
[ETHCon Korea 2019] Jang Byeongkook 장병국
PPTX
PPTX
PDF
빅데이터미래전략세미나발표자료 빅데이터기술현황및전망-황승구-20120410
PDF
Elastic Stack & Data pipeline (1장)
PDF
PPT
PDF
제 14회 보아즈(BOAZ) 빅데이터 컨퍼런스 - [Finalyst팀] : 2021 Korea Fintech Visualization
PDF
How to Make Money from Data - Global Cases
PDF
[울산과학고 SW/STEAM] 1주차 - 데이터 시각화 방법론 및 사례
PDF
글로벌 사례로 보는 데이터로 돈 버는 법 - 트레저데이터 (Treasure Data)
PDF
[2016 데이터 그랜드 컨퍼런스] 1 3. bk3(엔코아)데이터그랜드컨퍼런스 4차산업혁명의 핵심-데이터경제-엔코아
PDF
Effective Data Lake : 고객 경험을 통한 사례 탐구 - 유다니엘 솔루션즈 아키텍트, AWS :: AWS Summit Seo...
PPTX
More from 흥래 김
PPTX
PPTX
검색엔진과 DB Like 검색의 결과가 다른 이유
PDF
PDF
PDF
PDF
엘라스틱서치 클러스터로 수십억 건의 데이터 운영하기
PPTX
PPTX
PPTX
PPTX
PPTX
PPTX
PDF
Spring boot와 docker를 이용한 msa
PDF
[제14회 JCO 컨퍼런스] 개발자를 위한 서버이중화 by JAVACAFE
PPTX
[DevOn 2013] Dynamic web proxy
PPTX
PPTX
플랫폼 통합을 위한 Client Module 개발 & 배포
PPTX
[JCO 컨퍼런스] 웹사이트 Front-End 성능 최적화
PDF
Spring 3.1에서 ehcache 활용 전략
PDF
[2012 자바카페 OPEN 세미나] Introduction to google guava
Elasticsearch와 Python을 이용하여 맨땅에서 데이터 분석하기 1. 2. 3. 최근 5년간 비트코인 가격 분석
대용량 데이터 분석을 위한 4단계
엘라스틱서치와 데이터 분석 플랫폼
Overview
4. 5. 최근 5년간 비트코인 가격 변화
2017년 중반부터 본격적으로 상승
2018년 1월 최고가를 갱신하며 대폭락
2019년초 바닥을 다지고 반등하며 현재 다시 상승 중
6. 7. 8. 제공되는 주요 경제 지표
미국 증권 지수 동북아 증권 지수 환율 비트코인
다우 KOSPI (한국) 달러 / 원화 Bithumb (원화)
나스닥 SSEC (중국) 달러 / 위안화 Bittrex (달러)
S&P500 NIKKEI (일본) 달러 / 엔화
9. [미국 증권 지수] 5년간 다우 지수
2016년 11월
트럼프 대통령 당선
2018년 11월
FAANG 주가 급락
10. 11. 12. [동북아 증권 지수] 5년간 KOSPI (한국) 지수
2017년 05월
문재인 대통령 당선
2018년 06월
북미 정삼회담
13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 주가 상승률 비교 (미국 vs 한국)
5년간 미국 주가가 약 50% 상승한 것에 비해
국내 주가는 재자리 걸음
1차 북미정상회담
2차 북미정상회담
23. 24. 주가 상승률 비교 (미국 vs 중국)
5년간 미국 주가가 약 50% 상승하는 동안
중국 상해 주가는 마이너스 성장
미/중 무역분쟁
25. 26. 주가 상승률 비교 (미국 vs 일본)
일본 니케이 지수는 미국과
비슷한 패턴으로 움직이는 경향이 있다.
27. 28. 주가 상승률 비교 (미국 vs 동북아시아)
최근 5년간 전세계 주가를 비교해보면
미국과 일본 증시가 비슷하게 움직이고
한국과 중국 증시가 비슷하게 움직이고 있다.
29. 30. 주가 대비 비트코인 상승률 비트코인은 지난 5년간
최대 3000%의 상승률을 기록했다.
최근 5년간 전세계 주가는
10%내외의 미미한 상승률을 가지고 있다.
31. 32. 33. 34. 비트코인 가격대별 한국, 중국 주가 패턴
한국, 중국 주가 패턴은
비트코인 가격이 하락하는 시점부터
동반 하락하는 패턴을 보여준다.
비트코인 하락시점의 주가는
한국 증가보다 중국 주가의 하락폭이
더 심해 보인다.
35. 36. 37. 비트코인 가격대별 주요 주가 등락폭
비트코인 시장 활성화 단계에
비트코인 폭락시
주가 동반폭락 비트코인 시장 활성화 단계에
비트코인 폭락시
주가 동반폭락
38. 비트코인 가격대별 주요 주가 등락폭
증시 패턴과 반대로 움직임
미/중 무역분쟁으로 인해
갈곳없는 자금들이 검증된 비트코인
시장으로 유입되는 것으로 추정
39. 40. 41. 42. 43. 44. 45. 46. 47. 비트코인 가격 비교 (달러 vs 원)
비트코인 가격은 일반적으로
미국거래소 가격(달러)가
한국거래소 가격(원)보다 비싸다.
이는 전체 거래량의 차이로 해석할 수 있다.
48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 비트코인에서 하루에 처리되는 평균 Transaction 수
https://www.blockchain.com/ko/charts/n-transactions?timespan=all
2019년 하루 약 50만건
2013년 하루 약 5만건
58. 비트코인에서 하루에 처리되는 평균 Transaction 수
https://www.blockchain.com/ko/charts/n-transactions?timespan=all
2013년 하루 약 5만건
2019년 하루 약 50만건
Transaction 10배 이상 증가
59. 지금까지 누적된 비트코인 Blockchain Size (MB)
https://www.blockchain.com/ko/charts/blocks-size?timespan=all
2013년 25GB
2019년 225GB
60. 지금까지 누적된 비트코인 Blockchain Size (MB)
https://www.blockchain.com/ko/charts/blocks-size?timespan=all
2013년 25GB
2019년 225GB
Blockchain Size 10배 이상 증가
61. 지금까지 누적된 총 Transaction 수
https://www.blockchain.com/ko/charts/n-transactions-total?timespan=all
2013년 2천만건
2019년 4억 5천만건
62. 지금까지 누적된 총 Transaction 수
https://www.blockchain.com/ko/charts/n-transactions-total?timespan=all
2013년 2천만건
2019년 4억 5천만건
Transaction Count 20배 이상 증가
63. 64. 65. 66. 67. 68. 69. 대용량 데이터 분석을 위한 4단계
Raw Data 수집
[1단계]
Raw Data
정제 및 저장
[2단계]
분석 데이터 제공
[3단계]
데이터 분석
[4단계]
70. 대용량 데이터 분석을 위한 4단계
Raw Data 수집
[1단계]
Raw Data
정제 및 저장
[2단계]
분석 데이터 제공
[3단계]
데이터 분석
[4단계]
71. 대용량 데이터 분석을 위한 4단계
Raw Data 수집
[1단계]
Raw Data
정제 및 저장
[2단계]
분석 데이터 제공
[3단계]
데이터 분석
[4단계]
데이터 분석 과정 (20%)
데이터 정제 과정 (80%)
72. 다양한 데이터 종류 수집
- File, REST API, Socket, etc
대량의 데이터 수집
- 데이터 종류에 따라 초당 수백, 수천의 처리가 필요
실시간 데이터 수집
- 실시간으로 유입되는 데이터의 경우 수집 실패시 데이터 유실 가능성
비정형 데이터 수집
- 다양한 형태의 비정형 데이터를 일관되게 수집하는 것이 필요
[1단계] Raw Data 수집
73. 비정형 데이터를 구조적 형태로 변환
- 시계열 기준 형식
- 코드 기준 형식
데이터 노이즈 제거
- PK, FK 생성
- 필수데이터 생성
- 데이터 Validation
데이터 저장
- 대량의 데이터 핸들링이 가능해야 함
- 기존 데이터와 통합
- 필요에 따른 데이터 수정 및 삭제 가능
[2단계] Raw Data 정제 및 저장
74. 데이터 집계
- 정제된 Raw Data를 다양한 형태로 가공
- Unique, Sum, Count, etc
제공 데이터 Interval 조절
- 일간, 월간, 년간 데이터 조회시 데이터 핸들링
- 집계를 통한 대량의 데이터 처리 노하우 필요
[3단계] 분석 데이터 제공
75. 모든 데이터를 API 형태로 제공받아서 처리
사전 약속된 파라메터에 따라 데이터의 Interval 처리
- Raw 데이터 조회
- 일간 데이터 조회
- 월간 데이터 조회
데이터 분석에 필요한 도구는 마음대로 선택 가능
- Python
- R
- Kibana
- Zepplin
[4단계] 데이터 분석
76. 77. 78. 79. 80. ElasticStack
Beats
- 다양한 형태의 데이터를 수집할 수 있는 경량 데이터 수집기
Logstash
- 동적 데이터 수집 파이프라인
Elasticsearch
- 실시간 데이터 저장 및 집계가 가능한 대용량 데이터 저장소
Kibana
- 다양한 형태의 비정형 데이터를 시각화 할 수 있는 UI도구
81. 82. 83. Beats [1단계] Raw Data 수집
별도의 개발없이 10여줄의 설정만으로도
Raw Data 수집
다양한 Architecture 구성을 통하여
대량의 데이터 수집이 가능하다.
84. 85. 86. Logstash [2단계] Raw Data 정제 및 저장
Input 영역에서 정제할 데이터
스트림을 전달 받는다.
Filter 영역에서 수집된 Raw Data를
다양한 형태로 정제한다.
Output 영역에서 정제가 완료된
데이터를 Elastsicsearch로 저장한다.
87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103.