SlideShare a Scribd company logo
대용량 분산 시스템 아키텍쳐
#3.대용량 분산 아키텍쳐
조대협
http://bcho.tistory.com
소프트웨어 개발 트랜드의 변화
• 대규모/긴기간 에서 소규모/단기간 (스타트업)
• 빠르고 잦은 릴리즈 (애자일)
• 고객의 VOC를 수용 (빅데이타,SNS)
• 개발과 운영을 통합 (DEVOPS)
• 열심히 일하는 것으로 감당 안됨 (자동화)
• 스페샬 리스트에서 제너럴 리스트 (수퍼엔지니어)
• 대용량 글로벌 스케일
• 오픈소스
• 구글링,STACKOVERFLOW,블로그,GITHUB
소프트웨어 개발 트랜드의 변화
• 아키텍쳐의 변화
중앙 집중형 저장소
(RDBMS,NFS)
UX + 비지니스 로직
분산형 저장소
(NoSQL,Sharding)
REST API
비지니스 로직
자바스크립트
• HTML,Servlet/JSP
• EJB,Spring
• RDBMS
• HTML5,AngularJS
• REST,WebSocket
• Node.JS,IMDG
• NoSQL,Sharding
동기식,중앙 집중형,고가용성
클러스터링
비동기식, 분산형, Resilience
Shared Nothing
일반적인 시스템 서비스 구조
• 모든 서비스 시스템은 일반적으로 다음과 같은 구조를 갖는다.
OSS BSS
• 컴포넌트
– Internal Business Logic : 일반적인 트렌젝션 처리 (서비스)
– External Interface : 대외 연계
– Reporting : 데이타 수집 및 분석/리포트 생성
– OSS (Operation Support System) : Tech Ops, Biz Ops
– BSS (Business Support System) : 리포트, PO 관리
대용량 분산 시스템 아키텍쳐
• SOA 기반의 플랫폼 아키텍쳐 (Common)
대용량 분산 시스템 아키텍쳐
• SOA 기반의 플랫폼 아키텍쳐 (Common)
: 재사용 가능한 API 컴포넌트 기반의 아키텍쳐
– Access Layer : Access Layer는 크게 두 가지 역할을 하는데, 외부로 부
터 들어오는 사용자 요청에 대해서 관문 역할을 하며, 외부 시스템과의
연동 역할을 한다.
– Business Layer : Business Layer는 들어온 사용자 요청에 대해서 비지니
스 로직을 처리하여 응답을 내보낸다.
– Persistent Layer : 마지막으로 Persistent Layer는 Business Logic에 의해
처리되는 또는 처리된 데이타를 저장하는 역할을 한다.
Access Layer
• 사용자 API에 대한 End Point
1. Reverse Proxy
– 부하 분산
– SSL Termination
– IP Blocking
– Logging
Access Layer
2. Service Bus (or API Gateway)
– API 에 대한 Backbone 역할
– Cross Cutting Concern (Logging, Authentication , Authorization)
– Mediation
• Routing
• Message Transforming
• Message format/Protocol converting
• MEP converting
• QoS management (메세지 Throttling)
• Orcherstration
Service Bus를 이용한, Sync to Async 변환
Access Layer
2. Service Bus (or API Gateway)
아래 내부와 외부 API 호출에 대한 접근 통제를 차별화 한 설계
Access Layer
2. Service Bus (or API Gateway)
• API Platform
• API Platform (APIgee)
• API Service (3Scale – API Market)
※ MaaS, BaaS
Access Layer
2. Service Bus (or API Gateway)
• API Mediation (APIgee)
Access Layer
2. Service Bus (or API Gateway)
• API Portal
- API Spec
- API Key 인증
- API Manual
- API Sand Box
Access Layer
3. IDM (Identity Management System)
– 사용자 계정 관리
– Access Control (Authentication, Authorization, Audit)
– Federation
– Lifecycle management & Provisioning
– Single Sign On
ProvisioningAuthentication & Authorization
Access Layer
3. Integration
– Integration Type
• API Integration
• Native Adapter – JCA, Mecator, TopLink ,WTC
• Data replication – ETL/CDC
– Consideration
• Logging (Audit)
• Retry
– Ignore
– Notification
– Retry
– Manual Handling
Business Layer
1. Transaction Processing (Sync)
– Simple request and response pattern.
– Stateless, Shared Nothing (공유 정보는 DataGrid로)
– Heavy Transaction & small # of concurrent user
• Multi threaded server
• Web Application Server
– Light Transaction & Huge # of concurrent user (C10K)
• Single thread server
• Vertex, node.js
Business Layer
1. Transaction Processing (Sync)
Multi thread server Single Thread Server
(Async)
Business Layer
1. Transaction Processing (Sync)
Multi thread server Single Thread Server
(Async)
http://strongloop.com/strongblog/node-js-is-faster-than-java/
Business Layer
1. Transaction Processing (Sync)
– 트렌젝션 처리
• Transaction manager (JTS, XA)
• 보상 (Compensation) 트렌젝션
Business Layer
2. Transaction Processing (Async)
• 메세지 큐 기반 (MQ, RabbitMQ,ActiveMQ, JMS,ZeroMQ)
• 응답을 기다리지 않고 바로 리턴
• 큐 뒤에, 다수의 Worker를 둬서, 대용량 처리에 유리
Business Layer
2. Transaction Processing (Async)
* Message Exchange Patterns
1) Fire & forget
2) Publish & Subscribe
3) Routing
4) Call Back
※ collation id
Business Layer
2. Transaction Processing (Async)
• 에러처리 (Error Hospital)
① Ignore
② Notify
③ Human interaction
④ Retry (Aging required)
Business Layer
3. Data Grid
• IMDG (In memory data grid)- HazelCast,Infinispan,Coherence
※ cf. redis (IMDB, 클러스터 안됨)
• 거대한 메모리 클러스터
• 공유 정보 (Sessiom,키 등)와 캐쉬 영역으로 사용됨
• 클러스터링 기반의 자가 HA 기능 필수
Business Layer
4. Working Space
• 작업용 파일을 올리는 일종이 temp directory
• 이미지 변환, 동영상 변환
• 자체 HA를 위한 Clustering 필수
• NFS, Gluster FS
Working Space + Async Transaction Processing 기반 구조
Persistent Layer
• RDBMS
• NoSQL
– Column DB
– Document DB
– Graph DB
• 파일 시스템
– 일반 파일 시스템
– Object Storage (S3,Blob Storage,OpenStack Swift)
Analytics Layer
• 데이타 분석 및 리포팅
– 단계
• 단순 리포팅
• 인사이트
• 예측
– 리포팅
• 리포트 생성 (엑셀)
• 대쉬 보드 (웹)
• Ad-Hoc 쿼리
Analytics Layer
• 전통적인 OLAP 방식의 분석 시스템
– ETL
– Dataware house
– Data Mart
– Reporting
Analytics Layer
• Map & Reduce (Hadoop) 기반의 분석 시스템
Map & Reduce + OLAP 형태의 분석 시스템
Analytics Layer
• 실시간 분석 시스템
– Realtime BI
– CEP (Centralized Event Processing)
OAM (Operation Admin Monitoring)
• CMDB (Application)
– RDBMS, ZooKeeper
• Configuration Management (Middleware & Infra)
– Chef,Puppet
• Deployment (Application)
– RPM,Fabric,Caspirano
• Monitoring (Application,Middleware,DBMS,Infra)
– Dash board : Nagio
– History : Cacti,Ganglia,Zzabix
– Application: Jennifer, Appdynamics
• Log gathering (Application,Middleware,DBMS,Infra)
– Log gathering : Flume,Fluentd
– Log gathering & Search : Logstash + Elastic Search + Kafka, graylog
– Error dash board : Sentry
글로벌 배포 시스템
• 고려 사항
– Regulation : 법률(데이타의 위치와 이동,개인정보 보호), 세금
– 지역별 기술 차이
• 중국 : Amazon 없음, Google Push 안됨
• 동남아 : 네트웍이 많이 느림
– 네트웍 Latency
– 데이타 센터간 데이타 복제
• DB 복제 방식 : CDC/ETL
• API 복제 방식 : API를 중복 호출 (Service Bus 등을 이용)
– 다국어 지원
글로벌 배포 시스템
• 위치 선정
– 법적 이슈 및 세금 (중국,미국,유럽)
– 네트워크 속도 (더블린, 미서부, 일본)
– 인력 수급
– 세제 혜택
– 가격
– Procurement (서버 구매)
※ 중국, 유럽 (더블린), 미서부 (캘리포니아)
글로벌 배포 시스템
• 구성 방식
– Master center / Regional center
– Master / Master center
• 서비스 Look up : 주로 데이타 복제 가능 여부에 따라 디자인
– 가까운 곳 우선 (데이타 센터간 동기화가 잘 되어 있을 경우 – 주로 근거
리 또는 전용망)
– 특정 데이타 센터 지정 방식
※ Global Load Balancer 디자인이 관건
글로벌 배포 시스템
• Request 라우팅
• 데이타 센터간 복제
솔루션 스택
Layer Component Product
Access Layer
Reverse Proxy apache httpd, nginx, haproxy
Enterprise Service Bus (ESB Approach) mule, Oracle Service Bus
Enterprise Service Bus (API Platform
Approach)
Apigee, Layer 7,Mashery,3scale
Identity Management
Shiboleth, SimpleSAML PHP,
OpenAM, CA Site Minder
Integration Layer Apache Camel, Spring Integration
Business
Layer
Transaction processing(Sync)
apache tomcat, jetty ,apache mina ,apache netty ,redhat jboss
,oracle weblogic
Message Queue (Async) Rabbit MQ, Active MQ, Zero MQ
data grid Memcached,redis , oracle coherence ,Infinispan ,Hazlecast
Persistent
Layer
RDBMS mysql,maria db, postgres,MS SQL,Oracle
mysql replication Ganglia , tungsten ,oracle golden gate
file system (NFS) glusterfs
file system (object store) openstack swift,S3,BlobStorage
NoSQL
Hbase , Cassandra , mongodb,
Riak, Couch Base
Analysis Layer
log gathering Flume , flumed, Logstash, GrayLog,Sentry
analysis service splunk
ETL Pentaho
map & reduce Hadoop,pig,hive
cep esper
OAM
cmdb zookeeper
monitoring Jennifer , ganglia , nagios
configuration management Puppet , chef,ancible
Deployment Fabric,RPM
클라우드 컴퓨팅
• 퍼브릭 클라우드
– IaaS,PaaS,SaaS
– 결코 싸지 않음
– 같은 서비스라도 지역별로 가격이 다름
– 생각보다 장애 많이 남 (99.95%)
– IO가 함정
– CPU Core가 2000년대 초 Xeon 수준 (요즘 CPU 수준이 아닌 가상화됨)
– 비쌈!!
– Infra Service, Fundamental Service
– IaaS : Amazon(갑), Azure, IBM Layer 7 (다크호스),Google Compute
engine
– PaaS : Heroku, Google App Engine,Azure, MongoLab, Cloudant,
CouchDB Cloud 서비스, MS Directory Service
– 저가 ? Digital Ocean
몇가지 짚고 넘어갈 이야기
• 할 수 있는 것은 모두 Cache (CDN, DB 캐쉬, API 캐쉬)
• 인증, 보안. 개인정보 관리 특히 API 키
• 일단 빨리 시작해서, 사용자가 많아지면 아키텍쳐 개선
• 오버디자인 주의
• Technical debt – 빚은 항상 적절하게
• 아키텍쳐 디자인은 Trade off 게임이자 투자
• HighAvailibility.com
• Infoq.com
분산 시스템 아키텍쳐 디자인 패턴
• 부하 분산
• 캐슁
– 분산 방식, 집중 방식
• 데이타 파티셔닝
• 쿼리 오프로딩
• 비동기 처리
• 데이타 복제
• 배포
• 로깅
– 글로벌 트렌젝션 ID

More Related Content

What's hot

Etsy Activity Feeds Architecture
Etsy Activity Feeds ArchitectureEtsy Activity Feeds Architecture
Etsy Activity Feeds Architecture
Dan McKinley
 
Introduction to Redis
Introduction to RedisIntroduction to Redis
Introduction to Redis
Dvir Volk
 

What's hot (20)

Introduction to memcached
Introduction to memcachedIntroduction to memcached
Introduction to memcached
 
Etsy Activity Feeds Architecture
Etsy Activity Feeds ArchitectureEtsy Activity Feeds Architecture
Etsy Activity Feeds Architecture
 
서버 성능에 대한 정의와 이해
서버 성능에 대한 정의와 이해서버 성능에 대한 정의와 이해
서버 성능에 대한 정의와 이해
 
Cassandra Introduction & Features
Cassandra Introduction & FeaturesCassandra Introduction & Features
Cassandra Introduction & Features
 
Apache kafka performance(throughput) - without data loss and guaranteeing dat...
Apache kafka performance(throughput) - without data loss and guaranteeing dat...Apache kafka performance(throughput) - without data loss and guaranteeing dat...
Apache kafka performance(throughput) - without data loss and guaranteeing dat...
 
MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?
MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?
MSA 전략 1: 마이크로서비스, 어떻게 디자인 할 것인가?
 
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
[NDC 2018] Spark, Flintrock, Airflow 로 구현하는 탄력적이고 유연한 데이터 분산처리 자동화 인프라 구축
 
MSA ( Microservices Architecture ) 발표 자료 다운로드
MSA ( Microservices Architecture ) 발표 자료 다운로드MSA ( Microservices Architecture ) 발표 자료 다운로드
MSA ( Microservices Architecture ) 발표 자료 다운로드
 
AWS를 통한 데이터 분석 및 처리의 새로운 혁신 기법 - 김윤건, AWS사업개발 담당:: AWS Summit Online Korea 2020
AWS를 통한 데이터 분석 및 처리의 새로운 혁신 기법 - 김윤건, AWS사업개발 담당::  AWS Summit Online Korea 2020AWS를 통한 데이터 분석 및 처리의 새로운 혁신 기법 - 김윤건, AWS사업개발 담당::  AWS Summit Online Korea 2020
AWS를 통한 데이터 분석 및 처리의 새로운 혁신 기법 - 김윤건, AWS사업개발 담당:: AWS Summit Online Korea 2020
 
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
[NDC18] 야생의 땅 듀랑고의 데이터 엔지니어링 이야기: 로그 시스템 구축 경험 공유
 
From cache to in-memory data grid. Introduction to Hazelcast.
From cache to in-memory data grid. Introduction to Hazelcast.From cache to in-memory data grid. Introduction to Hazelcast.
From cache to in-memory data grid. Introduction to Hazelcast.
 
High Concurrency Architecture at TIKI
High Concurrency Architecture at TIKIHigh Concurrency Architecture at TIKI
High Concurrency Architecture at TIKI
 
Introduction to Redis
Introduction to RedisIntroduction to Redis
Introduction to Redis
 
검색엔진이 데이터를 다루는 법 김종민
검색엔진이 데이터를 다루는 법 김종민검색엔진이 데이터를 다루는 법 김종민
검색엔진이 데이터를 다루는 법 김종민
 
Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링Apache kafka 관리와 모니터링
Apache kafka 관리와 모니터링
 
[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)[211] HBase 기반 검색 데이터 저장소 (공개용)
[211] HBase 기반 검색 데이터 저장소 (공개용)
 
[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영[236] 카카오의데이터파이프라인 윤도영
[236] 카카오의데이터파이프라인 윤도영
 
Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )
Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )
Cloud dw benchmark using tpd-ds( Snowflake vs Redshift vs EMR Hive )
 
Stability Patterns for Microservices
Stability Patterns for MicroservicesStability Patterns for Microservices
Stability Patterns for Microservices
 
아마존 클라우드와 함께한 1개월, 쿠키런 사례중심 (KGC 2013)
아마존 클라우드와 함께한 1개월, 쿠키런 사례중심 (KGC 2013)아마존 클라우드와 함께한 1개월, 쿠키런 사례중심 (KGC 2013)
아마존 클라우드와 함께한 1개월, 쿠키런 사례중심 (KGC 2013)
 

Viewers also liked

Viewers also liked (14)

대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
대용량 분산 아키텍쳐 설계 #1 아키텍쳐 설계 방법론
 
Global platform
Global platformGlobal platform
Global platform
 
RESTful API Design, Second Edition
RESTful API Design, Second EditionRESTful API Design, Second Edition
RESTful API Design, Second Edition
 
애자일 스크럼과 JIRA
애자일 스크럼과 JIRA 애자일 스크럼과 JIRA
애자일 스크럼과 JIRA
 
Scaling and High Performance Storage System: LeoFS
Scaling and High Performance Storage System: LeoFSScaling and High Performance Storage System: LeoFS
Scaling and High Performance Storage System: LeoFS
 
[RakutenTechConf2014] [D-4] The next step of LeoFS and Introducing NewDB Project
[RakutenTechConf2014] [D-4] The next step of LeoFS and Introducing NewDB Project[RakutenTechConf2014] [D-4] The next step of LeoFS and Introducing NewDB Project
[RakutenTechConf2014] [D-4] The next step of LeoFS and Introducing NewDB Project
 
Rakuten LeoFs - distributed file system
Rakuten LeoFs - distributed file systemRakuten LeoFs - distributed file system
Rakuten LeoFs - distributed file system
 
The State of Ceph, Manila, and Containers in OpenStack
The State of Ceph, Manila, and Containers in OpenStackThe State of Ceph, Manila, and Containers in OpenStack
The State of Ceph, Manila, and Containers in OpenStack
 
1. 아키텍쳐 설계 프로세스
1. 아키텍쳐 설계 프로세스1. 아키텍쳐 설계 프로세스
1. 아키텍쳐 설계 프로세스
 
마이크로서비스 아키텍처와 DevOps 기술 - Amazon 사례를 중심으로 (윤석찬)
마이크로서비스 아키텍처와 DevOps 기술 - Amazon 사례를 중심으로 (윤석찬)마이크로서비스 아키텍처와 DevOps 기술 - Amazon 사례를 중심으로 (윤석찬)
마이크로서비스 아키텍처와 DevOps 기술 - Amazon 사례를 중심으로 (윤석찬)
 
하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
하둡 알아보기(Learn about Hadoop basic), NetApp FAS NFS Connector for Hadoop
 
Deep Dive on the AWS Storage Gateway - April 2017 AWS Online Tech Talks
Deep Dive on the AWS Storage Gateway - April 2017 AWS Online Tech TalksDeep Dive on the AWS Storage Gateway - April 2017 AWS Online Tech Talks
Deep Dive on the AWS Storage Gateway - April 2017 AWS Online Tech Talks
 
Micro Service Architecture의 이해
Micro Service Architecture의 이해Micro Service Architecture의 이해
Micro Service Architecture의 이해
 
마이크로서비스 아키텍처로 개발하기
마이크로서비스 아키텍처로 개발하기마이크로서비스 아키텍처로 개발하기
마이크로서비스 아키텍처로 개발하기
 

Similar to 대용량 분산 아키텍쳐 설계 #3 대용량 분산 시스템 아키텍쳐

MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
문기 박
 
가상화와 컨테이너의 이해_20230117.pptx
가상화와 컨테이너의 이해_20230117.pptx가상화와 컨테이너의 이해_20230117.pptx
가상화와 컨테이너의 이해_20230117.pptx
Byungho Lee
 
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
Amazon Web Services Korea
 
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
Amazon Web Services Korea
 
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
Amazon Web Services Korea
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료
Wooseung Kim
 

Similar to 대용량 분산 아키텍쳐 설계 #3 대용량 분산 시스템 아키텍쳐 (20)

Ch6 대용량서비스레퍼런스아키텍처 part.1
Ch6 대용량서비스레퍼런스아키텍처 part.1Ch6 대용량서비스레퍼런스아키텍처 part.1
Ch6 대용량서비스레퍼런스아키텍처 part.1
 
4. 대용량 아키텍쳐 설계 패턴
4. 대용량 아키텍쳐 설계 패턴4. 대용량 아키텍쳐 설계 패턴
4. 대용량 아키텍쳐 설계 패턴
 
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
MSA(Service Mesh), MDA(Data Mesh), MIA(Inference Mesh) 기술동향 소개-박문기@메ᄀ...
 
조대협의 서버 사이드 - 대용량 아키텍처와 성능튜닝
조대협의 서버 사이드 - 대용량 아키텍처와 성능튜닝조대협의 서버 사이드 - 대용량 아키텍처와 성능튜닝
조대협의 서버 사이드 - 대용량 아키텍처와 성능튜닝
 
지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기지금 핫한 Real-time In-memory Stream Processing 이야기
지금 핫한 Real-time In-memory Stream Processing 이야기
 
Accelerate spring boot application with apache ignite
Accelerate spring boot application with apache igniteAccelerate spring boot application with apache ignite
Accelerate spring boot application with apache ignite
 
폴라리스오피스 운영시스템
폴라리스오피스 운영시스템폴라리스오피스 운영시스템
폴라리스오피스 운영시스템
 
가상화와 컨테이너의 이해_20230117.pptx
가상화와 컨테이너의 이해_20230117.pptx가상화와 컨테이너의 이해_20230117.pptx
가상화와 컨테이너의 이해_20230117.pptx
 
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
AWS를 통한 빅데이터 기반 비지니스 인텔리전스 구축- AWS Summit Seoul 2017
 
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo,  and application case of SK TelecomSQL-on-Hadoop with Apache Tajo,  and application case of SK Telecom
SQL-on-Hadoop with Apache Tajo, and application case of SK Telecom
 
GigaSpaces소개자료
GigaSpaces소개자료GigaSpaces소개자료
GigaSpaces소개자료
 
AWS 클라우드로 천만명 웹 서비스 확장하기 - 윤석찬 백승현 - AWS Summit 2016
AWS 클라우드로 천만명 웹 서비스 확장하기 - 윤석찬 백승현 - AWS Summit 2016AWS 클라우드로 천만명 웹 서비스 확장하기 - 윤석찬 백승현 - AWS Summit 2016
AWS 클라우드로 천만명 웹 서비스 확장하기 - 윤석찬 백승현 - AWS Summit 2016
 
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
AWS 빅데이터 아키텍처 패턴 및 모범 사례- AWS Summit Seoul 2017
 
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
AWS CLOUD 2017 - Amazon Redshift 기반 DW 와 비지니스 인텔리전스 구현 방법 (김일호 솔루션즈 아키텍트)
 
Play node conference
Play node conferencePlay node conference
Play node conference
 
NoSQL
NoSQLNoSQL
NoSQL
 
클라우드 이야기1 2 20160823-신인철_slideshare
클라우드 이야기1 2 20160823-신인철_slideshare클라우드 이야기1 2 20160823-신인철_slideshare
클라우드 이야기1 2 20160823-신인철_slideshare
 
2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료2012 빅데이터 big data 발표자료
2012 빅데이터 big data 발표자료
 
소프트웨어 개발 트랜드 및 MSA (마이크로 서비스 아키텍쳐)의 이해
소프트웨어 개발 트랜드 및 MSA (마이크로 서비스 아키텍쳐)의 이해소프트웨어 개발 트랜드 및 MSA (마이크로 서비스 아키텍쳐)의 이해
소프트웨어 개발 트랜드 및 MSA (마이크로 서비스 아키텍쳐)의 이해
 
Private PaaS with Docker, spring cloud and mesos
Private PaaS with Docker, spring cloud and mesos Private PaaS with Docker, spring cloud and mesos
Private PaaS with Docker, spring cloud and mesos
 

More from Terry Cho

More from Terry Cho (20)

Kubernetes #6 advanced scheduling
Kubernetes #6   advanced schedulingKubernetes #6   advanced scheduling
Kubernetes #6 advanced scheduling
 
Kubernetes #4 volume & stateful set
Kubernetes #4   volume & stateful setKubernetes #4   volume & stateful set
Kubernetes #4 volume & stateful set
 
Kubernetes #3 security
Kubernetes #3   securityKubernetes #3   security
Kubernetes #3 security
 
Kubernetes #2 monitoring
Kubernetes #2   monitoring Kubernetes #2   monitoring
Kubernetes #2 monitoring
 
Kubernetes #1 intro
Kubernetes #1   introKubernetes #1   intro
Kubernetes #1 intro
 
머신러닝으로 얼굴 인식 모델 개발 삽질기
머신러닝으로 얼굴 인식 모델 개발 삽질기머신러닝으로 얼굴 인식 모델 개발 삽질기
머신러닝으로 얼굴 인식 모델 개발 삽질기
 
5. 솔루션 카달로그
5. 솔루션 카달로그5. 솔루션 카달로그
5. 솔루션 카달로그
 
3. 마이크로 서비스 아키텍쳐
3. 마이크로 서비스 아키텍쳐3. 마이크로 서비스 아키텍쳐
3. 마이크로 서비스 아키텍쳐
 
서비스 지향 아키텍쳐 (SOA)
서비스 지향 아키텍쳐 (SOA)서비스 지향 아키텍쳐 (SOA)
서비스 지향 아키텍쳐 (SOA)
 
REST API 설계
REST API 설계REST API 설계
REST API 설계
 
모바일 개발 트랜드
모바일 개발 트랜드모바일 개발 트랜드
모바일 개발 트랜드
 
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
머신 러닝 입문 #1-머신러닝 소개와 kNN 소개
 
R 프로그래밍-향상된 데이타 조작
R 프로그래밍-향상된 데이타 조작R 프로그래밍-향상된 데이타 조작
R 프로그래밍-향상된 데이타 조작
 
R 프로그래밍 기본 문법
R 프로그래밍 기본 문법R 프로그래밍 기본 문법
R 프로그래밍 기본 문법
 
R 기본-데이타형 소개
R 기본-데이타형 소개R 기본-데이타형 소개
R 기본-데이타형 소개
 
2014 공개소프트웨어 대회 소프트웨어 개발 트렌드의 변화
2014 공개소프트웨어 대회 소프트웨어 개발 트렌드의 변화2014 공개소프트웨어 대회 소프트웨어 개발 트렌드의 변화
2014 공개소프트웨어 대회 소프트웨어 개발 트렌드의 변화
 
Redis data modeling examples
Redis data modeling examplesRedis data modeling examples
Redis data modeling examples
 
빠르게훓어보는 Node.js와 Vert.x
빠르게훓어보는 Node.js와 Vert.x빠르게훓어보는 Node.js와 Vert.x
빠르게훓어보는 Node.js와 Vert.x
 
14회 jco 컨퍼런스 조대협의 소프트웨어 개발 배포용
14회 jco 컨퍼런스 조대협의 소프트웨어 개발 배포용14회 jco 컨퍼런스 조대협의 소프트웨어 개발 배포용
14회 jco 컨퍼런스 조대협의 소프트웨어 개발 배포용
 
자바 성능 강의
자바 성능 강의자바 성능 강의
자바 성능 강의
 

대용량 분산 아키텍쳐 설계 #3 대용량 분산 시스템 아키텍쳐

  • 1. 대용량 분산 시스템 아키텍쳐 #3.대용량 분산 아키텍쳐 조대협 http://bcho.tistory.com
  • 2. 소프트웨어 개발 트랜드의 변화 • 대규모/긴기간 에서 소규모/단기간 (스타트업) • 빠르고 잦은 릴리즈 (애자일) • 고객의 VOC를 수용 (빅데이타,SNS) • 개발과 운영을 통합 (DEVOPS) • 열심히 일하는 것으로 감당 안됨 (자동화) • 스페샬 리스트에서 제너럴 리스트 (수퍼엔지니어) • 대용량 글로벌 스케일 • 오픈소스 • 구글링,STACKOVERFLOW,블로그,GITHUB
  • 3. 소프트웨어 개발 트랜드의 변화 • 아키텍쳐의 변화 중앙 집중형 저장소 (RDBMS,NFS) UX + 비지니스 로직 분산형 저장소 (NoSQL,Sharding) REST API 비지니스 로직 자바스크립트 • HTML,Servlet/JSP • EJB,Spring • RDBMS • HTML5,AngularJS • REST,WebSocket • Node.JS,IMDG • NoSQL,Sharding 동기식,중앙 집중형,고가용성 클러스터링 비동기식, 분산형, Resilience Shared Nothing
  • 4. 일반적인 시스템 서비스 구조 • 모든 서비스 시스템은 일반적으로 다음과 같은 구조를 갖는다. OSS BSS • 컴포넌트 – Internal Business Logic : 일반적인 트렌젝션 처리 (서비스) – External Interface : 대외 연계 – Reporting : 데이타 수집 및 분석/리포트 생성 – OSS (Operation Support System) : Tech Ops, Biz Ops – BSS (Business Support System) : 리포트, PO 관리
  • 5. 대용량 분산 시스템 아키텍쳐 • SOA 기반의 플랫폼 아키텍쳐 (Common)
  • 6. 대용량 분산 시스템 아키텍쳐 • SOA 기반의 플랫폼 아키텍쳐 (Common) : 재사용 가능한 API 컴포넌트 기반의 아키텍쳐 – Access Layer : Access Layer는 크게 두 가지 역할을 하는데, 외부로 부 터 들어오는 사용자 요청에 대해서 관문 역할을 하며, 외부 시스템과의 연동 역할을 한다. – Business Layer : Business Layer는 들어온 사용자 요청에 대해서 비지니 스 로직을 처리하여 응답을 내보낸다. – Persistent Layer : 마지막으로 Persistent Layer는 Business Logic에 의해 처리되는 또는 처리된 데이타를 저장하는 역할을 한다.
  • 7. Access Layer • 사용자 API에 대한 End Point 1. Reverse Proxy – 부하 분산 – SSL Termination – IP Blocking – Logging
  • 8. Access Layer 2. Service Bus (or API Gateway) – API 에 대한 Backbone 역할 – Cross Cutting Concern (Logging, Authentication , Authorization) – Mediation • Routing • Message Transforming • Message format/Protocol converting • MEP converting • QoS management (메세지 Throttling) • Orcherstration Service Bus를 이용한, Sync to Async 변환
  • 9. Access Layer 2. Service Bus (or API Gateway) 아래 내부와 외부 API 호출에 대한 접근 통제를 차별화 한 설계
  • 10. Access Layer 2. Service Bus (or API Gateway) • API Platform • API Platform (APIgee) • API Service (3Scale – API Market) ※ MaaS, BaaS
  • 11. Access Layer 2. Service Bus (or API Gateway) • API Mediation (APIgee)
  • 12. Access Layer 2. Service Bus (or API Gateway) • API Portal - API Spec - API Key 인증 - API Manual - API Sand Box
  • 13. Access Layer 3. IDM (Identity Management System) – 사용자 계정 관리 – Access Control (Authentication, Authorization, Audit) – Federation – Lifecycle management & Provisioning – Single Sign On ProvisioningAuthentication & Authorization
  • 14. Access Layer 3. Integration – Integration Type • API Integration • Native Adapter – JCA, Mecator, TopLink ,WTC • Data replication – ETL/CDC – Consideration • Logging (Audit) • Retry – Ignore – Notification – Retry – Manual Handling
  • 15. Business Layer 1. Transaction Processing (Sync) – Simple request and response pattern. – Stateless, Shared Nothing (공유 정보는 DataGrid로) – Heavy Transaction & small # of concurrent user • Multi threaded server • Web Application Server – Light Transaction & Huge # of concurrent user (C10K) • Single thread server • Vertex, node.js
  • 16. Business Layer 1. Transaction Processing (Sync) Multi thread server Single Thread Server (Async)
  • 17. Business Layer 1. Transaction Processing (Sync) Multi thread server Single Thread Server (Async) http://strongloop.com/strongblog/node-js-is-faster-than-java/
  • 18. Business Layer 1. Transaction Processing (Sync) – 트렌젝션 처리 • Transaction manager (JTS, XA) • 보상 (Compensation) 트렌젝션
  • 19. Business Layer 2. Transaction Processing (Async) • 메세지 큐 기반 (MQ, RabbitMQ,ActiveMQ, JMS,ZeroMQ) • 응답을 기다리지 않고 바로 리턴 • 큐 뒤에, 다수의 Worker를 둬서, 대용량 처리에 유리
  • 20. Business Layer 2. Transaction Processing (Async) * Message Exchange Patterns 1) Fire & forget 2) Publish & Subscribe 3) Routing 4) Call Back ※ collation id
  • 21. Business Layer 2. Transaction Processing (Async) • 에러처리 (Error Hospital) ① Ignore ② Notify ③ Human interaction ④ Retry (Aging required)
  • 22. Business Layer 3. Data Grid • IMDG (In memory data grid)- HazelCast,Infinispan,Coherence ※ cf. redis (IMDB, 클러스터 안됨) • 거대한 메모리 클러스터 • 공유 정보 (Sessiom,키 등)와 캐쉬 영역으로 사용됨 • 클러스터링 기반의 자가 HA 기능 필수
  • 23. Business Layer 4. Working Space • 작업용 파일을 올리는 일종이 temp directory • 이미지 변환, 동영상 변환 • 자체 HA를 위한 Clustering 필수 • NFS, Gluster FS Working Space + Async Transaction Processing 기반 구조
  • 24. Persistent Layer • RDBMS • NoSQL – Column DB – Document DB – Graph DB • 파일 시스템 – 일반 파일 시스템 – Object Storage (S3,Blob Storage,OpenStack Swift)
  • 25. Analytics Layer • 데이타 분석 및 리포팅 – 단계 • 단순 리포팅 • 인사이트 • 예측 – 리포팅 • 리포트 생성 (엑셀) • 대쉬 보드 (웹) • Ad-Hoc 쿼리
  • 26. Analytics Layer • 전통적인 OLAP 방식의 분석 시스템 – ETL – Dataware house – Data Mart – Reporting
  • 27. Analytics Layer • Map & Reduce (Hadoop) 기반의 분석 시스템 Map & Reduce + OLAP 형태의 분석 시스템
  • 28. Analytics Layer • 실시간 분석 시스템 – Realtime BI – CEP (Centralized Event Processing)
  • 29. OAM (Operation Admin Monitoring) • CMDB (Application) – RDBMS, ZooKeeper • Configuration Management (Middleware & Infra) – Chef,Puppet • Deployment (Application) – RPM,Fabric,Caspirano • Monitoring (Application,Middleware,DBMS,Infra) – Dash board : Nagio – History : Cacti,Ganglia,Zzabix – Application: Jennifer, Appdynamics • Log gathering (Application,Middleware,DBMS,Infra) – Log gathering : Flume,Fluentd – Log gathering & Search : Logstash + Elastic Search + Kafka, graylog – Error dash board : Sentry
  • 30. 글로벌 배포 시스템 • 고려 사항 – Regulation : 법률(데이타의 위치와 이동,개인정보 보호), 세금 – 지역별 기술 차이 • 중국 : Amazon 없음, Google Push 안됨 • 동남아 : 네트웍이 많이 느림 – 네트웍 Latency – 데이타 센터간 데이타 복제 • DB 복제 방식 : CDC/ETL • API 복제 방식 : API를 중복 호출 (Service Bus 등을 이용) – 다국어 지원
  • 31. 글로벌 배포 시스템 • 위치 선정 – 법적 이슈 및 세금 (중국,미국,유럽) – 네트워크 속도 (더블린, 미서부, 일본) – 인력 수급 – 세제 혜택 – 가격 – Procurement (서버 구매) ※ 중국, 유럽 (더블린), 미서부 (캘리포니아)
  • 32. 글로벌 배포 시스템 • 구성 방식 – Master center / Regional center – Master / Master center • 서비스 Look up : 주로 데이타 복제 가능 여부에 따라 디자인 – 가까운 곳 우선 (데이타 센터간 동기화가 잘 되어 있을 경우 – 주로 근거 리 또는 전용망) – 특정 데이타 센터 지정 방식 ※ Global Load Balancer 디자인이 관건
  • 33. 글로벌 배포 시스템 • Request 라우팅 • 데이타 센터간 복제
  • 34. 솔루션 스택 Layer Component Product Access Layer Reverse Proxy apache httpd, nginx, haproxy Enterprise Service Bus (ESB Approach) mule, Oracle Service Bus Enterprise Service Bus (API Platform Approach) Apigee, Layer 7,Mashery,3scale Identity Management Shiboleth, SimpleSAML PHP, OpenAM, CA Site Minder Integration Layer Apache Camel, Spring Integration Business Layer Transaction processing(Sync) apache tomcat, jetty ,apache mina ,apache netty ,redhat jboss ,oracle weblogic Message Queue (Async) Rabbit MQ, Active MQ, Zero MQ data grid Memcached,redis , oracle coherence ,Infinispan ,Hazlecast Persistent Layer RDBMS mysql,maria db, postgres,MS SQL,Oracle mysql replication Ganglia , tungsten ,oracle golden gate file system (NFS) glusterfs file system (object store) openstack swift,S3,BlobStorage NoSQL Hbase , Cassandra , mongodb, Riak, Couch Base Analysis Layer log gathering Flume , flumed, Logstash, GrayLog,Sentry analysis service splunk ETL Pentaho map & reduce Hadoop,pig,hive cep esper OAM cmdb zookeeper monitoring Jennifer , ganglia , nagios configuration management Puppet , chef,ancible Deployment Fabric,RPM
  • 35. 클라우드 컴퓨팅 • 퍼브릭 클라우드 – IaaS,PaaS,SaaS – 결코 싸지 않음 – 같은 서비스라도 지역별로 가격이 다름 – 생각보다 장애 많이 남 (99.95%) – IO가 함정 – CPU Core가 2000년대 초 Xeon 수준 (요즘 CPU 수준이 아닌 가상화됨) – 비쌈!! – Infra Service, Fundamental Service – IaaS : Amazon(갑), Azure, IBM Layer 7 (다크호스),Google Compute engine – PaaS : Heroku, Google App Engine,Azure, MongoLab, Cloudant, CouchDB Cloud 서비스, MS Directory Service – 저가 ? Digital Ocean
  • 36. 몇가지 짚고 넘어갈 이야기 • 할 수 있는 것은 모두 Cache (CDN, DB 캐쉬, API 캐쉬) • 인증, 보안. 개인정보 관리 특히 API 키 • 일단 빨리 시작해서, 사용자가 많아지면 아키텍쳐 개선 • 오버디자인 주의 • Technical debt – 빚은 항상 적절하게 • 아키텍쳐 디자인은 Trade off 게임이자 투자 • HighAvailibility.com • Infoq.com
  • 37. 분산 시스템 아키텍쳐 디자인 패턴 • 부하 분산 • 캐슁 – 분산 방식, 집중 방식 • 데이타 파티셔닝 • 쿼리 오프로딩 • 비동기 처리 • 데이타 복제 • 배포 • 로깅 – 글로벌 트렌젝션 ID