매년 11월말 AWS re:Invent 행사에서는 내년 클라우드 기술을 전망할 수 있는 새로운 서비스를 대거 출시했습니다. 올해 리인벤트 행사에서 발표된 신규 서비스 중 개발자들이 관심을 가질만한 서비스를 선보이는 시간으로 데모와 함께 소개합니다. 특히, AWS re:Invent에서 새로 출시한 Amazon CodeBuild, AWS X-Ray 등의 서비스를 통한 민첩한 데브옵스 방법을 알려드립니다. 리인벤트에서 발표된 신규 서비스로 클라우드 기술의 미래를 살펴보세요.
매년 11월말 AWS re:Invent 행사에서는 내년 클라우드 기술을 전망할 수 있는 새로운 서비스를 대거 출시했습니다. 올해 리인벤트 행사에서 발표된 신규 서비스 중 개발자들이 관심을 가질만한 서비스를 선보이는 시간으로 데모와 함께 소개합니다. 특히, AWS re:Invent에서 새로 출시한 Amazon CodeBuild, AWS X-Ray 등의 서비스를 통한 민첩한 데브옵스 방법을 알려드립니다. 리인벤트에서 발표된 신규 서비스로 클라우드 기술의 미래를 살펴보세요.
2014년 5월 28일 일본에서 진행된 AWS 기술 웨비나의 발표 자료를 한국의 정윤진 솔루션스 아키텍트가 한글로 번역한 자료입니다. 웨비나 당시와 현재의 내용이 상이한 부분이 있을 수 있으니 자료 열람에 이 점 참고하시기 바라며, 혹 내용에 대한 문의사항이 있으신 경우 info-kr@amazon.com으로 연락 부탁드리겠습니다.
2014년 5월 28일 일본에서 진행된 AWS 기술 웨비나의 발표 자료를 한국의 정윤진 솔루션스 아키텍트가 한글로 번역한 자료입니다. 웨비나 당시와 현재의 내용이 상이한 부분이 있을 수 있으니 자료 열람에 이 점 참고하시기 바라며, 혹 내용에 대한 문의사항이 있으신 경우 info-kr@amazon.com으로 연락 부탁드리겠습니다.
AWS에서 Software Development Engineer로 근무하고 있는 Hashimoto Koji가 작성하고 AWS 한국팀에서 근무중인 정윤진 솔루션스 아키텍트가 번역한 슬라이드입니다. AWS 클라우드를 활용해 대규모 분산 시스템을 구축하는 방법에 대해 다루고 있습니다.
AWS에서는 애플리케이션의 목적과 특징에 맞는 다양한 클라우드 기반 데이터베이스 선택 옵션을 제공합니다. 본 세션에서는 클라우드 DB 서비스를 간단히 알아보고, 그 중에서도 DB 서버 및 클러스터 관리 및 운영에 대한 걱정이 전혀 없는 서버리스(Serverless) DB 서비스인 Amazon Aurora Serverless와 DynamoDB에 대해 자세히 알아봅니다. DB 관리 및 운영 등의 번거러운 작업은 AWS에 맡기고, 비지니스 로직에 필요한 데이터 모델 구성 및 쿼리 최적화 등에 집중하여 시장에 요구에 따른 비지니스에 민첩한 서비스를 만드는 방법을 알아 봅니다.
데이터 분석가를 위한 신규 분석 서비스 - 김기영, AWS 분석 솔루션즈 아키텍트 / 변규현, 당근마켓 소프트웨어 엔지니어 :: AWS r...Amazon Web Services Korea
AWS re:Invent에서는 다양한 고객들의 요구에 맞추어 새로운 분석 및 서버리스 서비스가 대거 출시되었습니다. 본 강연에서는 새롭게 출시된 핵심 분석 기능들과 함께, 누구나 손쉽게 사용할 수 있는 AWS의 분석 서버리스와 On-demand 기능들에 대한 심층적인 정보를 확인하실 수 있습니다.
아마존은 반도체를 어떻게 설계하는가? -LS 산전 HPC 적용 사례와 함께 - 이현석 사업 개발 담당 이사, AWS / 유성열 책임 연구원...Amazon Web Services Korea
아마존은 반도체를 어떻게 설계하는가? -LS 산전 HPC 적용 사례와 함께
이현석 사업 개발 담당 이사, AWS
유성열 책임 연구원, LS산전
무한에 가까운 Computing 자원을 활용하는 AWS의 HPC Solutin 적용을 통한 국내외 High Tech/MFG 기업들의 Time-to-Market 혁신 사례를 소개드립니다.
모바일 퍼스트 시대에서 점점 더 고객과의 접점이 늘어나고 있습니다. 다양한 비금융 애플리케이션은 고객들의 수요에 탄력적으로 대응할 수 있는 시스템이 필요합니다. 본 강연에서는 AWS 위에서 최적의 솔루션을 구현하는 방안에 대해 공유합니다.
연사: 이창수 솔루션 아키텍트, 아마존 웹서비스
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...Amazon Web Services Korea
Database Migration Service(DMS)는 RDBMS 이외에도 다양한 데이터베이스 이관을 지원합니다. 실제 고객사 사례를 통해 DMS가 데이터베이스 이관, 통합, 분리를 수행하는 데 어떻게 활용되는지 알아보고, 동시에 데이터 분석을 위한 데이터 수집(Data Ingest)에도 어떤 역할을 하는지 살펴보겠습니다.
Amazon Elasticache - Fully managed, Redis & Memcached Compatible Service (Lev...Amazon Web Services Korea
Amazon ElastiCache는 Redis 및 MemCached와 호환되는 완전관리형 서비스로서 현대적 애플리케이션의 성능을 최적의 비용으로 실시간으로 개선해 줍니다. ElastiCache의 Best Practice를 통해 최적의 성능과 서비스 최적화 방법에 대해 알아봅니다.
Internal Architecture of Amazon Aurora (Level 400) - 발표자: 정달영, APAC RDS Speci...Amazon Web Services Korea
ccAmazon Aurora 데이터베이스는 클라우드용으로 구축된 관계형 데이터베이스입니다. Aurora는 상용 데이터베이스의 성능과 가용성, 그리고 오픈소스 데이터베이스의 단순성과 비용 효율성을 모두 제공합니다. 이 세션은 Aurora의 고급 사용자들을 위한 세션으로써 Aurora의 내부 구조와 성능 최적화에 대해 알아봅니다.
[Keynote] 슬기로운 AWS 데이터베이스 선택하기 - 발표자: 강민석, Korea Database SA Manager, WWSO, A...Amazon Web Services Korea
오랫동안 관계형 데이터베이스가 가장 많이 사용되었으며 거의 모든 애플리케이션에서 널리 사용되었습니다. 따라서 애플리케이션 아키텍처에서 데이터베이스를 선택하기가 더 쉬웠지만, 구축할 수 있는 애플리케이션의 유형이 제한적이었습니다. 관계형 데이터베이스는 스위스 군용 칼과 같아서 많은 일을 할 수 있지만 특정 업무에는 완벽하게 적합하지는 않습니다. 클라우드 컴퓨팅의 등장으로 경제적인 방식으로 더욱 탄력적이고 확장 가능한 애플리케이션을 구축할 수 있게 되면서 기술적으로 가능한 일이 달라졌습니다. 이러한 변화는 전용 데이터베이스의 부상으로 이어졌습니다. 개발자는 더 이상 기본 관계형 데이터베이스를 사용할 필요가 없습니다. 개발자는 애플리케이션의 요구 사항을 신중하게 고려하고 이러한 요구 사항에 맞는 데이터베이스를 선택할 수 있습니다.
Demystify Streaming on AWS - 발표자: 이종혁, Sr Analytics Specialist, WWSO, AWS :::...Amazon Web Services Korea
실시간 분석은 AWS 고객의 사용 사례가 점점 늘어나고 있습니다. 이 세션에 참여하여 스트리밍 데이터 기술이 어떻게 데이터를 즉시 분석하고, 시스템 간에 데이터를 실시간으로 이동하고, 실행 가능한 통찰력을 더 빠르게 얻을 수 있는지 알아보십시오. 일반적인 스트리밍 데이터 사용 사례, 비즈니스에서 실시간 분석을 쉽게 활성화하는 단계, AWS가 Amazon Kinesis와 같은 AWS 스트리밍 데이터 서비스를 사용하도록 지원하는 방법을 다룹니다.
Amazon EMR - Enhancements on Cost/Performance, Serverless - 발표자: 김기영, Sr Anal...Amazon Web Services Korea
Amazon EMR은 Apache Spark, Hive, Presto, Trino, HBase 및 Flink와 같은 오픈 소스 프레임워크를 사용하여 분석 애플리케이션을 쉽게 실행할 수 있는 관리형 서비스를 제공합니다. Spark 및 Presto용 Amazon EMR 런타임에는 오픈 소스 Apache Spark 및 Presto에 비해 두 배 이상의 성능 향상을 제공하는 최적화 기능이 포함되어 있습니다. Amazon EMR Serverless는 Amazon EMR의 새로운 배포 옵션이지만 데이터 엔지니어와 분석가는 클라우드에서 페타바이트 규모의 데이터 분석을 쉽고 비용 효율적으로 실행할 수 있습니다. 이 세션에 참여하여 개념, 설계 패턴, 라이브 데모를 사용하여 Amazon EMR/EMR 서버리스를 살펴보고 Spark 및 Hive 워크로드, Amazon EMR 스튜디오 및 Amazon SageMaker Studio와의 Amazon EMR 통합을 실행하는 것이 얼마나 쉬운지 알아보십시오.
Amazon OpenSearch - Use Cases, Security/Observability, Serverless and Enhance...Amazon Web Services Korea
로그 및 지표 데이터를 쉽게 가져오고, OpenSearch 검색 API를 사용하고, OpenSearch 대시보드를 사용하여 시각화를 구축하는 등 Amazon OpenSearch의 새로운 기능과 기능에 대해 자세히 알아보십시오. 애플리케이션 문제를 디버깅할 수 있는 OpenSearch의 Observability 기능에 대해 알아보세요. Amazon OpenSearch Service를 통해 인프라 관리에 대해 걱정하지 않고 검색 또는 모니터링 문제에 집중할 수 있는 방법을 알아보십시오.
Enabling Agility with Data Governance - 발표자: 김성연, Analytics Specialist, WWSO,...Amazon Web Services Korea
데이터 거버넌스는 전체 프로세스에서 데이터를 관리하여 데이터의 정확성과 완전성을 보장하고 필요한 사람들이 데이터에 액세스할 수 있도록 하는 프로세스입니다. 이 세션에 참여하여 AWS가 어떻게 분석 서비스 전반에서 데이터 준비 및 통합부터 데이터 액세스, 데이터 품질 및 메타데이터 관리에 이르기까지 포괄적인 데이터 거버넌스를 제공하는지 알아보십시오. AWS에서의 스트리밍에 대해 자세히 알아보십시오.
Amazon Redshift Deep Dive - Serverless, Streaming, ML, Auto Copy (New feature...Amazon Web Services Korea
이 세션에 참여하여 Amazon Redshift의 새로운 기능을 자세히 살펴보십시오. Amazon Data Sharing, Amazon Redshift Serverless, Redshift Streaming, Redshift ML 및 자동 복사 등에 대한 자세한 내용과 데모를 통해 Amazon Redshift의 새로운 기능을 알고 싶은 사용자에게 적합합니다.
From Insights to Action, How to build and maintain a Data Driven Organization...Amazon Web Services Korea
데이터는 혁신과 변혁의 토대입니다. 비즈니스 혁신을 이끄는 혁신은 특정 시점의 전략이나 솔루션이 아니라 성장을 위한 반복적이고 집단적인 계획입니다. 혁신에 이러한 접근 방식을 채택하는 기업은 전략과 비즈니스 문화에서 데이터를 기반으로 하는 경우가 많습니다. 이러한 접근 방식을 개발하려면 리더가 데이터를 조직의 자산처럼 취급하고 조직이 더 나은 비즈니스 성과를 위해 데이터를 활용할 수 있도록 권한을 부여해야 합니다. AWS와 Amazon이 어떻게 데이터와 분석을 활용하여 확장 가능한 비즈니스 효율성을 창출하고 고객의 가장 복잡한 문제를 해결하는 메커니즘을 개발했는지 알아보십시오.
[Keynote] Accelerating Business Outcomes with AWS Data - 발표자: Saeed Gharadagh...Amazon Web Services Korea
데이터는 최종 소비자의 성공에 초점을 맞춘 디지털 혁신에서 중추적인 역할을 하고 있습니다. 모든 기업들은 데이터를 자산으로 사용하여 사례 제공을 추진하고 까다로운 결과를 해결하고 있습니다. AWS 클라우드 기술과 분석 솔루션의 강력한 성능을 통해 고객은 혁신 여정을 가속화할 수 있습니다. 이 세션에서는 기업 고객들이 클라우드에서 데이터의 힘을 활용하여 혁신 목표를 달성하고 필요한 결과를 제공하는 방법에 대해 다룹니다.
LG전자 - Amazon Aurora 및 RDS 블루/그린 배포를 이용한 데이터베이스 업그레이드 안정성 확보 - 발표자: 이은경 책임, L...Amazon Web Services Korea
LG ThinQ는 LG전자의 가전제품과 서비스를 아우르는 플랫폼 브랜드로서 앱 하나로 간편한 컨트롤, 똑똑한 케어, 스마트한 쇼핑까지 한번에 가능한 플랫폼입니다. ThinQ 플랫폼은 글로벌 서비스로 제공되고 있어, 작업 시간을 최소화하고, 서비스의 영향을 최소화 할 필요가 있었습니다. 따라서 DB 버전 업그레이드 작업 시 애플리케이션 배포가 필요없는 Blue/Green Deployment 방식은 최선의 선택이 되었습니다.
KB국민카드 - 클라우드 기반 분석 플랫폼 혁신 여정 - 발표자: 박창용 과장, 데이터전략본부, AI혁신부, KB카드│강병억, Soluti...Amazon Web Services Korea
온프레미스 분석 플랫폼에는 자원 증설 비용, 자원 관리 비용, 신규 자원 도입 및 환경 설정의 리드타임 등 다양한 측면에서의 한계가 존재합니다. 이에 KB국민카드에서는 기존 분석 플랫폼의 한계를 극복함과 동시에 시너지를 낼 수 있는 클라우드 기반 분석 플랫폼을 설계 및 도입하였습니다. 본 사례 소개는 KB국민카드의 데이터 혁신 여정과 노하우를 소개합니다.
SK Telecom - 망관리 프로젝트 TANGO의 오픈소스 데이터베이스 전환 여정 - 발표자 : 박승전, Project Manager, ...Amazon Web Services Korea
SK Telecom의 망관리 프로젝트인 TANGO에서는 오라클을 기반으로 시스템을 구축하여 운영해 왔습니다. 하지만 늘어나는 사용자와 데이터로 인해 유연하고 비용 효율적인 인프라가 필요하게 되었고, 이에 클라우드 도입을 검토 및 실행에 옮기게 되었습니다. TANGO 프로젝트의 클라우드 도입을 위한 검토부터 준비, 실행 및 이를 통해 얻게 된 교훈과 향후 계획에 대해 소개합니다.
코리안리 - 데이터 분석 플랫폼 구축 여정, 그 시작과 과제 - 발표자: 김석기 그룹장, 데이터비즈니스센터, 메가존클라우드 ::: AWS ...Amazon Web Services Korea
2022년 코리안리는 핵심업무시스템(기간계/정보계 시스템)을 AWS 클라우드로 전환하는 사업과 AWS 클라우드 기반에서 손익분석을 위한 어플리케이션 구축 사업을 동시에 진행하고 있었습니다. 이에 따라 클라우드 전환 이후 시스템 간 상호운용성과 호환성을갖춘 데이터 분석 플랫폼 또한 필요하게 되었습니다. 코리안리 IT 환경에 적합한 플랫폼 선정을 위하여 AWS Native Analytics Platform, 3rd Party Analytics Platform (클라우데라, 데이터브릭스)과의 PoC를 진행하고, 최종적으로 AWS Native Analytics Platform 으로 확정하였습니다. 코리안리는 메가존클라우드와 함께 2022년 10월부터 4개월(구축 3개월, 안정화 및 교육 1개월) 동안 AWS 기반 데이터 분석 플랫폼을 구축하고 활용 범위를 지속적으로 확대하고 있습니다.
LG 이노텍 - Amazon Redshift Serverless를 활용한 데이터 분석 플랫폼 혁신 과정 - 발표자: 유재상 선임, LG이노...Amazon Web Services Korea
LG 이노텍은 세계 시장을 선도하는 글로벌 소재·부품기업으로, Amazon Redshift 을 데이터 분석 플랫폼의 핵심 서비스로 활용하고 있습니다.지속적인 데이터 증가와 업무 확대에 따른 유연한 아키텍처 개선의 필요성에 대처하기 위해, 2022년에 AWS 에서 발표된 Redshift Serverless 를 활용한, 비용 최적화된 아키텍처 개선 과정의 실사례를 엿볼수 있는 기회가 됩니다.
2. 스타트업과 개발자들을 위한 AWS 클라우드 태권
발표자 소개
• 김명보
• VCNC에서 비트윈을 개발하고 있는 개발자
• 서버팀과 데이터 팀에서 잡다한 것들을 개발하는 중
• 회사에서 AWS에 돈을 쓰는 것을 담당
3. 스타트업과 개발자들을 위한 AWS 클라우드 태권
비트윈
• 커플들을 위한 모바일 서비스
• 아이폰, 안드로이드 어플리케이션 제공
• 채팅, 기념일, 사진, 메모, 캘린더 기능 제공
• 전 세계에서 1300만+ 다운로드 (as of 2015.08)
4. 스타트업과 개발자들을 위한 AWS 클라우드 태권
비트윈 데이트
• 커플/솔로들을 위한 데이트 코스 추천 서비스
• 아이폰, 안드로이드 어플리케이션 제공
• 지역별 맛집, 구경거리 등에 대한 리뷰 공유
• 한국에서 30만+ 다운로드 (as of 2015.08)
5. 스타트업과 개발자들을 위한 AWS 클라우드 태권
오늘의 발표
• 데이터 분석 시스템 Migration 한 이야기
• 왜 새로운 시스템을 만들 수 밖에 없었나?
• In-house에서 AWS로
• MapReduce로부터 Spark/Zeppelin으로
• 데이터 분석을 통한 Retention 개선 및 개발 방향 설정 경험
7. 스타트업과 개발자들을 위한 AWS 클라우드 태권
VCNC의 과거 분석 시스템 – (1)
AWS S3Server
Hadoop
HDFS + HBase
Hadoop
MapReduce
MySQL
8. 스타트업과 개발자들을 위한 AWS 클라우드 태권
VCNC의 과거 분석 시스템 – (2)
• 매일 돌리는 주기적인 분석 작업과 On-demand 분석이 요구됨
• 서버가 Json 으로 로그를 남김
• 서버에서 하루에 한 번씩 S3로 업로드
• 회사 내에 데이터 분석용 HDFS + HBase + MapReduce 클러스터 존재
• 아침에 S3로부터 로그를 받아와서 HBase에 쏟아 부음
• 분석을 돌려 결과를 MySQL을 저장함
9. 스타트업과 개발자들을 위한 AWS 클라우드 태권
과거 분석 시스템의 문제점
• 처음엔 1시간 밖에 안 걸리고 좋았음
• 구성후 2년이 지나니 10시간도 넘게 걸림
• 지금부터 유저 수가 2배가 되면????
• 여러 대의 서버와 오픈 소스 스택을 직접 관리해야 함
• 갖가지 난관과 장애의 연속
• 분석 할 때마다 방대한 MapReduce 코드를 작성해야 함
10. 스타트업과 개발자들을 위한 AWS 클라우드 태권
과거 분석 시스템의 문제점
• 잦은 하드 디스크 고장
• 메모리
• Hadoop 2.0.0에 Data Corruption이 퍼지는 버그 존재
• 메모리는 역시 삼성!
• 네트워크 – 1G는 병목, 10G는 비쌈
• 늘어나는 관리비용
• 더 이상 값싼 PC로 분석 클러스터 유지 불가능
11. 스타트업과 개발자들을 위한 AWS 클라우드 태권
과거 분석 시스템의 문제점
• GC timeout
• HDFS/HBase/MapReduce
• 여러 Java stack 사이의 효과적인 메모리 할당의 어려움
• YARN은 당시에 퍼포먼스 문제가 있는 초기 단계
• MySQL이 너무 느림
• 분석을 위한 index가 여러 column에 걸쳐서 존재 – gender, age, country, device, …
12. 스타트업과 개발자들을 위한 AWS 클라우드 태권
과거 분석 시스템의 문제점
• 아침에 S3로부터 로그 복사가 너무 오래 걸림
• 사장님 : 오늘 분석 결과 언제 나와요?
• 데이터 팀 : 로그 파일들 아직 바다 건너고 있는데요…
• 사장님 : …
14. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템 - Spark
• 메모리를 활용하는 MapReduce
• 훨씬 다양한 API
• distinct, groupByKey, sort, join, …
• 재사용하는 데이터는 cache
• Map같은 연산은 lazy 하게 처리
15. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템 – AWS
Log bucket On-demand
Spark Cluster 1
On-demand
Spark Cluster 2
Daily Analysis
Spark Cluster
Placement Group
Zeppelin / Dashboard UsersResult
bucket
16. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템 – EC2/SPOT
• 필요할 때 cluster 크기를 키우거나 추가적인 cluster를 띄울 수 있다
• 여러 개의 분석을 필요할 경우 동시에 돌릴 수 있다
• 동시에 돌릴 수 있으면, 가격은 유지하면서 모든 분석이 끝나는 시간을 앞당길 수
있다.
• 같은 작업에 많은 EC2 instance를 사용하더라도 결국 같은 비용
• SPOT의 싼 비용을 활용
17. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템 – S3
• 이미 비트윈의 로그가 저장되어 있음
• EC2에서 S3의 접근 속도도 좋음
• r3.8xlarge (10GB NIC) 에서 200~330MBytes/sec 나옴
18. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템 – R3 (X1)
• R3 instances
• 메모리 optimized instance – 244GB
• 320GB SSD x 2
• Shuffle 결과 임시 저장할 때 유리함
• X1 instances (출시 예고)
• 2TB 메모리를 가지는 instance
20. 스타트업과 개발자들을 위한 AWS 클라우드 태권
새로운 분석 시스템
– Placement Group
• Instance간의 network latency 가 낮아짐
• RTT가 0.3 ms 에서 0.2 ms 로 감소함 ( Tokyo Region 기준 )
• Spakr의 Wide-dependency shuffle operation에서 유리함
• sort, groupBy 등
21. 스타트업과 개발자들을 위한 AWS 클라우드 태권
Migration의 효과
• 과거에는 당일 분석을 중단시키면서 오래 걸리는 분석을 돌리기
어려웠음
• 예) 1년치 로그 전체에 대한 분석
• 현재는 당일 분석과 시간이 오래 걸리는 분석을 동시에 실행 가능
22. 스타트업과 개발자들을 위한 AWS 클라우드 태권
Migration의 효과
• 비트윈의 버그/이슈 추적에 큰 도움이 됨
• 어떤 유저가 앱이 로그아웃 되었다는 데 이유를 모르겠다
• 서버의 버그 + 유저의 3달 전의 행동에 의해서 생긴 문제
• 3달 치의 해당 유저의 행동 로그와 Exception 로그를 비교 분석하여 원인 발견
• 진입 장벽이 낮아져 더 많은 개발 팀원들이 데이터 분석에 관심을
가지기 시작함
24. 스타트업과 개발자들을 위한 AWS 클라우드 태권
휴면 계정 보호법 적용
• 1년 이상 사용하지 않은 한국 사용자들의 데이터를 따로 분리 보관해야
함
• 사용자들이 마지막으로 접근한 시점이 DB에 적혀 있지 않았음
• 전체 로그 파일 (압축 해제 시 200TB+) 에 대한 분석이 필요
• 6대의 r3.8xlarge Cluster로 하루 만에 전수 조사 종료
25. 스타트업과 개발자들을 위한 AWS 클라우드 태권
Wake-up push worker
• 비트윈 가입 후 3일간 채팅을 쓰지 않으면 그 후 돌아올 가능성이
낮음을 발견
• 낮은 채팅 사용으로 초기 이탈이 우려되는 유저들에게 채팅 사용을
유도하는 푸쉬 메세지를 전송
• 정확한 효과 측정을 위해서 같은 조건에서 푸쉬를 보내지 않는 10 ~
20%의 대조군 설정
27. 스타트업과 개발자들을 위한 AWS 클라우드 태권
BetweenDate 데이터 분석
• 새로운 서비스 출시 (2015.06)
• 기존 데이터 분석 시스템에 그대로 적용
• 복잡한 추가 시스템 개발 없이 로그가 쌓이는 S3 bucket과 Zeppelin
notebook만 추가됨
28. 스타트업과 개발자들을 위한 AWS 클라우드 태권
BetweenDate 데이터 분석
• 데이터 분석을 통해서 향후 개발 방향 설정
• 생각보다 많은 유저들이 오직 보기만 하는데 사용
• 참여도에 따라 Retention이 달라짐
• 유저들의 참여를 유도하는 이벤트 진행
• 소셜화(팔로우, 팔로잉) 기능 우선 개발 하기로 결정
29. 스타트업과 개발자들을 위한 AWS 클라우드 태권
결론
• 수개월에 걸쳐 데이터 분석 시스템을 전부 재구성
• 빠르고 효율적이며 범용적인 Apache Spark, Apache Zeppelin을 활용
• AWS를 활용, 최대한 시스템을 간단하게 구성하여 운영 비용을 줄임
• 10배 이상 빠르고 간편한 시스템을 만듦