AWS Summit: Strikingly analytics

© 2018, Amazon Web Services, Inc. or its affiliates. All rights reserved.
张晨
Data Platform Engineer @ Strikingly
史少峰
PMC of Apache Kylin, Software Architect @ Kyligence
Strikingly Analytics
使用 AWS 和 Apache Kylin 实现百万用户级别的数
据服务

• 创立于 2012 年
• 提供一站式建站服务
• 实现盈利的时间: 两个月
• 服务全球数百万客户
• 月均访问量达到千万级别
• 2016年推出本土服务上线了
• 已为数十万中国用户提供建站服务
• 2017年率先推出微信小程序上线服务
• 领先的微信小程序平台提供商

• 访问者流 (ClickStream) 分析
• 服务使用 Strikingly/上线了
建站的客户和发布微信小程序的
客户
• 实现多维分析，为商业智能 (BI)
决策提供支撑
是什么？
• 提供全面的一站式建站服务
• 方便客户查询和访问数据，使得
不了解相关技术的人也可以从大
数据分析当中获益
• 掌握原始数据，支撑更为灵活细
致的商业分析需求
为什么？

• 处理超大规模数据
• 运维数据平台的基础设施
• 响应通用类型的查询请求
• 快速支持新增需求( 快速迭代 )
• 支撑多租户、亚秒级查询
挑战
• 功能强大的云服务
• 丰富而全面的开源生态系统
• 成熟的相关技术分析报告和论文
• 从前端到后端各个部门的配合
可以利用的资源
使用云服务 (AWS) 和开源工具 (Hadoop、Kylin)
可以快速实现相关数据分析服务！

Amazon Web Services
• Strikingly/上线了自创立起即采用
AWS 向全球客户提供服务。在中
国区仍使用 AWS 以保持系统架
构一致
• AWS 相关技术文档非常丰富。一
般的使用问题都可以使用 Google
解决
• 第三方工具链比较丰富和完善
运维方面
• 生态系统繁荣，许多开源大数据
工具提供针对 AWS 相关服务的
官方扩展和技术文档
• AWS Java SDK 功能覆盖完整，
使用方便，EMR 等服务默认集成
各类 Jar 包，可以直接使用
• S3，DynamoDB 等服务在全球
范围内久经考验，值得信赖
开发方面

Apache Kylin
• 基于 Hadoop 生态环境，方便与
EMR 配合使用，减轻了维护基础
设施的压力
• 节点数据主要储存在 HBase 等
外部储存中，容易实现容器化
• 节点类型简单 (Job、Query 等)
相互耦合较低，数据 Rebalance
由底层储存实现
运维方面
• 支持 SQL 接口，提供多维度上接
近 Ad-hoc 的查询支持
• 在预定义的模型上提供亚秒级、
多租户并发查询的服务
• 支持 JDBC 和 RESTful API 两种
查询模式
• 可以使用 RESTful API 进行部分
数据维护操作
开发方面

• 提供真实可靠的数据
• 自动化的故障处理和恢复
• 协调系统架构当中各个组件的运行
• 实现稳定的用户服务和较低的数据传达延迟
真正的挑战
实现从数据收集到服务用户整条管线的正确运行！

系统架构

数据收集

数据收集
• 研发成本低
• 数据延迟较大
• 可定制性和灵活性较差
• 昂贵
第三方服务 Application Load Balancer
• 研发成本稍高
• 数据延迟较低
• 可定制性和灵活性高
• 便宜(10x)

数据平台

数据平台
• 灵活性高
• 配置和运维成本高
• 需要自己安装 AWS 相关服务的
Java Library
自行部署
• 灵活性略低
• 配置和运维成本低
• 自动集成 AWS 相关服务 Jar 包，
方便部署自研的 ETL 过程
• 自动备份到 S3
Elastic Map Reduce

数据处理

数据处理
• 模型简单易用
• 兼容 EMR 部署的 Hadoop 环境
• 接近 Ad-hoc 的 SQL 查询
• 多租户、亚秒级数据查询
• 易用的 RESTful API 接口
• 开源！
Apache Kylin
• 容器化 (降低部署成本)
• 改进运维方式，方便在容器化和
云部署的环境下执行运维任务
• 增强的错误隔离和错误处理能力
• 将 Kylin 嵌入数据处理管线
TODO (开源版本)
需要方便的工具处理 Kylin 和各种 AWS 服务的交互！

系统运维与协调

任务调度

错误隔离

查询服务

总结

实时数据管线

Thank you!

AWS Summit: Strikingly analytics

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to AWS Summit: Strikingly analytics

Similar to AWS Summit: Strikingly analytics (20)

More from Chase Zhang

More from Chase Zhang (6)

AWS Summit: Strikingly analytics

Editor's Notes