SlideShare a Scribd company logo
1 of 21
Download to read offline
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
吕毅
2016.09
链家⽹网存储架构变迁
⾃自我介绍
吕毅
• 链家⽹网架构师
• 曾供职于新浪平台架构部、百度移动云事业部
• 参与项⽬目新浪SAE,百度移动搜索、⼿手机百度APP
• 2015年年9⽉月加⼊入链家⽹网
• 2015.10~2016.8,负责链家⽹网平台服务建设
• 2016.8⾄至今,负责链家⽹网⼤大数据平台建设
⽬目录
➢ 链家⽹网与存储架构变迁
➢ ⼀一场持续半年年的存储改造⼯工作
➢ 我们所熟悉的AWS S3
➢ Q&A
链家⽹网与存储架构变迁
链家⽹网线上业务历程
链家地产成⽴立
链家在线、HERP系统上线运营
“楼盘字典”项⽬目启动
2001年年
2007年年
2008年年
2012年年
链家提出“真房源”
SE(Sales Effectiveness)系统上线
TE(Transaction Effectiveness)系统上线
“掌上链家”APP发布
“链家在线”更更名为“链家⽹网”
域名变更更为Lianjia.com
着⼿手重建to C业务
着⼿手⾃自研SE、TE系统
2014年年
2016年年
SE、TE合并为Link系统
“楼盘字典”项⽬目积累6000万房产信息
链家⽹网存储架构变迁
链家地产成⽴立
链家在线、HERP系统上线运营
“楼盘字典”项⽬目启动
2001年年
2007年年
2008年年
2012年年
链家提出“真房源”
SE(Sales Effectiveness)系统上线
TE(Transaction Effectiveness)系统上线
“掌上链家”APP发布
“链家在线”更更名为“链家⽹网”
启⽤用域名Lianjia.com
2014年年
2016年年
SE、TE合并为Link系统
“楼盘字典”项⽬目积累6000万房产信息
传统⽂文件系统
FastDFS
Ceph
AWS S3
链家⽹网存储服务相关数据
总存储⽂文件:
8270万+
总存储容量量:
43TB
65%
房源实勘图
4%
⽂文件
备份
13%
⾳音视频
15%
其他图⽚片
2%
其他
⼀一场持续半年年的存储改造⼯工作
为什什么要改造?
使⽤用Ceph遇到了了问题:
容量量不不够
维稳成本
数据备份
为什什么选⽤用AWS S3?
使⽤用S3不不需要操⼼心的事:
容量量规划
存储管理理
数据备份
维修硬件
云存储为何选⽤用S3? (1/2)

⼗十年年 S3
云存储为何选⽤用S3? (2/2)

11个9的持久性
链家⽹网存储架构 2015年年
corporate data center
AWS Direct
Connect
ELB
(internal)
EC2
(Web Services)
ELB
(public)
Ceph
Business group
Business A
Business B
Projects
(Web services)
80% 20%
链家⽹网基于AWS S3的存储架构
corporate data center
AWS Direct
Connect
Projects
(internal)
ELB
(internal)
EC2
(auto scaling)
ELB
(public)
S3 Redshift
Cache
security group
Availability Zone
存储架构改造中遇到的问题
存量量与增量量的问题
业务⽅方迁移成本
写⼊入数据双写
数据迁移
我们所熟悉的AWS S3
关于Bucket
Bucket名全球唯⼀一
可以建⽴立Huge Bucket
关于⽂文件检索与统计
使⽤用数据库存储⽂文件Meta信息供检索
关于存储成本
冷数据 使⽤用AWS Glacier存储
代理理S3服务
在S3能⼒力力之上 封装公司通⽤用逻辑
Q&A
链家网存储架构变迁,吕毅

More Related Content

Viewers also liked

阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划
mysqlops
 

Viewers also liked (6)

D baa s_in_xiaomi
D baa s_in_xiaomiD baa s_in_xiaomi
D baa s_in_xiaomi
 
阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路阿里巴巴运维团队的无状态运维思路
阿里巴巴运维团队的无状态运维思路
 
美团点评技术沙龙010-美团数据库自动化运维系统构建之路
美团点评技术沙龙010-美团数据库自动化运维系统构建之路美团点评技术沙龙010-美团数据库自动化运维系统构建之路
美团点评技术沙龙010-美团数据库自动化运维系统构建之路
 
阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划阿里巴巴运维自动化的探索与规划
阿里巴巴运维自动化的探索与规划
 
Wot2015 微博平台护城河-构建高效的防御体系-王关胜
Wot2015 微博平台护城河-构建高效的防御体系-王关胜Wot2015 微博平台护城河-构建高效的防御体系-王关胜
Wot2015 微博平台护城河-构建高效的防御体系-王关胜
 
基于Python构建可扩展的自动化运维平台
基于Python构建可扩展的自动化运维平台基于Python构建可扩展的自动化运维平台
基于Python构建可扩展的自动化运维平台
 

Similar to 链家网存储架构变迁,吕毅

新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
锐 张
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平
drewz lin
 
IDC大会:新浪SAE架构与设计
IDC大会:新浪SAE架构与设计IDC大会:新浪SAE架构与设计
IDC大会:新浪SAE架构与设计
Xi Zeng
 
影响搜索引擎排名的因素
影响搜索引擎排名的因素影响搜索引擎排名的因素
影响搜索引擎排名的因素
YUCHENG HU
 

Similar to 链家网存储架构变迁,吕毅 (20)

ChinaNetCloud - Aliyun Joint Event on Cloud Operations
ChinaNetCloud - Aliyun Joint Event on Cloud Operations ChinaNetCloud - Aliyun Joint Event on Cloud Operations
ChinaNetCloud - Aliyun Joint Event on Cloud Operations
 
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)新浪云计算公开课第一期:Let’s run @ sae(丛磊)
新浪云计算公开课第一期:Let’s run @ sae(丛磊)
 
企业应用与互联网的融合
企业应用与互联网的融合企业应用与互联网的融合
企业应用与互联网的融合
 
App house
App houseApp house
App house
 
云计算概念介绍2011 03
云计算概念介绍2011 03云计算概念介绍2011 03
云计算概念介绍2011 03
 
FIT2CLOUD:云管理及DevOps协作平台
FIT2CLOUD:云管理及DevOps协作平台FIT2CLOUD:云管理及DevOps协作平台
FIT2CLOUD:云管理及DevOps协作平台
 
深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具深入淺出 AWS 大數據工具
深入淺出 AWS 大數據工具
 
Top100summit前端的云时代支付宝前端平台架构 王保平
Top100summit前端的云时代支付宝前端平台架构  王保平Top100summit前端的云时代支付宝前端平台架构  王保平
Top100summit前端的云时代支付宝前端平台架构 王保平
 
AWS re:Invent Recap 2016 Taiwan part 1
AWS re:Invent Recap 2016 Taiwan part 1AWS re:Invent Recap 2016 Taiwan part 1
AWS re:Invent Recap 2016 Taiwan part 1
 
海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)海通证券金融云思考与实践(数据技术嘉年华2017)
海通证券金融云思考与实践(数据技术嘉年华2017)
 
Easy to recap AWS reinvent 2017
Easy to recap AWS reinvent 2017Easy to recap AWS reinvent 2017
Easy to recap AWS reinvent 2017
 
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
NoSQL@VIP — 唯品会NoSQL平台⾃动化发展及运维经验分享
 
移动互联网服务端架构介绍
移动互联网服务端架构介绍移动互联网服务端架构介绍
移动互联网服务端架构介绍
 
ServiceMesh-Runtime-FaaS三位一体.pdf
ServiceMesh-Runtime-FaaS三位一体.pdfServiceMesh-Runtime-FaaS三位一体.pdf
ServiceMesh-Runtime-FaaS三位一体.pdf
 
IDC大会:新浪SAE架构与设计
IDC大会:新浪SAE架构与设计IDC大会:新浪SAE架构与设计
IDC大会:新浪SAE架构与设计
 
No sql@vip new
No sql@vip newNo sql@vip new
No sql@vip new
 
影响搜索引擎排名的因素
影响搜索引擎排名的因素影响搜索引擎排名的因素
影响搜索引擎排名的因素
 
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
2016 AWS Summit TPE - Hiiir 如何透過 AWS IAM 做好雲端權限控管
 
Customer Sharing: Hiiir
Customer Sharing: HiiirCustomer Sharing: Hiiir
Customer Sharing: Hiiir
 
AWS Career Exploration Day
AWS Career Exploration DayAWS Career Exploration Day
AWS Career Exploration Day
 

More from 毅 吕

the evolution of data infrastructure at lianjia
the evolution of data infrastructure at lianjiathe evolution of data infrastructure at lianjia
the evolution of data infrastructure at lianjia
毅 吕
 

More from 毅 吕 (7)

打造研发工程师的核心竞争力
打造研发工程师的核心竞争力打造研发工程师的核心竞争力
打造研发工程师的核心竞争力
 
the evolution of data infrastructure at lianjia
the evolution of data infrastructure at lianjiathe evolution of data infrastructure at lianjia
the evolution of data infrastructure at lianjia
 
SAE平台的灵活应用(吕毅、魏世江)
SAE平台的灵活应用(吕毅、魏世江)SAE平台的灵活应用(吕毅、魏世江)
SAE平台的灵活应用(吕毅、魏世江)
 
Lianjia data infrastructure, Yi Lyu
Lianjia data infrastructure, Yi LyuLianjia data infrastructure, Yi Lyu
Lianjia data infrastructure, Yi Lyu
 
链家网大数据平台枢纽——工具链,吕毅
链家网大数据平台枢纽——工具链,吕毅链家网大数据平台枢纽——工具链,吕毅
链家网大数据平台枢纽——工具链,吕毅
 
Analysis big data by use php with storm
Analysis big data by use php with stormAnalysis big data by use php with storm
Analysis big data by use php with storm
 
PHP & Performance
PHP & PerformancePHP & Performance
PHP & Performance
 

链家网存储架构变迁,吕毅