SlideShare a Scribd company logo
1 of 39
Download to read offline
Copyright © 2015 Mirantis, Inc. All rights reserved
Copyright © 2015 Mirantis, Inc. All rights reserved
training.mirantis.comtraining.mirantis.com
1
Release 1.0
Topic:深⼊入理理解 Ceph RGW 对象存储
Speaker:朱荣泽 & 任家英
Copyright © 2015 Mirantis, Inc. All rights reserved
2
• 对象存储对 OpenStack 的意义
• Ceph 对象存储 RGW 原理理解析
• 基于 Ceph 的对象存储的架构设计
• Ceph RGW 发展现状
• Ceph RGW 案例例分享
议 程
Copyright © 2015 Mirantis, Inc. All rights reserved 3
对象存储对 OpenStack 的意义
Copyright © 2015 Mirantis, Inc. All rights reserved
4
• 镜像存储(虚拟机镜像,容器器镜像)
• 视频,⾳音频,图⽚片的存储
• 归档/备份数据的存储
• ⼤大数据分析平台的存储⽀支持
• CDN
云平台的常⻅见存储需求
Copyright © 2015 Mirantis, Inc. All rights reserved
5
海海量量⾮非结构化数据的存储
• 访问特征
• ⼤大块的顺序读写(blob)
• 单次写⼊入,多次读取(WORM)
• ⼏几乎不不会修改
• ⽂文件的上传者和访问者并不不是同⼀一个⼈人
Copyright © 2015 Mirantis, Inc. All rights reserved
6
海海量量⾮非结构化数据的存储
• 存储特征
• 强调吞吐,⽽而不不是延迟
• 容量量都很⼤大,PB 甚⾄至 EB 级别
• 存储⽣生命周期⻓长,有些甚⾄至是永久归档
• 被存储的数据之间是没有关系或者是弱关系的
Copyright © 2015 Mirantis, Inc. All rights reserved
7
• 为复杂存储问题提供简单的使⽤用接⼝口
• 典型实现
• AWS S3
• OpenStack Swift
• 采⽤用 HTTP 协议,RESTfull ⻛风格的 API
• 3 个核⼼心概念
• ⽤用户 - 对象存储的使⽤用者,存储桶的拥有者
• 存储桶 - 作为存放对象的容器器
• 对象 - ⽤用户实际上传的⽂文件
海海量量⾮非结构化数据的存储
Copyright © 2015 Mirantis, Inc. All rights reserved 8
Ceph 对象存储 RGW 原理理解析
Copyright © 2015 Mirantis, Inc. All rights reserved
9
• Ceph 软件架构
• RGW 数据组织
• RGW IO 路路径
Ceph 对象存储 RGW 原理理解析
Copyright © 2015 Mirantis, Inc. All rights reserved 10
⼀一. Ceph 软件架构
Copyright © 2015 Mirantis, Inc. All rights reserved
11
Ceph 软件架构
Copyright © 2015 Mirantis, Inc. All rights reserved
12
RADOS 客户端编程接⼝口
• 命名空间 -> pool
• 存储单元 -> rados-object
• 键值对 -> omap/xattr
Copyright © 2015 Mirantis, Inc. All rights reserved
13
RGW - RADOS 的 HTTP 协议转发层
直接通过 librados 访问 RADOS 集群 通过 RGW 以 HTTP 请求访问 RADOS 集群
Copyright © 2015 Mirantis, Inc. All rights reserved
14
RADOS “对象” 和 RGW “对象” ⽐比较
Copyright © 2015 Mirantis, Inc. All rights reserved
15
⼆二. RGW 数据组织
Copyright © 2015 Mirantis, Inc. All rights reserved
16
数据组织的逻辑层级
• 元数据
• 每个⽤用户创建的存储桶(bucket per user)
• 存储桶索引 - 每个存储桶中的对象列列表(rgw-object per
bucket)
• 数据
• 每个对象拆分的 RADOS 层对象(rados-object per rgw-
object)
Copyright © 2015 Mirantis, Inc. All rights reserved
17
数据的实际存储
• 数据和元数据均保存在 RADOS 集群的存储池中
• 可扩展性为王,避免引⼊入额外的元数据管理理⽅方案
• 性能问题通过存储池的存储策略略去改善
Copyright © 2015 Mirantis, Inc. All rights reserved
18
3. RGW IO 路路径
Copyright © 2015 Mirantis, Inc. All rights reserved
19
RGW IO 路路径
Copyright © 2015 Mirantis, Inc. All rights reserved
20
RGW IO 路路径 -> HTTP 前端
• Civetweb(可嵌⼊入的 C++ 实现的
HTTP 服务端库)
• Loadgen(测试专⽤用,并不不处理理数据
IO)
• FCGI(作为 Apache 模块,⽀支持
CGI 协议)
• 新的 HTTP 前端
Copyright © 2015 Mirantis, Inc. All rights reserved
21
RGW IO 路路径 -> 与 RADOS 集群的交互
• 统⼀一的执⾏行行层
• 与 RADOS 交互的有两种⽅方式
• 调⽤用 librados 接⼝口函数
• 定义 object class(在 RADOS集群端
进⾏行行计算的机制,避免额外的数据传
输)
Copyright © 2015 Mirantis, Inc. All rights reserved
22
基于 Ceph 的对象存储的架构设计
Copyright © 2015 Mirantis, Inc. All rights reserved
23
• 架构设计的重要性?
• SDX
• 逻辑架构/⻆角⾊色划分
• ⼤大规模部署
• 对象存储的性能优化
• 对象存储系统与 OpenStack 的集成
基于 Ceph 的对象存储架构设计
Copyright © 2015 Mirantis, Inc. All rights reserved
架构设计 部署 验证 交付
扩展 运维 诊断 监控 Day Two
Day One
架构设计的重要性? 70%
Copyright © 2015 Mirantis, Inc. All rights reserved
架构设计的主要内容
Copyright © 2015 Mirantis, Inc. All rights reserved
SDX - 如何满⾜足客户的需求
Ceph是真正的SDS(软件定义存储),通过灵活的配置和堆服务器器硬件,可以让我们⾃自定义
存储集群的性能、容量量、可⽤用性、可靠性等指标,满⾜足当前的需求和未来战略略的需求。
Copyright © 2015 Mirantis, Inc. All rights reserved
逻辑架构/⻆角⾊色划分
Copyright © 2015 Mirantis, Inc. All rights reserved
⼤大规模部署
• 限定单个Cluster的规模,通过组合Cluster来扩展存储容量量
• 重新设计CRUSH MAP,优化数据可靠性和持久性
• ⾃自动化部署⼯工具,提⾼高部署效率,减少⼿手⼯工部署带来的错误
• 图形化管理理平台
• 部署前的硬盘配置检测、硬盘性能基准测试、⽹网络检测
Copyright © 2015 Mirantis, Inc. All rights reserved
对象存储的性能优化 - 我们的思路路
• 流⽔水线/排队论
• 先找到IOPS峰值
• Queue
• Op threads
• Msg cap
• 再优化Latency
• Msg cap
• Journal
• WBThrottle
• Cache
• CPU
Copyright © 2015 Mirantis, Inc. All rights reserved
30
•Glance
•Image, Snapshot
•Cinder
•Backup
•Sahara
•Hadoop
Ceph RGW 与 OpenStack 集成
Copyright © 2015 Mirantis, Inc. All rights reserved
31
Ceph RGW 发展现状
Copyright © 2015 Mirantis, Inc. All rights reserved
32
• 接⼝口功能
• S3 兼容功能
• Swift 兼容功能
• ⽤用户不不可⻅见的功能
Ceph RGW 功能分类
Copyright © 2015 Mirantis, Inc. All rights reserved
33
• 存储桶/对象操作
• 分段上传/下载
• get-by-range
• 数据管理理
• 对象多版本
• 对象⽣生命周期管理理
• 对象超时(开发中)
• 对象归档/恢复(不不⽀支持)
• 访问管理理
• 强制访问控制
• 访问协议
• 静态⽹网站托管(⽀支持)
• BitTorrent 协议⽀支持(开发中)
• 计费系统集成
• tagging(不不⽀支持)
• 请求者付费模式(⽀支持)
接⼝口功能 -> S3 接⼝口
Copyright © 2015 Mirantis, Inc. All rights reserved
34
• 除了了 CORS 之外,实现了了 http://developer.openstack.org/api-ref-
objectstorage-v1.html 标准定义的所有特性
• 其中的重要特性
• 多租户⽀支持(社区贡献)
• 对象多版本(Mirantis 贡献)
• 对象超时(Mirantis 贡献)
• 静态⼤大对象⽀支持(Mirantis 贡献)
• 静态⽹网站托管(Mirantis 贡献, review 中)
接⼝口功能 -> Swift 接⼝口
Copyright © 2015 Mirantis, Inc. All rights reserved
35
• 动态的存储桶索引分⽚片
• LDAP 认证集成
• 多数据中⼼心数据⽅方案 multisite v2
• 服务端加密(Mirantis 开发中)
• 服务端压缩(Mirantis 开发中)
⽤用户不不可⻅见功能
Copyright © 2015 Mirantis, Inc. All rights reserved
36
Ceph RGW 案例例分享
Copyright © 2015 Mirantis, Inc. All rights reserved 37
国外案例例- AT&T
业务挑战
● ⼤大规模多数据中⼼心运维管理理,
● 需要成熟的CI/CD解决⽅方案
● ⾼高性能需求,⾼高级功能定制开发
● 5PB的分布式存储规模
● 超过10个数据中⼼心的管理理
为什什么选择Mirantis
● Mirantis拥有⼤大规模集群部署经验
● Mirantis提供分布式存储Ceph
● Mirantis可以派遣驻场⼯工程师提供CI/CD设计实施
● Mirantis OpenStack提供OpenStack性能优化增强
● DPDK、SR-IOV、NUMA 和 vCPU绑定特性⽀支持
● 为客户提供功能定制开发和⻓长期维护
美国第⼆二⼤大电信
运营商
2013年年签订云平
台技术运维服务合同,
持续服务超过2年年。
Copyright © 2015 Mirantis, Inc. All rights reserved 38
国内案例例 – 百联集团
百联集团是中国零售百
强第1名,中国企业
500强第16名。
业务挑战
● 转型商务电⼦子化战略略性项⽬目
● 涵盖IT数据中⼼心新建,云平台建设,全渠道各应⽤用整合,全集团统⼀一技术架构、数据交
换平台,线上线下⽀支付系统,百联E商场电⼦子平台,消费⼤大数据平台等
● 云平台初期400台规模
● 分布式存储未来需要存储5000万级别的⾼高清图⽚片和视频,⼤大⼩小为⼏几M~⼏几G
为什什么使⽤用OpenStack和Ceph
● 主流开源云平台技术⽅方案,符合规模逐步扩容的⻓长期发展⽬目标
● OpenStack可提供灵活的⽹网络架构,满⾜足百联内部⽹网络架构规划
● 分布式存储Ceph的容量量和性能可以线性扩展
为什什么选择我们
● Mirantis OpenStack产品将为百联提供强⼤大的架构⽀支撑
● Mirantis Ceph分布式存储满⾜足百联对于海海量量图⽚片和视频⽂文件存储的需求
● ⼤大数据分析Sahara、应⽤用管理理Murano符合百联的业务需求
● UMCloud帮助百联建设⼀一⽀支强有⼒力力的Openstack运维、研发技术团队
Copyright © 2015 Mirantis, Inc. All rights reserved
39

More Related Content

What's hot

阿里云CDN技术演进之路
阿里云CDN技术演进之路阿里云CDN技术演进之路
阿里云CDN技术演进之路Joshua Zhu
 
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践美团点评技术团队
 
Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0qianshi
 
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2redhat9
 
Memcached vs redis
Memcached vs redisMemcached vs redis
Memcached vs redisqianshi
 
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路li luo
 
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentHow to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentAnna Yen
 
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Wensong Zhang
 
Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Feng Yu
 
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结redhat9
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化Joshua Zhu
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验Hanborq Inc.
 
美团技术沙龙04 - Kv Tair best practise
美团技术沙龙04 - Kv Tair best practise 美团技术沙龙04 - Kv Tair best practise
美团技术沙龙04 - Kv Tair best practise 美团点评技术团队
 
OpenStack Introduction Ecosystem
OpenStack Introduction EcosystemOpenStack Introduction Ecosystem
OpenStack Introduction EcosystemNUTC, imac
 
“云存储系统”赏析系列分享三:Sql与nosql
“云存储系统”赏析系列分享三:Sql与nosql“云存储系统”赏析系列分享三:Sql与nosql
“云存储系统”赏析系列分享三:Sql与nosqlknuthocean
 
Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3redhat9
 
美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术团队
 
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Ceph Community
 

What's hot (20)

阿里云CDN技术演进之路
阿里云CDN技术演进之路阿里云CDN技术演进之路
阿里云CDN技术演进之路
 
美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践美团点评技术沙龙010-Redis Cluster运维实践
美团点评技术沙龙010-Redis Cluster运维实践
 
Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0Traffic server 管理员指南v1.0
Traffic server 管理员指南v1.0
 
Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2Bypat博客出品-服务器运维集群方法总结2
Bypat博客出品-服务器运维集群方法总结2
 
Memcached vs redis
Memcached vs redisMemcached vs redis
Memcached vs redis
 
Ceph perf-tunning
Ceph perf-tunningCeph perf-tunning
Ceph perf-tunning
 
Ceph intro
Ceph introCeph intro
Ceph intro
 
云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路云梯的多Namenode和跨机房之路
云梯的多Namenode和跨机房之路
 
How to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environmentHow to plan a hadoop cluster for testing and production environment
How to plan a hadoop cluster for testing and production environment
 
Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务Taobao图片存储与cdn系统到服务
Taobao图片存储与cdn系统到服务
 
Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践Flash存储设备在淘宝的应用实践
Flash存储设备在淘宝的应用实践
 
Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结Bypat博客出品-服务器运维集群方法总结
Bypat博客出品-服务器运维集群方法总结
 
Nginx深度開發與客制化
Nginx深度開發與客制化Nginx深度開發與客制化
Nginx深度開發與客制化
 
Hadoop大数据实践经验
Hadoop大数据实践经验Hadoop大数据实践经验
Hadoop大数据实践经验
 
美团技术沙龙04 - Kv Tair best practise
美团技术沙龙04 - Kv Tair best practise 美团技术沙龙04 - Kv Tair best practise
美团技术沙龙04 - Kv Tair best practise
 
OpenStack Introduction Ecosystem
OpenStack Introduction EcosystemOpenStack Introduction Ecosystem
OpenStack Introduction Ecosystem
 
“云存储系统”赏析系列分享三:Sql与nosql
“云存储系统”赏析系列分享三:Sql与nosql“云存储系统”赏析系列分享三:Sql与nosql
“云存储系统”赏析系列分享三:Sql与nosql
 
Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3Bypat博客出品-服务器运维集群方法总结3
Bypat博客出品-服务器运维集群方法总结3
 
美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统美团点评技术沙龙14:美团云对象存储系统
美团点评技术沙龙14:美团云对象存储系统
 
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
Operation and Maintenance of Large-Scale All-Flash Memory Ceph Storage Cluste...
 

Viewers also liked

Ceph at Spreadshirt (June 2016)
Ceph at Spreadshirt (June 2016)Ceph at Spreadshirt (June 2016)
Ceph at Spreadshirt (June 2016)Jens Hadlich
 
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05Hang Geng
 
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Hang Geng
 
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)Jens Hadlich
 
CephFS update February 2016
CephFS update February 2016CephFS update February 2016
CephFS update February 2016John Spray
 
Red Hat Storage for Mere Mortals
Red Hat Storage for Mere MortalsRed Hat Storage for Mere Mortals
Red Hat Storage for Mere MortalsRed_Hat_Storage
 
Ceph at Work in Bloomberg: Object Store, RBD and OpenStack
Ceph at Work in Bloomberg: Object Store, RBD and OpenStackCeph at Work in Bloomberg: Object Store, RBD and OpenStack
Ceph at Work in Bloomberg: Object Store, RBD and OpenStackRed_Hat_Storage
 
Ceph Block Devices: A Deep Dive
Ceph Block Devices:  A Deep DiveCeph Block Devices:  A Deep Dive
Ceph Block Devices: A Deep DiveRed_Hat_Storage
 
Red Hat Gluster Storage Performance
Red Hat Gluster Storage PerformanceRed Hat Gluster Storage Performance
Red Hat Gluster Storage PerformanceRed_Hat_Storage
 
Storage tiering and erasure coding in Ceph (SCaLE13x)
Storage tiering and erasure coding in Ceph (SCaLE13x)Storage tiering and erasure coding in Ceph (SCaLE13x)
Storage tiering and erasure coding in Ceph (SCaLE13x)Sage Weil
 
Ceph Introduction 2017
Ceph Introduction 2017  Ceph Introduction 2017
Ceph Introduction 2017 Karan Singh
 
Hadoop over rgw
Hadoop over rgwHadoop over rgw
Hadoop over rgwzhouyuan
 
Personal information
Personal informationPersonal information
Personal informationHHSome
 
Spy Programs
Spy ProgramsSpy Programs
Spy ProgramsHHSome
 
Vocabulary yr
Vocabulary yrVocabulary yr
Vocabulary yrjdrinks
 
Phishing
PhishingPhishing
PhishingHHSome
 
Переговоры с китайскими партнерами. Особенности китайской бизнес культуры
Переговоры с китайскими партнерами. Особенности китайской бизнес культурыПереговоры с китайскими партнерами. Особенности китайской бизнес культуры
Переговоры с китайскими партнерами. Особенности китайской бизнес культурыОлег Дронов
 
FIIB Leadership Program 2013-14-Shreesti Ghosh
FIIB Leadership Program 2013-14-Shreesti GhoshFIIB Leadership Program 2013-14-Shreesti Ghosh
FIIB Leadership Program 2013-14-Shreesti GhoshShreesti Ghosh
 

Viewers also liked (20)

Ceph at Spreadshirt (June 2016)
Ceph at Spreadshirt (June 2016)Ceph at Spreadshirt (June 2016)
Ceph at Spreadshirt (June 2016)
 
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05
Ceph中国社区9.19 Ceph IO 路径 和性能分析-王豪迈05
 
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03Ceph中国社区9.19 Some Ceph Story-朱荣泽03
Ceph中国社区9.19 Some Ceph Story-朱荣泽03
 
Intorduce to Ceph
Intorduce to CephIntorduce to Ceph
Intorduce to Ceph
 
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)
Ceph Object Storage at Spreadshirt (July 2015, Ceph Berlin Meetup)
 
CephFS update February 2016
CephFS update February 2016CephFS update February 2016
CephFS update February 2016
 
Red Hat Storage for Mere Mortals
Red Hat Storage for Mere MortalsRed Hat Storage for Mere Mortals
Red Hat Storage for Mere Mortals
 
Ceph at Work in Bloomberg: Object Store, RBD and OpenStack
Ceph at Work in Bloomberg: Object Store, RBD and OpenStackCeph at Work in Bloomberg: Object Store, RBD and OpenStack
Ceph at Work in Bloomberg: Object Store, RBD and OpenStack
 
Ceph Block Devices: A Deep Dive
Ceph Block Devices:  A Deep DiveCeph Block Devices:  A Deep Dive
Ceph Block Devices: A Deep Dive
 
Red Hat Gluster Storage Performance
Red Hat Gluster Storage PerformanceRed Hat Gluster Storage Performance
Red Hat Gluster Storage Performance
 
Storage tiering and erasure coding in Ceph (SCaLE13x)
Storage tiering and erasure coding in Ceph (SCaLE13x)Storage tiering and erasure coding in Ceph (SCaLE13x)
Storage tiering and erasure coding in Ceph (SCaLE13x)
 
Ceph Introduction 2017
Ceph Introduction 2017  Ceph Introduction 2017
Ceph Introduction 2017
 
Hadoop over rgw
Hadoop over rgwHadoop over rgw
Hadoop over rgw
 
Personal information
Personal informationPersonal information
Personal information
 
Spy Programs
Spy ProgramsSpy Programs
Spy Programs
 
TDD carlos vences
TDD   carlos vencesTDD   carlos vences
TDD carlos vences
 
Vocabulary yr
Vocabulary yrVocabulary yr
Vocabulary yr
 
Phishing
PhishingPhishing
Phishing
 
Переговоры с китайскими партнерами. Особенности китайской бизнес культуры
Переговоры с китайскими партнерами. Особенности китайской бизнес культурыПереговоры с китайскими партнерами. Особенности китайской бизнес культуры
Переговоры с китайскими партнерами. Особенности китайской бизнес культуры
 
FIIB Leadership Program 2013-14-Shreesti Ghosh
FIIB Leadership Program 2013-14-Shreesti GhoshFIIB Leadership Program 2013-14-Shreesti Ghosh
FIIB Leadership Program 2013-14-Shreesti Ghosh
 

Similar to Divein ceph objectstorage-cephchinacommunity-meetup

稳定、高效、低碳 -淘宝软件基础设施构建实践
稳定、高效、低碳  -淘宝软件基础设施构建实践稳定、高效、低碳  -淘宝软件基础设施构建实践
稳定、高效、低碳 -淘宝软件基础设施构建实践Wensong Zhang
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践Wensong Zhang
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践lovingprince58
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践drewz lin
 
美团技术沙龙04 美团下一代分布式存储系统
美团技术沙龙04   美团下一代分布式存储系统美团技术沙龙04   美团下一代分布式存储系统
美团技术沙龙04 美团下一代分布式存储系统美团点评技术团队
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务drewz lin
 
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Jianwei Li
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统智杰 付
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Wensong Zhang
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02lovingprince58
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Michael Zhang
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统Dai Jun
 
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师Enlight Chen
 
Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师Wensong Zhang
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 
Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Ethan M. Liu
 
深入浅出 V cloud director
深入浅出 V cloud director深入浅出 V cloud director
深入浅出 V cloud directorITband
 
Accelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraAccelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraJunchi Zhang
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Etu Solution
 

Similar to Divein ceph objectstorage-cephchinacommunity-meetup (20)

稳定、高效、低碳 -淘宝软件基础设施构建实践
稳定、高效、低碳  -淘宝软件基础设施构建实践稳定、高效、低碳  -淘宝软件基础设施构建实践
稳定、高效、低碳 -淘宝软件基础设施构建实践
 
开源+自主开发 - 淘宝软件基础设施构建实践
开源+自主开发  - 淘宝软件基础设施构建实践开源+自主开发  - 淘宝软件基础设施构建实践
开源+自主开发 - 淘宝软件基础设施构建实践
 
Taobao base
Taobao baseTaobao base
Taobao base
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
淘宝软件基础设施构建实践
淘宝软件基础设施构建实践淘宝软件基础设施构建实践
淘宝软件基础设施构建实践
 
美团技术沙龙04 美团下一代分布式存储系统
美团技术沙龙04   美团下一代分布式存储系统美团技术沙龙04   美团下一代分布式存储系统
美团技术沙龙04 美团下一代分布式存储系统
 
淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务淘宝对象存储与Cdn系统到服务
淘宝对象存储与Cdn系统到服务
 
Cloudera企业数据中枢平台
Cloudera企业数据中枢平台Cloudera企业数据中枢平台
Cloudera企业数据中枢平台
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02Taobao 海量图片存储与CDN系统02
Taobao 海量图片存储与CDN系统02
 
Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统Taobao海量图片存储与cdn系统
Taobao海量图片存储与cdn系统
 
淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统淘宝图片存储与Cdn系统
淘宝图片存储与Cdn系统
 
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
章文嵩:Taobao海量图片存储与cdn系统 v2-系统架构师
 
Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师Taobao海量图片存储与cdn系统 v2-系统架构师
Taobao海量图片存储与cdn系统 v2-系统架构师
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 
Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能Oracle db 12c 加速企业转型之十大功能
Oracle db 12c 加速企业转型之十大功能
 
深入浅出 V cloud director
深入浅出 V cloud director深入浅出 V cloud director
深入浅出 V cloud director
 
Accelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud eraAccelerate Database as a Service(DBaaS) in Cloud era
Accelerate Database as a Service(DBaaS) in Cloud era
 
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
Track A-1: Cloudera 大數據產品和技術最前沿資訊報告
 

Divein ceph objectstorage-cephchinacommunity-meetup

  • 1. Copyright © 2015 Mirantis, Inc. All rights reserved Copyright © 2015 Mirantis, Inc. All rights reserved training.mirantis.comtraining.mirantis.com 1 Release 1.0 Topic:深⼊入理理解 Ceph RGW 对象存储 Speaker:朱荣泽 & 任家英
  • 2. Copyright © 2015 Mirantis, Inc. All rights reserved 2 • 对象存储对 OpenStack 的意义 • Ceph 对象存储 RGW 原理理解析 • 基于 Ceph 的对象存储的架构设计 • Ceph RGW 发展现状 • Ceph RGW 案例例分享 议 程
  • 3. Copyright © 2015 Mirantis, Inc. All rights reserved 3 对象存储对 OpenStack 的意义
  • 4. Copyright © 2015 Mirantis, Inc. All rights reserved 4 • 镜像存储(虚拟机镜像,容器器镜像) • 视频,⾳音频,图⽚片的存储 • 归档/备份数据的存储 • ⼤大数据分析平台的存储⽀支持 • CDN 云平台的常⻅见存储需求
  • 5. Copyright © 2015 Mirantis, Inc. All rights reserved 5 海海量量⾮非结构化数据的存储 • 访问特征 • ⼤大块的顺序读写(blob) • 单次写⼊入,多次读取(WORM) • ⼏几乎不不会修改 • ⽂文件的上传者和访问者并不不是同⼀一个⼈人
  • 6. Copyright © 2015 Mirantis, Inc. All rights reserved 6 海海量量⾮非结构化数据的存储 • 存储特征 • 强调吞吐,⽽而不不是延迟 • 容量量都很⼤大,PB 甚⾄至 EB 级别 • 存储⽣生命周期⻓长,有些甚⾄至是永久归档 • 被存储的数据之间是没有关系或者是弱关系的
  • 7. Copyright © 2015 Mirantis, Inc. All rights reserved 7 • 为复杂存储问题提供简单的使⽤用接⼝口 • 典型实现 • AWS S3 • OpenStack Swift • 采⽤用 HTTP 协议,RESTfull ⻛风格的 API • 3 个核⼼心概念 • ⽤用户 - 对象存储的使⽤用者,存储桶的拥有者 • 存储桶 - 作为存放对象的容器器 • 对象 - ⽤用户实际上传的⽂文件 海海量量⾮非结构化数据的存储
  • 8. Copyright © 2015 Mirantis, Inc. All rights reserved 8 Ceph 对象存储 RGW 原理理解析
  • 9. Copyright © 2015 Mirantis, Inc. All rights reserved 9 • Ceph 软件架构 • RGW 数据组织 • RGW IO 路路径 Ceph 对象存储 RGW 原理理解析
  • 10. Copyright © 2015 Mirantis, Inc. All rights reserved 10 ⼀一. Ceph 软件架构
  • 11. Copyright © 2015 Mirantis, Inc. All rights reserved 11 Ceph 软件架构
  • 12. Copyright © 2015 Mirantis, Inc. All rights reserved 12 RADOS 客户端编程接⼝口 • 命名空间 -> pool • 存储单元 -> rados-object • 键值对 -> omap/xattr
  • 13. Copyright © 2015 Mirantis, Inc. All rights reserved 13 RGW - RADOS 的 HTTP 协议转发层 直接通过 librados 访问 RADOS 集群 通过 RGW 以 HTTP 请求访问 RADOS 集群
  • 14. Copyright © 2015 Mirantis, Inc. All rights reserved 14 RADOS “对象” 和 RGW “对象” ⽐比较
  • 15. Copyright © 2015 Mirantis, Inc. All rights reserved 15 ⼆二. RGW 数据组织
  • 16. Copyright © 2015 Mirantis, Inc. All rights reserved 16 数据组织的逻辑层级 • 元数据 • 每个⽤用户创建的存储桶(bucket per user) • 存储桶索引 - 每个存储桶中的对象列列表(rgw-object per bucket) • 数据 • 每个对象拆分的 RADOS 层对象(rados-object per rgw- object)
  • 17. Copyright © 2015 Mirantis, Inc. All rights reserved 17 数据的实际存储 • 数据和元数据均保存在 RADOS 集群的存储池中 • 可扩展性为王,避免引⼊入额外的元数据管理理⽅方案 • 性能问题通过存储池的存储策略略去改善
  • 18. Copyright © 2015 Mirantis, Inc. All rights reserved 18 3. RGW IO 路路径
  • 19. Copyright © 2015 Mirantis, Inc. All rights reserved 19 RGW IO 路路径
  • 20. Copyright © 2015 Mirantis, Inc. All rights reserved 20 RGW IO 路路径 -> HTTP 前端 • Civetweb(可嵌⼊入的 C++ 实现的 HTTP 服务端库) • Loadgen(测试专⽤用,并不不处理理数据 IO) • FCGI(作为 Apache 模块,⽀支持 CGI 协议) • 新的 HTTP 前端
  • 21. Copyright © 2015 Mirantis, Inc. All rights reserved 21 RGW IO 路路径 -> 与 RADOS 集群的交互 • 统⼀一的执⾏行行层 • 与 RADOS 交互的有两种⽅方式 • 调⽤用 librados 接⼝口函数 • 定义 object class(在 RADOS集群端 进⾏行行计算的机制,避免额外的数据传 输)
  • 22. Copyright © 2015 Mirantis, Inc. All rights reserved 22 基于 Ceph 的对象存储的架构设计
  • 23. Copyright © 2015 Mirantis, Inc. All rights reserved 23 • 架构设计的重要性? • SDX • 逻辑架构/⻆角⾊色划分 • ⼤大规模部署 • 对象存储的性能优化 • 对象存储系统与 OpenStack 的集成 基于 Ceph 的对象存储架构设计
  • 24. Copyright © 2015 Mirantis, Inc. All rights reserved 架构设计 部署 验证 交付 扩展 运维 诊断 监控 Day Two Day One 架构设计的重要性? 70%
  • 25. Copyright © 2015 Mirantis, Inc. All rights reserved 架构设计的主要内容
  • 26. Copyright © 2015 Mirantis, Inc. All rights reserved SDX - 如何满⾜足客户的需求 Ceph是真正的SDS(软件定义存储),通过灵活的配置和堆服务器器硬件,可以让我们⾃自定义 存储集群的性能、容量量、可⽤用性、可靠性等指标,满⾜足当前的需求和未来战略略的需求。
  • 27. Copyright © 2015 Mirantis, Inc. All rights reserved 逻辑架构/⻆角⾊色划分
  • 28. Copyright © 2015 Mirantis, Inc. All rights reserved ⼤大规模部署 • 限定单个Cluster的规模,通过组合Cluster来扩展存储容量量 • 重新设计CRUSH MAP,优化数据可靠性和持久性 • ⾃自动化部署⼯工具,提⾼高部署效率,减少⼿手⼯工部署带来的错误 • 图形化管理理平台 • 部署前的硬盘配置检测、硬盘性能基准测试、⽹网络检测
  • 29. Copyright © 2015 Mirantis, Inc. All rights reserved 对象存储的性能优化 - 我们的思路路 • 流⽔水线/排队论 • 先找到IOPS峰值 • Queue • Op threads • Msg cap • 再优化Latency • Msg cap • Journal • WBThrottle • Cache • CPU
  • 30. Copyright © 2015 Mirantis, Inc. All rights reserved 30 •Glance •Image, Snapshot •Cinder •Backup •Sahara •Hadoop Ceph RGW 与 OpenStack 集成
  • 31. Copyright © 2015 Mirantis, Inc. All rights reserved 31 Ceph RGW 发展现状
  • 32. Copyright © 2015 Mirantis, Inc. All rights reserved 32 • 接⼝口功能 • S3 兼容功能 • Swift 兼容功能 • ⽤用户不不可⻅见的功能 Ceph RGW 功能分类
  • 33. Copyright © 2015 Mirantis, Inc. All rights reserved 33 • 存储桶/对象操作 • 分段上传/下载 • get-by-range • 数据管理理 • 对象多版本 • 对象⽣生命周期管理理 • 对象超时(开发中) • 对象归档/恢复(不不⽀支持) • 访问管理理 • 强制访问控制 • 访问协议 • 静态⽹网站托管(⽀支持) • BitTorrent 协议⽀支持(开发中) • 计费系统集成 • tagging(不不⽀支持) • 请求者付费模式(⽀支持) 接⼝口功能 -> S3 接⼝口
  • 34. Copyright © 2015 Mirantis, Inc. All rights reserved 34 • 除了了 CORS 之外,实现了了 http://developer.openstack.org/api-ref- objectstorage-v1.html 标准定义的所有特性 • 其中的重要特性 • 多租户⽀支持(社区贡献) • 对象多版本(Mirantis 贡献) • 对象超时(Mirantis 贡献) • 静态⼤大对象⽀支持(Mirantis 贡献) • 静态⽹网站托管(Mirantis 贡献, review 中) 接⼝口功能 -> Swift 接⼝口
  • 35. Copyright © 2015 Mirantis, Inc. All rights reserved 35 • 动态的存储桶索引分⽚片 • LDAP 认证集成 • 多数据中⼼心数据⽅方案 multisite v2 • 服务端加密(Mirantis 开发中) • 服务端压缩(Mirantis 开发中) ⽤用户不不可⻅见功能
  • 36. Copyright © 2015 Mirantis, Inc. All rights reserved 36 Ceph RGW 案例例分享
  • 37. Copyright © 2015 Mirantis, Inc. All rights reserved 37 国外案例例- AT&T 业务挑战 ● ⼤大规模多数据中⼼心运维管理理, ● 需要成熟的CI/CD解决⽅方案 ● ⾼高性能需求,⾼高级功能定制开发 ● 5PB的分布式存储规模 ● 超过10个数据中⼼心的管理理 为什什么选择Mirantis ● Mirantis拥有⼤大规模集群部署经验 ● Mirantis提供分布式存储Ceph ● Mirantis可以派遣驻场⼯工程师提供CI/CD设计实施 ● Mirantis OpenStack提供OpenStack性能优化增强 ● DPDK、SR-IOV、NUMA 和 vCPU绑定特性⽀支持 ● 为客户提供功能定制开发和⻓长期维护 美国第⼆二⼤大电信 运营商 2013年年签订云平 台技术运维服务合同, 持续服务超过2年年。
  • 38. Copyright © 2015 Mirantis, Inc. All rights reserved 38 国内案例例 – 百联集团 百联集团是中国零售百 强第1名,中国企业 500强第16名。 业务挑战 ● 转型商务电⼦子化战略略性项⽬目 ● 涵盖IT数据中⼼心新建,云平台建设,全渠道各应⽤用整合,全集团统⼀一技术架构、数据交 换平台,线上线下⽀支付系统,百联E商场电⼦子平台,消费⼤大数据平台等 ● 云平台初期400台规模 ● 分布式存储未来需要存储5000万级别的⾼高清图⽚片和视频,⼤大⼩小为⼏几M~⼏几G 为什什么使⽤用OpenStack和Ceph ● 主流开源云平台技术⽅方案,符合规模逐步扩容的⻓长期发展⽬目标 ● OpenStack可提供灵活的⽹网络架构,满⾜足百联内部⽹网络架构规划 ● 分布式存储Ceph的容量量和性能可以线性扩展 为什什么选择我们 ● Mirantis OpenStack产品将为百联提供强⼤大的架构⽀支撑 ● Mirantis Ceph分布式存储满⾜足百联对于海海量量图⽚片和视频⽂文件存储的需求 ● ⼤大数据分析Sahara、应⽤用管理理Murano符合百联的业务需求 ● UMCloud帮助百联建设⼀一⽀支强有⼒力力的Openstack运维、研发技术团队
  • 39. Copyright © 2015 Mirantis, Inc. All rights reserved 39