Couchbase introduction - Chinese

Couchbase-端到端的NoSQL解决方案
曾臻– Couchbase 解决方案架构师
vickie@couchbase.com

©2014 Couchbase Inc.
Couchbase提供了端到端的数据管理解决方案
3
高可用性的缓存键值存储文档数据库嵌入式的移动数据
库
数据同步功能
通用的平台能力，支持广泛的应用和用户案例
Enterprises often start with cache, then broaden usage to other apps and use cases

核心能力
©2014 Couchbase, Inc. 4
• 开发人员的易用性为中心
 支持JSON
 数据的索引和查询
 增量的Map-Reduce索引数据
更新
• 灵活的水平扩展
 同一的节点类型，以及
Shared-nothing 架构
 跨数据中心的数据复制
 一键式的扩展能力
• 一致性下的高性能
 内嵌的基于对象的分布式缓存层
 细粒度的锁机制
 哈希分区
• 高可用性
 无须宕机的管理操作和升级操作
 流式数据复制，机架感知能力
 强大的集群监控能力（web console，
restful API，及命令行）

不同的行业客户及互联网客户
5
CommunicationsTechnology
Travel &
Hospitality
Media &
Entertainment
E-Commerce &
Digital Advertising
Retail & Apparel
Games & GamingFinance &
Business Services

用户案例总结
6
360 Degree
Customer View
Profile
managment
Catalog Fraud
Detection
Content
Management
Internet of
Things
Digital
Communicatio
n
Real Time
Big Data
Mobile
Application
s
Personalization

核心技术概念
©2014 Couchbase, Inc.

键值存储
• Couchbase 是一个键值文档数据库
• 键-支持长度最大为256字节的UTF-8字符串
• 值可以是:
- 简单数据类型：字符, 数字, 日期, 布尔型, 以及二进制数据都可以被存储 – 上述数据都是以
Base64编码的字符形式存储
- 复杂数据类型：字典/哈希, 数组/列表, 以JSON格式存储 (简单列表可以表达为由分隔符分割
的字符串)
- JSON 可以理解为特殊格式的字符串- 包含自嵌套的简单以及复杂数据类型
- 可以没有明确要求的Schema，动态的更改文档结构，现在更新，同类型的文档可以包含完
全不同的属性

Couchbase 支持丰富数据类型的存储
Key-Value 存储文档存储
2014-06-23-10:15am : 75F
2014-06-23-11:30am : 77F
2014-06-23-02:00pm : 82F
0001:
{firstname: “Dipti”,
lastname: “Borkar”,
language: “English”,
time_zone: “PST”,
zip: 94403
}
键 - UTF-8字符，最长256字节
值 – 可以使0-20兆字节 (推荐值的大小不超过1 MB)

 可以表达复杂的对象和数据结构
 非常简单的表达, 轻量, 结构紧凑, 可读性高
 通用API的返回类型
 Facebook, Twitter, 等大型SNS都返回JSON
 基于Javascript
 Couchbase支持原生的存储JSON
 序列化/反序列化十分快速
JSON数据格式的优势

文档的存储和获取
Couchbase 集群
服务器节点
用户/应用数据
存在于
Data Buckets
文档
读出/ 写入
组成了
客户端
服务器
动态扩展
基于哈希分区

User Object
string uid
string firstname
string lastname
int age
array favorite_colors
string email
u::john@couchbase.com
{ “uid”: 123456,
“firstname”: “John”,
“lastname”: “Smith”,
“age”: 22,
“favorite_colors”: [“blue”, “black”],
“email”: “john@couchbase.com”
}
User Object
string uid
string firstname
string lastname
int age
array favorite_colors
string email
u::john@couchbase.com
{ “uid”: 123456,
“firstname”: “John”,
“lastname”: “Smith”,
“age”: 22,
“favorite_colors”: [“blue”, “black”],
“email”: “john@couchbase.com”
}
insert()/rep
lace()/upse
rt()
get()
对象到JSON的序列化和反序列化

演示一数据建模 Data model

核心架构
同一的节点类型

所有服务器上安装同样节点
Heartbeat
Processmonitor
Globalsingletonsupervisor
Configurationmanager
on each node
Rebalanceorchestrator
Nodehealthmonitor
one per clusa
vBucketstateandreplicationmanager
http
RESTmanagementAPI/WebUI
HTTP
8091
Erlang port mapper
4369
Distributed Erlang
21100 - 21199
Erlang/OTP
storage interface
Couchbase EP Engine
11210
Memcapable 2.0
Moxi
11211
Memcapable 1.0
Memcached
Persistence Layer
8092
Query API
QueryEngine
Data Manager Cluster Manager

节点- 写入操作
33 2
Managed Cache
DiskQueue
Disk
Replication
Queue
App Server
节点间-内存到内存的数
据复制
Doc
DocDoc

Managed Cache
Disk
节点- 读取操作
Managed Cache
Doc 1
Get
Doc 1
Doc 1Doc 1
App Server
DiskQueue
Replication
Queue
据复制

Disk
Managed Cache
节点- 缓存删除
Doc 1
Doc 1
Doc 2Doc 3Doc 4Doc 5Doc 6
App Server
DiskQueue
Replication
Queue
据复制

节点- 缓存失效
33 2
DiskQueue
Disk
Replication
Queue
App Server
据复制
Doc 1
Doc 1
Doc 1Doc 1
Managed Cache
Get
Doc 1

集群层操作

 每个bucket中都包含活跃的和备份的数据集
 每个数据集（活跃/备份）都包含1024 个分区(vBuckets)
 文档的读取和写入等操作与分区vBuckets进行交互
 相同的文档ID，每次都被哈希到相同的分区
 分区vBucket可以在节点之间移动(rebalance)
 vBucket和物理服务器之间的对应关系存储在cluster map中
 每个virtual bucket 包含整个数据集的1/1024
自动分区 – Bucket and vBuckets
vB
Data buckets
vB
1 ….. 1024
1024个逻辑分区
virtual bucket
21

Cluster Map

Cluster Map – 新增两个节点

read/write/update
Active
SERVER 1
Active
SERVER 2
Active
SERVER 3
APP SERVER 1
COUCHBASE Client Library
CLUSTER MAP
CLUSTER MAP
APP SERVER 2
Shard
5
Shard
2
Shard
9
Shard
Shard
Shard
Shard
4
Shard
7
Shard
8
Shard
Shard
Shard
Shard
1
Shard
3
Shard
6
Shard
Shard
Shard
Replica Replica Replica
Shard
4
Shard
1
Shard
8
Shard
Shard
Shard
Shard
6
Shard
3
Shard
2
Shard
Shard
Shard
Shard
7
Shard
9
Shard
5
Shard
Shard
Shard
集群层操作
• 数据均匀的分布在每个节点上
• 每个节点即包含活跃数据也包含备
份数据
- 在同一时间，数据只有一个拷贝处于
active状态
• 客户端library 提供给应用与数据库
交互的接口
• Cluster map 记录了1024个vbuket
和节点的映射关系
- 应用无需操心任何与数据分区和数据寻
址相关的工作
• 应用负责读，写，更新数据
• 多个应用可以同时访问相同的数据

SERVER 4 SERVER 5
Replica
Active
Replica
Active
read/write/update
APP SERVER 1
CLUSTER MAP
CLUSTER MAP
APP SERVER 2
Active
SERVER 1
Shard
9
Shard
Replica
Shard
4
Shard
1
Shard
8
Shard
Shard
Shard
Active
SERVER 2
Shard
8
Shard
Replica
Shard
6
Shard
3
Shard
2
Shard
Shard
Shard
Active
SERVER 3
Shard
6
Shard
Replica
Shard
7
Shard
9
Shard
5
Shard
Shard
Shard
read/write/update
Shard
5
Shard
2
Shard
Shard
Shard
4
Shard
7
Shard
Shard
Shard
1
Shard
3
Shard
Shard
增加节点
• 一键式的扩展性，在集群中增加两
个服务器
• 随着节点容量的增加，文档数据自
动的在节点间进行重分布
- 平均分布
- 最小量的节点间数据移动
• 数据重分布完成后，更新Cluster
map
• 应用的请求平均分布在新的处理能
力的集群上

故障恢复
SERVER 4 SERVER 5
Replica
Active
Replica
Active
App Server 1
CLUSTER MAP
CLUSTER MAP
App Server 2
Active
SERVER 1
Shard 5
Shard 2
Shard 9Shard
Shard
Shard
Replica
Shard 4
Shard 1
Shard 8Shard
Shard
Shard
Active
SERVER 2
Shard 4
Shard 7 Shard 8
Shard
Shard Shard
Replica
Shard 6
Shard 3 Shard 2
Shard
Shard Shard
Active
SERVER 3
Shard 1
Shard 3
Shard 6Shard
Shard
Shard
Replica
Shard 7
Shard 9
Shard 5Shard
Shard
Shard
• 应用访问数据分片
• Server3发生故障，发送到
Server 3的请求失败
• 集群侦测到服务器失效
o 将其他节点的备份数据分
区编程活跃数据分区
o 更新cluster map
• 请求被路由到可用的节点
• 自动故障恢复后，需要进行
数据的重分布
Shard 1 Shard 3
Shard

跨数据中心复制 (XDCR)
• 持续的从源端集群向目标端集群进行集群间数据复制
• 支持单向或者双向的数据操作
• 任一集群都支持应用的读写操作 (active – active 复制)
• 复制的吞吐量可以线性扩展
• 易于管理：通过console，Rest ，或者命令行CLI

跨数据中心复制(XDCR)
单向复制
• 热备份/ 灾难恢复
• 开发/测试环境的拷贝
• 复制到索引集群
• 集成Solr，ElasticSearch分布式文本检索引擎
• 定制化集成

跨数据中心复制(XDCR)
双向复制
• 多个活跃集群
• 为全球性应用提供Data locality
• 灾难恢复

33 2
数据写入后的跨数据中心复制
2
Managed Cache
DiskQueue
Disk
Replication
Queue
App Server
Couchbase Server Node
Doc 1
Doc 1
XDCR
Queue
Doc 1Doc 1
(New in 3.0)
内存到内存的跨级群
节点数据复制节点间-内存到内存的数
据复制
31

数据视图View
• 视图和数据查询
– 分布式的索引和查询
– Secondary indexes
– 基于index的灵活查询
• 增量的索引更新
– 分布式的实时数据分析
– 只有更新的数据进行view engine
• 全文检索Full Text Search
– 和ElasticSearch / Solr 的集成
– 使用XDCR的能力

33 2
33
Managed Cache
DiskQueue
Disk
Replication
Queue
应用服务器
Couchbase Server Node
Doc 1
Doc 1
节点间-内存到内存的数据复制
View engine Doc 1Doc 1
数据写入后的索引视图构建

Active
SERVER 1
Shard
5
Shard
2
Shard
Shard
Replica
Shard
4
Shard
1
Shard
Shard
Shard
1
Active
SERVER 3
Shard
5
Shard
2
Shard
Shard
Replica
Shard
4
Shard
1
Shard
Shard
Shard
1
Active
SERVER 2
Shard
5
Shard
2
Shard
Shard
Replica
Shard
4
Shard
1
Shard
Shard
Shard
1
APP SERVER 1
CLUSTER MAP
CLUSTER MAP
APP SERVER 2
Couchbase Server 架构 – 视图
• 分布式的索引视图
• 支持海量的数据集
• 并行的索引构建
• 每个节点的数据对应自己的
索引视图
• 查询合并结果，返回客户端

演示二集群操作& XDCR演示&视图查询

SQL for Document （开发者评估版）
下一代, NoSQL 查询语言
 类SQL : SELECT * FROM WHERE/LIKE/JOIN/GROUP/etc, CREATE INDEX
 针对JSON的扩展，用以支持嵌套的和层次型的数据结构
 支持索引视图，和新的secondary索引
 Query (DQL), Manipulation (DML), Description (DDL)
 ODBC/JDBC drivers –由simba提供
整合到Couchbase 4.0（目前官网上有开发者评估版下载）:
 集成安装
 多线程，无状态的查询和索引组件
 基于Couchbase 高性能，高可扩展性的

Couchbase中的数据查询
表达式查询语言
Java script 视图& spatial views
 使用增加维护的Map Reduce计算
 对于聚合操作的预构建和计算
 适合分析，报表以及大数据等用力场景
SQL for Document
 SQL-Like
 构建secondary indexes
 极其适合即席查询和数据分析查询

SQL For Document的拓扑
Client SDK
App
Index
CB Node
ODBC /
JDBC
App
Query
Manager
Data
Index
CB Node
Query
Manager
Data
Index
CB Node
Query
Manager
Data
Index
CB Node
Query
Manager
Data
Index
CB Node
Query
Manager
Data
Index
CB Node
Query
Manager
Data
Connectivity & ecosystem
Node services & independent scaling
Scale-out query throughput
ODBC /
JDBC
BI Tool

查询过程
Index
Nodes
Clients
Data
Nodes
(1) Request (6) Response
Query
Nodes
(2) Plan: Query to execution plan (5) Evaluate: Documents to results
(3) Scan: Attributes to keys (4) Fetch: Keys to documents

在查询服务内部的流程
Index
Client
Data
FetchScanParse Plan Join Filter
Pre-Aggregate
Offset Limit Project
Data-parallel — Query latency benefits from N cores
Memory-bound
Pluggable architecture — datastore, index, client, …
Request Response
SortAggregate

演示三 Couchbase SQL for Document

Couchbase introduction - Chinese

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Similar to Couchbase introduction - Chinese

Similar to Couchbase introduction - Chinese (20)

Couchbase introduction - Chinese

Editor's Notes