Ceph性能优化
杨冠军
硬件选型
• SATA盘:

• ⼤大容量量:4T / 8T

• ⾼高带宽:每个约200MB/s

• SSD盘:

• ⾼高IOPS,低延时

• 容量量较⼩小:800G

• ⽐比率:

• 结合实际需求,SSD / SATA⽐比率为:1 / 3
系统调整
• kernel threads限制

• /proc/sys/kernel/pid_max

• 磁盘调度算法

• SATA:“deadline”

• SSD:“noop”

• 磁盘的read ahead调整

• /sys/block/sd[x]/queue/read_ahead_kb
CRUSH规划
• Class

• SATA

• SSD

• Roles

• 数据分布

• 数据均衡

• 故障隔离
参数调整
• 参数个数:1400+

# ceph daemon osd.0 config show | grep "_" | wc –l

1425

• 参数分类:57

• 常⽤用优化:Client端,OSD端,MDS端
OSD参数
• FileStore

• journal

• xfs

• BlueStore

• db / wal分离

• 参数优化
性能测试
• 测试⼯工具:

• Ceph⾃自动:rados bench <seconds> write|seq|rand

• 外部⼯工具:dd,fio

• 测试⽅方法:

• 实际使⽤用模式测试

• 避免系统cache影响

• BandWidth,IOPS,Latency
Ceph软件栈
• Client

• Enternet

• Messenger

• ObjectStore

• BlueStore

• Disk
IO Path和分析⼯工具
• Client

• 性能监控:BandWidth,IOPS,Latency,CPU,内存

• ⽹网络

• iperf,sar

• OSD

• Bluestore:ceph osd perf,ceph daemonperf等

• cpu:htop,perf

• Disk

• iostat:%util, rw/s, await等

• iotop
OSD性能分析
• ceph osd perf

• ceph daemon <osd> perf dump

• ceph daemon <osd> dump_historic_ops

• ceph daemon <osd> dump_ops_in_flight

• ceph daemonperf <osd>

• 监控历史
Q&A

Ceph perf-tunning