#准备环境

准备/etc/hosts

规划网络，分为public_network 和 cluster_network

增加ceph的yum repo

编辑文件/etc/yum.repos.d/ceph.repo

[ceph-updates]
baseurl=http://10.150.140.95/update/
name=Ceph packages
enabled=1
priority=1
gpgcheck=0

配置ntp

增加新用户cephadmin

ssh root@ceph-server
useradd -d /home/cephadmin -m cephadmin
passwd cephadmin

echo "cephadmin ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/cephadmin
chmod 0440 /etc/sudoers.d/cephadmin

配置用户cephadmin ssh无密码登陆

打开防火墙

端口 6789 用于monitor
端口 6800:7100 用于osd

禁用SELINUX

sudo setenforce 0

##所有节点安装ceph和客户端工具

yum install ceph striprados

安装monitor节点

yum install ceph-deploy

开始配置ceph.conf

su - cephadmin
mkdir mycluster

此后所有操作都用cephadmin用户在mycluster下进行

ceph-deploy new 初始moniter节点

修改ceph.conf文件

其中ms nocrc是给cpu受限的机器使用

如果确定osd的文件系统是xfs, filestore xattr use omap 为false. 同时filestore journal writeahead为true

如果使用自定义的crushmap, 设置osd crush update on start = false

如果使用osd-domain, 设置osd crush chooseleaf type = {osd-domain-num}

[global]
auth service required = cephx
filestore xattr use omap = true
auth client required = cephx
auth cluster required = cephx
mon host = 10.182.200.24,10.182.200.78,10.182.200.77
mon initial members = <初始moniter节点>
fsid = ee4ea70c-093f-4797-8d3d-871c0aacc92b
osd pool default size = 3
osd pool default min size = 2
osd pool default pg num = 128
osd pool default pgp num = 128
ms nocrc=true
public network = x.x.x.x/x
cluster network = x.x.x.x/x

[osd]
osd max backfills = 1
osd backfill scan min = 16
osd backfill scan max = 256
filestore op threads = 4
osd recovery max active = 1
osd recovery max chunk = 32M
osd recovery threads = 1
journal max write bytes = 32M
journal queue max bytes = 32M
mon osd down out interval  = 900

安装monitor节点

ceph-deploy mon create-initial

推送admin keyring到所有节点

sudo chmod +r /etc/ceph/ceph.client.admin.keyring
ceph-deploy admin <所有节点>

保留mycluster文件架，为以后自动添加monitor节点准备

检查

ceph -s

状态是HEALTH_ERR,无osd，mon节点都已经加入

手动安装OSD节点

所有osd节点用手动安装的方式, 使用root用户

创建osd号

ceph osd create

返回一个数字，这个数字就是osd的唯一号,记录为{osd-number}

ceph osd tree

检查出现osd.0,状态是down.

准备ceph osd文件夹

mkdir /var/lib/ceph/osd/ceph-{osd-number}
mkfs -t xfs /dev/disk
mount -o noatime /dev/disk /var/lib/ceph/osd/ceph-{osd-number}

在文件夹内建立osd keyring等数据

ceph-osd -i {osd-num} --mkfs --mkkey

检查文件夹/var/lib/ceph/osd/ceph-{osd-number}内容, 并建立sysvinit

touch  /var/lib/ceph/osd/ceph-{osd-number}/sysvinit

添加osd权限

ceph auth add osd.{osd-num} osd 'allow *' mon 'allow rwx' -i /var/lib/ceph/osd/ceph-{osd-num}/keyring

检查权限是否已经添加

ceph auth list

加入osd，权值1代表1T，所有如果是500G硬盘，就为0.5

ceph osd crush add osd.{osd-num} {weight} root=default host={机器名}

检查osd列表

ceph osd tree

启动ceph osd

/etc/init.d/ceph start osd

检查是否加入集群

ceph osd tree
ceph -s

操作ceph集群

删除默认的pool

ceph osd pool delete metadata metadata --yes-i-really-really-mean-it
ceph osd pool delete rbd rbd --yes-i-really-really-mean-it
ceph osd pool delete data data --yes-i-really-really-mean-it

删除pool中的object

rados rm <objectname> -p <poolname>；如果要删除全部object，则使用rados ls -p poolname列出objects，再调rados rm

建立新pool

pgsnum = (osd数量 * 100) / 副本数向上对齐

ceph osd pool create ${poolname} {pgnum} {pgnum}
ceph osd pool set video size {副本数}

查看参数

ceph --admin-daemon /var/run/ceph/ceph-osd.$id.asok config show

删除osd

ceph osd out {osd-num}
/etc/init.d/ceph stop osd.{osd-num}
ceph osd crush remove osd.{osd-num}
ceph osd crush remove `hostname -s`
ceph auth del osd.{osd-num}
ceph osd rm osd.{osd-num}

查看crushmap

ceph osd getcrushmap -o crush.out
crushtool -d crush.out -o crush.txt
ceph osd crush dump
ceph osd crush rule dump

增加一个bucket

例如增加一个bucket, 类型为rack, 名字为L1

ceph osd crush add-bucket L1 rack
ceph osd crush move L1 root=default
ceph osd crush move osd.{osd-num} rack=L1

加入一个自定义的osd

ceph osd crush add osd.{osd-num} {weight} {bucket-type}={bucket-name}

清理ceph数据

保证有一个干净的ceph环境

rm /etc/ceph/*.keyring
rm /etc/ceph/*.conf
rm /var/log/ceph/*
rm /var/lib/ceph/{bootstrap-mds,bootstrap-osd,mds,mon,osd}/*
ceph auth list #检查keyring被清除
kill -9 $pid_osd $pid_mds $pid_mon #杀死相关进程

ceph osd 维护模式

ceph osd set noout
/etc/init.d/ceph stop osd.{osd-num}

ceph injectargs 维护模式

#How often an Ceph OSD Daemon pings its peers (in seconds).
#默认为6
ceph tell osd.* injectargs '--osd-heartbeat-interval 10'

#The elapsed time when a Ceph OSD Daemon hasn’t shown a heartbeat that the Ceph Storage Cluster considers it down.
#默认为20
ceph tell osd.* injectargs '--osd-heartbeat-grace 30'

维护完成

/etc/init.d/ceph start osd.{osd-num}
ceph osd unset noout

手工添加mon节点

取得client.admin的keyring，保存到文件/etc/ceph/ceph.client.admin.keyring
取得mon.的keyring，保存到任意位置，记为{mon.keyring}

ceph auth get mon. -o {mon.keyring}
取得monitor map，保存到任意位置，记为{mon.map}

ceph mon getmap -o {mon.map}
Optional. 更新所有mon节点的配置文件，添加新节点的IP地址到ceph.conf [global]字段的mon_host
依上文配置文件配置新节点的ceph.conf

生成mon文件系统

 ceph-mon -i {mon-id} --mkfs --monmap {mon.map} --keyring {mon.keyring}

加入集群
```
 ceph mon add {mon-id} {ip}
```

告诉ceph可以启动了

 touch /var/lib/ceph/mon/ceph-{名称}/done
 touch /var/lib/ceph/mon/ceph-{名称}/sysvinit

启动mon服务
```
 service ceph start mon.{名称}
```

手工添加mds server

创建目录：

sudo mkdir /var/lib/ceph/mds/mds.0
生成mds.0的keyring，保存到/var/lib/ceph/mds/mds.0/mds.0.keyring： sudo ceph auth get-or-create mds.0 mds 'allow ' osd 'allow *' mon 'allow rwx' > /var/lib/ceph/mds/mds.0/mds.0.keyring

编辑ceph.conf:

 [mds]

 mds data = /var/lib/ceph/mds/mds.$id

 keyring = /var/lib/ceph/mds/mds.$id/mds.$id.keyring

 [mds.0]

 host = {hostname}

启动mds进程：
```
 service ceph start mds.0
```

在cephfs中使用erasure code pool的部署：

1.创建ec的profile：

	ceph osd erasure-code-profile set mds_profile k=3 m=2 ruleset-failure-domain=host

2.创建metadata的pool：

	ceph osd pool create metadata 4000 4000

3.创建ec data pool,名字为cold-storage:

	ceph osd pool create cold-storage 4000 4000 erasure mds_profile

4.创建cache storage pool:

	ceph osd pool create cache-storage 4000 4000

5.建立cache和cold的连接：

	ceph osd tier add  cold-storage cache-storage

6.设置cache的模式为writeback:

	ceph osd tier cache-mode cache-storage writeback

7.设置overlay

	ceph osd tier set-overlay cold-storage cache-storage

8..创建fs

	ceph fs new cephfs_20141201 metadata cold-storage

9.设置hit_set_type

	ceph osd pool set cache-storage hit_set_type bloom

内核设置

####ceph tcp tunning####
net.core.rmem_max = 33554432
net.core.wmem_max = 33554432
net.core.rmem_default = 33554432
net.core.wmem_default = 33554432
net.core.optmem_max = 40960
net.ipv4.tcp_rmem = 4096 87380 33554432
net.ipv4.tcp_wmem = 4096 65536 33554432

#increase the max packet backlog
net.core.somaxconn = 1024
net.core.netdev_max_backlog = 50000
net.ipv4.tcp_max_syn_backlog = 30000
net.ipv4.tcp_max_tw_buckets = 2000000
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_fin_timeout = 10

#Disable TCP slow start on idle connections
net.ipv4.tcp_slow_start_after_idle = 0

ceph radosgw apache 打开keepalive后,设置内核参数(测试中)

net.ipv4.tcp_keepalive_probes = 20
net.ipv4.tcp_keepalive_intvl = 60
net.ipv4.tcp_keepalive_time = 600

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ceph-deploy-cn.markdown

ceph-deploy-cn.markdown

准备/etc/hosts

规划网络，分为public_network 和 cluster_network

增加ceph的yum repo

配置ntp

增加新用户cephadmin

配置用户cephadmin ssh无密码登陆

打开防火墙

禁用SELINUX

安装monitor节点

开始配置ceph.conf

修改ceph.conf文件

安装monitor节点

推送admin keyring到所有节点

检查

手动安装OSD节点

操作ceph集群

删除默认的pool

删除pool中的object

建立新pool

查看参数

删除osd

查看crushmap

增加一个bucket

加入一个自定义的osd

清理ceph数据

ceph osd 维护模式

ceph injectargs 维护模式

维护完成

手工添加mon节点

手工添加mds server

在cephfs中使用erasure code pool的部署：

内核设置

Files

ceph-deploy-cn.markdown

Latest commit

History

ceph-deploy-cn.markdown

File metadata and controls

准备/etc/hosts

规划网络，分为public_network 和 cluster_network

增加ceph的yum repo

配置ntp

增加新用户cephadmin

配置用户cephadmin ssh无密码登陆

打开防火墙

禁用SELINUX

安装monitor节点

开始配置ceph.conf

修改ceph.conf文件

安装monitor节点

推送admin keyring到所有节点

检查

手动安装OSD节点

操作ceph集群

删除默认的pool

删除pool中的object

建立新pool

查看参数

删除osd

查看crushmap

增加一个bucket

加入一个自定义的osd

清理ceph数据

ceph osd 维护模式

ceph injectargs 维护模式

维护完成

手工添加mon节点

手工添加mds server

在cephfs中使用erasure code pool的部署：

内核设置