• 6. 增加/删除 Monitor
    • 6.1 增加 Monitor(手动)
    • 6.2 增加 Monitor( ceph-deploy )
    • 6.3 删除 Monitor(手动)
    • 6.4 删除 Monitor(从不健康的集群中)
    • 6.5 删除 Monitor( ceph-deploy )

    6. 增加/删除 Monitor


    一个集群可以只有一个 monitor,我们推荐生产环境至少部署 3 个。 Ceph 使用 Paxos 算法的一个变种对各种 map 、以及其它对集群来说至关重要的信息达成共识。建议(但不是强制)部署奇数个 monitor 。Ceph 需要 mon 中的大多数在运行并能够互相通信,比如单个 mon,或 2 个中的 2 个,3 个中的 2 个,4 个中的 3 个等。初始部署时,建议部署 3 个 monitor。后续如果要增加,请一次增加 2 个。

    6.1 增加 Monitor(手动)

    1、在目标节点上,新建 mon 的默认目录。{mon-id} 一般取为节点的 hostname 。

    1. ssh {new-mon-host}
    2. sudo mkdir /var/lib/ceph/mon/ceph-{mon-id}

    2、创建一个临时目录(和第 1 步中的目录不同,添加 mon 完毕后需要删除该临时目录),来存放新增 mon 所需的各种文件,

    1. mkdir {tmp}

    3、获取 mon 的 keyring 文件,保存在临时目录下。

    1. ceph auth get mon. -o {tmp}/{key-filename}

    4、获取集群的 mon map 并保存到临时目录下。

    1. ceph mon getmap -o {tmp}/{map-filename}

    5、格式化在第 1 步中建立的 mon 数据目录。需要指定 mon map 文件的路径(获取法定人数的信息和集群的 fsid )和 keyring 文件的路径。

    1. sudo ceph-mon -i {mon-id} --mkfs --monmap {tmp}/{map-filename} --keyring {tmp}/{key-filename}

    6、启动节点上的 mon 进程,它会自动加入集群。守护进程需要知道绑定到哪个 IP 地址,可以通过 --public-addr {ip:port} 选择指定,或在 ceph.conf 文件中进行配置 mon addr

    1. ceph-mon -i {mon-id} --public-addr {ip:port}

    6.2 增加 Monitor( ceph-deploy )

    还可以通过 ceph-deploy 工具很方便地增加 MON。

    1、登入 ceph-deploy 工具所在的 Ceph admin 节点,进入工作目录。

    1. ssh {ceph-deploy-node}
    2. cd /path/ceph-deploy-work-path

    2、执行下列命令,新增 Monitor:

    1. ceph-deploy mon create {host-name [host-name]...}

    注意: 在某一主机上新增 Mon 时,如果它不是由 ceph-deploy new 命令所定义的,那就必须把 public network 加入 ceph.conf 配置文件。

    6.3 删除 Monitor(手动)

    当你想要删除一个 mon 时,需要考虑删除后剩余的 mon 个数是否能够达到法定人数。

    1、停止 mon 进程。

    1. stop ceph-mon id={mon-id}

    2、从集群中删除 monitor。

    1. ceph mon remove {mon-id}

    3、从 ceph.conf 中移除 mon 的入口部分(如果有)。

    6.4 删除 Monitor(从不健康的集群中)

    本小节介绍了如何从一个不健康的集群(比如集群中的 monitor 无法达成法定人数)中删除 ceph-mon 守护进程。

    1、停止集群中所有的 ceph-mon 守护进程。

    1. ssh {mon-host}
    2. service ceph stop mon || stop ceph-mon-all
    3. # and repeat for all mons

    2、确认存活的 mon 并登录该节点。

    1. ssh {mon-host}

    3、提取 mon map。

    1. ceph-mon -i {mon-id} --extract-monmap {map-path}
    2. # in most cases, that's
    3. ceph-mon -i `hostname` --extract-monmap /tmp/monmap

    4、删除未存活或有问题的的 monitor。比如,有 3 个 monitors,mon.amon.bmon.c,现在仅有 mon.a 存活,执行下列步骤:

    1. monmaptool {map-path} --rm {mon-id}
    2. # for example,
    3. monmaptool /tmp/monmap --rm b
    4. monmaptool /tmp/monmap --rm c

    5、向存活的 monitor(s) 注入修改后的 mon map。比如,把 mon map 注入 mon.a,执行下列步骤:

    1. ceph-mon -i {mon-id} --inject-monmap {map-path}
    2. # for example,
    3. ceph-mon -i a --inject-monmap /tmp/monmap

    6、启动存活的 monitor。

    7、确认 monitor 是否达到法定人数( ceph -s )。

    8、你可能需要把已删除的 monitor 的数据目录 /var/lib/ceph/mon 归档到一个安全的位置。或者,如果你确定剩下的 monitor 是健康的且数量足够,也可以直接删除数据目录。

    6.5 删除 Monitor( ceph-deploy )

    1、登入 ceph-deploy 工具所在的 Ceph admin 节点,进入工作目录。

    1. ssh {ceph-deploy-node}
    2. cd /path/ceph-deploy-work-path

    2、如果你想删除集群中的某个 Mon ,可以用 destroy 选项。

    1. ceph-deploy mon destroy {host-name [host-name]...}

    注意: 确保你删除某个 Mon 后,其余 Mon 仍能达成一致。如果不可能,删除它之前可能需要先增加一个。