黑帽联盟

标题: keepalived工作原理和配置说明 [打印本页]

作者: 定位    时间: 2017-4-14 06:38
标题: keepalived工作原理和配置说明
keepalived是什么
keepalived是集群管理中保证集群高可用的一个服务软件,其功能类似于heartbeat,用来防止单点故障。

keepalived工作原理
keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。
keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。

keepalived的配置文件
keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、static_ipaddress、static_routes、vrrp_script、vrrp_instance和virtual_server。

global_defs区域
主要是配置故障发生时的通知对象以及机器标识

  1. global_defs {
  2.     notification_email {
  3.         a@abc.com
  4.         b@abc.com
  5.         ...
  6.     }
  7.     notification_email_from alert@abc.com
  8.     smtp_server smtp.abc.com
  9.     smtp_connect_timeout 30
  10.     enable_traps
  11.     router_id host163
  12. }
复制代码
static_ipaddress和static_routes区域
static_ipaddress和static_routes区域配置的是是本节点的IP和路由信息。如果你的机器上已经配置了IP和路由,那么这两个区域可以不用配置。其实,一般情况下你的机器都会有IP地址和路由信息的,因此没必要再在这两个区域配置。

  1. static_ipaddress {
  2.     10.210.214.163/24 brd 10.210.214.255 dev eth0
  3.     ...
  4. }
  5. static_routes {
  6.     10.0.0.0/8 via 10.210.214.1 dev eth0
  7.     ...
  8. }
复制代码

以上分别表示启动/关闭keepalived时在本机执行的如下命令:
  1. # /sbin/ip addr add 10.210.214.163/24 brd 10.210.214.255 dev eth0
  2. # /sbin/ip route add 10.0.0.0/8 via 10.210.214.1 dev eth0
  3. # /sbin/ip addr del 10.210.214.163/24 brd 10.210.214.255 dev eth0
  4. # /sbin/ip route del 10.0.0.0/8 via 10.210.214.1 dev eth0
复制代码
注意: 请忽略这两个区域,因为我坚信你的机器肯定已经配置了IP和路由。

vrrp_script区域
用来做健康检查的,当时检查失败时会将vrrp_instance的priority减少相应的值。

  1. vrrp_script chk_http_port {
  2.     script "</dev/tcp/127.0.0.1/80"
  3.     interval 1
  4.     weight -10
  5. }
复制代码

以上意思是如果script中的指令执行失败,那么相应的vrrp_instance的优先级会减少10个点。


vrrp_instance和vrrp_sync_group区域
vrrp_instance用来定义对外提供服务的VIP区域及其相关属性。
vrrp_rsync_group用来定义vrrp_intance组,使得这个组内成员动作一致。举个例子来说明一下其功能:
两个vrrp_instance同属于一个vrrp_rsync_group,那么其中一个vrrp_instance发生故障切换时,另一个vrrp_instance也会跟着切换(即使这个instance没有发生故障)。

  1. vrrp_sync_group VG_1 {
  2.     group {
  3.         inside_network   # name of vrrp_instance (below)
  4.         outside_network  # One for each moveable IP.
  5.         ...
  6.     }
  7.     notify_master /path/to_master.sh
  8.     notify_backup /path/to_backup.sh
  9.     notify_fault "/path/fault.sh VG_1"
  10.     notify /path/notify.sh
  11.     smtp_alert
  12. }
  13. vrrp_instance VI_1 {
  14.     state MASTER
  15.     interface eth0
  16.     use_vmac <VMAC_INTERFACE>
  17.     dont_track_primary
  18.     track_interface {
  19.         eth0
  20.         eth1
  21.     }
  22.     mcast_src_ip <IPADDR>
  23.     lvs_sync_daemon_interface eth1
  24.     garp_master_delay 10
  25.     virtual_router_id 1
  26.     priority 100
  27.     advert_int 1
  28.     authentication {
  29.         auth_type PASS
  30.         auth_pass 12345678
  31.     }
  32.     virtual_ipaddress {
  33.         10.210.214.253/24 brd 10.210.214.255 dev eth0
  34.         192.168.1.11/24 brd 192.168.1.255 dev eth1
  35.     }
  36.     virtual_routes {
  37.         172.16.0.0/12 via 10.210.214.1
  38.         192.168.1.0/24 via 192.168.1.1 dev eth1
  39.         default via 202.102.152.1
  40.     }
  41.     track_script {
  42.         chk_http_port
  43.     }
  44.     nopreempt
  45.     preempt_delay 300
  46.     debug
  47.     notify_master <STRING>|<QUOTED-STRING>
  48.     notify_backup <STRING>|<QUOTED-STRING>
  49.     notify_fault <STRING>|<QUOTED-STRING>
  50.     notify <STRING>|<QUOTED-STRING>
  51.     smtp_alert
  52. }
复制代码
注意: 同一网段中virtual_router_id的值不能重复,否则会出错,相关错误信息如下。
  1. Keepalived_vrrp[27120]: ip address associated with VRID not present in received packet :
  2. one or more VIP associated with VRID mismatch actual MASTER advert
  3. bogus VRRP packet received on eth1 !!!
  4. receive an invalid ip number count associated with VRID!
  5. VRRP_Instance(xxx) ignoring received advertisment...
复制代码

可以用这条命令来查看该网络中所存在的vrid:tcpdump -nn -i any net 224.0.0.0/8
首先nopreemt必须在state为BACKUP的节点上才生效(因为是BACKUP节点决定是否来成为MASTER的),其次要实现类似于关闭auto failback的功能需要将所有节点的state都设置为BACKUP,或者将master节点的priority设置的比BACKUP低。我个人推荐使用将所有节点的state都设置成BACKUP并且都加上nopreempt选项,这样就完成了关于autofailback功能,当想手动将某节点切换为MASTER时只需去掉该节点的nopreempt选项并且将priority改的比其他节点大,然后重新加载配置文件即可(等MASTER切过来之后再将配置文件改回去再reload一下)。
当使用track_script时可以不用加nopreempt,只需要加上preempt_delay 5,这里的间隔时间要大于vrrp_script中定义的时长。

virtual_server_group和virtual_server区域
virtual_server_group一般在超大型的LVS中用到,一般LVS用不过这东西,因此不多说。

  1. virtual_server IP Port {
  2.     delay_loop <INT>
  3.     lb_algo rr|wrr|lc|wlc|lblc|sh|dh
  4.     lb_kind NAT|DR|TUN
  5.     persistence_timeout <INT>
  6.     persistence_granularity <NETMASK>
  7.     protocol TCP
  8.     ha_suspend
  9.     virtualhost <STRING>
  10.     alpha
  11.     omega
  12.     quorum <INT>
  13.     hysteresis <INT>
  14.     quorum_up <STRING>|<QUOTED-STRING>
  15.     quorum_down <STRING>|<QUOTED-STRING>
  16.     sorry_server <IPADDR> <PORT>
  17.     real_server <IPADDR> <PORT> {
  18.         weight <INT>
  19.         inhibit_on_failure
  20.         notify_up <STRING>|<QUOTED-STRING>
  21.         notify_down <STRING>|<QUOTED-STRING>
  22.         # HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHECK
  23.         HTTP_GET|SSL_GET {
  24.             url {
  25.                 path <STRING>
  26.                 # Digest computed with genhash
  27.                 digest <STRING>
  28.                 status_code <INT>
  29.             }
  30.             connect_port <PORT>
  31.             connect_timeout <INT>
  32.             nb_get_retry <INT>
  33.             delay_before_retry <INT>
  34.         }
  35.     }
  36. }
复制代码
其他选项暂时不作说明。

keepalived主从切换
主从切换比较让人蛋疼,需要将backup配置文件的priority选项的值调整的比master高50个点,然后reload配置文件就可以切换了。当时你也可以将master的keepalived停止,这样也可以进行主从切换。

keepalived仅做HA时的配置
请看该文档同级目录下的配置文件示例。
说明:
10.210.214.113 为keepalived的备机,其配置文件为113.keepalived.conf
10.210.214.163 为keepalived的主机,其配置文件为163.keepalived.conf
10.210.214.253 为Virtual IP,即提供服务的内网IP地址,在网卡eth0上面
192.168.1.11 为模拟的提供服务的公网IP地址,在网卡eth1上面
用tcpdump命令来捕获的结果如下:

  1. 17:20:07.919419 IP 10.210.214.163 > 224.0.0.18: VRRPv2, Advertisement, vrid 1, prio 200, authtype simple, intvl 1s, length 20
复制代码
      
keepalived工作原理和配置说明
keepalived是什么
keepalived是集群管理中保证集群高可用的一个服务软件,其功能类似于heartbeat,用来防止单点故障。

keepalived工作原理
keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路由冗余协议。
虚拟路由冗余协议,可以认为是实现路由器高可用的协议,即将N台提供相同功能的路由器组成一个路由器组,这个组里面有一个master和多个backup,master上面有一个对外提供服务的vip(该路由器所在局域网内其他机器的默认路由为该vip),master会发组播,当backup收不到vrrp包时就认为master宕掉了,这时就需要根据VRRP的优先级来选举一个backup当master。这样的话就可以保证路由器的高可用了。
keepalived主要有三个模块,分别是core、check和vrrp。core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。check负责健康检查,包括常见的各种检查方式。vrrp模块是来实现VRRP协议的。

keepalived的配置文件
keepalived只有一个配置文件keepalived.conf,里面主要包括以下几个配置区域,分别是global_defs、static_ipaddress、static_routes、vrrp_script、vrrp_instance和virtual_server。

global_defs区域
主要是配置故障发生时的通知对象以及机器标识
global_defs {    notification_email {        a@abc.com        b@abc.com        ...    }    notification_email_from alert@abc.com    smtp_server smtp.abc.com    smtp_connect_timeout 30    enable_traps    router_id host163}static_ipaddress和static_routes区域
static_ipaddress和static_routes区域配置的是是本节点的IP和路由信息。如果你的机器上已经配置了IP和路由,那么这两个区域可以不用配置。其实,一般情况下你的机器都会有IP地址和路由信息的,因此没必要再在这两个区域配置。
static_ipaddress {    10.210.214.163/24 brd 10.210.214.255 dev eth0    ...}static_routes {    10.0.0.0/8 via 10.210.214.1 dev eth0    ...}以上分别表示启动/关闭keepalived时在本机执行的如下命令:
# /sbin/ip addr add 10.210.214.163/24 brd 10.210.214.255 dev eth0# /sbin/ip route add 10.0.0.0/8 via 10.210.214.1 dev eth0# /sbin/ip addr del 10.210.214.163/24 brd 10.210.214.255 dev eth0# /sbin/ip route del 10.0.0.0/8 via 10.210.214.1 dev eth0注意: 请忽略这两个区域,因为我坚信你的机器肯定已经配置了IP和路由。

vrrp_script区域
用来做健康检查的,当时检查失败时会将vrrp_instance的priority减少相应的值。
vrrp_script chk_http_port {    script "</dev/tcp/127.0.0.1/80"    interval 1    weight -10}以上意思是如果script中的指令执行失败,那么相应的vrrp_instance的优先级会减少10个点。

vrrp_instance和vrrp_sync_group区域
vrrp_instance用来定义对外提供服务的VIP区域及其相关属性。
vrrp_rsync_group用来定义vrrp_intance组,使得这个组内成员动作一致。举个例子来说明一下其功能:
两个vrrp_instance同属于一个vrrp_rsync_group,那么其中一个vrrp_instance发生故障切换时,另一个vrrp_instance也会跟着切换(即使这个instance没有发生故障)。
vrrp_sync_group VG_1 {    group {        inside_network   # name of vrrp_instance (below)        outside_network  # One for each moveable IP.        ...    }    notify_master /path/to_master.sh    notify_backup /path/to_backup.sh    notify_fault "/path/fault.sh VG_1"    notify /path/notify.sh    smtp_alert}vrrp_instance VI_1 {    state MASTER    interface eth0    use_vmac <VMAC_INTERFACE>    dont_track_primary    track_interface {        eth0        eth1    }    mcast_src_ip <IPADDR>    lvs_sync_daemon_interface eth1    garp_master_delay 10    virtual_router_id 1    priority 100    advert_int 1    authentication {        auth_type PASS        auth_pass 12345678    }    virtual_ipaddress {        10.210.214.253/24 brd 10.210.214.255 dev eth0        192.168.1.11/24 brd 192.168.1.255 dev eth1    }    virtual_routes {        172.16.0.0/12 via 10.210.214.1        192.168.1.0/24 via 192.168.1.1 dev eth1        default via 202.102.152.1    }    track_script {        chk_http_port    }    nopreempt    preempt_delay 300    debug    notify_master <STRING>|<QUOTED-STRING>    notify_backup <STRING>|<QUOTED-STRING>    notify_fault <STRING>|<QUOTED-STRING>    notify <STRING>|<QUOTED-STRING>    smtp_alert}注意: 同一网段中virtual_router_id的值不能重复,否则会出错,相关错误信息如下。  
Keepalived_vrrp[27120]: ip address associated with VRID not present in received packet :one or more VIP associated with VRID mismatch actual MASTER advertbogus VRRP packet received on eth1 !!!receive an invalid ip number count associated with VRID!VRRP_Instance(xxx) ignoring received advertisment...可以用这条命令来查看该网络中所存在的vrid:tcpdump -nn -i any net 224.0.0.0/8
首先nopreemt必须在state为BACKUP的节点上才生效(因为是BACKUP节点决定是否来成为MASTER的),其次要实现类似于关闭auto failback的功能需要将所有节点的state都设置为BACKUP,或者将master节点的priority设置的比BACKUP低。我个人推荐使用将所有节点的state都设置成BACKUP并且都加上nopreempt选项,这样就完成了关于autofailback功能,当想手动将某节点切换为MASTER时只需去掉该节点的nopreempt选项并且将priority改的比其他节点大,然后重新加载配置文件即可(等MASTER切过来之后再将配置文件改回去再reload一下)。
当使用track_script时可以不用加nopreempt,只需要加上preempt_delay 5,这里的间隔时间要大于vrrp_script中定义的时长。

virtual_server_group和virtual_server区域
virtual_server_group一般在超大型的LVS中用到,一般LVS用不过这东西,因此不多说。
virtual_server IP Port {    delay_loop <INT>    lb_algo rr|wrr|lc|wlc|lblc|sh|dh    lb_kind NAT|DR|TUN    persistence_timeout <INT>    persistence_granularity <NETMASK>    protocol TCP    ha_suspend    virtualhost <STRING>    alpha    omega    quorum <INT>    hysteresis <INT>    quorum_up <STRING>|<QUOTED-STRING>    quorum_down <STRING>|<QUOTED-STRING>    sorry_server <IPADDR> <PORT>    real_server <IPADDR> <PORT> {        weight <INT>        inhibit_on_failure        notify_up <STRING>|<QUOTED-STRING>        notify_down <STRING>|<QUOTED-STRING>        # HTTP_GET|SSL_GET|TCP_CHECK|SMTP_CHECK|MISC_CHECK        HTTP_GET|SSL_GET {            url {                path <STRING>                # Digest computed with genhash                digest <STRING>                status_code <INT>            }            connect_port <PORT>            connect_timeout <INT>            nb_get_retry <INT>            delay_before_retry <INT>        }    }}其他选项暂时不作说明。

keepalived主从切换
主从切换比较让人蛋疼,需要将backup配置文件的priority选项的值调整的比master高50个点,然后reload配置文件就可以切换了。当时你也可以将master的keepalived停止,这样也可以进行主从切换。

keepalived仅做HA时的配置
请看该文档同级目录下的配置文件示例。
说明:
10.210.214.113 为keepalived的备机,其配置文件为113.keepalived.conf
10.210.214.163 为keepalived的主机,其配置文件为163.keepalived.conf
10.210.214.253 为Virtual IP,即提供服务的内网IP地址,在网卡eth0上面
192.168.1.11 为模拟的提供服务的公网IP地址,在网卡eth1上面
用tcpdump命令来捕获的结果如下:
17:20:07.919419 IP 10.210.214.163 > 224.0.0.18: VRRPv2, Advertisement, vrid 1, prio 200, authtype simple, intvl 1s, length 20

LVS+Keepalived配置
注Keepalived与LVS结合使用时一般还会用到一个工具ipvsadm,用来查看相关VS相关状态,关于ipvsadm的用法可以参考man手册。
10.67.15.95为keepalived master,VIP为10.67.15.94,配置文件为95-lvs-keepalived.conf
10.67.15.96为keepalived master,VIP为10.67.15.94,配置文件为96-lvs-keepalived.conf
10.67.15.195为real server  
注意:
当使用LVS+DR+Keepalived配置时,需要在real server上添加一条iptables规则(其中dport根据情况添加或缺省):

  1. # iptables -t nat -A PREROUTING -p tcp -d 10.67.15.94 --dport 80 -j REDIRECT
复制代码

当使用LVS+NAT+Keepalived配置时,需要将real server的默认路由配置成Director的VIP10.67.15.94,必须确保client的请求是通过10.67.15.94到达real server的。


安装keepalived
从keepalived官网下载合适的版本,解压并执行如下命令完成安装。

  1. # cd keepalived-xxx
  2. # ./configure --bindir=/usr/bin --sbindir=/usr/sbin --sysconfdir=/etc --mandir=/usr/share
  3. # make && make install
复制代码

你也可以打成RPM包,然后安装。


说明
我们用到的HA场景如下: 两台主机host113和host163,内网IP在eth1网卡上,分别是10.210.214.113和10.210.214.163,VIP为公网IP在eth0上,IP地址是202.102.152.253,网关为202.102.152.1。当VIP在host113上提供服务时,host113上的默认路由为202.102.152.1,提供服务的端口为202.102.152.253:443。host113发生故障需要将VIP及服务切回到host163上的时候,需要以下几步,第一将VIP接管过来,第二添加默认路由202.102.152.1,第三启动在端口202.102.152.253:443上的服务。
如此一来,keepalived需要另外的脚本来完成添加默认路由和启动服务工作,这点和heartbeat中的resources是相同的。目前我进行了测试,发现keepalived速度要比heartbeat快,也就是说效率比heartbeat高。并且,最重要的一点,keepalived支持多个backup。
不要问我为何有以上需求。要为两个不同的域名提供https服务,由于SSL证书问题,必须有两个公网IP地址分别绑定443端口。
当然,通过SNI也可以实现一个公网IP绑定443端口来为多个域名提供https服务,但是这需要浏览器支持(M$的IE浏览器不支持)。(nginx/apache)

吐槽
keepalived的主从切换比较让人蛋疼,需要修改配置文件或停止一方的运行。但是由于keepalived是通过vrrp协议来实现failover(故障转移)的,因此也决定了手动主从切换的不便。
keepalived的文档也很旧了,一直都找不到合适的文档,之前我就一直忽略了vrrp_script这个区域,导致很多事情想不通。
另外,我发现我越来越喜欢keepalived了。。。






欢迎光临 黑帽联盟 (https://bbs.cnblackhat.com/) Powered by Discuz! X2.5