1:先來說一下為什么會出現這種方案,以及這個方案是怎么回事兒?
只要是個服務,就都有掛的可能,Mysql也不例外,為了讓各位運維、DBA、和全棧工程師晚上能睡個安穩覺,有更多的時間和女朋友么么噠,我們希望數據庫服務器在宕機的時候能自動恢復過來,最少的影響用戶的體驗,留下更多的獎金買003。
這個時候我們的MHA(Mysql Highe Available)大顯身手了,他的原理就一句話:在Mysql的主從架構下,當主庫掛掉的時候,自動將備庫升級為主庫,同時為其他備庫重新設置新的主庫。
假設我們有服務器
A:192.168.1.60 (主庫)
B:192.168.1.70(備庫,備主[主庫宕機的情況,提升B為主庫])
C:192.168.1.80(備庫2)
D: 192.168.1.88 (manager,MHA管理中心,安裝MHA manager,在主庫和備庫上面都需要安裝MHA node,manager管理node很好理解吧)
讓B C 成為A的slave 機 就不在這里介紹了,很簡單的配置.
2:具體原理如下:
(1)從宕機崩潰的master保存二進制日志事件(binlog events);
(2)識別含有最新更新的slave;
(3)應用差異的中繼日志(relay log)到其他的slave;
(4)應用從master保存的二進制日志事件(binlog events);
(5)提升一個slave為新的master;
(6)使其他的slave連接新的master進行復制;
3:MHA的安裝,因為MHA的功能是通過perl腳本來實現的,所以我們要安裝perl環境
A: 讓A B C D四臺機子互相無密碼登陸
查看A B C D 主機 /root/.ssh/ 下面有沒有 id_rsa.pub 文件
如果沒有從新生成 ssh-keygen -t rsa -b 2048
然后通過scp命令拷貝到其他三臺機子,如下
[root@192.168.1.88 ~]# scp id_rsa.pub root@192.168.1.60:/root/.ssh/ //復制到主機60
[root@192.168.1.60 ~]# cat id_rsa.pub >> authorized_keys
安裝必要的perl庫,
[root@192.168.1.88 ~]# yum install cpan perl
[root@192.168.1.88 ~]# yum -y install perl-MIME-Lite perl-Params-Validate perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
[root@192.168.1.88 ~]# wget ftp://ftp.muug.mb.ca/mirror/centos/6.5/os/x86_64/Packages/compat-db43-4.3.29-15.el6.x86_64.rpm
[root@192.168.1.88 ~]# wget http://downloads.naulinux.ru/pub/NauLinux/6x/i386/sites/School/RPMS/perl-Log-Dispatch-2.27-1.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Mail-Sender-0.8.16-3.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://dl.fedoraproject.org/pub/epel/6/i386/perl-Mail-Sendmail-0.79-12.el6.noarch.rpm
[root@192.168.1.88 ~]# wget http://mirror.centos.org/centos/6/os/x86_64/Packages/perl-Time-HiRes-1.9721-136.el6.x86_64.rpm
[root@192.168.1.88 ~]# rpm -ivh perl-Parallel-ForkManager-0.7.9-1.el6.noarch.rpm perl-Log-Dispatch-2.27-1.el6.noarch.rpm perl-Mail-Sender-0.8.16-3.el6.noarch.rpm perl-Mail-Sendmail-0.79-12.el6.noarch.rpm perl-Time-HiRes-1.9721-136.el6.x86_64.rpm
再安裝MHA manager(在192.168.1.88上)
[root@192.168.1.88 ~]# wget https://downloads.mariadb.com/files/MHA/mha4mysql-manager-0.55-0.el6.noarch.rpm
[root@192.168.1.88 ~]# rpm -ivh mha4mysql-manager-0.55-0.el6.noarch.rpm
安裝過程中會出現一些缺失的庫,自己再去找對應的庫就好了;
再在從庫安裝MHA node(在192.168.1.50、192.168.1.60、192.168.1.70,A、B、C上)
[root@A-B-C ~]#wget https://downloads.mariadb.com/files/MHA/mha4mysql-node-0.54-0.el6.noarch.rpm
[root@A-B-C~]#rpm -ivh mha4mysql-node-0.54-0.el6.noarch.rpm
(缺失perl庫的話,按第一步來裝好)
配置Manager
shell> mkdir -p /masterha/app1 //創建app目錄,用來存放臨時數據文件,
shell> mkdir /etc/masterha //創建目錄,配置文件目錄
shell> vi /etc/masterha/app1.cnf //創建配置文件
[server default]
user=root //linux用于管理mysql用戶名
password=123456 //linux用于管理mysql密碼
manager_workdir=/masterha/app1
manager_log=/masterha/app1/manager.log
remote_workdir=/masterha/app1
ssh_user=root //ssh免密鑰登錄的帳號名
repl_user=slaver //mysql復制帳號,用來在主從機之間同步二進制日志等
repl_password=slaver //mysql密碼
ping_interval=1 //ping間隔,用來檢測master是否正常
[server2]
hostname=192.168.1.70
port=3306
[server3]
hostname=192.168.1.80
port=3306
設置relay log的清除方式(在每個slave節點上):
[root@192.168.0.80 ~]# mysql -e 'set global relay_log_purge=0'
[root@192.168.0.70 ~]# mysql -e 'set global relay_log_purge=0’
2、masterha_check_ssh工具驗證ssh信任登錄是否成功
[root@192.168.0.88 ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf
注意:用ssh-keygen實現4臺主機之間相互免密鑰登錄決定這一步是否成功。
Wed Apr 23 22:10:01 2014 - [debug] ok.
Wed Apr 23 22:10:01 2014 - [info] All SSH connection tests passed successfully.
3、masterha_check_repl工具驗證mysql復制是否成功
[root@192.168.0.88 ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf
注意:上一篇文章中的master--slaver是否成功決定這一步是否成功。或是MHA文件配置的用戶賬號有關。
port=3306
candidate_master=1
master_binlog_dir=/data/mysql
[server1]
hostname=192.168.1.60
Wed Apr 23 22:10:56 2014 - [info] Checking replication health on 192.168.1.232..
Wed Apr 23 22:10:56 2014 - [info] ok.
Wed Apr 23 22:10:56 2014 - [warning] master_ip_failover_script is not defined.
Wed Apr 23 22:10:56 2014 - [warning] shutdown_script is not defined.
Wed Apr 23 22:10:56 2014 - [info] Got exit code 0 (Not master dead).
MySQL Replication Health is OK
在出庫上面停止mysql,模擬宕機的情況
[root@192.168.0.60 ~]#service mysql stop
我們可以在manager 機器上面看到輸出的日志
[root@192.168.0.88 ~]tail -f /masterha/app1/manager.log