在 Linux 上实现 MySQL 高可用的主流方案与落地步骤
一、方案总览与选型建议
| 方案 | 架构要点 | 自动故障切换 | 一致性 | 典型场景 | 复杂度 |
|---|---|---|---|---|---|
| 主从复制 + 虚拟 IP(Keepalived/HAProxy) | 一主一备或一主多从,应用通过 VIP 访问写库,读可扩展从库 | 是(Keepalived 检测与漂移) | 最终一致(异步复制) | 读写分离、读多写少 | 中 |
| 主主复制 + Keepalived | 双主互为主从,配合 auto_increment_offset/increment 避免主键冲突,单点写入 | 是(配合脚本/仲裁) | 最终一致(需谨慎冲突处理) | 双活写、就近写入 | 中高 |
| MHA(Master High Availability) | 一主多从,管理节点检测主库故障并提升新主,支持半同步 | 是 | 强一致倾向(配合半同步) | 高可用且需自动切换 | 中 |
| InnoDB Cluster / Group Replication(MGR) | 多节点组复制,多数派提交,内置故障转移 | 是 | 强一致(多数派) | 原生高可用、云原生友好 | 中高 |
| PXC(Percona XtraDB Cluster)/ Galera | 多主多写,基于认证的复制,几乎同步 | 是 | 强一致(几乎同步) | 多写、强一致需求 | 高 |
| 共享存储(Heartbeat + SAN/DRBD) | 共享块/存储,主备切换 | 是 | 强一致(取决于共享存储) | 传统企业环境 | 高(成本与复杂度) |
| 上述方案各有取舍,选型时优先考虑业务对一致性、写入并发、运维复杂度与成本的权衡。 |
二、快速落地路径
路径 A:主从复制 + Keepalived 实现自动切换(适合读多写少)
[mysqld]
server-id=1
log-bin=mysql-bin
binlog_format=ROW
CREATE USER 'repl'@'%' IDENTIFIED BY 'ReplPass!';
GRANT REPLICATION SLAVE ON *.* TO 'repl'@'%';
FLUSH PRIVILEGES;
SHOW MASTER STATUS;[mysqld]
server-id=2
relay-log=mysql-relay-bin
read-only=1
CHANGE MASTER TO
MASTER_HOST='主库IP',
MASTER_USER='repl',
MASTER_PASSWORD='ReplPass!',
MASTER_LOG_FILE='mysql-bin.000001',
MASTER_LOG_POS=154;
START SLAVE;
SHOW SLAVE STATUS\G,确保 Slave_IO_Running/Slave_SQL_Running=Yes。sudo apt-get install keepalived(或 yum)/usr/bin/mysqladmin ping,失败阈值与权重调整实现主备切换vrrp_script check_mysql {
script "/usr/bin/mysqladmin ping"
interval 2
weight -1
fall 3
rise 2
}
vrrp_instance VI_1 {
interface eth0
state BACKUP
virtual_router_id 51
priority 100
advert_int 1
authentication { auth_type PASS; auth_pass StrongPass; }
virtual_ipaddress { 192.168.1.100/24 }
track_script { check_mysql }
}
systemctl start keepalived路径 B:MHA 实现一主多从的自动故障转移(适合需要自动选主的场景)
masterha_manager --conf=/etc/mha/app1.cnfmasterha_master_switch --master_state=dead 等命令完成切换与回切策略。路径 C:InnoDB Cluster / Group Replication(MGR,原生高可用)
[mysqld]
server-id=1
log-bin=mysql-bin
binlog_format=ROW
gtid-mode=ON
enforce_gtid_consistency=ON
disabled_storage_engines=MyISAM,BLACKHOLE
SET SQL_LOG_BIN=0;
CREATE USER rpl_user@'%' IDENTIFIED BY 'RplPass!';
GRANT REPLICATION SLAVE ON *.* TO rpl_user@'%';
FLUSH PRIVILEGES;
SET SQL_LOG_BIN=1;
CHANGE MASTER TO MASTER_USER='rpl_user', MASTER_PASSWORD='RplPass!'
FOR CHANNEL 'group_replication_recovery';
INSTALL PLUGIN group_replication SONAME 'group_replication.so';
SET GLOBAL group_replication_bootstrap_group=ON;
START GROUP_REPLICATION;
SET GLOBAL group_replication_bootstrap_group=OFF;
CHANGE MASTER TO MASTER_USER='rpl_user', MASTER_PASSWORD='RplPass!'
FOR CHANNEL 'group_replication_recovery';
START GROUP_REPLICATION;
dba.createCluster(...)、cluster.addInstance(...)、cluster.status()。三、关键配置与最佳实践
rpl_semi_sync_master_enabled/rpl_semi_sync_slave_enabled)。auto_increment_offset/auto_increment_increment,确保自增主键不冲突;严格限制仅单点写入或使用分布式 ID。Seconds_Behind_Master)、主从 IO/SQL 线程状态、VIP 漂移、连接数、慢查询等;关键指标阈值告警。四、常见陷阱与排查要点
SHOW SLAVE STATUS\G 的 Last_Error/Exec_Master_Log_Pos。binlog_format、gtid_mode 等全局参数,变更前在测试环境验证。