问题: MySQL同步报错故障处理总结

异步半同步区别

异步复制

简单的说就是master把binlog发送过去,不管slave是否接收完,也不管是否执行完,这一动作就结束了.

半同步复制

简单的说就是master把binlog发送过去,slave确认接收完,但不管它是否执行完,给master一个信号我这边收到了,这一动作就结束了。(谷歌写的代码,5.5上正式应用。)

异步的劣势

当master上写操作繁忙时,当前POS点例如是10,而slave上IO_THREAD线程接收过来的是3,此时master宕机,会造成相差7个点未传送到slave上而数据丢失。

常见错误

第一种:在master上删除一条记录,而slave上找不到。

Last_SQL_Error: Could not execute Delete_rows event on table hcy.t1; 
Can't find record in 't1', 
Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; 
the event's master log mysql-bin.000006, end_log_pos 254

第二种:主键重复。在slave已经有该记录,又在master上插入了同一条记录。

第三种:丢失数据,在master上更新一条记录,而slave上找不到,丢失了数据。

特殊情况

  • slave的中继日志relay-bin损坏。

    这种情况SLAVE在宕机,或者非法关机,例如电源故障、主板烧了等,造成中继日志损坏,同步停掉。

  • 人为失误需谨慎:多台slave存在重复server-id。

    这种情况同步会一直延时,永远也同步不完,error错误日志里一直出现上面两行信息。解决方法就是把server-id改成不一致即可。

问题处理

第一个:删除失败

在master上删除一条记录,而slave上找不到。

解决方法:

由于master要删除一条记录,而slave上找不到故报错,这种情况主上都将其删除了,那么从机可以直接跳过。可用命令:

第二个:主键重复

在slave已经有该记录,又在master上插入了同一条记录。

解决方法

在slave上用desc hcy.t1; 先看下表结构:

删除重复的主键

在master上和slave上分别确认。

第三种:更新丢失

在master上更新一条记录,而slave上找不到,丢失了数据。

解决方法:

在master上,用mysqlbinlog 分析下出错的binlog日志在干什么。

在slave上,查找下更新后的那条记录,应该是不存在的。

然后再到master查看

把丢失的数据在slave上填补,然后跳过报错即可。

第四个:中继日志损坏

slave的中继日志relay-bin损坏。

手工修复

解决方法:找到同步的binlog和POS点,然后重新做同步,这样就可以有新的中继日值了。

以执行写的binlog和POS点为准。

Last updated

Was this helpful?