MySQL 主从复制事件校验 mysql Replication Event Checksum

2014-11-24 18:04:10 · 作者: · 浏览: 0

mysql 主从复制(replication) 同步速度快,简单易用,并且相当可靠。


不过,当你检查到主从数据不一致的时候,很难判断出问题所在(软件问题?硬件问题?网络传输问题?)


一个比较常见的情况是软硬件或者网络传输出错,导致主服务器上运行的sql语句与从服务器上运行的sql语句不一致(称为event corrupt)。


为了解决这个问题, mysql的开发人员在 5.6 Milestone Development Release版本中加入了 replication event checksum(主从复制事件校验)功能。


相关阅读:


----------------------------------------分割线----------------------------------------


当一个event被写入binary log(二进制日志)的时候,checksum也同时写入binary log,然后在event通过网络传输到从服务器(slave)之后,再在从服务器中对其进行验证并写入从服务器的relay log.


由于每一步都记录了event和checksum,所以我们可以很快地找出问题所在。


checksum使用zlib中的CRC-32算法,更具体地讲,是ISO-3309 CRC-32算法,虽然此算法效率非常高,但总是带来了一些额外的计算,至于会影响性能到怎样的地步,目前还没有benchmark。



[图1]


如图1所示,当箭头离开thread的时候,就可以生成checksum;当箭头进入thread的时候,就可以对checksum进行校验了。


不过由于某些原因,并非在所有的箭头处都进行了checksum。


event checksum功能,引入了三个新的参数:


binlog_checksum


默认为NONE, 表示在图1的箭头1 不生成checksum, 这样就可以兼容旧版本的mysql。


此外,就只能设置为CRC32了。


master_verify_checksum


可以设置为0或者1(默认为0)。 对应于图1中的箭头2。


设置为1的话,不仅dump thread会对event进行校验,当master上执行show binlog events的时候,也会对event进行校验。


设置为1,可以保证event被完整无缺地写入到主服务器的binlog中了。


不过,通常这个都设置为0。


slave_sql_verify_checksum


与master_verify_checksum类似,这个也只能设置为0或者1(默认为1)。


设置为1, 在图1的箭头4处会生成checksum,然后在箭头5处会对checksum进行验证。


看完这三个参数,再与图1进行一下比较,会发现在箭头3那里没有进行任何验证。


原文中的解释是:


在箭头4的时候,当IO thread把event写入到relay log的时候,会验证checksum。


This is not necessary since the checksum is verified when the event is written to the relay log at point 4, and the I/O thread just does a straight copy of the event。


当checksum出错的时候,会是怎样的呢?试试看吧。


这里与老版本的mysql一致, 暂时还看不到checksum的影子。