Mysql日志之Binary log(二进制日志)

1. 二进制日志(Binary log)

binlog可以说是mysql中比较重要的日志了,在日常开发及运维过程中,经常会遇到。

binlog即 Binary log,二进制日志文件,也叫做变更日志(update log)。它记录了数据库所有执行的DDL和DML等数据库更新事件语句。但是不包含没有修改任何数据的语句(如select、slow等)。

它以事件形式记录并保存在二进制文件中,通过这些信息,我们可以再现数据更新操作的全过程。

如果想要记录所有语句(例如:为了识别有问题的查询),需要使用通用查询日志。

1.1 Binary log 主要应用场景

  1. 用于数据恢复:如果mysql数据库意外停止,可以通过二进制日志文件来查看用户执行了哪些操作,对数据库服务器文件做了哪些修改,然后根据二进制日志文件中记录来恢复数据库服务器。
  1. 用于数据复制:由于日志的延续性和实效性,master把它的二进制文件传递给slaves来达到master-slave数据一致性的目的

可以说Mysql数据库的备份、主备、单主、多主、MGR都离不开Binary log,需要依靠Binary log来同步数据,保证数据一致性。

1.2 查看默认情况

查看记录二进制日志是否开启:在Mysql8默认情况下,二进制文件是开启的。

1
2
3
4
5
6
7
8
9
10
11
12
mysql> show variables like '%log_bin%';
+---------------------------------+------------------------------------+
| Variable_name | Value |
+---------------------------------+------------------------------------+
| log_bin | ON | //开关
| log_bin_basename | /usr/local/mysql/data/binlog | //存放路径
| log_bin_index | /usr/local/mysql/data/binlog.index |
| log_bin_trust_function_creators | OFF | //函数创建
| log_bin_use_v1_row_events | OFF |
| sql_log_bin | ON | //变更SQL记录
+---------------------------------+------------------------------------+
6 rows in set (0.04 sec)
  • log_bin_basename:是binlog日志的基本文件名,后面会追加标识来标识每一个文件
  • log_bin_index:是binlog文件的索引文件,这个文件管理了所有binlog文件的目录
  • log_bin_trust_function_creators:限制存储过程,二进制日志的一个重要功能是用于主从复制,而存储函数可能导致主从数据不一致。所以当开启二进制日志后,需要限制存储函数的创建、修改
    、调用。

  • log_bin_use_v1_row_events只读系统变量已弃用。 ON标识使用版本1二进制日志行,OFF标识使用版本2二进制日志行(Mysql5.6默认是2)

1.3 日志参数

永久性方式

修改Mysql的my.cnfmy.ini文件可以设置二进制日志的相关参数:

1
2
3
4
5
6
7
[mysqld]
#启用二进制日志
log-bin=mysql-bin
binlog_expire_logs_seconds= 600
max_binlog_size=100M
binlog-format=row #行级,记录每次操作后每行记录的变化。
binlog-do-db=cheetah #指定库,缩小监控的范围。
  • log-bin=mysql-bin:打开日志,这个可以自定义,可以设置为:/usr/log/mysql/binlog/mysql-bin,注意:新建的文件夹需要使用mysql用户,需要授权chown -R -v mysql:mysql binlog

  • binlog_expire_logs_seconds= 600:此参数控制二进制日志文件保留的时长,单位是秒;默认2592000(30天)

  • max_binlog_size=100M:控制单个二进制文件大小,当日志文件超过此变量是,执行切换操作。此参数最大和默认值都是1GB,该设置并不能严格控制binlog的大小,尤其是binlog比较靠近最大值而又遇到一个比较大的事务时,为了保证事务的完整性,可能不做切换日志的动作,只能将该事务所有的SQL都记录在当前日志文件,直到事务结束。一般情况下可采取默认值。

  • binlog-format=row:binlog 日志有三种格式:statement记录原生的SQLrowmixed

    1
    2
    3
    4
    5
    6
    mysql> show variables like 'binlog_format';
    +---------------+-------+
    | Variable_name | Value |
    +---------------+-------+
    | binlog_format | ROW | //行格式
    +---------------+-------+
    • statement:每一条修改语句都会记录在binlog中,优点:不需要记录每一行的变化,减少binlog的日志量,节约了IO,提高性能。
    • row:Mysql5.1x版本开始支持row level复制,它不记录SQL语句上下文相关信息,仅保存哪条记录被修改,优点:日志的内容会非常清楚的记录每一条数据的修改细节,而且不会出现某些特定情况下的存储过程/function/trigger的调用和触发无法被正确复制的问题。
    • mined: 从Mysql5.1.8开始支持,Mysql会判断这条SQL语句是否可能引起数据不一致,如果是,就用row格式,否则就用statement格式。实际上就是statement和row的结合。

临时性方式

如果不希望通过修改配置文件并重启的方式设置二进制日志的话,可以使用如下指令,需要注意的是在Mysql8里面只有会话级别的设置,没有global级别的设置。

1
2
mysql> set sql_log_bin=0;
Query OK, 0 rows affected (0.00 sec)

1.4 查看日志

当Mysql创建二进制日志文件是, 先创建一个以”filename”为名称、以”.index”为后缀的文件,再创建一个以”filename”为名称、以”.000001”为后缀的文件

Mysql服务重新启动依次,以”.000001”为后缀的文件就会增加一个,并且后缀名按1递增。即日志文件的数与Mysql服务启动的次数相同;如果日志长度超过了max_binlog_size的上限(默认1GB),就会创建一个新的日志文件。

查看当前的二进制日志文件列表及大小:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
mysql> show binary logs;        #查看binlog文件列表
+---------------+-----------+-----------+
| Log_name | File_size | Encrypted |
+---------------+-----------+-----------+
| binlog.000119 | 415 | No |
| binlog.000120 | 3627 | No |
| binlog.000121 | 156 | No |
+---------------+-----------+-----------+


mysql> show binlog events; ##只查看第一个binlog文件的内容
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+
| Log_name | Pos | Event_type | Server_id | End_log_pos | Info |
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+
| binlog.000119 | 4 | Format_desc | 1 | 125 | Server ver: 8.0.23, Binlog ver: 4 |
| binlog.000119 | 125 | Previous_gtids | 1 | 156 | |
| binlog.000119 | 156 | Anonymous_Gtid | 1 | 233 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS' |
| binlog.000119 | 233 | Query | 1 | 392 | use `test_mysql`; alter table user add UNIQUE INDEX in_name(name) USING BTREE /* xid=173 */ |
| binlog.000119 | 392 | Stop | 1 | 415 | |
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+


mysql> show binlog events in 'binlog.000119'; #查看指定binlog文件的内容
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+
| Log_name | Pos | Event_type | Server_id | End_log_pos | Info |
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+
| binlog.000119 | 4 | Format_desc | 1 | 125 | Server ver: 8.0.23, Binlog ver: 4 |
| binlog.000119 | 125 | Previous_gtids | 1 | 156 | |
| binlog.000119 | 156 | Anonymous_Gtid | 1 | 233 | SET @@SESSION.GTID_NEXT= 'ANONYMOUS' |
| binlog.000119 | 233 | Query | 1 | 392 | use `test_mysql`; alter table user add UNIQUE INDEX in_name(name) USING BTREE /* xid=173 */ |
| binlog.000119 | 392 | Stop | 1 | 415 | |
+---------------+-----+----------------+-----------+-------------+---------------------------------------------------------------------------------------------+


mysql> show master status; #查看当前正在写入的binlog文件
+---------------+----------+--------------+------------------+-------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+---------------+----------+--------------+------------------+-------------------+
| binlog.000121 | 1095 | | | |
+---------------+----------+--------------+------------------+-------------------+

所有对数据库的修改都会记录在binlog中。但binlog是二进制文件,无法直接查看,借助mysqlbinlog命令工具:

1
sudo /usr/local/mysql-8.0.23-macos10.15-x86_64/bin/mysqlbinlog -d seata '/usr/local/mysql-8.0.23-macos10.15-x86_64/data/binlog.000120'
  • 为防止binlog版本不一致,可以在前面加上/usr/local/mysql-8.0.23-macos10.15-x86_64/bin/mysqlbinlog

  • -d seata:指定数据库查看,或者使用-database

  • 如果加上 -v 表示将行事件以伪SQL的形式表现出来

  • 可以查看指定日期的日志,加上--start-datetime="2023-08-15 09:00:00" --stop-datetime="2023-08-17 20:00:00"

  • grep根据关键字检索

    1
    2
    3
    4
    5
    #drop关键字 
    指定路径/bin/mysqlbinlog --no-defaults --base64-output=decode-rows -v 指定路径/mysql_log/mysql3306_bin.000012 | grep -i drop

    #drop关键字前后各10行
    指定路径/bin/mysqlbinlog --no-defaults --base64-output=decode-rows -v 指定路径/mysql_log/mysql3306_bin.000012 | grep -i -A 10 -B 10 drop
  • 如果末尾加上 > 1.txt表示输出到1.txt里面

从执行结果可以看到,这是一个简单的日志文件,日志中记录了用户的一些操作,这里出现具体的SQL语句,这是因为我的binlog没有加密(生产环境需要加密);

执行一条Update语句:

1
UPDATE t_account SET amount = 5000 WHERE id = 1;

再次查看binlog日志:

可以看到一个Update语句包含如下事件:

  • Query 事件负责开始一个事务Begin

  • Table_map 事件负责映射需要的表

  • Update_rows 事件负责写入数据

  • Xid 事件负责结束事务

下面的命令将行事件以伪sql的形式显示出来

1
sudo mysqlbinlog -v -d seata '/usr/local/mysql-8.0.23-macos10.15-x86_64/data/binlog.000121'

上面的命令同时显示binlog格式的语句,如果如下命令不显示它

1
sudo mysqlbinlog -v --base64-output=DECODE-ROWS -d seata '/usr/local/mysql-8.0.23-macos10.15-x86_64/data/binlog.000121'

除了上面这些命令,还有常用的命令如下:

1
2
3
4
5
6
7
8
# 可查看参数帮助
mysqlbinlog --no-defaults --help

# 查看最后 100 行
mysqlbinlog --no-defaults --base64-output=decode-rows -vv atguigu-bin.000121 |tail - 100

# 根据position查找
mysqlbinlog --no-defaults --base64-output=decode-rows -vv atguigu-bin.000121 |grep -A 20 '230824'

上面这种方法读取出binlog日志的全文内容比较多,不容易分辨常看到pos点信息,可以使用更为方便的命令

1
show binlog events [IN 'log_name'] [FROM pos] [LIMIT [offset,] row_count];
  • IN 'log_name': 指定要查询的binlog文件名(不指定就是第一个binlog文件)

  • FROM pos: 指定从哪个pos起始点开始查询(不指定从整个文件首个pos点开始)

  • LIMIT [offset,]: 偏移量(不指定默认为0)

  • row_count: 查询总条数(默认所有行)

上面这条语句可以将指定的binlog日志文件分成有效事件行的方式返回,并可使用limit指定pos点的起始偏移、查询条数等。其他举例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#a、查询第一个最早的binlog日志:
show binlog events\G ;

#b、指定查询mysql-bin.088802这个文件
show binlog events in 'binlog.000119'\G;

#c、指定查询binlog.000119这个文件,从pos点:391开始查起:
show binlog events in 'binlog.000119' from 391\G;

#d、指定查询binlog.000119这个文件,从pos点:391开始查起,查询5条(即5条语句)
show binlog events in 'binlog.000119' from 391 limit 5\G

#e、指定查询 binlog.000119这个文件,从pos点:391开始查起,偏移2行〈即中间跳过2个)查询5条(即5条语句)。
show binlog events in 'binlog.000119' from 391 limit 2,5\G;

1.5 使用日志恢复数据

mysqlbinlog恢复数据的语法如下:

1
mysqlbinlog [option] filename|mysql -uuser -ppassword

使用mysqlbinlog命令来读取filename中的内容,然后使用mysql命令将这些呢绒恢复到数据库中。

  • filename: 日志文件名

  • option:可选项,比较重要的两对option参数是:

    • -start-date-stop-date:可以指定恢复数据库的起始时间和结束时间点
    • -start-position-stop-postion:可以指定恢复数据的开始位置和结束位置。

注意:使用mysqlbinlog命令恢复时,必须时编号小的先恢复,例如:binlog.000119必须在binlog.000120之前恢复

1
2
3
4

flush logs; -- 可以生成新的binlog文件,不然这个文件边恢复边增加,是不行的。

show binary logs; -- 查看有哪些binlog文件

恢复数据命令:

1
mysqlbinlog --no-defaults  --start-position=236  --stop-position=1071 --database=seata /usr/local/mysql-8.0.23-macos10.15-x86_64/data/binlog.000120 | /usr/bin/mysql -root -p123456 -v seata

1.6 删除二进制日志

Mysql的二进制文件可以配置自动删除,同时Mysql也提供了安全的手动删除二进制文件的方法:

  • PURGE MASTER LOGS:PURGE MASTER LOGS
  • RESET MASTER:删除所有的二进制日志文件

删除指定日志文件

1
2
3
# 语法
PURGE {MASTER | BINARY} LOGS TO ‘指定日志文件名’
PURGE {MASTER | BINARY} LOGS BEFORE ‘指定日期’
  • Example1:删除创建时间比binlog.000120早的所有日志
    1
    2
    3
    4
    5
    show binary logs;   -- 显示二进制日志文件列表,多次重启mysql服务,会生成多个日志文件

    PURGE MASTER LOGS to "binlog.000120"; -- 删除创建时间比binlog.000120早的所有日志

    show binary logs;
  • Example2: 删除2023年8月25日前的所有日志文件

    1
    2
    3
    4
    5
    show binary logs;

    mysqlbinlog --no-defaults "/usr/local/mysql-8.0.23-macos10.15-x86_64/data/binlog.000121";

    PURGE MASTER LOGS before "20220825"; -- 删除2023年8月25日前创建的所有日志文件

    2023年08月25号之前的二进制日志文件都已经被删除,最后一个没有删除,是因为当前在用,还未记录最后的时间,所以未被删除。

删除所有日志

1
reset master;

1.7 其他场景

二进制日志可以通过数据库的去全量备份和二进制日志中保存的增量信息,完成数据库的无损失恢复,但是如果遇到数据量大、数据库和数据表很多(比如分库分表的应用)的场景,用二进制日志进行数据恢复,时很有挑战性的,因为起止位置不容易管理。

在这种情况下,有效的解决方法时:配置主从数据库服务器,甚至是一主多从的架构,把二进制日志文件的内容通过中继日志,同步到从数据库服务器中,这样就可以有效避免数据库故障导致的数据异常等问题。

2. 深入理解二进制日志

2.1 写入机制

binlog的写入时机也非常简单,事务执行过程中,先把日志写到binlog cache,事务提交后再把binlog cache 写到binlog文件中。因为一个事务的binlog不能被拆开,无论这个事务多大,也要确保一次性写入,所以系统会给每个线程分配一个内存作为binlog cache

我们可以通过binlog_cache_size参数控制单个线程binlog cache 大小。如果存储内容超过了这个参数,就要暂存到磁盘Swap。binlog日志刷盘流程如下:

  • write: 把日志写入到文件系统的的page cache,并没有把数据持久化到磁盘,所以速度比较快
  • fsync:将数据持久化到磁盘

writefsync的时机可以由参数sync_binlog控制,默认是0。

1
2
3
4
5
6
mysql> show variables like 'sync_binlog';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| sync_binlog | 1 |
+---------------+-------+
  • sync_binlog = 0:表示每次提交事务都只write,由系统自行判断什么时候执行fsync。虽然性能的到提升,但是如果机器宕机,page cache中的binlog会丢失。

  • sync_binlog = 1:表示每次提交都会执行fsync,就如同redo log刷盘流程一样。最后还有一种折中方式,可以设置为N(N>1),表示每次提交事务都write,但是累计N个事务后才fsync。

    在出现IO瓶颈的场景里,将sync_binlog设置成一个比较的的只,可以提升性能。同样,如果出现机器宕机,会丢失最近N个事务的binlog日志。

2.2 binlog 与 redolog对比

  • redo log:它是物理日志,记录内容是在某个数据页上做了什么修改,属于InnoDB存储引擎层产生的。
  • binlog:它是逻辑日志,记录内容是语句的原始逻辑,属于Mysql server层

虽然它们都属于持久化的保证,但是侧重点不同:

  • redo log让InnoDB 存储引擎拥有了崩溃恢复的能力

  • binlog保证了Mysql集群架构的数据一致性

博文原地址:https://mp.weixin.qq.com/s/F0y3fYhQD86gpTWCijYkdA