mysql锁总结

     最近做了一次和MySQL(innoDB)锁有关的技术分享,记录一下
     为了能尽量准确简洁的描述innoDB的锁机制,看了好多的文章,由于innoDB中的锁系统确实非常复杂,细节特别多,如有纰漏和谬误,还请联系改正

innoDB锁简介

     innoDb支持多种粒度的锁,按照粒度来分,可分为表锁(LOCK_TABLE)行锁(LOCK_REC)
     一般的锁系统都会有共享锁排他锁的分类,共享锁也叫读锁排他锁也叫写锁。加在同一个资源上,写锁会阻塞另外一把写锁或读锁的获取,读锁则允许另外一把读锁的获取,也就是读读之间允许并发,读写或者写写会阻塞,innodb中表锁和行锁都支持共享锁(简写S)排他锁(简写X)
     因为innoDB支持多粒度的锁,允许表锁和行锁的并存,为了方便多粒度锁冲突的判断,innoDB中还存在一种名叫意向锁(Intention Locks)的锁。
     除此之外,还有一种特殊的表锁,自增锁,主要用来并发安全的生成自增id,一种特殊的意向锁,插入意向锁,用来防止幻读问题

表锁

     表锁,锁定的粒度是整个表,也分共享锁和排他锁。不同于行锁,表锁MySQL Server层就有实现(所以MyISAM支持表锁,也只支持表锁),innoDb则在存储引擎层面也实现了一遍表锁(后面会介绍具体结构)。
     哪些时候会触发表锁呢?在执行某些ddl时,比如alter table等操作,会对整个表加锁,也可以手动执行锁表语句:LOCK TALBES table_name [READ | WRITE],READ为共享锁,WRITE为排他锁,手动解锁的语句为:UNLOCK TABLES,会直接释放当前会话持有的所有表锁

有一些需要注意的地方:

官网上建议的表锁的使用方法:

SET autocommit=0;
LOCK TABLES t1 WRITE, t2 READ, ...;
... do something with tables t1 and t2 here ...
COMMIT;
UNLOCK TABLES;

实际业务中,没有特殊理由,不建议使用表锁,因为锁的粒度太大了,极大的影响并发

意向锁

    意向锁是一种特殊的表级锁,意向锁是为了让InnoDB多粒度的锁能共存而设计的。取得行的共享锁和排他锁之前需要先取得表的意向共享锁(IS)和意向排他锁(IX),意向共享锁和意向排他锁都是系统自动添加和自动释放的,整个过程无需人工干预。
    主要是用来辅助表级和行级锁的冲突判断,因为Innodb支持行级锁,如果没有意向锁,则判断表锁和行锁冲突的时候需要遍历表上所有行锁,有了意向锁,则只要判断表是否存在意向锁就可以知道是否有行锁了。表级别锁的兼容性如下表:

XIXSIS
XConflictConflictConflictConflict
IXConflictCompatibleConflictCompatible
SConflictConflictCompatibleCompatible
ISConflictCompatibleCompatibleCompatible

可以看到,意向锁与意向锁兼容,IX、IS自身以及相互都兼容,不互斥,因为意向锁仅表示下一层级加什么类型的锁,不代表当前层加什么类型的锁;IX和表级X、S互斥;IS和表级X锁互斥。其兼容性正好体现了其作用

自增锁

    自增锁是一种特殊的表级别锁,如果一个表的某个行具有AUTO_INCREMENT的列,则一个事务在插入记录到这个表的时候,会先获取自增锁。如果一个事务持有自增锁,会阻塞其他事物对该表的插入操作,保证自增连续。innodb_autoinc_lock_mode变量定义了不同的自增算法,在MySql8.0之前默认值是1,MySql8.0之后默认值是2,具体区别参考官方文档

行锁

    Innodb中的行锁种类繁多,可以分为:记录锁(record locks)、间隙锁(gap locks)、临键锁(next-key locks),插入意向锁(insert intention locks)。行锁在逻辑上都可以看作作用于索引或者索引间隙之上,索引分为主键索引和非主键索引两种,如果一条sql语句操作了主键索引,MySQL就会锁定这条主键索引;如果一条语句操作了非主键索引,MySQL会先锁定该非主键索引,再锁定相关的主键索引。
     很多语句都会加行锁,比如Update、Delete、Insert等操作,或者使用SELECT … FOR SHARE | UPDATE [NOWAIT |SKIP LOCKED]来进行当前读(Locking Reads),其中SHARE表示加共享锁,UPDATE表示加排他锁。当要加的锁与当前行已有锁互斥时,会一直阻塞等待一段时间(innodb_lock_wait_timeout定义了等待时间)。加上NOWAIT参数则不会阻塞,会立即返回,并显示一个错误,加上SKIP LOCKED则会在结果集中跳过这些冲突的记录(慎用)。
     在不同的语句,不同的事务隔离级别下,甚至不同的索引类型下,行锁会表现成不同的形式,下面介绍这些形式

记录锁(record locks)#####

     在逻辑上,记录锁可以理解为锁定的是某个具体的索引,当SQL执行按照唯一性(Primary key、Unique key)索引进行数据的检索时,查询条件等值匹配且查询的数据是存在,这时 SQL 语句加上的锁即为记录锁

间隙锁(gap locks)

     在逻辑上,间隙锁可以理解为锁住的是索引之间的间隙,是一个左开右开的区间。当SQL执行按照索引进行数据的检索时,查询条件的数据不存在,这时SQL语句加上的锁即为间隙锁。

     如上图,因为这些语句查询的值都不存在,所以锁住的都是间隙。并且在 InnoDb 存储引擎里,每个数据页中都会有两个虚拟的行记录,用来限定记录的边界,分别是:Infimum RecordSupremum RecordInfimum 是比该页中任何记录都要小的值,而 Supremum 比该页中最大的记录值还要大,这两条记录在创建页的时候就有了,并且不会删除。所以当查询的值比当前已有记录最大值还大时候,锁住的会是最大值到Supremum之间的间隙。比如第一条语句,查询的时候就算是等值匹配,只要这个不存在的数据落在两个索引节点之间,就算不是一个范围,也会锁住索引节点间的所有数据即gap3,范围(7,11)。

     间隙锁是可以共存的,共享间隙锁与独占间隙锁之间是没有区别的,两者之间并不冲突。其存在的目的都是防止其他事务往间隙中插入新的纪录,故而一个事务所采取的间隙锁是不会去阻止另外一个事务在同一个间隙中加锁的

     间隙锁是设计用来防止幻读的,当锁定一个gap时,其他事务没有办法再往这个gap中插入数据,PostgreSQL没有这种机制,所以PostgreSQl没有办法锁住不存在的行,无法防止幻读(见之前的文章:记一次并发问题的排查PostgreSQL的事务隔离和MVCC

临键锁(next-key locks)#####

     在逻辑上,临键锁可以理解为锁住的是索引本身以及索引之前的间隙,是一个左开右闭的区间。当SQL执行按照非唯一索引进行数据的检索时,会给匹配到行上加上临键锁。

     如上图,当执行select * from table_name where id = 3 for update时会锁定(-∞,3)区间,因为按照这个SQL的语义,即是为了锁住id=3的数据,不允许其他操作,如果只是锁住记录本身,肯定是没有办法保证的,因为这是非唯一索引,还有可能插入其他id=3的数据,如果把间隙都给锁住,则其他对这个间隙的插入操作都会被阻塞,从而保证了一致性,这也是临键锁的用意。

     如果加锁时,查询条件没有命中索引(非ICP的查询),则InnoDB会尝试给全表每一条记录都加上临键锁,效果相当于锁表了

插入意向锁(insert intention locks)#####

     插入意向锁是一种间隙锁形式的意向锁,在真正执行INSERT操作之前设置。当执行插入操作时,总会检查当前插入操作的下一条记录(已存在的主索引节点)上是否存在锁对象,判断是否锁住了gap,如果锁住了,则判定和插入意向锁冲突,当前插入操作就需要等待,也就是配合上面的间隙锁或者临键锁一起防止了幻读操作。
     因为插入意向锁是一种意向锁,意向锁只是表示一种意象,所以插入意向锁之间不会互相冲突,多个插入操作同时插入同一个gap时,无需互相等待,比如当前索引上有记录4和8,两个并发session同时插入记录6,7。他们会分别为(4,8)加上GAP锁,但相互之间并不冲突。
     INSERT语句在执行插入之前,会先在gap中加入插入意向锁,如果是唯一索引,还会进行Duplicate Key判断,如果存在相同Key且该Key被加了互持锁,则还会加共享锁,然后等待(因为这个相同的Key之后有可能会回滚删除,这里非常容易死锁)。等到成功插入后,会在这条记录上加排他记录锁。

行锁小结

     行锁在不同的语句中和环境条件下可以表现成:记录锁(record locks)、 间隙锁(gap locks)、临键锁(next-key locks)和插入意向锁(insert intention locks)。记录锁锁住具体的记录,间隙锁锁住记录之间的间隙,临键锁锁住记录和记录前面的间隙,插入意向锁则是特殊的间隙锁,在插入前判断行将要插入的间隙是否会有冲突。

     以上说的各种行锁的加锁情况都是在可重复读(REPEATABLE READ)隔离级别下,这个级别也是innoDB默认的事务隔离级别,是最常用的隔离级别,但是其实不同语句在不同隔离级别下加锁的情况会有非常大的区别,以下会简单说明

不同语句和隔离级别对加锁的影响

     这里先排除读未提交(READ UNCOMMITTED)这种隔离级别的情况,这种级别在生产上几乎无法使用,会出现脏读的情况,不一致读,无法保证事务的ACID。然后先看下串行化(SERIALIZABLE)隔离级别

     串行化隔离级别和可重复读隔离级别最大的区别应该是,innoDB会隐式的转换所有的SELECT语句,给其加共享锁,变成SELECT ... FOR SHARE,这样读操作会阻塞其他写操作,使得读写无法并发,只能串行,从而保证严格的一致性。不过这种行为也受到autocommit变量的影响:

     不可重复读(READ COMMITTED)隔离级别下,和可重复读隔离级别在行锁方面主要的区别是

死锁

    因为使用表锁时,需要一次性申请所有所需表的锁,所以在只使用表锁的情况下不会出现死锁,一般出现死锁的情况都是行锁。innoDB有死锁探测机制,在申请锁的时候,都会先进行死锁判断,采用的算法深度优先搜索,并且如果在搜索过程中发现有环,就说明发生了死锁,为了避免死锁检测开销过大,如果搜索深度超过了 200(LOCK_MAX_DEPTH_IN_DEADLOCK_CHECK)也同样认为发生了死锁。出现死锁时,innoDB会选择一个回滚代价比较小的事务进行回滚。以下会举几个比较典型的死锁例子(均在可重复度隔离级别下),首先会先建一张测试的表:

CREATE TABLE `student` (
  `id` int NOT NULL,
  `uuid` varchar(64) NOT NULL,
  `name` varchar(64) NOT NULL,
  `age` int NOT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `uuid_index` (`uuid`),
  KEY `name_index` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci
死锁例一
语句顺序\事务事务一事务二
T1begin;begin;
T2select * from student where id = 1 for update;select * from student where id = 2 for update;
T3select * from student where id = 2 for update;
T4(死锁发生)select * from student where id = 1 for update;

    这是最简单最典型的死锁的情况了,两个事务互相锁定持有资源,并且等待对方的资源,最后形成一个环,死锁出现。最后某个事务回滚,写业务代码的时候,应该对并发条件可能出现这种情况的语句有所警觉。

死锁例二

前提:事务开始时,student表里有id=1的记录

语句顺序\事务事务一事务二
T1begin;begin;
T2select * from student where id = 1 for share;select * from student where id = 1 for share;
T3update student set name = ‘Tom’ where id = 1;
T4(死锁发生)update student set name = ‘Jack’ where id = 1;

     两个事务分别对某个记录申请共享锁,因为共享锁性质,两个事务都能获取到。然后又都对这条记录申请排他锁,T3中事务一申请排他锁,等待事务二的共享锁释放,加入锁等待队列,T4中事务二又申请排他锁,于是形成环,死锁条件达成。所以在事务开始时就要想到后面可能会做的操作,提前获取足够强度的锁,而不是中途升级。

死锁例三

前提:事务开始时,student表里没有id=100的记录

语句顺序\事务事务一事务二
T1begin;begin;
T2select * from student where id = 100 for update;select * from student where id = 100 for update;
T3insert into student values (100, ‘uuid100’, ‘jack’, 18);
T4(死锁发生)insert into student values (100, ‘uuid100’, ‘jack’, 18);

    如上,在可重复读隔离级别下,如果两个事务同时对某个间隙用SELECT...FOR UPDATE加排他锁,在没有符合该条件记录情况下,两个线程都会加锁成功。程序发现记录尚不存在,就试图插入一条新记录,如果两个线程都这么做,就会出现死锁。因为在记录真正插入之前会加插入意向锁,插入意向锁和间隙锁互斥,所以在T3时,事务一阻塞了,申请插入意向锁排队等待事务二的间隙锁释放,T4时,事务二又申请插入意向锁,需要等待事务一的间隙锁释放,形成环,死锁条件达成。
    这种情况一般发生在,某些业务需要提前锁住间隙,防止并发插入同一数据(关键属性相同的数据),也就会先SELECT...FOR UPDATEINSERT,但是这样很容易死锁,可以直接对关键属性建立唯一索引,防止并发插入,也存在无法建立索引的情况记一次并发问题的排查,这时候可以考虑其他办法

死锁例四

前提:事务开始时,student表里没有uuid=uuid100的记录

语句顺序\事务事务一事务二事务三
T1begin;begin;begin;
T2insert into student values (100, ‘uuid100’, ‘jack’, 18);
T3insert into student values (101, ‘uuid100’, ‘jack’, 18);insert into student values (102, ‘uuid100’, ‘jack’, 18);
T4(死锁发生)rollback;

     这也是MySql官方文档给出的一个例子。三个事务同时插入一条某个唯一索引属性(上面的uuid)相同的数据,其中某个事务先一步插入,其他两个事务会阻塞等待,然后先一步插入的事务回滚,其他两个事务出现死锁,其中某个事务会被回滚。官方文档还提到了另外一种类似的情况,具体可以参考 Locks Set by Different SQL Statements in InnoDB
     这种死锁的原因是,INSERT的时候,会对唯一索引进行Duplicate Key判断,如果唯一键冲突,则会加共享锁等待,也就是T3时候的事务二和事务三,都会获得共享锁。T4时,事务一回滚,事务二和事务三都会申请升级排他锁,这样就造成类似死锁案例二的情况,形成死锁了

死锁例五
语句顺序\事务事务一事务二
T1begin;begin;
T2(死锁发生)update student set age = age + 1 where name = ‘jack’;update student set name = ‘bob’ where id > 100;

     这个例子引用自淘宝数据库内核月报-InnoDB 事务锁系统简介,这个地方的死锁我没有试出来,需要在高并发环境才可能出现,理论上可能会出现。虽然只是两个很简单的更新语句,但是事务一的加锁顺序是,先锁二级索引name_index,再锁聚集索引,事务二的加锁顺序是,先锁聚集索引,再锁二级索引name_index,不同的加锁顺序在并发时可能导致死锁

死锁小结

    使用SHOW ENGINE INNODB STATUS语句可以看到最近一次的死锁信息,在调试的时候很有帮助。
    出现死锁后某个事务会回滚,其他事务成功,上层业务会捕获到死锁错误,再重试一般会成功,如果出现大量锁重试,则说明哪里出了问题,写代码的时候可以注意以下几点可以减少死锁出现的概率:

锁的内部表示

innoDb内部中,用unsigned long类型表示锁的类型,其中不同的位代表锁不同的信息,最低的4位表示lock_mode,中间的4位表示lock_type,其余高位表示record_lock_type,内部使用位操作来设置和判断是否设置了对应的值 :

record_lock_typelock_typelock_mode

lock_mode:描述了锁的基本类型,分为以下几种

在源码中有一个lock_mode的枚举类型,除了以上还有几个值:LOCK_NONE,用来表示一致性读,LOCK_NUM用来表示lock_mode的数量,LOCK_NONE_UNSET用来复位低8位

lock_type:占用中间的4位,目前只用到了5位和6位,分别表示表锁(LOCK_TABLE)和 行锁(LOCK_REC)

record_lock_type:对于表锁类型来说都是空的,对于行锁目前值有:

以上说的是锁的类型的表示,行锁、表锁类型相关信息都统一到一个字段了。同类型字段一样,行锁、表锁本身在innoDb中也统一用一个结构体来表示lock_t,大体如下:

struct lock_t {
    trx_t* trx; // 锁所属的事务
    UT_LIST_NODE_T(lock_t) trx_locks; // 事务所持锁的列表
    ulint type_mode; // 锁类型
    hash_node_t hash; // 全局锁哈希表对应的节点
    dict_index_t* index; // 行锁的行记录索引
    union {
        lock_table_t;  // 表锁 
        lock_rec_t  rec_lock; // 行锁
    } un_member; // 锁详情
};

行锁和表锁都用一个lock_t结构来表示,差异部分在一个union结构中表示,里面的type_mode即是上面介绍的锁类型,行锁的结构如下:

struct lock_rec_t {
    ulint space; // 锁的space id
    ulint page_no; // 锁的page number
    ulint n_bits; // 锁住位置的bitmap
};

通过(space,page_no)可以确定锁所在的页,innoDb内部还会有个字段heap_no来表示记录在页上的偏移,也就是说三元组(space,page_no,heap_no)可以唯一的确定一行的位置。在分配lock_rec_t结构的时候,还会为其在最后分配一个大小为n_bits的bitmap,而记录偏移的bit即为heap_no,用来快速判断这页哪些记录加了锁。

innoDb所有的行锁会插入到一个全局hash表(lock_sys->rec_hash)中,相同(space,page_no)也就是同一页的锁会被Hash到同一个bucket里,通过lock_t->hash串成链表。

总结一下,就是同一事务,同一类型的行锁在同一页上会复用同一个锁结构lock_t,用后面的bitmap来具体表示锁哪些行,大大节约了空间。同一页上不同的事物或类型的锁通过链表串起来放在rec_hash的同一个bucket里,利用hash的结构先定位到页,然后遍历同一页上不同的lock_t,就可以得到哪些事物的哪些锁锁住了哪些行,这种设计平衡了时间和空间的效率。

总结

     innoDB锁系统配合MVCC机制一起实现了事务的一致性隔离性,innoDB中的锁总类繁多,并且和事务隔离级别关系密切,不同语句在不同隔离级别下的加锁情况大有不同,细节尤其多,而了解这些对排查死锁会有很大的帮助。行锁在innoDB中的实现也颇为巧妙,值得学习

参考链接

© 2019 - 2022 · Firsy · Theme Simpleness Powered by Hugo ·