点击“终码一生”,关注,置顶公众号
每日技术干货,第一时间送达!
1
锁是计算机协调多个进程或线程并发访问某一资源的机制。在程序开发中会存在多线程同步的问题,当多个线程并发访问某个数据的时候,尤其是针对一些敏感的数据(比如订单、金额等),我们就需要保证这个数据在任何时刻最多只有一个线程在访问,保证数据的完整性和一致性。在开发过程中加锁是为了保证数据的一致性,这个思想在数据库领域中同样很重要。
在数据库中,除传统的计算资源〈如CPU、RAM、/o等)的争用以外,数据也是一种供许多用户共享的资源。为保证数据的一致性,需要对并发操作进行控制,因此产生了锁。同时锁机制也为实现MySQL的各个隔离级别提供了保证。锁冲突也是影响数据库并发访问性能的一个重要因素。所以锁对数据库而言显得尤其重要,也更加复杂。
事务的隔离性是由锁来实现的。
2
并发事务访问相同记录的情况大致可以划分为3种:
2.1 读-读情况
读-读情况,即并发事务相继读取相同的记录。读取操作本身不会对记录有任何影响,并不会引起什么问题,所以允许这种情况的发生。
2.2 写-写情况
写-写情况,即并发事务相继对相同的记录做出改动。
在这种情况下会发生脏写的问题,任何一种隔离级别都不允许这种问题发生。所以再多个未提交的事物相继对一条记录做改动时,需要让他们排队执行,这个排队的过程其实是通过锁来实现的。这个所谓的锁其实是一个内存中的结构,在事务执行前本来没有所的,也就是说一开始是没有锁结构和记录进行关联的。
当一个事务想对这条记录做改动时,首先会看看内存中有没有与这条记录关联的锁结构,当没有的时候就会在内存中生成一个锁结构与之关联。另外,搜索公众号终码一生后台回复“资料”,获取最新面试资料和教程。
在锁结构里有很多信息,为了简化理解,只把两个比较重要的属性拿了出来:
-
trx信息:代表这个锁结构是哪个事务生成的。
-
is_waiting:代表当前事务是否在等待。
当事务T1改动了这条记录后,就生成了一个锁结构与该记录关联,因为之前没有别的事务为这条记录加锁,所以is_waiting属性就是false,我们把这个场景就称之为获取锁成功,或者加锁成功,然后就可以继续执行操作了。
在事务T1提交之前,另一个事务T2也想对该记录做改动,那么先看看有没有锁结构与这条记录关联,发现有一个锁结构与之关联后,然后也生成了一个锁结构与这条记录关联,不过锁结构的is_waiting 属性值为true,表示当前事务需要等待,我们把这个场景就称之为获取锁失败,或者加锁失败,图示:
-
不加锁:意思就是不需要在内存中生成对应的锁结构,可以直接执行操作。
-
获取锁成功,或者加锁成功:意思就是在内存中生成了对应的锁结构,而且锁结构的is_waiting属性为false,也就是事务可以继续执行操作。
-
获取锁失败,或者加锁失败,或者没有获取到锁:意思就是在内存中生成了对应的锁结构,不过锁结构的is_waiting属性为true,也就是事务需要等待,不可以继续执行操作。
2.3读-写、写-读情况
读-写、写-读,即一个事务进行读取操作,另一个事务进行改动操作,这种情况可能会发生脏读、不可重复读、幻读的问题
2.4 并发问题的解决方案
-
方案1:读操作利用多版本并发控制(MVCC),写操作进行加锁
所谓的WVCC,就是生成一个ReadView,通过ReadView找到符合条件的记录版本(历史版本由undo日志构建)。查询语句只能读到在生成ReadView之前已提交事务所做的更改,在生成ReadView之前未提交的事务或者之后才开启的事务所做的更改是看不到的。而写操作肯定针对的是最新版本的记录,读记录的历史版本和改动记录的最新版本本身并不冲突,也就是采用MVCC时,读-写操作并不冲突。另外,搜索公众号终码一生后台回复“资料”,获取最新面试资料和教程。
普通的SELECT语句在READ COMMITED和REPEATABLE READ隔离界别 下会使用到MVCC读取记录
在READ COMMITED隔离级别下,一个事务在执行过程中每次执行SELECT操作时都会生成一个ReadView,ReadView的存在本省就保证了事务不可以读取到未提交的事务所做的更改,也就是避免了脏读的现象
在REPEATABLE READ隔离级别下,一个事务在执行过程中只有第一次执行SELECT操作才会生成一个ReadView,之后的SELECT操作都复用这个ReadView,这样也就避免了不可重复读和幻读的问题。
-
方案2:读、写操作都采用加锁的方式
3
3.1 从数据操作的类型划分:读锁、写锁
对于数据库中并发事务的读-读情况并不会引起什么问题。对于写-写、读-写或写-读这些情况可能会引起一些问题,需要使用MVCC或者加锁的方式来解决它们。在使用加锁的方式解决问题时,由于既要允许读-读情况不受影响,又要使写-写、读-写或写-读情况中的操作相互阻塞,所以MySQL实现一个由两种类型的锁组成的锁系统来解决。这两种类型的锁通常被称为共享锁(Shared Lock,S Lock)和排他锁(Exclusive Lock,XLock),也叫读锁(readlock)和写锁(write lock) 。
-
读锁:也称共享锁,用英文S表示。针对同一份数据,多个事务的读操作可以同时进行而不会相互阻塞
-
写锁:也称排他锁,用英文X表示。当前写操作没有完成前,它会阻断其他写锁和读锁,这样就能确保在给定的时间里,只有一个事务能执行写入,并防止其他用户读取正在写入的同一资源。
需要注意的是对于InnoDB引擎来说,读锁和写锁可以加在表上,也可以加在行上。
举例(行级读写锁):如果一个事务T1已经获得了某个行r的读锁,那么此时另外的一个事务T2是可以去获得这个行r的读锁的,因为读取操作并没有改变行r的数据;但是,如果某个事务T3想获得行r的写锁则它必须等待事务T1、T2释放掉行r上的读锁才行。
1、锁定读
对读取操作加S锁
SELECT ... LOCK IN SHARE MODE;
或
SELECT ... FOR SHARE;#(8.0新增语法)
对读取操作加X锁
SELECT ... FOR UPDATE;
2、写操作
平常用的写操作无非是INSERT 、UPDATE、DELETE这三种
DELETE:
对一条记录做DELETE操作的过程其实是先在B+树中定位到这条记录的位置,然后获取这条记录的X锁,再执行delete mark 操作。我们也可以把这个定位待删除记录在B+树中位置的过程看成是一个获取X锁的锁定读。
UPDATE:在对一条记录做UPDATE操作时分为三种情况:
-
情况1:未修改该记录的键值,并且被更新的列占用的存储空间在修改前后未发生变化。
则先在B+树中定位到这条记录的位置,然后再获取一下记录的x锁,最后在 原记录的位置进行修改操作。我们也可以把这个定位待修改记录在B+树中位 置的过程看成是一个获取X锁的锁定读。
-
情况2:未修改该记录的键值,并且至少有一个被更新的列占用的存储空间在修改前后发生变化。
则先在B+树中定位到这条记录的位置,然后获取一下记录的X锁,将该记录 彻底删除掉(就是把记录彻底移入垃圾链表),最后再插入一条新记录。这 个定位待修改记录在B+树中位置的过程看成是一个获取×锁的锁定读,新插 入的记录由INSERT 操作提供的隐式锁进行保护。
-
情况3:修改了该记录的键值,则相当于在原记录上做DELETE 操作之后再来一次INSERT操作,加锁操作就需要按照DELETE和INSERT的规则进行了。
INSERT:
一般情况下,新插入一条记录的操作并不加锁,通过一种称之为隐式锁的结构来保护这条新插入的记录在本事务提交前不背别的事务访问
3.2 从数据库操作的粒度划分:表级锁、页级锁、行锁
为了尽可能提高数据库的并发度,每次锁定的数据范围越小越好,理论上每次只锁定当前操作的数据的方案会得到最大的并发度,但是管理锁是很耗资源的事情(涉及获取。检查、释放锁等动作)。因此数据库系统需要在高并发响应和系统性能两方面进行平衡,这样就产生了”锁粒度〈Lock granularity)”的概念。
1、表锁(Table Lock)
该锁会锁定整张表,它是MySQL中最基本的锁策略,并不依赖于存储引擎(不管你是MysQL的什么存储引擎,对于表锁的策略都是一样的),并且表锁是开销最小的策略(因为粒度比较大)。由于表级锁一次会将整个表锁定,所以可以很好的避免死锁问题。当然,锁的粒度大所带来最大的负面影响就是出现锁资源争用的概率也会最高,导致并发率大打折扣。另外,搜索公众号终码一生后台回复“资料”,获取最新面试资料和教程。
①表级别的S锁X锁
在对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,InnoDB存储引擎是不会为这个表添加表级别的S锁或者X锁的。在对某个表执行一些诸如ALTER TABLE、DROP TABLE这类的DDL语句时,其他事务对这个表并发执行诸如SELECT、INSERT、DELETE、UPDATE的语句会发生阻塞。同理,某个事务中对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,在其他会话中对这个表执行DDL语句也会发生阻塞。这个过程其实是通过在server层使用一种称之为元数据锁(英文名: Metadata Locks,简称MDL)结构来实现的。
一般情况下,不会使用InnoDB存储引擎提供的表级别的S锁和X锁。只会在一些特殊情况下,比方说崩溃恢复过程中用到。比如,在系统变量autocommit=0, innodb_table_locks = 1时,手动获取InnoDB存储引擎提供的表t的S锁或者X锁可以这么写:
-
LOCK TABLES t READ:InnoDB存储引擎会对表t加表级别的S锁
-
LOCK TABLES t UPDATE:InnoDB存储引擎会对表t加表级别的X锁
②意向锁(interntion lock)
InnoDB支持多粒度锁,它允许行级锁与表级锁共存,而意向锁就是其中的一种表锁。
-
意向锁的存在是为了协调行锁和表锁的关系,支持多粒度(表锁与行锁)锁的并存
-
意向锁是不与行级锁冲突表级锁,这一点非常重要
-
表明某个事务正在某些行持有了锁或该事务准备去持有锁
意向锁分为两种:
-
意向共享锁:事务有意向对表中的某些行加共享锁
-
意向排他锁:事务有意向对表中的某些行加排他锁
③自增锁(AUTO-INC锁)
-
Simple inserts(简单插入)
可以预先缺点要插入的行数(当语句被初始处理时)的语句。包括没有嵌套子查询的单行和多行Insert…values()和REPLACE语句
-
Bulk inserts(批量插入)
事先不知道要插入的行数(所需自动递增值的数量)的语句,比如INSERT … SELECT, REPLACE…SELECT, LOAD DATA语句,但不包括INSERT。InnoDB在每处理一行,为Auto_Increment列分配一个新值。
-
Mixed-mode inserts(混合模式插入)
这些事Simple inserts语句但是指定部分新行的自动递增值。只是指定了部分id的值。
AUTO-INC锁是当向使用含有AUTO_INCREMENT列的表中插入数据时需要获取的一种特殊的表级锁,在执行插入语句时就在表级别加一个AUTO_INC锁,然后为每条待插入记录的AUTO_INCREMENT修饰的列分配上递增的值,在该语句执行结束后,再把AUTO_INC锁释放掉。一个事务在持有AUTO_INC锁的过程中,其他事务的插入语句都要被阻塞,可以保证一个语句中分配的递增的值是连续的。也正因为此,其并发性显然不高,当我们向一个有AUTO_INCREMENT关键字的主键插入值的时候,每条语句都要对这个表锁进行竞争,这样的并发潜力其实是很低下的。所以Innodb_autoinc_lock_mode的不同取值来提供有不同的锁定机制,来显著提高SQL语句的可伸缩性和性能。
-
innodb_autoinc_lock_mode = 0(传统的锁定模式)
在此锁定模式下,所有类型的insert语句都会获得一个特殊的表级AUTO-INC锁,用于插入具有AUTO_INCREMENT列的表。这种模式其实就如我们上面的例子,即每当执行insert的时候,都会得到一个表级锁(AUTO-INC锁),使得语句中生成的auto_increment为顺序,且在binlog中重放的时候,可以保证master与slave中数据的auto_increment是相同的。因为是表级锁,当在同一时间多个事务中执行insert的时候,对于AUTO-INC锁的争夺会限制并发能力。
-
innodb_autoinc_lock_mode = 1(连续锁定模式)
在这个模式下,“bak inserts”仍然使用AUTO-INC表级锁,并保持到语句结束。这适用于所有INSERT …SELECT,REPLACE … SELECT和LOAD DATA语句。同一时刻只有一个语句可以持有AUTO-INC锁。另外,搜索公众号终码一生后台回复“资料”,获取最新面试资料和教程。
-
innodb_autoinc_lock_mode = 2(交错锁定模式)
在这种锁定模式下,所有类NSERT语句都不会使用表级AUTO-INC锁,并且可以同时执行多个语句。这是最快和最可扩展的锁定模式,但是当使用基于语句的复制或恢复方案时,从二进制日志重摆SQL语句时,这是不安全的。
④元数据锁(MDL锁)
MDL的作用是,保证读写的正确性。
因此,当对一个表做增删改操作的时候,加MDL读锁;当对表结构变更操作的时候,加MDL写锁
2、InnoDB中的行锁
行锁也称记录锁,顾名思义,就是锁住某一行,需要注意的是,MySQL服务器并没有实现行锁机制,行级锁只在存储引擎层实现。
优点:锁定力度小,发生锁冲突概率低,可以实现并发度高
缺点:对于锁的开销比较大,加锁会比较慢,容易出现死锁的情况。
①记录锁(Record Locks)
记录锁也就是仅仅把一条记录锁上,官方的类型名称为:LOCK_REC_NOT_GAP。
②间隙锁(Gap Locks)
gap锁的提出仅仅是为了防止插入幻影记录而提出的。
③临键锁(Next-Key Locks)
有时候我们既想锁住某条记录,又想阻止其他事务在该记录前边间隙插入新记录,所以InnoDB就提出了一种称为Next-Key Locks的锁
相当于 临键锁 = 记录锁 + 间隙锁
④插入意向锁(Insert Intention Locks)
我们说一个事务在插入一条记录时需要判断一下插入位置是不是被别的事务加了gap锁( next-key锁也包含gap锁),如果有的话,插入操作需要等待,直到拥有gap锁的那个事务提交。但是InnoDB规定事务在等待的时候也需要在内存中生成一个锁结构,表明有事务想在某个间隙中插入新记录,但是现在在等待。InnoDB就把这种类型的锁命名为Insert Intention Locks,官方的类型名称为:LOCK_INSERT_INTENTION,我们称为插入意向锁。插入意向锁是一种Gap锁,不是意向锁,在insert操作时产生。
插入意向锁是在插入一条记录行钱,由Insert操作产生的一种间隙锁,该锁用以表示插入意向,当多个事务在同一个区间插入位置不同的多条数据时,事务之间不需要互相等待。插入意向锁的特性可以分成两部分:
(1)插入意向锁是一种特殊的间隙锁——间隙锁可以锁定开区间内的部分记录
(2)插入意向锁之间互不排斥,所以即使多个事务在同一区间插入多条记录,只要记录本身不冲突,那么事务之间就不会出现冲突等待。
3、页锁
页锁就是在页的粒度上就那些锁定,锁定的数据比行锁要多哦,因为一个页中可以有多个行记录。当我们使用页锁的时候,会出现数据浪费的现象,但这样的浪费最多也就是一个页上的数据行。页锁的开销介于表锁和行锁之间,会出现死锁。锁定粒度介于表锁和行锁之间,并发度一般。
每个层级的锁数量是有限制的,因为锁会占用内存空间,锁空间的大小是有限的。当某个层级的锁数量超过了这个层级的阈值时,就会进行锁升级。锁升级就是用更大粒度的锁替代多个更小粒度的锁,比如InnoDB中行锁升级为表锁,这样做的好处是占用的锁空间降低了,但同时数据的并发度也下降了。
3.2 从对待锁的态度划分:乐观锁、悲观锁
从对待锁的态度来看锁的话,可以将锁分成乐观锁和悲观锁,从名字中也可以看出这两种锁是两种看待数据并发的思维方式。需要注意的是,乐观锁和悲观锁并不是锁,而是锁的设计思想。
1、悲观锁(Pessimistic Locking)
悲观锁总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会阻塞直到它拿到锁。(共享资源每次只给一个线程使用,其他线程阻塞,用完后再把资源转让给其它线程)。
注意:select…for update语句在执行的过程中所有扫描的行都会被锁上,因此在MySQL中用悲观锁必须确定使用了索引,而不是全表扫描,否则将会吧整个表锁住
悲观锁适合写操作多的场景,因为写的操作具有排他性。
2、乐观锁(Optimistic Locking)
乐观锁适用于多读的应用类型,这样可以提高吞吐量。
3.3 按加锁的方式划分:显式锁、隐式锁
1、隐式锁
一个事务在执行Insert操作时,如果即将插入的间隙已经被其他事务加了gap锁,那么本次Insert操作会阻塞,并且当前事务会在该间隙上加一个插入意向锁,否则一般情况下insert是不加锁的。
2、显式锁
3.4全局锁
全局锁就是对整个数据库实例加锁。当你需要让整个库处于只读状态的时候,可以使用这个命令之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。全局锁的典型使用场景是:做全库逻辑备份。
Flush tables with read lock;
3.5 死锁
两个事务都持有对方需要的锁,并且等待对方释放,并且双方都不会释放自己的锁。
举例:
产生死锁的必要条件
-
两个或者两个以上的事务
-
每个事务都已经持有锁并且申请新的锁
-
锁资源同时只能被同一个事务持久或者不兼容
-
事务之前因为持有锁和申请锁导致彼此循环等待。
死锁的关键是:两个(或以上)事务加锁的顺序不一样
3.6 如何处理死锁
方式1:等待,直到超时(innodb_lock_wait-timeout)
方式2:使用死锁 检测进行死锁处理
方式1检测死锁太过被动,inndb还提供了wait-for graph算法来主动进行死锁检测,每当加锁请求无法立即满足需要并进入等待时,wait-for graph算法就会触发。
一旦检测到死锁,InnoDB会选择回滚Undo量最小的事务,让其他事务继续执行。
4
InnoDB存储引擎中锁结构如下:
结构解析
1、锁所在的事物信息:
不论是表锁还是行锁,都是在事务执行过程中生成的,哪个事务生成了这个锁结构,这里就记录这个事务的信息。另外,搜索公众号终码一生后台回复“资料”,获取最新面试资料和教程。
此锁所在的事务信息在内存结构中只是一个指针,通过指针可以找到内存中关于该事务的更多信息
比方说事务id等。
2、索引信息:
对于行锁来说,需要记录一下加锁的记录是属于哪个索引的。这里也是一个指针。
3、表锁/行锁信息:
表锁结构和行锁结构在这个位置的内容是不同的。
-
表锁:记载着是对哪个表加的锁,还有一些其他的信息
-
行锁:记载了三个重要信息
-
Space ID:记录所在表空间
-
Page Number:记录所在的页号
-
n_bits:对于行锁来说,一条记录就对应着一个比特位,一个页面中包含很多记录,用不同的比特位来区分到底是哪一条记录加了锁。为此在行锁结构的末尾放置了一堆比特位,这个n_bits属性代表使用了多少比特位。
4、type_mode:
这是一个32位的数,被分成了lock_mode、lock_type和rec_lock_type这三个部分,如图所示:
锁的模式(lock_mode),占用低4位,可选的值如下:
-
LOCK_IS(十进制的9):表示共享意向锁,也就是IS锁
-
LOCK_IX(十进制的1):表示独占意向锁,也就是IX锁。
-
LOCK_S (十进制的2):表示共享锁,也就是S锁。
-
LOCK_X (十进制的3):表示独占锁,也就是X锁。
-
LOCK_AUTO_INC (十进制的4)∶表示AUTO-INC锁。
锁的类型( lock_type ),占用第5~8位,不过现阶段只有第5位和第6位被使用:
-
LOCK_TABLE (十进制的16),也就是当第5个比特位置为1时,表示表级锁。
-
LOCK_REC (十进制的32),也就是当第6个比特位置为1时,表示行级锁。
行锁的具体类型( rec_lock_type ),使用其余的位来表示。只有在lock_type的值为LOCK_REC时,也就是只有在该锁为行级锁时,才会被细分为更多的类型:
-
LOCK_ORDINARY (十进制的日):表示next-key锁。
-
LOCK_GAP (十进制的512) :也就是当第10个比特位置为1时,表示gap锁。
-
LOK_REC_NOT_GAP(十进制的1024):也就是当第11个比特位置为1时,表示正经记录锁
-
LOCK_INSERT_INTENTION (十进制的2048):也就是当第12个比特位置为1时,表示插入意向锁。
其他的类型:还有一些不常用的类型我们就不多说了。
is_waiting属性呢?基于内存空间的节省,所以把is_waiting属性放到了type_mode这个32位的数字中:
-
LOCK_WAIT(十进制的256):当第9个比特位置为1时,表示is_waiting为true,也就是当前事务尚未获取到锁,处在等待状态;当这个比特位为0时,表示is_waiting为false,也就是当前事务获取锁成功。
5、其他信息
为了更好的管理系统运行过程中生成的各种锁结构而设计了各种哈希表和链表。
也就是当第11个比特位置为1时,表示正经记录锁
-
LOCK_INSERT_INTENTION (十进制的2048):也就是当第12个比特位置为1时,表示插入意向锁。
其他的类型:还有一些不常用的类型我们就不多说了。
-
is_waiting属性呢?基于内存空间的节省,所以把is_waiting属性放到了type_mode这个32位的数字中:
-
LOCK_WAIT(十进制的256):当第9个比特位置为1时,表示is_waiting为true,也就是当前事务尚未获取到锁,处在等待状态;当这个比特位为0时,表示is_waiting为false,也就是当前事务获取锁成功。
来源:haust_允谦
PS:防止找不到本篇文章,可以收藏点赞,方便翻阅查找哦。
往期推荐