当前位置: 主页 > JAVA语言

java线程死锁怎么解决-java多线程解决死锁

发布时间:2023-03-09 21:02   浏览次数:次   作者:佚名

Java 语言通过 synchronized 关键字来保证原子性,这是因为每一个 Object 都有一个隐含的锁,这个也称作监视器对象。在进入 synchronized 之前自动获取此内部锁,而一旦离开此方式,无论是完成或者中断都会自动释放锁。显然这是一个独占锁,每个锁请求之间是互斥的。相对于众多高级锁 (Lock/ReadWriteLock 等),synchronized 的代价都比后者要高。但是 synchronzied 的语法比较简单,而且也比较容易使用和理解。Lock 一旦调用了 lock() 方法获取到锁而未正确释放的话很有可能造成死锁,所以 Lock 的释放操作总是跟在 finally 代码块里面,这在代码结构上也是一次调整和冗余。Lock 的实现已经将硬件资源用到了极致,所以未来可优化的空间不大,除非硬件有了更高的性能,但是 synchronized 只是规范的一种实现,这在不同的平台不同的硬件还有很高的提升空间,未来 Java 锁上的优化也会主要在这上面。既然 synchronzied 都不可能避免死锁产生,那么死锁情况会是经常容易出现的错误,下面具体描述死锁发生的原因及解决方法。

死锁描述

死锁是操作系统层面的一个错误,是进程死锁的简称,最早在 1965 年由 Dijkstra 在研究银行家算法时提出的,它是计算机操作系统乃至整个并发程序设计领域最难处理的问题之一。

事实上,计算机世界有很多事情需要多线程方式去解决,因为这样才能最大程度上利用资源,才能体现出计算的高效。但是,实际上来说,计算机系统中有很多一次只能由一个进程使用的资源的情况,例如打印机,同时只能有一个进程控制它。在多通道程序设计环境中,若干进程往往要共享这类资源,而且一个进程所需要的资源还很有可能不止一个。因此,就会出现若干进程竞争有限资源,又推进顺序不当,从而构成无限期循环等待的局面。我们称这种状态为死锁。简单一点描述,死锁是指多个进程循环等待它方占有的资源而无限期地僵持下去的局面。很显然,如果没有外力的作用,那么死锁涉及到的各个进程都将永远处于封锁状态。

系统发生死锁现象不仅浪费大量的系统资源,甚至导致整个系统崩溃,带来灾难性后果。所以,对于死锁问题在理论上和技术上都必须予以高度重视。

银行家算法

一个银行家如何将一定数目的资金安全地借给若干个客户,使这些客户既能借到钱完成要干的事,同时银行家又能收回全部资金而不至于破产。银行家就像一个操作系统,客户就像运行的进程,银行家的资金就是系统的资源。

银行家算法需要确保以下四点:

1、当一个顾客对资金的最大需求量不超过银行家现有的资金时就可接纳该顾客;

2、顾客可以分期贷款, 但贷款的总数不能超过最大需求量;

3、当银行家现有的资金不能满足顾客尚需的贷款数额时,对顾客的贷款可推迟支付,但总能使顾客在有限的时间里得到贷款;

4、当顾客得到所需的全部资金后,一定能在有限的时间里归还所有的资金。

清单 1. 银行家算法实现/*一共有5个进程需要请求资源,有3类资源*/

publicclassBankDemo{ // 每个进程所需要的最大资源数 publicstaticintMAX[][] = { { 7, 5, 3}, { 3, 2, 2}, { 9, 0, 2}, { 2, 2, 2}, { 4, 3, 3} }; // 系统拥有的初始资源数 publicstaticintAVAILABLE[] = { 10, 5, 7}; // 系统已给每个进程分配的资源数 publicstaticintALLOCATION[][] = { { 0, 0, 0}, { 0, 0, 0}, { 0, 0, 0}, { 0, 0, 0}, { 0, 0, 0} }; // 每个进程还需要的资源数 publicstaticintNEED[][] = { { 7, 5, 3}, { 3, 2, 2}, { 9, 0, 2}, { 2, 2, 2}, { 4, 3, 3} }; // 每次申请的资源数 publicstaticintRequest[] = { 0, 0, 0}; // 进程数与资源数 publicstaticintM = 5, N = 3; intFALSE = 0; intTRUE = 1; publicvoidshowdata(){ inti, j; System.out.print( "系统可用的资源数为:/n"); for(j = 0; j < N; j++) { System.out.print( "资源"+ j + ":"+ AVAILABLE[j] + " "); } System.out.println(); System.out.println( "各进程还需要的资源量:"); for(i = 0; i < M; i++) { System.out.print( "进程"+ i + ":"); for(j = 0; j < N; j++) { System.out.print( "资源"+ j + ":"+ NEED[i][j] + " "); } System.out.print( "/n"); } System.out.print( "各进程已经得到的资源量: /n"); for(i = 0; i < M; i++) { System.out.print( "进程"); System.out.print(i); for(j = 0; j < N; j++) { System.out.print( "资源"+ j + ":"+ ALLOCATION[i][j] + " "); } System.out.print( "/n"); } } // 分配资源,并重新更新各种状态 publicvoidchangdata(intk){ intj; for(j = 0; j < N; j++) { AVAILABLE[j] = AVAILABLE[j] - Request[j]; ALLOCATION[k][j] = ALLOCATION[k][j] + Request[j]; NEED[k][j] = NEED[k][j] - Request[j]; } }; // 回收资源,并重新更新各种状态 publicvoidrstordata(intk){ intj; for(j = 0; j < N; j++) { AVAILABLE[j] = AVAILABLE[j] + Request[j]; ALLOCATION[k][j] = ALLOCATION[k][j] - Request[j]; NEED[k][j] = NEED[k][j] + Request[j]; } }; // 释放资源 publicvoidfree(intk){ for( intj = 0; j < N; j++) { AVAILABLE[j] = AVAILABLE[j] + ALLOCATION[k][j]; System.out.print( "释放"+ k + "号进程的"+ j + "资源!/n"); } } publicintcheck0(intk){ intj, n = 0; for(j = 0; j < N; j++) { if(NEED[k][j] == 0) n++; } if(n == 3) return1; elsereturn0; } // 检查安全性函数 //所以银行家算法其核心是:保证银行家系统的资源数至少不小于一个客户的所需要的资源数。在安全性检查函数 chkerr() 上由这个方法来实现 //这个循环来进行核心判断,从而完成了银行家算法的安全性检查工作。 publicintchkerr(ints){

intWORK;

intFINISH[] = newint[M], temp[] = newint[M];

// 保存临时的安全进程序列

inti, j, k = 0;

for(i = 0; i < M; i++)

FINISH[i] = FALSE;

for(j = 0; j < N; j++) { WORK = AVAILABLE[j]; // 第 j 个资源可用数 i = s; // 判断第 i 个进程是否满足条件 while(i < M) { if(FINISH[i] == FALSE && NEED[i][j] ( a java。util。concurrent。locks。ReentrantLock$NonfairSync) at java。util。concurrent。locks。LockSupport。park(LockSupport。java: 156) at java。util。concurrent。locks。AbstractQueuedSynchronizer。 parkAndCheckInterrupt(AbstractQueuedSynchronizer。java: 811) at java。util。concurrent。locks。AbstractQueuedSynchronizer。 doAcquireInterruptibly(AbstractQueuedSynchronizer。java: 867) at java。

util。concurrent。locks。AbstractQueuedSynchronizer。 acquireInterruptibly(AbstractQueuedSynchronizer。java: 1201) at java。util。concurrent。locks。ReentrantLock。lockInterruptibly(ReentrantLock。java: 312) at DeadLock。run(DeadLock。java: 50) "south": at sun。misc。Unsafe。park(Native Method) - parking to wait for< 0x153872955963c798> ( a java。util。concurrent。locks。ReentrantLock$NonfairSync) at java。util。concurrent。locks。LockSupport。park(LockSupport。java: 156) at java。util。concurrent。locks。AbstractQueuedSynchronizer。

parkAndCheckInterrupt(AbstractQueuedSynchronizer。java: 811) at java。util。concurrent。locks。AbstractQueuedSynchronizer。 doAcquireInterruptibly(AbstractQueuedSynchronizer。java: 867) at java。util。concurrent。locks。AbstractQueuedSynchronizer。 acquireInterruptibly(AbstractQueuedSynchronizer。java: 1201) at java。util。concurrent。locks。ReentrantLock。lockInterruptibly(ReentrantLock。java: 312) at DeadLock。run(DeadLock。java: 28) Found 1deadlock。 死锁解决方案

死锁是由四个必要条件导致的,所以一般来说,只要破坏这四个必要条件中的一个条件,死锁情况就应该不会发生。

1、如果想要打破互斥条件,我们需要允许进程同时访问某些资源,这种方法受制于实际场景,不太容易实现条件;

2、打破不可抢占条件,这样需要允许进程强行从占有者那里夺取某些资源,或者简单一点理解,占有资源的进程不能再申请占有其他资源,必须释放手上的资源之后才能发起申请,这个其实也很难找到适用场景;

3、进程在运行前申请得到所有的资源,否则该进程不能进入准备执行状态。这个方法看似有点用处,但是它的缺点是可能导致资源利用率和进程并发性降低;

4、避免出现资源申请环路,即对资源事先分类编号,按号分配。这种方式可以有效提高资源的利用率和系统吞吐量,但是增加了系统开销,增大了进程对资源的占用时间。

如果我们在死锁检查时发现了死锁情况,那么就要努力消除死锁,使系统从死锁状态中恢复过来。消除死锁的几种方式:

1、最简单、最常用的方法就是进行系统的重新启动,不过这种方法代价很大,它意味着在这之前所有的进程已经完成的计算工作都将付之东流,包括参与死锁的那些进程,以及未参与死锁的进程;

2、撤消进程,剥夺资源。终止参与死锁的进程,收回它们占有的资源,从而解除死锁。这时又分两种情况:一次性撤消参与死锁的全部进程,剥夺全部资源;或者逐步撤消参与死锁的进程,逐步收回死锁进程占有的资源。一般来说java线程死锁怎么解决java线程死锁怎么解决,选择逐步撤消的进程时要按照一定的原则进行,目的是撤消那些代价最小的进程,比如按进程的优先级确定进程的代价;考虑进程运行时的代价和与此进程相关的外部作业的代价等因素;

3、进程回退策略,即让参与死锁的进程回退到没有发生死锁前某一点处,并由此点处继续执行,以求再次执行时不再发生死锁。虽然这是个较理想的办法,但是操作起来系统开销极大,要有堆栈这样的机构记录进程的每一步变化,以便今后的回退,有时这是无法做到的。

其实即便是商业产品,依然会有很多死锁情况的发生,例如 MySQL 数据库,它也经常容易出现死锁案例。

MySQL 死锁情况解决方法

假设我们用 Show innodb status 检查引擎状态时发现了死锁情况,如清单 7 所示。

清单 7. MySQL 死锁WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 0page no 843102n bits 600index `KEY_TSKTASK_MONTIME2` of table `dcnet_db/TSK_TASK` trx id 0677833454lock_mode X locks rec but not gap waiting Record lock, heap no 395PHYSICAL RECORD: n_fields 3; compact format; info bits 00: len 8; hex 8153872955960425; asc %;; 1: len 8; hex 800012412c66d29c; asc A,f ;; 2: len 8; hex 815387295596629c; asc b ;; *** WE ROLL BACK TRANSACTION(1)

我们假设涉事的数据表上面有一个索引,这次的死锁就是由于两条记录同时访问到了相同的索引造成的。

我们首先来看看 InnoDB 类型的数据表,只要能够解决索引问题,就可以解决死锁问题。MySQL 的 InnoDB 引擎是行级锁,需要注意的是,这不是对记录进行锁定,而是对索引进行锁定。在 UPDATE、DELETE 操作时,MySQL 不仅锁定 WHERE 条件扫描过的所有索引记录,而且会锁定相邻的键值,即所谓的 next-key locking;

如语句 UPDATE TSK_TASK SET UPDATE_TIME = NOW() WHERE ID > 10000 会锁定所有主键大于等于 1000 的所有记录,在该语句完成之前,你就不能对主键等于 10000 的记录进行操作;当非簇索引 (non-cluster index) 记录被锁定时,相关的簇索引 (cluster index) 记录也需要被锁定才能完成相应的操作。

再分析一下发生问题的两条 SQL 语句:

当“update TSK_TASK set STATUS_ID=1064,UPDATE_TIME=now () where STATUS_ID=1061 and MON_TIME

假设“update TSK_TASK set STATUS_ID=1067,UPDATE_TIME=now () where ID in (9921180)”几乎同时执行时,本语句首先锁定簇索引 (主键),由于需要更新 STATUS_ID 的值,所以还需要锁定 KEY_TSKTASK_MONTIME2 的某些索引记录。

这样第一条语句锁定了 KEY_TSKTASK_MONTIME2 的记录,等待主键索引,而第二条语句则锁定了主键索引记录,而等待 KEY_TSKTASK_MONTIME2 的记录,这样死锁就产生了。

我们通过拆分第一条语句解决了死锁问题:即先查出符合条件的 ID:select ID from TSK_TASK where STATUS_ID=1061 and MON_TIME < date_sub(now(), INTERVAL 30 minute);然后再更新状态:update TSK_TASK set STATUS_ID=1064 where ID in (….)。

结束语

我们发现,死锁虽然是较早就被发现的问题,但是很多情况下我们设计的程序里还是经常发生死锁情况。我们不能只是分析如何解决死锁这类问题,还需要具体找出预防死锁的方法,这样才能从根本上解决问题。总的来说,还是需要系统架构师、程序员不断积累经验,从业务逻辑设计层面彻底消除死锁发生的可能性

●本文编号212,以后想阅读这篇文章直接输入212即可。

●输入m可以获取到文章目录

推荐《》

涵盖:程序人生、算法与数据结构、黑客技术与网络安全、大数据技术、前端开发、Java、Python、Web开发、安卓开发、iOS开发、C/C++、.NET、Linux、数据库、运维等。传播计算机学习经验、推荐计算机优秀资源:点击前往《》!返回搜狐,查看更多