三種避免死鎖的思路

tomorrowwu 發布于2019-08-14 11:38 / 1598人閱讀

摘要：本文將展示三種用于避免死鎖的技術加鎖順序加鎖時限死鎖檢測加鎖順序當多個線程需要相同的一些鎖，但是按照不同的順序加鎖，死鎖就很容易發生。

死鎖是兩個或更多線程阻塞著等待其它處于死鎖狀態的線程所持有的鎖。死鎖通常發生在多個線程同時但以不同的順序請求同一組鎖的時候。死鎖原理請參考此文。

在有些情況下死鎖是可以避免的。本文將展示三種用于避免死鎖的技術：

加鎖順序

加鎖時限

死鎖檢測

加鎖順序

當多個線程需要相同的一些鎖，但是按照不同的順序加鎖，死鎖就很容易發生。

如果能確保所有的線程都是按照相同的順序獲得鎖，那么死鎖就不會發生。看下面這個例子：

Thread 1:
  lock A 
  lock B

Thread 2:
   wait for A
   lock C (when A locked)

Thread 3:
   wait for A
   wait for B
   wait for C

如果一個線程（比如線程3）需要一些鎖，那么它必須按照確定的順序獲取鎖。它只有獲得了從順序上排在前面的鎖之后，才能獲取后面的鎖。

例如，線程2和線程3只有在獲取了鎖A之后才能嘗試獲取鎖C(譯者注：獲取鎖A是獲取鎖C的必要條件)。因為線程1已經擁有了鎖A，所以線程2和3需要一直等到鎖A被釋放。然后在它們嘗試對B或C加鎖之前，必須成功地對A加了鎖。

按照順序加鎖是一種有效的死鎖預防機制。但是，這種方式需要你事先知道所有可能會用到的鎖(譯者注：并對這些鎖做適當的排序)，但總有些時候是無法預知的。

加鎖時限

另外一個可以避免死鎖的方法是在嘗試獲取鎖的時候加一個超時時間，這也就意味著在嘗試獲取鎖的過程中若超過了這個時限該線程則放棄對該鎖請求。若一個線程沒有在給定的時限內成功獲得所有需要的鎖，則會進行回退并釋放所有已經獲得的鎖，然后等待一段隨機的時間再重試。這段隨機的等待時間讓其它線程有機會嘗試獲取相同的這些鎖，并且讓該應用在沒有獲得鎖的時候可以繼續運行(譯者注：加鎖超時后可以先繼續運行干點其它事情，再回頭來重復之前加鎖的邏輯)。

以下是一個例子，展示了兩個線程以不同的順序嘗試獲取相同的兩個鎖，在發生超時后回退并重試的場景：

Thread 1 locks A
Thread 2 locks B

Thread 1 attempts to lock B but is blocked
Thread 2 attempts to lock A but is blocked

Thread 1"s lock attempt on B times out
Thread 1 backs up and releases A as well
Thread 1 waits randomly (e.g. 257 millis) before retrying.

Thread 2"s lock attempt on A times out
Thread 2 backs up and releases B as well
Thread 2 waits randomly (e.g. 43 millis) before retrying.

在上面的例子中，線程2比線程1早200毫秒進行重試加鎖，因此它可以先成功地獲取到兩個鎖。這時，線程1嘗試獲取鎖A并且處于等待狀態。當線程2結束時，線程1也可以順利的獲得這兩個鎖（除非線程2或者其它線程在線程1成功獲得兩個鎖之前又獲得其中的一些鎖）。

需要注意的是，由于存在鎖的超時，所以我們不能認為這種場景就一定是出現了死鎖。也可能是因為獲得了鎖的線程（導致其它線程超時）需要很長的時間去完成它的任務。

此外，如果有非常多的線程同一時間去競爭同一批資源，就算有超時和回退機制，還是可能會導致這些線程重復地嘗試但卻始終得不到鎖。如果只有兩個線程，并且重試的超時時間設定為0到500毫秒之間，這種現象可能不會發生，但是如果是10個或20個線程情況就不同了。因為這些線程等待相等的重試時間的概率就高的多（或者非常接近以至于會出現問題）。

(譯者注：超時和重試機制是為了避免在同一時間出現的競爭，但是當線程很多時，其中兩個或多個線程的超時時間一樣或者接近的可能性就會很大，因此就算出現競爭而導致超時后，由于超時時間一樣，它們又會同時開始重試，導致新一輪的競爭，帶來了新的問題。)

這種機制存在一個問題，在Java中不能對synchronized同步塊設置超時時間。你需要創建一個自定義鎖，或使用Java5中java.util.concurrent包下的工具。寫一個自定義鎖類不復雜，但超出了本文的內容。后續的Java并發系列會涵蓋自定義鎖的內容。

死鎖檢測

死鎖檢測是一個更好的死鎖預防機制，它主要是針對那些不可能實現按序加鎖并且鎖超時也不可行的場景。

每當一個線程獲得了鎖，會在線程和鎖相關的數據結構中（map、graph等等）將其記下。除此之外，每當有線程請求鎖，也需要記錄在這個數據結構中。

當一個線程請求鎖失敗時，這個線程可以遍歷鎖的關系圖看看是否有死鎖發生。例如，線程A請求鎖7，但是鎖7這個時候被線程B持有，這時線程A就可以檢查一下線程B是否已經請求了線程A當前所持有的鎖。如果線程B確實有這樣的請求，那么就是發生了死鎖（線程A擁有鎖1，請求鎖7；線程B擁有鎖7，請求鎖1）。

當然，死鎖一般要比兩個線程互相持有對方的鎖這種情況要復雜的多。線程A等待線程B，線程B等待線程C，線程C等待線程D，線程D又在等待線程A。線程A為了檢測死鎖，它需要遞進地檢測所有被B請求的鎖。從線程B所請求的鎖開始，線程A找到了線程C，然后又找到了線程D，發現線程D請求的鎖被線程A自己持有著。這是它就知道發生了死鎖。

下面是一幅關于四個線程（A,B,C和D）之間鎖占有和請求的關系圖。像這樣的數據結構就可以被用來檢測死鎖。

那么當檢測出死鎖時，這些線程該做些什么呢？

一個可行的做法是釋放所有鎖，回退，并且等待一段隨機的時間后重試。這個和簡單的加鎖超時類似，不一樣的是只有死鎖已經發生了才回退，而不會是因為加鎖的請求超時了。雖然有回退和等待，但是如果有大量的線程競爭同一批鎖，它們還是會重復地死鎖（編者注：原因同超時類似，不能從根本上減輕競爭）。

一個更好的方案是給這些線程設置優先級，讓一個（或幾個）線程回退，剩下的線程就像沒發生死鎖一樣繼續保持著它們需要的鎖。如果賦予這些線程的優先級是固定不變的，同一批線程總是會擁有更高的優先級。為避免這個問題，可以在死鎖發生的時候設置隨機的優先級。

原文 Deadlock Prevention
譯者：申章 ??校對：丁一
via ifeve

GPU云服務器云服務器死鎖的形成給個明確的思路數據分析的思路云計算的三種服務模式

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/64038.html

Java基礎學習——多線程之線程間通信（安全問題、等待喚醒機制）

摘要：線程間通信其實就是多個線程操作同一個資源，但動作不同。同步前提是多線程。將該線程載入線程池，等待喚醒。該方法拋出異常，故需要配合使用隨機喚醒線程池中一線程。線程為了檢測死鎖，它需要遞進地檢測所有被請求的鎖。線程間通信其實就是多個線程操作同一個資源，但動作不同。示例：在某個數據庫中，Input輸入人的姓名，性別，Output輸出，兩個線程同時作用。思考：1.明確哪些代碼是多線程操作的...

CocoaChina 2019-08-16 10:26 評論0 收藏0
多線程之死鎖就是這么簡單

摘要：此時線程需要鎖才能繼續往下執行。但是線程的鎖并沒有釋放，線程的鎖也沒有釋放。前言只有光頭才能變強回顧前面： ThreadLocal就是這么簡單多線程三分鐘就可以入個門了！多線程基礎必要知識點！看了學習多線程事半功倍 Java鎖機制了解一下 AQS簡簡單單過一遍 Lock鎖子類了解一下線程池你真不來了解一下嗎？本篇主要是講解死鎖，這是我在多線程的最后一篇了。主要將多線程...

winterdawn 2019-08-16 11:14 評論0 收藏0
數據庫并發控制協議

摘要：關于串行化與一致性的關系數據庫并發控制的基本目標是確保事務的并發執行不會導致數據庫一致性的丟失。該請求發送給并發控制管理器，只有并發控制管理器授予所需鎖后，事務才能繼續其操作。全文主要參考數據庫系統概念一書以及mooc上戰德臣老師的數據庫課程　　事務最基本的特性之一是隔離性，當數據庫中有多個事務并發執行的時候，隔離性不一定能保持。為了保持事務的隔離性，系統必須對并發事務之間的相互作用...

glumes 2019-06-25 18:54 評論0 收藏0
[Java并發-4]解決Java死鎖的問題

摘要：例如，張三同時申請賬本和，賬本管理員如果發現文件架上只有賬本，這個時候賬本管理員是不會把賬本拿下來給張三的，只有賬本和都在的時候才會給張三。但仍需注意的是，有時候預防死鎖成本也是很高的。在上一篇中，我們嘗試使用了 Account.class作為互斥鎖，來解決轉賬問題。但是很容易發現這樣，所有的轉賬操作都是串行的，性能太差了。讓我們嘗試提升下性能。向現實世界要答案現實世界中，轉賬...

stonezhu 2019-08-16 16:44 評論0 收藏0