国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

使用Python和Java調用Shell腳本時的死鎖陷阱

freewolf / 2551人閱讀

摘要:一般使用或者調用外部腳本需要注意的是,這里的方向是相對于主程序的,所以就是子進程的輸出,而是子進程的輸入。基于同樣的原因,假如調用了方法等待子進程執行完畢而沒有及時處理輸出的話,就會造成死鎖。

最近有一項需求,要定時判斷任務執行條件是否滿足并觸發 Spark 任務,平時編寫 Spark 任務時都是封裝為一個 Jar 包,然后采用 Shell 腳本形式傳入所需參數執行,考慮到本次判斷條件邏輯復雜,只用 Shell 腳本完成不利于開發測試,所以調研使用了 Python 和 Java 分別調用 Spark 腳本的方法。

使用版本為 Python 3.6.4 及 JDK 8

Python

主要使用 subprocess 庫。Python 的 API 變動比較頻繁,在 3.5 之后新增了 run 方法,這大大降低了使用難度和遇見 Bug 的概率。

subprocess.run(["ls", "-l"])
subprocess.run(["sh", "/path/to/your/script.sh", "arg1", "arg2"])

為什么說使用 run 方法可以降低遇見 Bug 的概率呢?
在沒有 run 方法之前,我們一般調用其他的高級方法,即 Older high-level API,比如 callcheck_all,或者直接創建 Popen 對象。因為默認的輸出是 console,這時如果對 API 不熟悉或者沒有仔細看 doc,想要等待子進程運行完畢并獲取輸出,使用了 stdout = PIPE 再加上 wait 的話,當輸出內容很多時會導致 Buffer 寫滿,進程就一直等待讀取,形成死鎖。在一次將 Spark 的 log 輸出到 console 時,就遇到了這種奇怪的現象,下邊的腳本可以模擬:

# a.sh
for i in {0..9999}; do
    echo "***************************************************"
done 
p = subprocess.Popen(["sh", "a.sh"], stdout=subprocess.PIPE)
p.wait()

call 則在方法內部直接調用了 wait 產生相同的效果。
要避免死鎖,則必須在 wait 方法調用之前自行處理掉輸入輸出,或者使用推薦的 communicate 方法。 communicate 方法是在內部生成了讀取線程分別讀取 stdout stderr,從而避免了 Buffer 寫滿。而之前提到的新的 run 方法,就是在內部調用了 communicate

stdout, stderr = process.communicate(input, timeout=timeout)
Java

說完了 Python,Java 就簡單多了。
Java 一般使用 Runtime.getRuntime().exec() 或者 ProcessBuilder 調用外部腳本:

Process p = Runtime.getRuntime().exec(new String[]{"ls", "-al"});
Scanner sc = new Scanner(p.getInputStream());
while (sc.hasNextLine()) {
    System.out.println(sc.nextLine());
}
// or
Process p = new ProcessBuilder("sh", "a.sh").start();  
p.waitFor(); // dead lock    

需要注意的是,這里 stream 的方向是相對于主程序的,所以 getInputStream() 就是子進程的輸出,而 getOutputStream() 是子進程的輸入。

基于同樣的 Buffer 原因,假如調用了 waitFor 方法等待子進程執行完畢而沒有及時處理輸出的話,就會造成死鎖。
由于 Java API 很少變動,所以沒有像 Python 那樣提供新的 run 方法,但是開源社區也給出了自己的方案,如commons exec,或 http://www.baeldung.com/run-shell-command-in-java,或 alvin alexander 給出的方案(雖然不完整)。

// commons exec,要想獲取輸出的話,相比 python 來說要復雜一些
CommandLine commandLine = CommandLine.parse("sh a.sh");
        
ByteArrayOutputStream out = new ByteArrayOutputStream();
PumpStreamHandler streamHandler = new PumpStreamHandler(out);
        
Executor executor = new DefaultExecutor();
executor.setStreamHandler(streamHandler);
executor.execute(commandLine);
        
String output = new String(out.toByteArray());

但其中的思想和 Python 都是統一的,就是在后臺開啟新線程讀取子進程的輸出,防止 Buffer 寫滿。

另一個統一思想的地方就是,都推薦使用數組或 list 將輸入的 shell 命令分隔成多段,這樣的話就由系統來處理空格等特殊字符問題。

Original article in my Blog

參考:
https://dcreager.net/2009/08/06/subprocess-communicate-drawbacks/
https://alvinalexander.com/java/java-exec-processbuilder-process-1
https://www.javaworld.com/article/2071275/core-java/when-runtime-exec---won-t.html

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41283.html

相關文章

  • 使用PythonJava調用Shell腳本時的死鎖陷阱

    摘要:一般使用或者調用外部腳本需要注意的是,這里的方向是相對于主程序的,所以就是子進程的輸出,而是子進程的輸入。基于同樣的原因,假如調用了方法等待子進程執行完畢而沒有及時處理輸出的話,就會造成死鎖。 最近有一項需求,要定時判斷任務執行條件是否滿足并觸發 Spark 任務,平時編寫 Spark 任務時都是封裝為一個 Jar 包,然后采用 Shell 腳本形式傳入所需參數執行,考慮到本次判斷條件...

    wow_worktile 評論0 收藏0
  • SegmentFault 技術周刊 Vol.40 - 2018,來學習一門新的編程語言吧!

    摘要:入門,第一個這是一門很新的語言,年前后正式公布,算起來是比較年輕的編程語言了,更重要的是它是面向程序員的函數式編程語言,它的代碼運行在之上。它通過編輯類工具,帶來了先進的編輯體驗,增強了語言服務。 showImg(https://segmentfault.com/img/bV1xdq?w=900&h=385); 新的一年不知不覺已經到來了,總結過去的 2017,相信小伙們一定有很多收獲...

    caspar 評論0 收藏0
  • SegmentFault 技術周刊 Vol.40 - 2018,來學習一門新的編程語言吧!

    摘要:入門,第一個這是一門很新的語言,年前后正式公布,算起來是比較年輕的編程語言了,更重要的是它是面向程序員的函數式編程語言,它的代碼運行在之上。它通過編輯類工具,帶來了先進的編輯體驗,增強了語言服務。 showImg(https://segmentfault.com/img/bV1xdq?w=900&h=385); 新的一年不知不覺已經到來了,總結過去的 2017,相信小伙們一定有很多收獲...

    nihao 評論0 收藏0
  • SegmentFault 技術周刊 Vol.40 - 2018,來學習一門新的編程語言吧!

    摘要:入門,第一個這是一門很新的語言,年前后正式公布,算起來是比較年輕的編程語言了,更重要的是它是面向程序員的函數式編程語言,它的代碼運行在之上。它通過編輯類工具,帶來了先進的編輯體驗,增強了語言服務。 showImg(https://segmentfault.com/img/bV1xdq?w=900&h=385); 新的一年不知不覺已經到來了,總結過去的 2017,相信小伙們一定有很多收獲...

    Drummor 評論0 收藏0
  • 多線程編程完全指南

    摘要:在這個范圍廣大的并發技術領域當中多線程編程可以說是基礎和核心,大多數抽象并發問題的構思與解決都是基于多線程模型來進行的。一般來說,多線程程序會面臨三類問題正確性問題效率問題死鎖問題。 多線程編程或者說范圍更大的并發編程是一種非常復雜且容易出錯的編程方式,但是我們為什么還要冒著風險艱辛地學習各種多線程編程技術、解決各種并發問題呢? 因為并發是整個分布式集群的基礎,通過分布式集群不僅可以大...

    mengera88 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<