国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

Java HotSpot VM中的JIT編譯

caozhijian / 2718人閱讀

摘要:如同其它虛擬機,虛擬機為字節(jié)碼提供了一個運行時環(huán)境。編譯是一個混合模式的虛擬機,也就是說它既可以解釋字節(jié)碼,又可以將代碼編譯為本地機器碼以更快的執(zhí)行。解決此問題一般是在進程啟動后,對代碼進行預熱以使它們被強制編譯。

Java HotSpot虛擬機是Oracle收購Sun時獲得的,JVM和開源的OpenJDK都是以此虛擬機為基礎發(fā)展的。如同其它虛擬機,HotSpot虛擬機為字節(jié)碼提供了一個運行時環(huán)境。實際上,它主要會做這三件事情:

執(zhí)行方法所請求的指令和運算。

定位、加載和驗證新的類型(即類加載)。

管理應用內(nèi)存。

最后兩點都是各自領域的大話題,所以這篇文章中只關注代碼執(zhí)行。

JIT編譯

Java HotSpot是一個混合模式的虛擬機,也就是說它既可以解釋字節(jié)碼,又可以將代碼編譯為本地機器碼以更快的執(zhí)行。通過配置-XX:+PrintCompilation參數(shù),你可以在log文件中看到方法被JIT編譯時的信息。JIT編譯發(fā)生在運行時 —— 方法經(jīng)過多次運行之后。到方法需要使用到的時候,HotSpot VM會決定如何優(yōu)化這些代碼。

如果你好奇JIT編譯帶來的性能提升,可以使用-Djava.compiler=none將其關掉然后運行基準測試程序來看看它們的差別。

Java HotSpot虛擬機可以運行在兩種模式下:client或者server。你可以在JVM啟動時通過配置-client或者-server選項來選擇其中一種。兩種模式都有各自的適用場景,本文中,我們只會涉及到server模式。

兩種模式最主要的區(qū)別是server模式下會進行更激進的優(yōu)化 —— 這些優(yōu)化是建立在一些并不永遠為真的假設之上。一個簡單的保護條件(guard condition)會驗證這些假設是否成立,以確保優(yōu)化總是正確的。如果假設不成立,Java HotSpot虛擬機將會撤銷所做的優(yōu)化并退回到解釋模式。也就是說Java HotSpot虛擬機總是會先檢查優(yōu)化是否仍然有效,不會因為假設不再成立而表現(xiàn)出錯誤的行為。

在server模式下,Java
HotSpot虛擬機會默認在解釋模式下運行方法10000次才會觸發(fā)JIT編譯。可以通過虛擬機參數(shù)-XX:CompileThreshold來調(diào)整這個值。比如-XX:CompileThreshold=5000會讓觸發(fā)JIT編譯的方法運行次數(shù)減少一半。(譯者注:有關JIT觸發(fā)條件可參考《深入理解Java虛擬機》第十一章以及《Java Performance》第三章HotSpot VM JIT Compilers小節(jié))

這可能會誘使新手將編譯閾值調(diào)整到一個非常低的值。但要抵擋住這個誘惑,因為這樣可能會降低虛擬機性能,優(yōu)化后減少的方法執(zhí)行時間還不足以抵消花在JIT編譯上的時間。

當Java HotSpot虛擬機能為JIT編譯收集到足夠多的統(tǒng)計信息時,性能會最好。當你降低編譯閾值時,Java HotSpot虛擬機可能會在非熱點代碼的編譯中花費較多時間。有些優(yōu)化只有在收集到足夠多的統(tǒng)計信息時才會進行,所以降低編譯閾值可能導致優(yōu)化效果不佳。

另外一方面,很多開發(fā)者想讓一些重要方法在編譯模式下盡快獲得更好的性能。

解決此問題一般是在進程啟動后,對代碼進行預熱以使它們被強制編譯。對于像訂單系統(tǒng)或者交易系統(tǒng)來說,重要的是要確保預熱不會產(chǎn)生真實的訂單。

Java HotSpot虛擬機提供了很多參數(shù)來輸出JIT的編譯信息。最常用的就是前文提到的PrintCompilation,也還有一些其它參數(shù)。

接下來我們將使用PrintCompilation來觀察Java HotSpot虛擬機在運行時編譯方法的成效。但先有必要說一下用于計時的System.nanoTime()方法。

計時方法

Java為我們提供了兩個主要的獲取時間值的方法:currentTimeMillis()和nanoTime().前者對應于我們在實體世界中看到的時間(所謂的鐘表時間),它的精度能滿足大多數(shù)情況,但不適用于低延遲的應用。

納秒計時器擁有更高的精度。這種計時器度量時間的間隔極短。1納秒是光在光纖中移動20CM所需的時間,相比之下,光通過光纖從倫敦傳送到紐約大約需要27.5毫秒。

因為納秒級的時間戳精度太高,使用不當就會產(chǎn)生較大誤差,因此使用時需要注意。

如,currentTimeMillis()能很好的在機器間同步,可以用于測量網(wǎng)絡延遲,但nanoTime()不能跨機器使用。

接下來將上面的理論付諸實踐,來看一個很簡單(但極其強大)的JIT編譯技術。

方法內(nèi)聯(lián)

方法內(nèi)聯(lián)是編譯器優(yōu)化的關鍵手段之一。方法內(nèi)聯(lián)就是把方法的代碼“復制”到發(fā)起調(diào)用的方法里,以消除方法調(diào)用。這個功能相當重要,因為調(diào)用一個小方法可能比執(zhí)行該小方法的方法體耗時還多。

JIT編譯器可以進行漸進內(nèi)聯(lián),開始時內(nèi)聯(lián)簡單的方法,如果可以進行其它優(yōu)化時,就接著優(yōu)化內(nèi)聯(lián)后的較大的代碼塊。

Listing1,Listing1A以及Listing1B是個簡單的測試,將直接操作字段和通過getter/setter方法做了對比。如果簡單的getters和setters方法沒有使用內(nèi)聯(lián)的話,那調(diào)用它們的代價是相當大的,因為方法調(diào)用比直接操作字段代價更高。

Listing1:

public class Main {
    private static double timeTestRun(String desc, int runs, 
        Callable callable) throws Exception {
        long start = System.nanoTime();
        callable.call();
        long time = System.nanoTime() - start;
        return (double) time / runs;
    }

    // Housekeeping method to provide nice uptime values for us
    private static long uptime() {
        return ManagementFactory.getRuntimeMXBean().getUptime() + 15; 
    // fudge factor
    }

    public static void main(String... args) throws Exception {
        int iterations = 0;
        for (int i : new int[]
            { 100, 1000, 5000, 9000, 10000, 11000, 13000, 20000, 100000} ) {
            final int runs = i - iterations;
            iterations += runs;

            // NOTE: We return double (sum of values) from our test cases to
            // prevent aggressive JIT compilation from eliminating the loop in
            // unrealistic ways
            Callable directCall = new DFACaller(runs);
            Callable viaGetSet = new GetSetCaller(runs);

            double time1 = timeTestRun("public fields", runs, directCall);
            double time2 = timeTestRun("getter/setter fields", runs, viaGetSet);

            System.out.printf("%7d %,7d		field access=%.1f ns, getter/setter=%.1f ns%n",
                uptime(), iterations, time1, time2);
            // added to improve readability of the output
            Thread.sleep(100);
        }
    }
}

Listing1A:

public class DFACaller implements Callable{
    private final int runs;

    public DFACaller(int runs_) {
        runs = runs_;
    }

    @Override
    public Double call() {
        DirectFieldAccess direct = new DirectFieldAccess();
        double sum = 0;
        for (int i = 0; i < runs; i++) {
            direct.one++;
            sum += direct.one;
        }
        return sum;
    }
}

public class DirectFieldAccess {
    int one;
}

Listing1B:

public class GetSetCaller implements Callable {
    private final int runs;

    public GetSetCaller(int runs_) {
        runs = runs_;
    }

    @Override
    public Double call() {
        ViaGetSet getSet = new ViaGetSet();
        double sum = 0;
        for (int i = 0; i < runs; i++) {
            getSet.setOne(getSet.getOne() + 1);
            sum += getSet.getOne();
        }
        return sum;
    }
}

public class ViaGetSet {
    private int one;

    public int getOne() {
        return one;
    }

    public void setOne(int one) {
        this.one = one;
    }
}

如果使用java -cp. -XX:PrintCompilation Main 運行測試用例,就能看到性能上的差異(見Listing2)。

Listing2

 31    1     java.lang.String::hashCode (67 bytes) 
 36   100    field access=1970.0 ns, getter/setter=1790.0 ns 
 39    2     sun.nio.cs.UTF_8$Encoder::encode (361 bytes) 
 42    3     java.lang.String::indexOf (87 bytes) 
141   1,000 field access=16.7 ns, getter/setter=67.8 ns 
245   5,000 field access=16.8 ns, getter/setter=72.8 ns 
245    4     ViaGetSet::getOne (5 bytes) 
348   9,000 field access=16.0 ns, getter/setter=65.3 ns 
450    5     ViaGetSet::setOne (6 bytes) 
450  10,000 field access=16.0 ns, getter/setter=199.0 ns 
553    6     Main$1::call (51 bytes) 
554    7     Main$2::call (51 bytes) 
556    8     java.lang.String::charAt (33 bytes) 
556  11,000 field access=1263.0 ns, getter/setter=1253.0 ns 
658  13,000 field access=5.5 ns, getter/setter=1.5 ns 
760  20,000 field access=0.7 ns, getter/setter=0.7 ns 
862 100,000 field access=0.7 ns, getter/setter=0.7 ns 

這些是什么意思?Listing2中的第一列是程序啟動到語句執(zhí)行時所經(jīng)過的毫秒數(shù),第二列是方法ID(編譯后的方法)或遍歷次數(shù)。

注意:測試中沒有直接使用String和UTF_8類,但它們?nèi)匀怀霈F(xiàn)在編譯的輸出中,這是因為平臺使用了它們。

從Listing2中的第二行可以發(fā)現(xiàn),直接訪問字段和通過getter/setter都是比較慢的,這是因為第一次運行時包含了類加載的時間,下一行就比較快了,盡管此時還沒有任何代碼被編譯。

另外要注意下面幾點:

在遍歷1000和5000次時,直接操作字段比使用getter/setter方法快,因為getter 和setter還沒有內(nèi)聯(lián)或優(yōu)化。即便如此,它們都還相當?shù)乜臁?/p>

在遍歷9000次時,getter方法被優(yōu)化了(因為每次循環(huán)中調(diào)用了兩次),使性能有小許提高。

在遍歷10000次時,setter方法也被優(yōu)化了,因為需要額外花費時間去優(yōu)化,所以執(zhí)行速度降下來了。

最終,兩個測試類都被優(yōu)化了:

DFACaller直接操作字段,GetSetCaller使用getter和setter方法。此時它們不僅剛被優(yōu)化,還被內(nèi)聯(lián)了。

從下一次的遍歷中可以看到,測試用例的執(zhí)行時間仍不是最快的。

在13000次遍歷之后,兩種字段訪問方式的性能都和最后更長時間測試的結果一樣好,我們已經(jīng)達到了性能的穩(wěn)定狀態(tài)。

需要特別注意的是,直接訪問字段和通過getter/setter訪問在穩(wěn)定狀態(tài)下的性能是基本一致的,因為方法已經(jīng)被內(nèi)聯(lián)到GetSetCaller中,也就是說在viaGetSet中所做的事情和directCall中完全一樣。

JIT編譯是在后臺進行的。每次可用的優(yōu)化手段可能隨機器的不同而不同,甚至,同個程序的多次運行期間也可能不一樣。

總結

這篇文章中,我所描述的只是JIT編譯的冰山一角,尤其是沒有提到如何寫出好的基準測試以及如何使用統(tǒng)計信息以確保不會被平臺的動態(tài)性所愚弄。

這里使用的基準測試非常簡單,不適合做為真實的基準測試。在第二部分,我計劃向您展示一個真實的基準測試并繼續(xù)深入JIT編譯的過程。

原文 Introduction to JIT Compliation in Java Hotspot VM
譯者 郭蕾
校對丁一
via ifeve

文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/64069.html

相關文章

  • 學習JVM必看書籍

    學習JVM的相關資料 《深入理解Java虛擬機——JVM高級特性與最佳實踐(第2版)》 showImg(https://segmentfault.com/img/bVbsqF5?w=200&h=200); 基于最新JDK1.7,圍繞內(nèi)存管理、執(zhí)行子系統(tǒng)、程序編譯與優(yōu)化、高效并發(fā)等核心主題對JVM進行全面而深入的分析,深刻揭示JVM的工作原理。以實踐為導向,通過大量與實際生產(chǎn)環(huán)境相結合的案例展示了解...

    shaonbean 評論0 收藏0
  • JAVA刷題(持續(xù)更新)

    摘要:年期間微軟公司發(fā)布,無論是技術實現(xiàn)上還是目標用戶都與有很多相近之處,給帶來了很多討論比較和競爭對的發(fā)展進程影響很大。年月日大會上,公司宣布最終會將開源。及其他與公司爭奪的控制權,令從跨平臺技術變?yōu)榻壎ㄔ谏系募夹g是微軟公司的主要目的。 一、基礎 面向?qū)ο?面向?qū)ο蟾拍?面向?qū)ο?Object Oriented,OO)是軟件開發(fā)方法 對象:萬物皆對象,對象可以是具體的事物,也可以是抽象...

    cyixlq 評論0 收藏0
  • 譯文-Hotspot VM中Oop Maps的含義?

    摘要:原文出處是記錄棧中引用對象的數(shù)據(jù)結構。它的主要作用是發(fā)現(xiàn)棧中的對象,當對象被移動到堆中更新該對象的應用。采用延遲計算算法,當發(fā)生時,通過字節(jié)碼流分析。開發(fā)者手動創(chuàng)建這些運行時副本的作者。 原文出處:What does Oop Maps means in Hotspot VM exactly Oop Maps是記錄Java棧中引用對象的數(shù)據(jù)結構。它的主要作用是發(fā)現(xiàn)Java棧中的GC Ro...

    wujl596 評論0 收藏0
  • 實戰(zhàn)Java虛擬機之二“虛擬機的工作模式”

    摘要:今天開始實戰(zhàn)虛擬機之二虛擬機的工作模式。總計有個系列實戰(zhàn)虛擬機之一堆溢出處理實戰(zhàn)虛擬機之二虛擬機的工作模式實戰(zhàn)虛擬機之三的新生代實戰(zhàn)虛擬機之四禁用實戰(zhàn)虛擬機之五開啟編譯目前的虛擬機支持和兩種運行模式。 今天開始實戰(zhàn)Java虛擬機之二:虛擬機的工作模式。 總計有5個系列實戰(zhàn)Java虛擬機之一堆溢出處理實戰(zhàn)Java虛擬機之二虛擬機的工作模式實戰(zhàn)Java虛擬機之三G1的新生代GC實戰(zhàn)Jav...

    focusj 評論0 收藏0
  • JAVA運行時簡述(HotSpot)

    摘要:拆解虛擬機的基本步聚如下首先,要等待到自身成為唯一一個正在運行的非守護線程時,在整個等待過程中,虛擬機仍舊是可工作的。將相應的事件發(fā)送給,禁用,并終止信號線程。 本文簡單介紹HotSpot虛擬機運行時子系統(tǒng),內(nèi)容來自不同的版本,因此可能會與最新版本之間(當前為JDK12)存在一些誤差。 1.命令行參數(shù)處理HotSpot虛擬機中有大量的可影響性能的命令行屬性,可根據(jù)他們的消費者進行簡...

    hosition 評論0 收藏0

發(fā)表評論

0條評論

caozhijian

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<