摘要:建立一個基線測試作比較很重要。然而,相對于一個經典的排序算法基線如快速排序,你可以說,處理萬元素比去快。這一關聯由測試向量來維護。接著,測試的開始時間被獲取到并以毫秒的形式用一個保存起來。運行一個手動測試。對每一個基線組固定測試。
介紹
對代碼進行持續性開發和有意義的基準測試是一個復雜的任務。雖然測試工具本身(Intel? VTune? Amplifier, SmartBear AQTime, Valgrind)與應用程序沒有相關性,但是它們在某些時候對一些小團隊,或者說是一些繁瑣的工作來說還是很重要的。這個Celero項目,主要是要建倉一個小型的程序庫,使它可以在加入 C++ 工程和對代碼進行基準測試時能夠非常容易地去重建,分享,并允許在獨立的運行進程、開發者或者是工程間進行比較。Celero 使用一個與 GoogleTest 相似的構架,使得他的 API 很容易地使用,并融入一個工程中。當你在開發過程中進行自動測試時,自動化基準將會扮演舉足輕重的作用。
背景通常,編寫基準的目的是為了測量一段代碼的性能。基準有助于比較解決同一問題的不同方案并選擇其中最合適的一個。其他時候,基準能以一種很有意義的方式突出設計或算法改變后的性能影響。
通過測量代碼的性能,可以為性能消除那些你以為是正確方案的錯誤。只有通過測量,你才能確定比如用一張查找表比計算一個值更快。這種傳聞(通常是重復的)可能導致糟糕的設計決策,最終生成效率更慢的代碼。
編寫好的基準的目的是為了消除所有噪音和開銷,并且只測量被測代碼。在測量中,噪音源包括時鐘分辨率噪音、操作系統后臺操作、測試設置/清除、框架開銷以及其他不相干的系統行為。
理論上,我們想測量被測代碼的執行時間“t”。實際上,我們測到的是“t”與所有噪音的和。
這些影響我們測量的“t”的不相干因素會隨時間變化而波動。因此,我們想試圖將“t”隔離出來。實現這樣的方法是通過多次測量,但只保留最小的總時間。這個最小的總時間必然是受噪音干擾最小且最接近時間“t”的值。
一旦得到這個測量值,在進行隔離就沒什么意義了。建立一個基線測試作比較很重要。基線通常應該是一個基于你正要測量出一個解決方案的問題的“經典”或“純粹”的方案。一旦有了一個基線,你花時間去比較你的算法就有意義。簡單地說,你中意的排序算法(fSort)不能在10毫秒內自動排序100萬元素。然而,相對于一個經典的排序算法基線如快速排序(qSort),你可以說,fSort處理100萬元素比去Sort快50%。這是個很有意義且強大的測量。
Celero大量使用Visual C++和GCC4.7都支持的C++11特性。這對使代碼整潔、便攜大有幫助。為了使代碼更容易采用,用戶所需的所有定義都放在一個命名空間為celero的單一頭文件:Celero.h里。
Celero.h里包含將每個用戶基準用例轉換為獨特的、具有與之相關測試固件的類(如果有的話),然后登記測試用例到一個工廠。這些宏自動將基線測試用例與相關的測試基準關聯起來,這樣,在運行時基準相關的數據就可以被算出。這一關聯由測試向量來維護。
測試向量利用PImpl慣語來隱藏實現并且保持包含Celero.h的開銷降到最小。
Celero將結果輸出到命令行。因為顏色是有用的(可能有助于主觀因素/結果的可讀性),所以std::cout調用了自身之外的一些東西。Console.h定義了一個簡單的顏色函數,SetConsoleColor,它可以被celero::print命名空間中的函數用來格式化程序的輸出。
測量基準的執行時間位于TestFixturebase類中,而且所有基準的寫法都是以此為基礎派生出來的。首先,測試夾具(譯注:test fixture 是檢測被測試系統時所需要的所有東西)的創建代碼被執行。接著,測試的開始時間被獲取到并以毫秒的形式用一個unsigned long保存起來。這么做是為了減少浮點指針錯誤。再下一步,指定次數的操作(迭代)被執行。結束時,結束時間被抓取到,測試夾具銷毀,本次執行的測量時間被返回,并且這個結果會被保存下來。
無論指定多少個樣本,這個循環就像這樣重復。如果樣本沒有指定(為零),那么測試將會重復運行直到一秒鐘,或者至少采集了30個樣本。當寫到代碼的這個特定部分時,顯然這里存在有一種“if-else”的關系。不管怎么說,大量的代碼都是如此重復著“if”與"else"的片段。這里可以使用一個老式的函數,但是利用std::function來定義一個 匿名函數(lambda)再自然不過,這樣就可以調用它并使所有的代碼整潔。(c++ 11真是一個奇妙的東西)最后,結果被打印到屏幕。
Celero 使用 CMake 去提供跨平臺構件。由于它使用得是 C++ 11,因而需要請求一個現在流行的編譯器(Visual C++ 2012 or GCC 4.7+)。
一旦你的項目中加入了 Celero,你能夠創建專門的基準項目和源文件。為了方便,一個頭文件和aCELERO_MAINmacro 能提供給 main() ,來幫助你的基準項目自動去執行所有的基準測試。
下面有一個簡單的 Celero 基準的例子:
#includeCELERO_MAIN; // 運行一個自動的基線。 // Celero 保證能提供足夠的采樣來得到一個合理的測量結果 BASELINE(CeleroBenchTest, Baseline, 0, 7100000) { celero::DoNotOptimizeAway(static_cast (sin(3.14159265))); } // 運行一個自動測試。 // Celero 保證能提供足夠的采樣來得到一個合理的測量結果 BENCHMARK(CeleroBenchTest, Complex1, 0, 7100000) { celero::DoNotOptimizeAway(static_cast (sin(fmod(rand(), 3.14159265)))); } // 運行一個手動測試。這是對一個樣本進行每秒 7100000 次操作。 // Celero 保證能提供足夠的采樣來得到一個合理的測量結果。 BENCHMARK(CeleroBenchTest, Complex2, 1, 7100000) { celero::DoNotOptimizeAway(static_cast (sin(fmod(rand(), 3.14159265)))); } // 運行一個手動測試。這是對 60 個樣本進行每秒 7100000 次操作。 // Celero 保證能提供足夠的采樣來得到一個合理的測量結果。 BENCHMARK(CeleroBenchTest, Complex3, 60, 7100000) { celero::DoNotOptimizeAway(static_cast (sin(fmod(rand(), 3.14159265)))); }
這段代碼中我們做的第一件事情,就是定義一個BASELINE測試用例。這個模版有四個參數:
BASELINE(GroupName, BaselineName, Samples, Operations)
* GroupName- 基準組的名字。它是用來將運行與結果和它們相應的基線測量收集到一起。
* BaselineName- 為了報表目的的基線的名字。
* Samples- 對測試代碼進行給定次數的操作,對這些操作的總的循環運行次數。
* Operations- 你希望對每個樣本運行測試代碼的次數。
這里的樣本與操作是用來測量非常快的代碼的。例如,如果你知道基準測試中的代碼運行時間小于100毫秒,那么在進行一次測量之前,這個操作次數將會指定代碼運行"operations"次。而Samples則定義了要做多少次測量。
Celero允許指定零樣本也有助于此。零樣本將告訴Celero,基于完成指定次數操作所需要的時間,采集一些具有統計學意義數量的樣本。這些數字將會在運行時給出。
celero::DoNotOptimizeAway模版是用來保證優化編譯器不會消除你的函數或代碼。由于這個功能被用于所有的基準樣本以及它們的基線,所以相比較起來其中的額外時間消耗可以忽略不計。
在基線被定義之后,接著被定義的是各種各樣的基準。BENCHMARK宏的語法與普通宏的語法完全相同。
示例項目被設置為一旦成功編譯就自動執行基準測試代碼。在我的PC上運行這個基準測試得到的是以下的輸出:
[ CELERO ] [==========] [ STAGE ] Baselining [==========] [ RUN ] CeleroBenchTest.Baseline -- Auto Run, 7100000 calls per run. [ AUTO ] CeleroBenchTest.Baseline -- 30 samples, 7100000 calls per run. [ DONE ] CeleroBenchTest.Baseline (0.517049 sec) [7100000 calls in 517049 usec] [0.072824 us/call] [13731773.971132 calls/sec] [==========] [ STAGE ] Benchmarking [==========] [ RUN ] CeleroBenchTest.Complex1 -- Auto Run, 7100000 calls per run. [ AUTO ] CeleroBenchTest.Complex1 -- 30 samples, 7100000 calls per run. [ DONE ] CeleroBenchTest.Complex1 (2.192290 sec) [7100000 calls in 2192290 usec] [0.308773 us/call] [3238622.627481 calls/sec] [ BASELINE ] CeleroBenchTest.Complex1 4.240004 [ RUN ] CeleroBenchTest.Complex2 -- 1 run, 7100000 calls per run. [ DONE ] CeleroBenchTest.Complex2 (2.199197 sec) [7100000 calls in 2199197 usec] [0.309746 us/call] [3228451.111929 calls/sec] [ BASELINE ] CeleroBenchTest.Complex2 4.253363 [ RUN ] CeleroBenchTest.Complex3 -- 60 samples, 7100000 calls per run. [ DONE ] CeleroBenchTest.Complex3 (2.192378 sec) [7100000 calls in 2192378 usec] [0.308786 us/call] [3238492.632201 calls/sec] [ BASELINE ] CeleroBenchTest.Complex3 4.240175 [==========] [ STAGE ] Completed. 4 tests complete. [==========]
首次運行的測試將作為整個組測試的基線。這個基線顯示出它是一個“自動測試”,暗示著由Celero來衡量并決策運行測試代碼的次數。這個案例中,在我們的測試里它要運行7100000次代碼迭代總共30次。(每調用7100000次測量一次,這樣30次以后取最小的時間。)整個測量需要0.517049秒。基于這個結果,可以測量出每次對基準代碼的調用需要0.072824毫秒。
在基線測試結束之后,將運行每個多帶帶的測試。每個測試的運行與測量方式都是相同的,不過有一個額外的度量報告:基線。將它運行基準測試代碼所需要的時間與基線進行比較。這里的數據顯示,CeleroBenchTest.Complex1比基線運行需要的時間多了4.240004倍。
GitHub 項目點擊 這里.
基準應該總是要在發行版本中運行。但這絕對不是要求建立一個調試工程,也不是要改變原本的結果。編譯器(進行優化)將對你的代碼的執行起到非常好的作用。
Celero 在 Doxygen 中存放了 API 文檔。
Celero 對每一個基線組固定測試。
當監聽到第三個存儲槽時,執行代碼使基準運行得更快。這是多么有趣的事啊!
原文:Celero - A C++ Benchmark Authoring Library
轉載自:開源中國社區--super0555, 竟悟, jimmyjmh
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/8686.html
摘要:推薦閱讀資源庫工具應用程序精選列表中文版有哪些鮮為人知,但是很有意思的網站一份攻城獅筆記每天搜集上優秀的項目一些有趣的民間故事超好用的谷歌瀏覽器油猴插件合集目錄資源文檔文章圖書會談教程更多庫工具管理數據部署桌面發展監控應用資源文檔介紹文檔教 推薦閱讀 MongoDB 資源、庫、工具、應用程序精選列表中文版 有哪些鮮為人知,但是很有意思的網站? 一份攻城獅筆記 每天搜集 Github ...
摘要:安全生成安全的隨機數,加密數據,掃描漏洞的庫一個兼容標準的過濾器一個生成隨機數和字符串的庫使用生成隨機數的庫一個安全庫一個純安全通信庫一個簡單的鍵值加密存儲庫一個結構化的安全層一個試驗的面向對象的包裝庫一個掃描文件安全的庫 Security 安全 生成安全的隨機數,加密數據,掃描漏洞的庫 HTML Purifier-一個兼容標準的HTML過濾器 RandomLib-一個生成隨機數和字...
摘要:安全生成安全的隨機數,加密數據,掃描漏洞的庫一個兼容標準的過濾器一個生成隨機數和字符串的庫使用生成隨機數的庫一個安全庫一個純安全通信庫一個簡單的鍵值加密存儲庫一個結構化的安全層一個試驗的面向對象的包裝庫一個掃描文件安全的庫 Security 安全 生成安全的隨機數,加密數據,掃描漏洞的庫 HTML Purifier-一個兼容標準的HTML過濾器 RandomLib-一個生成隨機數和字...
摘要:誕生已經有十年之久,但是真正起勢得益于去年開源了大量的深度學習模塊和擴展。來自一個日本的深度學習創業公司,今年月發布的一個框架。顧名思義,是的深度學習框架,也是較早的商用級別的深度學習開源庫。 本周早些時候Google開源了TensorFlow(GitHub),此舉在深度學習領域影響巨大,因為Google在人工智能領域的研發成績斐然,有著雄厚的人才儲備,而且Google自己的Gmail和搜索...
閱讀 2771·2021-09-24 10:34
閱讀 1875·2021-09-22 10:02
閱讀 2262·2021-09-09 09:33
閱讀 1466·2021-08-13 15:02
閱讀 3277·2020-12-03 17:10
閱讀 1191·2019-08-30 15:44
閱讀 2152·2019-08-30 12:58
閱讀 3236·2019-08-26 13:40