国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

TiKV 源碼解析系列文章(三)Prometheus(上)

TNFE / 2373人閱讀

摘要:指標(biāo)實際上最終會提供一系列時序數(shù)據(jù)觀測值落在各個桶上的累計數(shù)量,如落在各個區(qū)間上的數(shù)量。我們將在發(fā)布后為也使用上原生的原子操作從而提高效率。例如,假設(shè)用戶定義了個桶邊界,分別是,則每個桶對應(yīng)的數(shù)值范圍是,對于觀測值來說需要更新四個桶。

作者:Breezewish

本文為 TiKV 源碼解析系列的第三篇,繼續(xù)為大家介紹 TiKV 依賴的周邊庫 [rust-prometheus],本篇主要介紹基礎(chǔ)知識以及最基本的幾個指標(biāo)的內(nèi)部工作機(jī)制,下篇會介紹一些高級功能的實現(xiàn)原理。

[rust-prometheus] 是監(jiān)控系統(tǒng) [Prometheus] 的 Rust 客戶端庫,由 TiKV 團(tuán)隊實現(xiàn)。TiKV 使用 [rust-prometheus] 收集各種指標(biāo)(metric)到 Prometheus 中,從而后續(xù)能再利用 [Grafana] 等可視化工具將其展示出來作為儀表盤監(jiān)控面板。這些監(jiān)控指標(biāo)對于了解 TiKV 當(dāng)前或歷史的狀態(tài)具有非常關(guān)鍵的作用。TiKV 提供了豐富的監(jiān)控指標(biāo)數(shù)據(jù),并且代碼中也到處穿插了監(jiān)控指標(biāo)的收集片段,因此了解 [rust-prometheus] 很有必要。

感興趣的小伙伴還可以觀看我司同學(xué)在 [FOSDEM 2019] 會議上關(guān)于 rust-prometheus 的技術(shù)分享。

基礎(chǔ)知識 指標(biāo)類別

[Prometheus] 支持四種指標(biāo):Counter、Gauge、Histogram、Summary。[rust-prometheus] 庫目前還只實現(xiàn)了前三種。TiKV 大部分指標(biāo)都是 Counter 和 Histogram,少部分是 Gauge。

Counter

[Counter] 是最簡單、常用的指標(biāo),適用于各種計數(shù)、累計的指標(biāo),要求單調(diào)遞增。Counter 指標(biāo)提供基本的 inc()inc_by(x) 接口,代表增加計數(shù)值。

在可視化的時候,此類指標(biāo)一般會展示為各個時間內(nèi)增加了多少,而不是各個時間計數(shù)器值是多少。例如 TiKV 收到的請求數(shù)量就是一種 Counter 指標(biāo),在監(jiān)控上展示為 TiKV 每時每刻收到的請求數(shù)量圖表(QPS)。

Gauge

[Gauge] 適用于上下波動的指標(biāo)。Gauge 指標(biāo)提供 inc()、dec()add(x)sub(x)set(x) 接口,都是用于更新指標(biāo)值。

這類指標(biāo)可視化的時候,一般就是直接按照時間展示它的值,從而展示出這個指標(biāo)按時間是如何變化的。例如 TiKV 占用的 CPU 率是一種 Gauge 指標(biāo),在監(jiān)控上所展示的直接就是 CPU 率的上下波動圖表。

Histogram

[Histogram] 即直方圖,是一種相對復(fù)雜但同時也很強(qiáng)大的指標(biāo)。Histogram 除了基本的計數(shù)以外,還能計算分位數(shù)。Histogram 指標(biāo)提供 observe(x) 接口,代表觀測到了某個值。

舉例來說,TiKV 收到請求后處理的耗時就是一種 Histogram 指標(biāo),通過 Histogram 類型指標(biāo),監(jiān)控上可以觀察 99%、99.9%、平均請求耗時等。這里顯然不能用一個 Counter 存儲耗時指標(biāo),否則展示出來的只是每時每刻中 TiKV 一共花了多久處理,而非單個請求處理的耗時情況。當(dāng)然,機(jī)智的你可能想到了可以另外開一個 Counter 存儲請求數(shù)量指標(biāo),這樣累計請求處理時間除以請求數(shù)量就是各個時刻平均請求耗時了。

實際上,這也正是 Prometheus 中 Histogram 的內(nèi)部工作原理。Histogram 指標(biāo)實際上最終會提供一系列時序數(shù)據(jù):

觀測值落在各個桶(bucket)上的累計數(shù)量,如落在 (-∞, 0.1](-∞, 0.2]、(-∞, 0.4](-∞, 0.8]、(-∞, 1.6](-∞, +∞) 各個區(qū)間上的數(shù)量。

觀測值的累積和。

觀測值的個數(shù)。

bucket 是 Prometheus 對于 Histogram 觀測值的一種簡化處理方式。Prometheus 并不會具體記錄下每個觀測值,而是只記錄落在配置的各個 bucket 區(qū)間上的觀測值的數(shù)量,這樣以犧牲一部分精度的代價大大提高了效率。

Summary

[Summary] 與 [Histogram] 類似,針對觀測值進(jìn)行采樣,但分位數(shù)是在客戶端進(jìn)行計算。該類型的指標(biāo)目前在 [rust-prometheus] 中沒有實現(xiàn),因此這里不作進(jìn)一步詳細(xì)介紹。大家可以閱讀 Prometheus 官方文檔中的介紹了解詳細(xì)情況。感興趣的同學(xué)也可以參考其他語言 Client Library 的實現(xiàn)為 [rust-prometheus] 貢獻(xiàn)代碼。

標(biāo)簽

Prometheus 的每個指標(biāo)支持定義和指定若干組標(biāo)簽([Label]),指標(biāo)的每個標(biāo)簽值獨立計數(shù),表現(xiàn)了指標(biāo)的不同維度。例如,對于一個統(tǒng)計 HTTP 服務(wù)請求耗時的 Histogram 指標(biāo)來說,可以定義并指定諸如 HTTP Method(GET / POST / PUT / ...)、服務(wù) URL、客戶端 IP 等標(biāo)簽。這樣可以輕易滿足以下類型的查詢:

查詢 Method 分別為 POST、PUT、GET 的 99.9% 耗時(利用單一 Label)

查詢 POST /api 的平均耗時(利用多個 Label 組合)

普通的查詢諸如所有請求 99.9% 耗時也能正常工作。

需要注意的是,不同標(biāo)簽值都是一個獨立計數(shù)的時間序列,因此應(yīng)當(dāng)避免標(biāo)簽值或標(biāo)簽數(shù)量過多,否則實際上客戶端會向 Prometheus 服務(wù)端傳遞大量指標(biāo),影響效率。

與 Prometheus [Golang client] 類似,在 [rust-prometheus] 中,具有標(biāo)簽的指標(biāo)被稱為 Metric Vector。例如 Histogram 指標(biāo)對應(yīng)的數(shù)據(jù)類型是 [Histogram],而具有標(biāo)簽的 Histogram 指標(biāo)對應(yīng)的數(shù)據(jù)類型是 [HistogramVec]。對于一個 [HistogramVec],提供它的各個標(biāo)簽取值后,可獲得一個 [Histogram] 實例。不同標(biāo)簽取值會獲得不同的 [Histogram] 實例,各個 [Histogram] 實例獨立計數(shù)。

基本用法

本節(jié)主要介紹如何在項目中使用 [rust-prometheus] 進(jìn)行各種指標(biāo)收集。使用基本分為三步:

定義想要收集的指標(biāo)。

在代碼特定位置調(diào)用指標(biāo)提供的接口收集記錄指標(biāo)值。

實現(xiàn) HTTP Pull Service 使得 Prometheus 可以定期訪問收集到的指標(biāo),或使用 rust-prometheus 提供的 Push 功能定期將收集到的指標(biāo)上傳到 [Pushgateway]。

注意,以下樣例代碼都是基于本文發(fā)布時最新的 rust-prometheus 0.5 版本 API。我們目前正在設(shè)計并實現(xiàn) 1.0 版本,使用上會進(jìn)一步簡化,但以下樣例代碼可能在 1.0 版本發(fā)布后過時、不再工作,屆時請讀者參考最新的文檔。
定義指標(biāo)

為了簡化使用,一般將指標(biāo)聲明為一個全局可訪問的變量,從而能在代碼各處自由地操縱它。rust-prometheus 提供的各個指標(biāo)(包括 Metric Vector)都滿足 Send + Sync,可以被安全地全局共享。

以下樣例代碼借助 [lazy_static] 庫定義了一個全局的 Histogram 指標(biāo),該指標(biāo)代表 HTTP 請求耗時,并且具有一個標(biāo)簽名為 method

#[macro_use]
extern crate prometheus;

lazy_static! {
   static ref REQUEST_DURATION: HistogramVec = register_histogram_vec!(
       "http_requests_duration",
       "Histogram of HTTP request duration in seconds",
       &["method"],
       exponential_buckets(0.005, 2.0, 20).unwrap()
   ).unwrap();
}
記錄指標(biāo)值

有了一個全局可訪問的指標(biāo)變量后,就可以在代碼中通過它提供的接口記錄指標(biāo)值了。在“基礎(chǔ)知識”中介紹過,[Histogram] 最主要的接口是 observe(x),可以記錄一個觀測值。若想了解 [Histogram] 其他接口或其他類型指標(biāo)提供的接口,可以參閱 [rust-prometheus 文檔]。

以下樣例在上段代碼基礎(chǔ)上展示了如何記錄指標(biāo)值。代碼模擬了一些隨機(jī)值用作指標(biāo),裝作是用戶產(chǎn)生的。在實際程序中,這些當(dāng)然得改成真實數(shù)據(jù) :)

fn thread_simulate_requests() {
   let mut rng = rand::thread_rng();
   loop {
       // Simulate duration 0s ~ 2s
       let duration = rng.gen_range(0f64, 2f64);
       // Simulate HTTP method
       let method = ["GET", "POST", "PUT", "DELETE"].choose(&mut rng).unwrap();
       // Record metrics
       REQUEST_DURATION.with_label_values(&[method]).observe(duration);
       // One request per second
       std::thread::sleep(std::time::Duration::from_secs(1));
   }
}
Push / Pull

到目前為止,代碼還僅僅是將指標(biāo)記錄了下來。最后還需要讓 Prometheus 服務(wù)端能獲取到記錄下來的指標(biāo)數(shù)據(jù)。這里一般有兩種方式,分別是 Push 和 Pull。

Pull 是 Prometheus 標(biāo)準(zhǔn)的獲取指標(biāo)方式,Prometheus Server 通過定期訪問應(yīng)用程序提供的 HTTP 接口獲取指標(biāo)數(shù)據(jù)。

Push 是基于 Prometheus [Pushgateway] 服務(wù)提供的另一種獲取指標(biāo)方式,指標(biāo)數(shù)據(jù)由應(yīng)用程序主動定期推送給 [Pushgateway],然后 Prometheus 再定期從 Pushgateway 獲取。這種方式主要適用于應(yīng)用程序不方便開端口或應(yīng)用程序生命周期比較短的場景。

以下樣例代碼基于 [hyper] HTTP 庫實現(xiàn)了一個可以供 Prometheus Server pull 指標(biāo)數(shù)據(jù)的接口,核心是使用 [rust-prometheus] 提供的 [TextEncoder] 將所有指標(biāo)數(shù)據(jù)序列化供 Prometheus 解析:

fn metric_service(_req: Request) -> Response {
   let encoder = TextEncoder::new();
   let mut buffer = vec![];
   let mf = prometheus::gather();
   encoder.encode(&mf, &mut buffer).unwrap();
   Response::builder()
       .header(hyper::header::CONTENT_TYPE, encoder.format_type())
       .body(Body::from(buffer))
       .unwrap()
}

對于如何使用 Push 感興趣的同學(xué)可以自行參考 rust-prometheus 代碼內(nèi)提供的 Push 示例,這里限于篇幅就不詳細(xì)介紹了。

上述三段樣例的完整代碼可參見這里。

內(nèi)部實現(xiàn)

以下內(nèi)部實現(xiàn)都基于本文發(fā)布時最新的 rust-prometheus 0.5 版本代碼,該版本主干 API 的設(shè)計和實現(xiàn) port 自 Prometheus [Golang client],但為 Rust 的使用習(xí)慣進(jìn)行了一些修改,因此接口上與 Golang client 比較接近。

目前我們正在開發(fā) 1.0 版本,API 設(shè)計上不再主要參考 Golang client,而是力求提供對 Rust 使用者最友好、簡潔的 API。實現(xiàn)上為了效率考慮也會和這里講解的略微有一些出入,且會去除一些目前已被拋棄的特性支持,簡化實現(xiàn),因此請讀者注意甄別。

Counter / Gauge

Counter 與 Gauge 是非常簡單的指標(biāo),只要支持線程安全的數(shù)值更新即可。讀者可以簡單地認(rèn)為 Counter 和 Gauge 的核心實現(xiàn)都是 Arc。但由于 Prometheus 官方規(guī)定指標(biāo)數(shù)值需要支持浮點數(shù),因此我們基于 [std::sync::atomic::AtomicU64] 和 CAS 操作實現(xiàn)了 [AtomicF64],其具體實現(xiàn)位于 src/atomic64/nightly.rs。核心片段如下:

impl Atomic for AtomicF64 {
   type T = f64;

   // Some functions are omitted.

   fn inc_by(&self, delta: Self::T) {
       loop {
           let current = self.inner.load(Ordering::Acquire);
           let new = u64_to_f64(current) + delta;
           let swapped = self
               .inner
               .compare_and_swap(current, f64_to_u64(new), Ordering::Release);
           if swapped == current {
               return;
           }
       }
   }
}

另外由于 0.5 版本發(fā)布時 [AtomicU64] 仍然是一個 nightly 特性,因此為了支持 Stable Rust,我們還基于自旋鎖提供了 [AtomicF64] 的 fallback,位于 src/atomic64/fallback.rs。

注:[AtomicU64] 所需的 integer_atomics 特性最近已在 rustc 1.34.0 stabilize。我們將在 rustc 1.34.0 發(fā)布后為 Stable Rust 也使用上原生的原子操作從而提高效率。
Histogram

根據(jù) Prometheus 的要求,Histogram 需要進(jìn)行的操作是在獲得一個觀測值以后,為觀測值處在的桶增加計數(shù)值。另外還有總觀測值、觀測值數(shù)量需要累加。

注意,Prometheus 中的 Histogram 是累積直方圖,其每個桶的含義是 (-∞, x],因此對于每個觀測值都可能要更新多個連續(xù)的桶。例如,假設(shè)用戶定義了 5 個桶邊界,分別是 0.1、0.2、0.4、0.8、1.6,則每個桶對應(yīng)的數(shù)值范圍是 (-∞, 0.1]、(-∞, 0.2]、(-∞, 0.4]、(-∞, 0.8]、(-∞, 1.6](-∞, +∞),對于觀測值 0.4 來說需要更新(-∞, 0.4]、(-∞, 0.8]、(-∞, 1.6](-∞, +∞) 四個桶。

一般來說 observe(x) 會被頻繁地調(diào)用,而將收集到的數(shù)據(jù)反饋給 Prometheus 則是個相對很低頻率的操作,因此用數(shù)組實現(xiàn)“桶”的時候,我們并不將各個桶與數(shù)組元素直接對應(yīng),而將數(shù)組元素定義為非累積的桶,如 (-∞, 0.1)、[0.1, 0.2)、[0.2, 0.4)[0.4, 0.8)[0.8, 1.6)、[1.6, +∞),這樣就大大減少了需要頻繁更新的數(shù)據(jù)量;最后在上報數(shù)據(jù)給 Prometheus 的時候?qū)?shù)組元素累積,得到累積直方圖,這樣就得到了 Prometheus 所需要的桶的數(shù)據(jù)。

當(dāng)然,由此可見,如果給定的觀測值超出了桶的范圍,則最終記錄下的最大值只有桶的上界了,然而這并不是實際的最大值,因此使用的時候需要多加注意。

[Histogram] 的核心實現(xiàn)見 src/histogram.rs:

pub struct HistogramCore {
   // Some fields are omitted.
   sum: AtomicF64,
   count: AtomicU64,
   upper_bounds: Vec,
   counts: Vec,
}

impl HistogramCore {
   // Some functions are omitted.

   pub fn observe(&self, v: f64) {
       // Try find the bucket.
       let mut iter = self
           .upper_bounds
           .iter()
           .enumerate()
           .filter(|&(_, f)| v <= *f);
       if let Some((i, _)) = iter.next() {
           self.counts[i].inc_by(1);
       }

       self.count.inc_by(1);
       self.sum.inc_by(v);
   }
}

#[derive(Clone)]
pub struct Histogram {
   core: Arc,
}

[Histogram] 還提供了一個輔助結(jié)構(gòu) [HistogramTimer],它會記錄從它創(chuàng)建直到被 Drop 的時候的耗時,將這個耗時作為 [Histogram::observe()] 接口的觀測值記錄下來,這樣很多時候在想要記錄 Duration / Elapsed Time 的場景中,就可以使用這個簡便的結(jié)構(gòu)來記錄時間:

#[must_use]
pub struct HistogramTimer {
   histogram: Histogram,
   start: Instant,
}

impl HistogramTimer {
   // Some functions are omitted.

   pub fn observe_duration(self) {
       drop(self);
   }

   fn observe(&mut self) {
       let v = duration_to_seconds(self.start.elapsed());
       self.histogram.observe(v)
   }
}

impl Drop for HistogramTimer {
   fn drop(&mut self) {
       self.observe();
   }
}

[HistogramTimer] 被標(biāo)記為了 [must_use],原因很簡單,作為一個記錄流逝時間的結(jié)構(gòu),它應(yīng)該被存在某個變量里,從而記錄這個變量所處作用域的耗時(或稍后直接調(diào)用相關(guān)函數(shù)提前記錄耗時),而不應(yīng)該作為一個未使用的臨時變量被立即 Drop。標(biāo)記為 must_use 可以在編譯期杜絕這種明顯的使用錯誤。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/17946.html

相關(guān)文章

  • TiKV 源碼解析系列文章(一)序

    摘要:而源碼解析系列文章則是會從源碼層面給大家抽絲剝繭,讓大家知道我們內(nèi)部到底是如何實現(xiàn)的。我們希望通過該源碼解析系列,能讓大家對有一個更深刻的理解。 作者:唐劉 TiKV 是一個支持事務(wù)的分布式 Key-Value 數(shù)據(jù)庫,有很多社區(qū)開發(fā)者基于 TiKV 來開發(fā)自己的應(yīng)用,譬如 titan、tidis。尤其是在 TiKV 成為 CNCF 的 Sandbox 項目之后,吸引了越來越多開發(fā)者的...

    LeviDing 評論0 收藏0
  • TiKV 源碼解析系列文章(四)Prometheus(下)

    摘要:由上述代碼可見,為了在線程安全的條件下實現(xiàn)各個具有獨立的時間序列,內(nèi)部采用了進(jìn)行同步,也就是說及類似函數(shù)內(nèi)部是具有鎖的。 作者: Breezewish 本文為 TiKV 源碼解析系列的第四篇,接上篇繼續(xù)為大家介紹 [rust-prometheus]。上篇 主要介紹了基礎(chǔ)知識以及最基本的幾個指標(biāo)的內(nèi)部工作機(jī)制,本篇會進(jìn)一步介紹更多高級功能的實現(xiàn)原理。 與上篇一樣,以下內(nèi)部實現(xiàn)都基于本文發(fā)...

    Nino 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<