kafka架構原理

IT那活兒發布于2023-01-11 13:19 / 1281人閱讀

kafka架構原理

點擊上方“IT那活兒”公眾號，關注后了解更多內容，不管IT什么活兒，干就完了！！！

一

Kafka介紹

kafka是一個分布式、支持分區的（partition）、多副本的（replica），基于zookeeper協調的分布式消息系統，它的最大的特性就是可以實時的處理大量數據以滿足各種需求場景。

二

Kafka的架構原理

Kafka是一種高吞吐量的分布式發布訂閱消息系統，它可以處理消費者規模的網站中的所有動作流數據，具有高性能、持久化、多副本備份、橫向擴展能力。

2.1 基礎架構與名詞解釋

Producer：Producer即生產者，消息的產生者，是消息的入口。
Broker：Broker是kafka實例，每個服務器上有一個或多個kafka的實例，我們姑且認為每個broker對應一臺服務器。每個kafka集群內的broker都有一個不重復的編號，如圖中的broker-0、broker-1等……
Topic：消息的主題，可以理解為消息的分類，kafka的數據就保存在topic。在每個broker上都可以創建多個topic。
Partition：Topic的分區，每個topic可以有多個分區，分區的作用是做負載，提高kafka的吞吐量。同一個topic在不同的分區的數據是不重復的，partition的表現形式就是一個一個的文件夾！
Replication:每一個分區都有多個副本，副本的作用是做備胎。當主分區（Leader）故障的時候會選擇一個備胎（Follower）上位，成為Leader。在kafka中默認副本的最大數量是10個，且副本的數量不能大于Broker的數量，follower和leader絕對是在不同的機器，同一機器對同一個分區也只可能存放一個副本（包括自己）。
Message：每一條發送的消息主體。
Consumer：消費者，即消息的消費方，是消息的出口。
Consumer Group：我們可以將多個消費組組成一個消費者組，在kafka的設計中同一個分區的數據只能被消費者組中的某一個消費者消費。同一個消費者組的消費者可以消費同一個topic的不同分區的數據，這也是為了提高kafka的吞吐量！
Zookeeper：kafka集群依賴zookeeper來保存集群的的元信息，來保證系統的可用性。

2.2 工作流程分析

2.2.1 發送數據

Producer在寫入數據的時候永遠的找leader，不會直接將數據寫入follower！那leader怎么找呢？寫入的流程又是什么樣的呢？我們看下圖：

注意：消息寫入leader后，follower是主動的去leader進行同步的！

producer采用push模式將數據發布到broker，每條消息追加到分區中，順序寫入磁盤，所以保證同一分區內的數據是有序的！寫入示意圖如下：

kafka為什么要做分區呢？分區的主要目的是：

方便擴展：因為一個topic可以有多個partition，所以我們可以通過擴展機器去輕松的應對日益增長的數據量。
提高并發：以partition為讀寫單位，可以多個消費者同時消費數據，提高了消息的處理效率。

在kafka中，如果某個topic有多個partition，producer又怎么知道該將數據發往哪個partition呢？kafka中有幾個原則：

partition在寫入的時候可以指定需要寫入的partition，如果有指定，則寫入對應的partition。
如果沒有指定partition，但是設置了數據的key，則會根據key的值hash出一個partition。
如果既沒指定partition，又沒有設置key，則會輪詢選出一個partition。

保證消息不丟失是一個消息隊列中間件的基本保證，那producer在向kafka寫入消息的時候，怎么保證消息不丟失呢？

通過上圖中的通過ACK應答機制！在生產者向隊列寫入數據的時候可以設置參數來確定是否確認kafka接收到數據，這個參數可設置的值為0、1、all。

0代表producer往集群發送數據不需要等到集群的返回，不確保消息發送成功。安全性最低但是效率最高。
1代表producer往集群發送數據只要leader應答就可以發送下一條，只確保leader發送成功。
all代表producer往集群發送數據需要所有的follower都完成從leader的同步才會發送下一條，確保leader發送成功和所有的副本都完成備份。安全性最高，但是效率最低。

注意：如果往不存在的topic寫數據，能不能寫入成功呢？kafka會自動創建topic，分區和副本的數量根據默認配置都是1。

2.2.2 保存數據

Producer將數據寫入kafka后，集群就需要對數據進行保存了！kafka將數據保存在磁盤，可能在我們的一般的認知里，寫入磁盤是比較耗時的操作，不適合這種高并發的組件。Kafka初始會多帶帶開辟一塊磁盤空間，順序寫入數據（效率比隨機寫入高）。

1）Partition 結構

Partition在服務器上的表現形式就是一個一個的文件夾，每個partition的文件夾下面會有多組segment文件，每組segment文件又包含.index文件、.log文件、.timeindex文件（早期版本中沒有）三個文件， log文件就實際是存儲message的地方，而index和timeindex文件為索引文件，用于檢索消息。

如上圖，這個partition有三組segment文件，每個log文件的大小是一樣的，但是存儲的message數量是不一定相等的（每條的message大小不一致）。文件的命名是以該segment最小offset來命名的，如000.index存儲offset為0~368795的消息，kafka就是利用分段+索引的方式來解決查找效率的問題。

2）Message結構

log文件就實際是存儲message的地方，我們在producer往kafka寫入的也是一條一條的message，那存儲在log中的message是什么樣子的呢？消息主要包含消息體、消息大小、offset、壓縮類型……等等！

我們重點需要知道的是下面三個：

offset：offset是一個占8byte的有序id號，它可以唯一確定每條消息在parition內的位置！
消息大小：消息大小占用4byte，用于描述消息的大小。
消息體：消息體存放的是實際的消息數據（被壓縮過），占用的空間根據具體的消息而不一樣。

3）存儲策略

無論消息是否被消費，kafka都會保存所有的消息。那對于舊數據有什么刪除策略呢？

基于時間，默認配置是168小時（7天）。
基于大小，默認配置是1073741824。

注意：kafka讀取特定消息的時間復雜度是O(1)，所以這里刪除過期的文件并不會提高kafka的性能！

2.2.3 消費數據

消息存儲在log文件后，消費者就可以進行消費了。

一般消息系統，consumer存在兩種消費模型：

push：優勢在于消息實時性高。劣勢在于沒有考慮consumer消費能力和飽和情況，容易導致producer壓垮consumer。
pull：優勢在可以控制消費速度和消費數量，保證consumer不會出現飽和。劣勢在于當沒有數據，會出現空輪詢，消耗cpu。

Kafka采用的是pull模式，消費者主動的去kafka集群拉取消息，與producer相同的是，消費者在拉取消息的時候也是找leader去拉取。

多個消費者可以組成一個消費者組（consumer group），每個消費者組都有一個組id！同一個消費組者的消費者可以消費同一topic下不同分區的數據，但是不會組內多個消費者消費同一分區的數據！！！我們看下圖：

注意：圖示是消費者組內的消費者小于partition數量的情況，所以會出現某個消費者消費多個partition數據的情況，消費的速度也就不及只處理一個partition的消費者的處理速度！如果是消費者組的消費者多于partition的數量，那會不會出現多個消費者消費同一個partition的數據呢？上面已經提到過不會出現這種情況！多出來的消費者不消費任何partition的數據。所以在實際的應用中，建議消費者組的consumer的數量與partition的數量一致！

在保存數據的小節里面，我們聊到了partition劃分為多組segment，每個segment又包含.log、.index、.timeindex文件，存放的每條message包含offset、消息大小、消息體……我們多次提到segment和offset，查找消息的時候是怎么利用segment+offset配合查找的呢？假如現在需要查找一個offset為368801的message是什么樣的過程呢？我們先看看下面的圖：

1）先找到offset的368801message所在的segment文件（利用二分法查找），這里找到的就是在第二個segment文件。
2）打開找到的segment中的.index文件（也就是368796.index文件，該文件起始偏移量為368796+1，我們要查找的offset為368801的message在該index內的偏移量為368796+5=368801，所以這里要查找的相對offset為5）。由于該文件采用的是稀疏索引的方式存儲著相對offset及對應message物理偏移量的關系，所以直接找相對offset為5的索引找不到，這里同樣利用二分法查找相對offset小于或者等于指定的相對offset的索引條目中最大的那個相對offset，所以找到的是相對offset為4的這個索引。
3）根據找到的相對offset為4的索引確定message存儲的物理偏移位置為256。打開數據文件，從位置為256的那個地方開始順序掃描直到找到offset為368801的那條Message。

這套機制是建立在offset為有序的基礎上，利用segment+有序offset+稀疏索引+二分查找+順序查找等多種手段來高效的查找數據！

至此，消費者就能拿到需要處理的數據進行處理了。那每個消費者又是怎么記錄自己消費的位置呢？

在早期的版本中，消費者將消費到的offset維護zookeeper中，consumer每間隔一段時間上報一次，這里容易導致重復消費，且性能不好！在新的版本中消費者消費到的offset已經直接維護在kafk集群的__consumer_offsets這個topic中！

本文作者：徐苗(上海新炬中北團隊）

本文來源：“IT那活兒”公眾號

云服務器 GPU云服務器 kafka原理 webrtc架構原理 webrtc的原理架構 cdn的原理和架構

文章版權歸作者所有，未經允許請勿轉載,若此文章存在違規行為，您可以聯系管理員刪除。

轉載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/129117.html

Kafka原理你真的知道嗎？

摘要：而在服務器中應該充分利用多線程來處理執行邏輯。能保證所在的失效，該消息仍然可以從新選舉的中獲取，不會造成消息丟失。這意味著無需等待來自的確認而繼續發送下一批消息。 showImg(https://segmentfault.com/img/remote/1460000018373147?w=702&h=369); 1.概述 Apache Kafka最早是由LinkedIn開源出來的分布式...

n7then 2019-08-16 15:30 評論0 收藏0
TiDB Binlog 源碼閱讀系列文章（一）序

摘要：總體而言，讀者需要有一定的使用經驗，以及可以讀懂語言程序。內容概要本篇作為源碼閱讀系列文章的序篇，會簡單的給大家講一下后續會講哪些部分以及邏輯順序，方便大家對本系列文章有整體的了解。小結本篇文章主要介紹了源碼閱讀系列文章的目的和規劃。作者：黃佳豪 TiDB Binlog 組件用于收集 TiDB 的 binlog，并準實時同步給下游，如 TiDB、MySQL 等。該組件在功能上類似于 ...

whidy 2019-06-25 19:21 評論0 收藏0

發表評論

登陸后可評論

0條評論

IT那活兒

男|高級講師

我要關注我要私信

TA的文章

消息中間件故障分析一例

閱讀 1353·2023-01-11 13:20
RAC雙節點crash回復一例

閱讀 1700·2023-01-11 13:20
ORA-600處理一例

閱讀 1211·2023-01-11 13:20
雙節點RAC實例2 HANG 故障分析一例

閱讀 1904·2023-01-11 13:20
RAC集群節點1重啟分析一例

閱讀 4162·2023-01-11 13:20
CRS啟動報錯CRS-1656處理分享

閱讀 2751·2023-01-11 13:20
oracle 12CR2打補丁報錯處理一例

閱讀 1397·2023-01-11 13:20
分布式緩存組件故障分析及監控優化

閱讀 3664·2023-01-11 13:20

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優惠，快來選購！