国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁技術文章
文章詳情頁

Zabbix對Kafka topic積壓數(shù)據(jù)監(jiān)控的解決方案

瀏覽:159日期:2023-04-06 15:09:24
目錄
  • Kafka
  • 需求
  • 解決方案
    • 1.監(jiān)控分析
    • 2.監(jiān)控思路
    • (1) 消費者組管理
    • (2)分區(qū)自動發(fā)現(xiàn)
    • (3)獲取監(jiān)控項“test-group/test/分區(qū)X”的Lag
    • (4)最終腳本
    • 3.Zabbix 自動發(fā)現(xiàn)配置
    • 4.告警信息

Kafka

Apache Kafka是一個分布式發(fā)布-訂閱消息系統(tǒng)和一個強大的隊列,可以處理大量的數(shù)據(jù),并使您能夠將消息從一個端點傳遞到另一個端點。

Kafka適合離線和在線消息消費。

Kafka消息保留在磁盤上,并在群集內復制以防止數(shù)據(jù)丟失。Kafka構建在ZooKeeper同步服務之上。它與Apache Storm和Spark非常好地集成,用于實時流式數(shù)據(jù)分析。

需求

雖然我們在生產環(huán)境中可以使用Kafka對業(yè)務進行解耦,但這并不意味著業(yè)務系統(tǒng)就高枕無憂了。消費者的消費速度是否能夠匹配生產速度、過多的消息積壓這些都可能影響業(yè)務系統(tǒng)的正常運行。

關于業(yè)務系統(tǒng)運行狀態(tài),雖然我們可以通過業(yè)務監(jiān)控來確定,但是業(yè)務監(jiān)控一般是要對數(shù)據(jù)進行聚合分析并達到一定的閾值才能觸發(fā)告警。因此業(yè)務監(jiān)控告警通知時,業(yè)務實際已經(jīng)有問題一段時間了。為應對這種情況,我們一般需要和系統(tǒng)監(jiān)控進行互補。系統(tǒng)監(jiān)控會周期性的對硬件、網(wǎng)絡、服務器、應用等不同維度進行監(jiān)控告警,一旦某個組件的狀態(tài)有問題,那么系統(tǒng)監(jiān)控會先預警,然后業(yè)務系統(tǒng)才可能進一步預警。經(jīng)過不同監(jiān)控系統(tǒng)的告警升級,才更能準確的反映業(yè)務系統(tǒng)的運行狀態(tài)。

話說回來,對于上線后的Kafka集群,我們除了要對服務的可用性進行監(jiān)控外,還要對Topic的消費情況進一步監(jiān)控。

解決方案

1.監(jiān)控分析

Lag作為監(jiān)控指標,它直接反映了一個消費者的運行情況。一個正常工作的消費者,它的Lag值應該很小,甚至是接近于0的,這表示該消費者能夠及時地消費生產者生產出來的消息,滯后程度很小。

因此我們將Topic作為我們的監(jiān)控項,當相關的Topic Lag達到某一閾值時進行多渠道告警。

另經(jīng)過Kafka運行機制的我們知道:

  • 每個Topic內部需要按照Partition進行再次分區(qū)
  • 同一個topic的partition只能由同一個消費者組(group)內的一個consumer來消費,分區(qū)數(shù)決定了同組消費者個數(shù)的上限

通過以上“Topic-Partition-消費者組(group)”之間的關系,為了便于我們通過告警信息更快的定位故障點:

  • 監(jiān)控項命名規(guī)則:消費者組(Group)/Topic/Partition,三者組成唯一的監(jiān)控項;
  • 監(jiān)控項Lag值:獲取業(yè)務系統(tǒng)中某個消費者組的特定Topic所有分區(qū)的Lag值進行告警;

2.監(jiān)控思路

(1) 消費者組管理

通過Kafka自帶的kafka-consumer-groups.sh腳本,我們可以輕松獲取查看指定消費組 消費的所有Topic、及所在分區(qū)、最新消費offset、Log最新數(shù)據(jù)offset、Lag還未消費數(shù)量、消費者ID等等信息

# 查看消費者組的topic 消費狀態(tài)bash kafka-consumer-groups.sh --bootstrap-server 192.168.3.55:9090 --describe --group test2_consumer_groupTOPIC PARTITION CURRENT-OFFSET LOG-END-OFFSET LAG CONSUMER-ID HOST CLIENT-IDtest 0 1000000 1000000 0 consumer-1-8688633a-2f88-4c41-89ca-fd0cd6d19ec7 /127.0.0.1 consumer-1test 1 1000000 1000000 0 consumer-1-8688633a-2f88-4c41-89ca-fd0cd6d19ec7 /127.0.0.1 consumer-1test 2 1000000 1000000 0 consumer-1-8688633a-2f88-4c41-89ca-fd0cd6d19ec7 /127.0.0.1 consumer-1test 3 1000000 1000000 0 consumer-1-8688633a-2f88-4c41-89ca-fd0cd6d19ec7 /127.0.0.1 consumer-1

(2)分區(qū)自動發(fā)現(xiàn)

對于Kafka topic的監(jiān)控我們使用Zabbix監(jiān)控平臺,考慮到后續(xù)業(yè)務系統(tǒng)的持續(xù)性接入,我們通過Zabbix自動發(fā)現(xiàn)實現(xiàn)對特定消費者組(Group)和Topic下所有分區(qū)自動發(fā)現(xiàn):

# 自動發(fā)現(xiàn)vim consumer-groups.conf#按消費者組(Group)|Topic格式,寫入自動發(fā)現(xiàn)配置文件test-group|test# 執(zhí)行腳本自動發(fā)現(xiàn)指定消費者和topic的分區(qū)bash consumer-groups.sh discovery{    "data": [{ "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"0" },{ "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"1" },{ "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"3" },{ "{#GROUP}":"test-group", "{#TOPICP}":"test", "{#PARTITION}":"2" }    ]}

自動發(fā)現(xiàn)中的GROUP、TOPIC、PARTITION 這三個信息可以用于進一步過濾不同的分區(qū)的Lag值和監(jiān)控系統(tǒng)中的監(jiān)控項名稱:

  • test-group/test/分區(qū)0
  • test-group/test/分區(qū)1
  • test-group/test/分區(qū)2
  • test-group/test/分區(qū)3
  • 等其他 test-group/test相關的所有分區(qū)

(3)獲取監(jiān)控項“test-group/test/分區(qū)X”的Lag

# 獲取分區(qū)0 lagbash consumer-groups.sh lag 0# 獲取分區(qū)1 lagbash consumer-groups.sh lag 1# 獲取分區(qū)2 lagbash consumer-groups.sh lag 2# 獲取分區(qū)3 lagbash consumer-groups.sh lag 3

(4)最終腳本

vim consumer-groups.sh#!/bin/bash#comment: 根據(jù)消費者組監(jiān)控topic lag,進行監(jiān)控告警#配置文件說明#消費者組|Topic#test-group|test#獲取topic 信息cal_topic() {    if [ $# -ne 2 ]; thenecho "parameter num error, 讀取topic信息失敗"exit 1    else/usr/local/kafka/bin/kafka-consumer-groups.sh --bootstrap-server 192.168.3.55:9092 --describe --group $1 |grep -w $2    fi}#topic+分區(qū)自動發(fā)現(xiàn)topic_discovery() {    printf "{\n"    printf "\t\"data\": [\n"    for line in `cat /data/scripts/consumer-groups.conf`    dogroup=`echo ${line} | awk -F"|" "{print $1}"`topic=`echo ${line} | awk -F"|" "{print $2}"`cal_topic $group $topic > /tmp/consumer-group-tmpcount=`cat /tmp/consumer-group-tmp|wc -l`n=0while read linedo     n=`expr  $n + 1`     #判斷最后一行     if [ $n -eq $count ]; then topicp=`echo $line | awk "{print $1}"` partition=`echo $line  | awk "{print $2}"` printf "\t\t{ \"{#GROUP}\":\"${group}\", \"{#TOPICP}\":\"${topicp}\", \"{#PARTITION}\":\"${partition}\" }\n"     else topicp=`echo $line | awk "{print $1}"` partition=`echo $line  | awk "{print $2}"` printf "\t\t{ \"{#GROUP}\":\"${group}\", \"{#TOPICP}\":\"${topicp}\", \"{#PARTITION}\":\"${partition}\" },\n"     fidone < /tmp/consumer-group-tmp    done    printf "\t]\n"    printf "}\n"}if [ $1 == "discovery" ]; then    topic_discoveryelif [ $1 == "lag" ];then    cat /tmp/consumer-group-tmp |awk -v p=$2 "{if($2==p){print $5}}"else    echo "Usage: /data/scripts/consumer-group.sh discovery | lag"fi

3.Zabbix 自動發(fā)現(xiàn)配置

1.自動發(fā)現(xiàn)配置

2.監(jiān)控項原型 通過消費者組、Topic、Partition 組成監(jiān)控項名稱,告警信息中的名稱能夠幫助我們快定位故障點。

3.觸發(fā)器 我們lag的初始閾值設置為50,可根據(jù)時間情況進行調整。

4.告警信息

告警主機:Kafka_192.168.3.55主機IP:192.168.3.55主機組:Kafka告警時間:2022.03.21 00:23:10告警等級:Average告警信息:test-group/test/分區(qū)1:數(shù)據(jù)積壓62告警項目:topic_lag[test,1]問題詳情:test-group/test/1: 62

到此這篇關于Zabbix對Kafka topic積壓數(shù)據(jù)監(jiān)控的文章就介紹到這了,更多相關Zabbix Kafka 監(jiān)控內容請搜索以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持!

標簽: Zabbix
主站蜘蛛池模板: 成人国产精品免费视频不卡 | 久久精品国产国产 | 殴美一级视频 | a天堂中文在线官网 | 午夜日韩精品 | 成年女人免费观看 | 日韩天天摸天天澡天天爽视频 | a毛片免费全部播放完整成 a毛片免费全部在线播放毛 | 久久99精品久久久久久久野外 | 亚洲特级黄色片 | 日本特级淫片免费 | 免费手机黄色网址 | 国产成人精品免费视频软件 | 高清日本无a区 | 怡红院亚洲 | 我想看三级特黄 | 久久久国产乱子伦精品 | 全免费毛片在线播放 | 国产成人在线视频观看 | 男人天堂网在线观看 | 国产成人综合高清在线观看 | 免费国产一级特黄久久 | 免费看一级 | 欧美精品做人一级爱免费 | 亚洲国产精品综合久久网络 | 99精品国产成人一区二区在线 | 久草国产在线观看 | 韩国一级毛片 | 欧美黄色高清 | 久草视频在线观 | 福利视频黄 | 国产成人综合网亚洲欧美在线 | 欧美一区二区三区男人的天堂 | 91精品人成在线观看 | 91精选视频在线观看 | 成人免费观看视频久爱网 | 找个毛片看看 | 91精品国产免费网站 | 国产夜色| 国产免费久久精品久久久 | 久久成人18免费网站 |