摘要:添加接收人監(jiān)控中心支持添加郵箱及微信兩種告警,需要注意的是,添加郵箱告警的話,需要預先配置發(fā)件服務器。由于監(jiān)控中心配置了一條告警規(guī)則,只要企業(yè)微信的信息填寫正確,一般分鐘以內(nèi)均可從企業(yè)微信中獲取到告警信息。
監(jiān)控中心是UK8S提供的產(chǎn)品化監(jiān)控方案,提供基于Prometheus的產(chǎn)品解決方案,涵蓋Prometheus集群的全生命周期管理,以及告警規(guī)則配置、報警設置等功能,省去了自行搭建監(jiān)控服務的學習成本及運維成本。
監(jiān)控中心基于CoreOS 開源的Prometheus Operator實現(xiàn),部署在UK8S集群中,包含三大監(jiān)控模塊,分別是Prometheus、Alertmanager、Grafana,高可用模式下,Prometheus及Alertmanager分別部署2個和3個副本,也支持單節(jié)點模式。
同時,為了簡化監(jiān)控服務部署的負擔,監(jiān)控中心啟動后,會默認安裝NodeExporter以抓取Node節(jié)點的監(jiān)控數(shù)據(jù),并添加了Scheduler、Controller Manager、etcd、kubelet等Target,零配置即可實現(xiàn)UK8S的健康狀態(tài)監(jiān)控。
功能點 | 功能說明 |
---|---|
創(chuàng)建集群 | 一鍵創(chuàng)建Prometheus集群 |
銷毀集群 | 銷毀已創(chuàng)建的Prometheus集群 |
創(chuàng)建告警規(guī)則 | 創(chuàng)建一條告警規(guī)則,即Prometheus Rule |
刪除告警規(guī)則 | 刪除Prometheus Rule |
添加監(jiān)控目標 | 添加監(jiān)控目標,即Target |
刪除監(jiān)控目標 | 刪除監(jiān)控目標,不再抓取其監(jiān)控數(shù)據(jù) |
添加接收人 | 在Alertmanager中配置郵件及微信接受人 |
監(jiān)控中心支持單節(jié)點模式和高可用兩種模式,需要注意的是,開啟監(jiān)控需要消耗一定的CPU、內(nèi)存資源,因此,如果開啟勾選了高可用模式,請注意:
建議參數(shù)配置如下:
一個監(jiān)控目標可理解為Prometheus中的一個Target或Job. 原生Prometheus既支持靜態(tài)配置監(jiān)控目標,也支持動態(tài)服務發(fā)現(xiàn)。
由于K8S的Pod被設置非永久性的資源,為了正確地抓取到每個應用對應的Pod監(jiān)控數(shù)據(jù),Prometheus Operator引入了Service Monitor機制,通過監(jiān)聽Service后面的EP(可認為是健康的Pod)來實現(xiàn)監(jiān)控數(shù)據(jù)的采集。
因此,為了抓取一組Pod的監(jiān)控數(shù)據(jù),我們必須為這組Pod創(chuàng)建一個對應的Service,并暴露對應的Metrics端口。
! 這里需要強調(diào)的是,Service必須暴露Metrics端口,而非業(yè)務端口。如我們有一個應用,其應用端口為80,Metrics端口為9200,則供Prometheus抓取數(shù)據(jù)的Service端口必須是9200,如果設置為80,則不能抓取到任何監(jiān)控數(shù)據(jù)。
在下面這個例子中,我們部署了一個示例應用,該應用為一個web應用程序,其容器對外暴露了兩個端口,一個是業(yè)務端口80,另一個是Metrics端口8080. 并且創(chuàng)建了一個Service,暴露的端口與容器端口一致。
apiVersion: apps/v1
kind: Deployment
metadata:
name: example-app
spec:
replicas: 2
selector:
matchLabels:
app: example-app
template:
metadata:
labels:
app: example-app
spec:
containers:
- name: example-app
image: uhub.service.ucloud.cn/uk8s_public/instrumented_app:latest
ports:
- name: metrics
containerPort: 8080
- name: web
containerPort: 80
---
kind: Service
apiVersion: v1
metadata:
name: example-app
labels:
app: example-app
spec:
selector:
app: example-app
ports:
- name: metrics
port: 8080
- name: web
port: 80
我們在UK8S的監(jiān)控中心-->監(jiān)控目標頁面,直接選中該Service,端口名稱選擇“metrics”,抓取路徑一般默認填寫“/metrics”,如果監(jiān)控指標的路徑是自定義請咨詢業(yè)務方。
添加完畢后,我們可以打開Prometheus 控制臺,查看該監(jiān)控目標是否已添加成功。
監(jiān)控中心支持添加郵箱及微信兩種告警,需要注意的是,添加郵箱告警的話,需要預先配置發(fā)件服務器。
不同的郵件服務提供商對于發(fā)件服務器的配置都有較為詳細的說明,這里強調(diào)兩點:
支持添加多個郵件接收人
在使用微信接收人之前,我們必須在微信管理后臺創(chuàng)建一個應用并獲取應用ID、企業(yè)ID、應用秘鑰、部門ID、企業(yè)微信用戶ID等信息,需要咨詢你的企業(yè)微信負責人方可獲取到此信息。
在使用微信接收人之前,我們必須在微信管理后臺創(chuàng)建一個應用并獲取應用ID、企業(yè)ID、應用秘鑰、部門ID、企業(yè)微信用戶ID等信息,需要咨詢你的企業(yè)微信負責人方可獲取到此信息。
由于監(jiān)控中心配置了一條watchdog告警規(guī)則,只要企業(yè)微信的信息填寫正確,一般10分鐘以內(nèi)均可從企業(yè)微信中獲取到告警信息。
實時文檔歡迎訪問https://docs.ucloud.cn/uk8s/monitor/prometheusplugin/intro
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/126278.html
摘要:宋體自年被開源以來,很快便成為了容器編排領域的標準。宋體年月,樂心醫(yī)療的第一個生產(chǎn)用集群正式上線。所以于年推出后,樂心醫(yī)療的運維團隊在開會討論之后一致決定盡快遷移到。Kubernetes 自 2014 年被 Google 開源以來,很快便成為了容器編排領域的標準。因其支持自動化部署、大規(guī)??缮炜s和容器化管理等天然優(yōu)勢,已經(jīng)被廣泛接納。但由于 Kubernetes 本身的復雜性,也讓很多企業(yè)的...
摘要:宋體本文從拉勾網(wǎng)的業(yè)務架構日志采集監(jiān)控服務暴露調(diào)用等方面介紹了其基于的容器化改造實踐。宋體此外,拉勾網(wǎng)還有一套自研的環(huán)境的業(yè)務發(fā)布系統(tǒng),不過這套發(fā)布系統(tǒng)未適配容器環(huán)境。寫在前面 拉勾網(wǎng)于 2019 年 3 月份開始嘗試將生產(chǎn)環(huán)境的業(yè)務從 UHost 遷移到 UK8S,截至 2019 年 9 月份,QA 環(huán)境的大部分業(yè)務模塊已經(jīng)完成容器化改造,生產(chǎn)環(huán)境中,后臺管理服務已全部遷移到 UK8...
摘要:開啟監(jiān)控中心開啟監(jiān)控中心開啟監(jiān)控中心監(jiān)控中心支持單節(jié)點模式和高可用兩種模式,需要注意的是,開啟監(jiān)控需要消耗一定的內(nèi)存資源,因此,如果開啟勾選了高可用模式,請注意至少有個節(jié)點的可用資源大于的容器配置。其中為塊,為塊。 開啟監(jiān)控中心監(jiān)控中心支持單節(jié)點模式和高可用兩種模式,需要注意的是,開啟監(jiān)控需要消耗一定的CPU、內(nèi)存資源,因此,如果開啟勾選了高可用模式,請注意:至少有2個Node節(jié)點的可用資源...
摘要:概述之前講過容器的可視化監(jiān)控,即監(jiān)控容器的運行情況,包括使用率內(nèi)存占用網(wǎng)絡狀況以及磁盤空間等等一系列信息。實戰(zhàn)一下中添加依賴啟動應用程序之后,只要在瀏覽器中輸入端點信息就能獲得應用的一些狀態(tài)信息。 showImg(https://segmentfault.com/img/remote/1460000014684947); 概述 之前講過Docker容器的可視化監(jiān)控,即監(jiān)控容器的運行情...
摘要:綜上所述,容器化性能上接近物理機,在多測試場景下,表現(xiàn)相對穩(wěn)定可靠。和實現(xiàn)了云服務器節(jié)點從物理機到宿主機的轉(zhuǎn)變。 2018年數(shù)人云Meetup第一站,聯(lián)合vivo在深圳舉辦 Building Microservice 系列活動第一期。本次技術沙龍vivo、中興通訊、華為、數(shù)人云共同派出技術大咖,為開發(fā)者們帶來有關微服務、容器化、配置中心、服務網(wǎng)格等領域的實戰(zhàn)與干貨分享。 數(shù)人云Meet...
閱讀 3670·2023-04-25 20:09
閱讀 3831·2022-06-28 19:00
閱讀 3194·2022-06-28 19:00
閱讀 3227·2022-06-28 19:00
閱讀 3342·2022-06-28 19:00
閱讀 2999·2022-06-28 19:00
閱讀 3237·2022-06-28 19:00
閱讀 2777·2022-06-28 19:00