成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

日常巡檢自動化

IT那活兒 / 2108人閱讀
日常巡檢自動化

點擊上方“IT那活兒”公眾號,關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了!?。?/strong>


  
作為運維人員,其中最基本一項職能職責(zé)針對網(wǎng)絡(luò)、服務(wù)器等進(jìn)行服務(wù)周期內(nèi)的維護(hù)。

維護(hù)過程中,巡檢是一項必不可缺少的工作??此坪唵蔚难矙z動作,在日常工作中尤為重要。

“日常巡檢”是對相關(guān)設(shè)備進(jìn)行日常的巡視和檢查,發(fā)現(xiàn)隱患及時盡可能的去進(jìn)行安全處理,盡可能的將該隱患處理在萌芽狀態(tài),就可以最大限度的減少該隱患帶來不必要的損失。
本文主要介紹基于智慧運維平臺(AMP)將日常巡檢以及簡單故障恢復(fù)實現(xiàn)自動化處理,并可在流程圖上直觀地看到是哪一步流程出錯,從而進(jìn)一步快速精準(zhǔn)定位問題。
AMP平臺簡介
自動化運維管理平臺--支撐八大運維場景自動化(如圖所示),覆蓋常見運維工作。
靈活的可視化任務(wù)編排及調(diào)度,操作、資源、工具、人員的任意編排調(diào)度,構(gòu)建多方位自動化能力。
內(nèi)置大量運維操作原子場景,支持常見數(shù)據(jù)庫、中間件、云平臺、網(wǎng)絡(luò)設(shè)備等運維操作自動化能力



實際場景--日常巡檢之微服務(wù)和組件狀態(tài)巡檢以及故障恢復(fù)

1. 日常巡檢自動化前

對于平臺的各個微服務(wù)狀態(tài)進(jìn)行巡檢需要登錄服務(wù)器,進(jìn)入指定目錄,執(zhí)行命令,查看各個微服務(wù)狀態(tài):
如果發(fā)現(xiàn)有服務(wù)狀態(tài)時 No running狀態(tài)還需要人工執(zhí)行重啟腳本進(jìn)行針對性啟動。
對于平臺使用的組件狀態(tài)進(jìn)行巡檢,例如kafka:
平臺的kafka部署在三臺服務(wù)器中,如果想要巡檢三個kafka的狀態(tài)時,最基礎(chǔ)的方法是登錄到每一個服務(wù)器上查看kafka的進(jìn)程是否存在:
另外方法可以通過查看kafka組件信息和消費信息來確認(rèn)三臺kafka是否都屬于正常狀態(tài):

1)查看kafka組信息

./bin/kafka-consumer-groups.sh --bootstrap-server ip:prot --list

2)查看消費信息

./bin/kafka-consumer-groups.sh --describe --bootstrap-server ip:prot --group 7a4f66af-a983-4a10-9a0c-19424ffcab3d

如果發(fā)現(xiàn)某一個kafka進(jìn)程掛掉,需要登錄到該服務(wù)器上執(zhí)行重啟腳本進(jìn)行進(jìn)程啟動。
同時平臺部署依賴的組件還有zookeeper、redis、Elasticsearch、nginx等。他們巡檢的操作都和kafka 的巡檢步驟相同或者類似。
如果按照最原始的巡檢步驟進(jìn)行巡檢,那么將上述的所有微服務(wù)、組件巡檢完成,費時費力。且是由于人工操作,會出現(xiàn)巡檢漏掉、或者未注意等等問題。
所以為了減輕人工巡檢時間,提高巡檢效率,減少由人工巡檢帶來的問題。于是使用到了平臺的調(diào)度功能來實現(xiàn)自動化巡檢。

自動巡檢結(jié)果流程圖

需要做到上述的流程圖的過程為:

  • 將微服務(wù)、組件所在服務(wù)器安裝Agent并且納入運維由平臺進(jìn)行管理;
  • 將各個微服務(wù)、組件的啟動、查看狀態(tài)等腳本分別配置在平臺的操作中,即將服務(wù)器上的腳本復(fù)制到平臺上一份,由平臺來進(jìn)行執(zhí)行腳本;
  • 通過平臺的調(diào)度功能進(jìn)行將各個操作,通過邏輯關(guān)系串聯(lián)在一起,即可形成上圖的結(jié)構(gòu)。
從該流程圖上可以很明確清晰的看到在巡檢過程中Elasticsearch、nginx兩個組件進(jìn)程異常,并通過了人工審核的步驟,再執(zhí)行重啟,重啟完畢之后再次執(zhí)行集群巡檢,指導(dǎo)正常才通過。

2. 日常巡檢自動化后

在巡檢過程中不需要人工登陸服務(wù)器,完全在平臺進(jìn)行操作,避免巡檢人員巡檢不到位、誤操作等問題,解決了傳統(tǒng)巡檢方式的弊端,在此優(yōu)勢之上,自動化巡檢更能將每次巡檢記錄進(jìn)行導(dǎo)出,為巡檢人員制作巡檢報告提供了可視化數(shù)據(jù),使巡檢報告脫離了繁瑣單一的文字描述的層次。

本文首發(fā)于2021年9月16日。

本文作者:李偉業(yè)(上海新炬王翦團(tuán)隊)

本文來源:“IT那活兒”公眾號


文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/129288.html

相關(guān)文章

  • 超帥!無人機(jī)巡檢上海1.3萬座玻璃幕墻的背后

    摘要:而其中執(zhí)行玻璃幕墻自動巡檢工作的正是合作伙伴獅尾智能研發(fā)的無人機(jī)。萬座玻璃幕墻建筑自動巡檢的背后目前,上海有近萬座玻璃幕墻建筑,是世界上玻璃幕墻建筑數(shù)量最大的大都市之一。說到無人機(jī)第一個想到的會是什么?大多數(shù)人的回答可能是:航拍玩具但,無人機(jī)還能做些什么呢?來看看下邊這個視頻視頻中,無人機(jī)正應(yīng)用于上海玻璃幕墻建筑的日常自動巡檢作業(yè),幫助上海住建委完成玻璃幕墻高空風(fēng)險的預(yù)警工作。而其中執(zhí)行玻璃...

    Tecode 評論0 收藏0
  • 數(shù)據(jù)庫管理平臺NetopGO簡介

    摘要:原文出自聽云技術(shù)博客斷斷續(xù)續(xù)寫了將近一個月,聽云第一版數(shù)據(jù)庫管理平臺終于寫完了,期間來來回回的改了好多次小毛病,現(xiàn)在已經(jīng)部署到生產(chǎn)環(huán)境上去了。主機(jī)管理這里主要是主機(jī)列表管理和業(yè)務(wù)組列表管理。 原文出自【聽云技術(shù)博客】:http://blog.tingyun.com/web/article/detail/600 斷斷續(xù)續(xù)寫了將近一個月,聽云第一版數(shù)據(jù)庫管理平臺終于寫完了,期間來來回回的改...

    YacaToy 評論0 收藏0
  • 智慧園區(qū)三維可視化系統(tǒng)(附方案+源碼)

    摘要:一,智慧園區(qū)建設(shè)的核心價值,三維可視化應(yīng)用,未來智慧園區(qū)管理發(fā)展方向。,應(yīng)急指揮預(yù)案可視化通過對應(yīng)急預(yù)案的資源流程事件預(yù)案進(jìn)行可視化管理,為園區(qū)重大危險事故提供高效調(diào)度指揮管理手段。獲取智慧園區(qū)三維可視化系統(tǒng)源碼 一,智慧園區(qū)建設(shè)的核心價值 1,三維可視化應(yīng)用,未來智慧園區(qū)管理發(fā)展方向。 ?...

    tanglijun 評論0 收藏0
  • 云計算的運維管理問題

    摘要:運行監(jiān)控云計算的運維管理應(yīng)從數(shù)據(jù)中心的日常監(jiān)控人手,對日常維護(hù)管理事件管理變更管理以及應(yīng)急預(yù)案管理等進(jìn)行全方位的日常監(jiān)控,以提前發(fā)現(xiàn)問題并消除隱患。自動化管理已然成為了當(dāng)前云計算運維管理的一個必然發(fā)展趨勢。從而有效實現(xiàn)云計算運維管理的改進(jìn)。云計算在企業(yè)運營中的基本工作原理是將計算分布在大量分布式計算機(jī)中,從而使企業(yè)數(shù)據(jù)中心的運行和互聯(lián)網(wǎng)更為相似。通過云計算的運維管理,企業(yè)不僅能夠?qū)崿F(xiàn)對IT資...

    CoderBear 評論0 收藏0

發(fā)表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<