成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

內(nèi)存庫長事務(wù)告警的自愈之路

IT那活兒 / 1580人閱讀
內(nèi)存庫長事務(wù)告警的自愈之路

一條告警,在不同階段回顧,常會有新想法:內(nèi)存庫(TimesTen)長事務(wù)告警就是這樣,從最開始的簡單告警,到逐漸完善成可以自愈的告警。

首先我們要知道什么是內(nèi)存庫長事務(wù),顧名思義就是運行時間較長、長時間未提交的事務(wù),這類事務(wù)往往會造成主備同步延時影響主備及時性,一般臨時處理方法是內(nèi)存庫維護人員將應(yīng)用信息反饋給應(yīng)用維護人員,經(jīng)授權(quán)后應(yīng)用側(cè)重啟對應(yīng)進程。

這個流程涉及的操作步驟如下:




回顧各個階段如下:




下面回顧下是如何在不同階段一步步對該告警進行完善的:


1

初學(xué)內(nèi)存庫

剛學(xué)內(nèi)存庫時,長事務(wù)告警是這樣的:

TT: 長事務(wù)告警:地市-主機IP-系統(tǒng)用戶-內(nèi)存庫實例-庫角色 , 共 3 個, 2017/09/13 03:00,請核查.

告警發(fā)出后,TT維護人員、應(yīng)用維護人員分別根據(jù)操作手冊《【工作手冊】TT內(nèi)存庫出現(xiàn)長事務(wù)處理方法-20161115.docx》進行處理;


2

深入內(nèi)存庫

經(jīng)過深入學(xué)習(xí)后,對長事務(wù)告警可能出現(xiàn)的各種情形有了積累,告警場景及處理方法逐漸明確完整,告警調(diào)整成這樣的:

TT: 長事務(wù)告警:地市-主機IP-系統(tǒng)用戶-內(nèi)存庫實例-庫角色-10個,應(yīng)用詳情:應(yīng)用主機1.IP 應(yīng)用進程號1;應(yīng)用主機2.IP 應(yīng)用進號2;應(yīng)用主機3.IP 應(yīng)用進程號3, 2018/3/16 01:11,請核查.

這時告警發(fā)出來后,應(yīng)用維護人員直接根據(jù)告警短信中的應(yīng)用詳情部分(進程主機IP地址、進程號),在BOSS后臺進程管理界面(Taskmon平臺)上查找進程的菜單路徑、名稱,審核影響,經(jīng)授權(quán)后執(zhí)行進程停止、啟動操作。

注:BOSS后臺進程管理界面


3

初學(xué)應(yīng)用

工作內(nèi)容調(diào)整投入到應(yīng)用維護中,再次收到了長事務(wù)告警,看著短信里面的主機IP和進程ID,想著如果直接把進程路徑及名稱寫出來不是更好嗎?經(jīng)過一段時間的學(xué)習(xí),梳理清楚了在數(shù)據(jù)庫sql查詢方法,這時長事務(wù)告警調(diào)整成這樣的:

TT: 長事務(wù)告警:地市-主機IP-系統(tǒng)用戶-內(nèi)存庫實例-庫角色-2個,應(yīng)用詳情:應(yīng)用主機1.IP ping正常,200集群_CBE系統(tǒng)->200_離線二批->批價合賬合并進程_CBE_RATE728_689_1->intcb_proc->20053203146->應(yīng)用主機1.IP:應(yīng)用進程號1;應(yīng)用主機2.IP ping正常,200集群_臨時搶占進程->200_TMP_二批->TMP_批價合賬合并進程_CBE_RATE715_683_1->intcb_proc->20053202443->應(yīng)用主機2.IP:應(yīng)用進程號2, 2019/8/24 18:50,請核查.

告警發(fā)出來后,一眼就知道是什么業(yè)務(wù)進程、在平臺的哪個界面操作,這時不用再登主機查信息了,應(yīng)用維護人員(或移動值班室人員)直接登錄進程管理界面就可以處理了。


4

深入應(yīng)用

隨著應(yīng)用的深入學(xué)習(xí),知道了進程的啟停不僅只能人工在界面處理,還可以通過調(diào)用接口實現(xiàn);于是想到了正好可以做長事務(wù)告警的自愈處理,于是告警調(diào)整成下面這樣的:

內(nèi)存庫: TT: 長事務(wù)告警:地市-主機IP-系統(tǒng)用戶-內(nèi)存庫實例-庫角色-2個,應(yīng)用詳情:應(yīng)用主機1.IP ping正常,201集群_CBE系統(tǒng)->201_不計費流量話單匹配用戶資料_event_trans->CBE_RATE710_GPRS_FREE_731->event_trans->20180130020->應(yīng)用主機1.IP:應(yīng)用進程號1,已重啟;10.25.19.195 ping正常,201集群_CBE系統(tǒng)->201_離線二批->批價合賬合并進程_CBE_RATE710_735_1->intcb_proc->20153203690->應(yīng)用主機2.IP:應(yīng)用進程號2,已重啟; 2020/8/10 19:00,請核查.





梳理各個階段如下:







總結(jié)思考如下:




內(nèi)存庫長事務(wù)告警的自處理,最開始告警的處理、登記占用了大部分維護時間,且都是重復(fù)性的工作,現(xiàn)在告警短信包含了所有信息并且自動處理,維護人員可以將注意點轉(zhuǎn)變到告警原因的統(tǒng)計分析工作上,挖掘更有價值的信息;

本文列舉的樣例只是很小的一個點,提升的效果也是有限的;自以為其他事情也一樣,隨著技術(shù)的提升、角色的調(diào)整、思維的轉(zhuǎn)變,在不同階段對同一件事情往往會有不同的看法,所以需要經(jīng)常回頭看下以前做的事情,不斷完善;一個點帶來的效率的提升可以不斷正向激勵自己,陸續(xù)積累的點逐漸匯聚起來,提升工作效率。

目前現(xiàn)場引入了自動化運維平臺,再回頭看內(nèi)存庫長事務(wù)的告警處理,又能碰撞出什么樣的火花呢?且聽下回分解。


END


更多精彩干貨分享

點擊下方名片關(guān)注

IT那活兒

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/129903.html

相關(guān)文章

  • “大促”背后技術(shù) | 當我們說促銷時候,我們在談什么?

    摘要:郭理靖表示,在京東商城的實踐中,針對線上系統(tǒng)選擇構(gòu)建兩個機房,分別是生產(chǎn)環(huán)境以及在災(zāi)備環(huán)境。在監(jiān)控引擎方面,京東云的嘗試也是比較細致的,其中包括監(jiān)控服務(wù)報警服務(wù)等。進一步,根據(jù)不同的報警,我們可以定位到 showImg(https://segmentfault.com/img/bVbtNqp?w=688&h=113); showImg(https://segmentfault.com/...

    20171112 評論0 收藏0
  • “大促”背后技術(shù) | 當我們說促銷時候,我們在談什么?

    摘要:郭理靖表示,在京東商城的實踐中,針對線上系統(tǒng)選擇構(gòu)建兩個機房,分別是生產(chǎn)環(huán)境以及在災(zāi)備環(huán)境。在監(jiān)控引擎方面,京東云的嘗試也是比較細致的,其中包括監(jiān)控服務(wù)報警服務(wù)等。進一步,根據(jù)不同的報警,我們可以定位到 showImg(https://segmentfault.com/img/bVbtNqp?w=688&h=113); showImg(https://segmentfault.com/...

    張巨偉 評論0 收藏0
  • “大促”背后技術(shù) | 當我們說促銷時候,我們在談什么?

    摘要:郭理靖表示,在京東商城的實踐中,針對線上系統(tǒng)選擇構(gòu)建兩個機房,分別是生產(chǎn)環(huán)境以及在災(zāi)備環(huán)境。在監(jiān)控引擎方面,京東云的嘗試也是比較細致的,其中包括監(jiān)控服務(wù)報警服務(wù)等。進一步,根據(jù)不同的報警,我們可以定位到 showImg(https://segmentfault.com/img/bVbtNqp?w=688&h=113); showImg(https://segmentfault.com/...

    王巖威 評論0 收藏0
  • New Relic性能監(jiān)控(二)應(yīng)用監(jiān)控APM

    摘要:左邊側(cè)邊欄分為三個組,分別為監(jiān)控數(shù)據(jù),事件和報告。從接到請求到響應(yīng)處理完成的過程為稱為一次事務(wù)。針對應(yīng)用,還提供性能監(jiān)控數(shù)據(jù),包括內(nèi)存使用,線程數(shù)等等。 New Relic性能監(jiān)控(二)應(yīng)用監(jiān)控APM 2018-04-12 瑯琊書生本系列文章基于公司使用New Relic的經(jīng)驗,鑒于國內(nèi)較少有這方面的文章,因此把我工作中了解到的知識分享給大家,希望可以給需要的朋友帶來幫助。 上期文章...

    wangxinarhat 評論0 收藏0
  • “懂運維、精運營、重服務(wù)” UCloud發(fā)布混合云多云管理平臺UCMP

    摘要:企業(yè)微信截圖企業(yè)微信截圖多云異構(gòu)環(huán)境下的資源統(tǒng)一管理在混合云的架構(gòu)下,不同云服務(wù)商提供的基礎(chǔ)資源數(shù)據(jù)結(jié)構(gòu)不同,對企業(yè)資產(chǎn)管理運營管理運維管理都帶來了巨大的不便?,F(xiàn)如今數(shù)字經(jīng)濟高速發(fā)展,兼具基礎(chǔ)設(shè)施投資成本低、資源擴展速度快、數(shù)據(jù)安全高可控的混合云架構(gòu),成為了政府單位及中大型傳統(tǒng)行業(yè)的首選。但多云架構(gòu)混合云方案在帶來成本、效率、安全等優(yōu)勢的同時,由于IT資源分散在不同的架構(gòu)中,也帶來了混合架構(gòu)...

    Tecode 評論0 收藏0

發(fā)表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<