成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

Oracle2PG系列之檢查點(diǎn)引起的故障案例

IT那活兒 / 2056人閱讀
Oracle2PG系列之檢查點(diǎn)引起的故障案例
點(diǎn)擊上方“IT那活兒”,關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了!! 

1

最近碰到個(gè)案例,某Oracle數(shù)據(jù)庫遷移到PG的過程中,壓測(cè)發(fā)現(xiàn)一波巨量IO將PG庫給沖hang住了,一通檢查發(fā)現(xiàn)是PG全量檢查點(diǎn)搗的鬼,今天我們一起來總結(jié)一下。

2

先普及一下基礎(chǔ)知識(shí),一般數(shù)據(jù)庫的最小存儲(chǔ)單元都是數(shù)據(jù)塊(block/page),當(dāng)客戶端修改數(shù)據(jù)時(shí)意味著,數(shù)據(jù)庫引擎需要將對(duì)應(yīng)的物理數(shù)據(jù)塊讀到數(shù)據(jù)庫的buffer cache中進(jìn)行修改,此時(shí)這個(gè)數(shù)據(jù)塊與物理文件中的數(shù)據(jù)塊將不在一致,稱為臟塊。
由于臟塊分布隨機(jī),持久化到存儲(chǔ)的成本巨大,讓客戶端等待這個(gè)臟塊完成持久化完成無疑TPS會(huì)非常差。
為了改進(jìn)這個(gè)問題各大數(shù)據(jù)庫廠商普遍采用預(yù)寫式(write ahead log,也有取名redo,都是一個(gè)意思)來記錄這些臟塊的修改動(dòng)作(record),將這些record持續(xù)性順序的持久化到磁盤,臟塊將在后續(xù)異步持久化到存儲(chǔ)中。
傳統(tǒng)HDD順序IO的性能優(yōu)于隨機(jī)IO幾十倍,這即保證了數(shù)據(jù)修改不會(huì)丟失,性能也得到得了巨大提升。
參考o(jì)racle文檔圖:
需要注意:當(dāng)臟塊持久化不及時(shí),buffer cache中堆積了巨量臟塊時(shí),如果發(fā)生宕機(jī),數(shù)據(jù)庫再次啟動(dòng)時(shí)為了維持一致性,需要調(diào)用wal的record來恢復(fù)這些臟塊。這就需要數(shù)據(jù)庫判斷哪些是臟塊,通常數(shù)據(jù)庫廠商采用檢查點(diǎn)(checkpoint)點(diǎn)來進(jìn)行標(biāo)記。
Buffer cache中的臟塊持久化到數(shù)據(jù)文件中后,將標(biāo)記上checkpoint position,并與wal record進(jìn)行關(guān)聯(lián),position之前的wal將不再需要,position之后的wal record用來對(duì)臟塊進(jìn)行一致性恢復(fù)。
參考o(jì)racle文檔圖:
注意:在Oracle中,其采用SCN來記錄Checkpoint position。
Oracle在古老的8i版本之前,采用一次性將buffer cache中的臟塊全量持久化到數(shù)據(jù)文件中并更新checkpoint position,稱為全量檢查點(diǎn)(full checkpoint)。這種方法比較簡(jiǎn)單粗暴,產(chǎn)生的問題也很直觀,當(dāng)產(chǎn)生全量檢查點(diǎn)時(shí),巨量的臟塊持久化IO會(huì)對(duì)數(shù)據(jù)庫TPS產(chǎn)生劇烈影響,甚至于hang、宕機(jī)等、問題多多。
Oracle針對(duì)這個(gè)問題后續(xù)采用了增量檢查點(diǎn)(Incremental checkpoint),在buffer cache中對(duì)臟塊按順序進(jìn)行鏈表記錄,增量檢查點(diǎn)按鏈表持續(xù)推進(jìn)position,數(shù)據(jù)庫實(shí)例異常宕機(jī)時(shí),僅需對(duì)最新position之后的臟塊使用wal record進(jìn)行一致性恢復(fù),這會(huì)大大縮短恢復(fù)時(shí)間,且將全量檢查點(diǎn)的巨量臟塊持久化IO進(jìn)行平滑拆分提高數(shù)據(jù)庫穩(wěn)定性,同時(shí)提供了Fast Mtrr等參數(shù)進(jìn)一步幫助用戶來控制一致性恢復(fù)時(shí)間。
以上我們就搞清了Oracle檢查點(diǎn)相關(guān)的知識(shí)。

3

接下來就來探討PG的檢查點(diǎn):
PG的文檔中描述其在發(fā)生檢查點(diǎn)時(shí),需要將全量臟塊刷新到磁盤中,且提到會(huì)引起IO過載的問題。注意PG目前的版本中還不支持增量檢查點(diǎn)。
再來看一下模擬壓測(cè)故障的案例:使用pgbench進(jìn)行TPS壓力測(cè)試,發(fā)現(xiàn)在開始checkpoint后, iostat中write開始劇烈上升,同時(shí)pgbench的TPS直線下降,數(shù)據(jù)庫基本無響應(yīng)。
如下:
pg checkpointlog:
注意:這里為了加大全量檢查點(diǎn)的力度設(shè)置檢查點(diǎn)周期為1分鐘。
檢查點(diǎn)期間iostat中磁盤寫壓力較大,IO響應(yīng)出現(xiàn)延遲。
同時(shí)pidstat觀察到postgres walwrite進(jìn)程的io在checkpoint發(fā)起后直線下降。由于事務(wù)wal日志落盤不及時(shí)大量的會(huì)話等待于WALWriteLock,數(shù)據(jù)庫hang。
以上就復(fù)現(xiàn)了生產(chǎn)壓測(cè)時(shí)的故障現(xiàn)象。
針對(duì)于此,PG建議通過設(shè)置checkpoint_timeout與max_wal_size來控制檢查點(diǎn)的周期,同時(shí)設(shè)置checkpoint_completion_target來控制檢查點(diǎn)周期間,刷臟的負(fù)荷。
具體如下:

根據(jù)如上優(yōu)化后,生產(chǎn)環(huán)境經(jīng)過多輪壓測(cè)調(diào)整,TPS穩(wěn)定運(yùn)行24小時(shí),基本達(dá)到理想效果。

4

最后我們總結(jié)一下, Oracle中有詳細(xì)的lgwr日志、ckpt日志、dbwr日志等等便于我們排查問題,而PG的日志信息較少,排查問題相對(duì)困難,這方面還有待改進(jìn),本文就到此為止。

 



END



  



本文作者:胡 杰

本文來源:IT那活兒(上海新炬王翦團(tuán)隊(duì))

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/129530.html

相關(guān)文章

  • 無人值守時(shí)代,運(yùn)維如何保障發(fā)布質(zhì)量?

    摘要:導(dǎo)讀阿里巴巴千億交易背后,如何盡量避免發(fā)布故障在面對(duì)實(shí)際運(yùn)維過程中遇到的問題該如何解決近日,在大會(huì)上,阿里巴巴運(yùn)維技術(shù)專家少荃,給我們帶來了解決方案和思路。在阿里,這些屏幕包括監(jiān)控發(fā)布單機(jī)器故障預(yù)警等。 導(dǎo)讀:阿里巴巴千億交易背后,如何盡量避免發(fā)布故障?在面對(duì)實(shí)際運(yùn)維過程中遇到的問題該如何解決?近日,在GOPS大會(huì)上,阿里巴巴運(yùn)維技術(shù)專家少荃,給我們帶來了解決方案和思路。 showIm...

    Yu_Huang 評(píng)論0 收藏0
  • 無人值守時(shí)代,運(yùn)維如何保障發(fā)布質(zhì)量?

    摘要:摘要阿里巴巴千億交易背后,如何盡量避免發(fā)布故障在面對(duì)實(shí)際運(yùn)維過程中遇到的問題該如何解決阿里巴巴運(yùn)維技術(shù)專家少荃,給我們帶來了解決方案和思路。在阿里,這些屏幕包括監(jiān)控發(fā)布單機(jī)器故障預(yù)警等。無人值守發(fā)布無人值守發(fā)布主要是把上述過程自動(dòng)化智能化。 摘要: 阿里巴巴千億交易背后,如何盡量避免發(fā)布故障?在面對(duì)實(shí)際運(yùn)維過程中遇到的問題該如何解決?阿里巴巴運(yùn)維技術(shù)專家少荃,給我們帶來了解決方案和思路...

    LancerComet 評(píng)論0 收藏0
  • [譯]GC專家系列3-GC調(diào)優(yōu)

    摘要:原文鏈接本篇是專家系列的第三篇。但是,請(qǐng)記住調(diào)優(yōu)是不得已時(shí)的選擇??s短耗時(shí)的單次執(zhí)行與相比,耗時(shí)有較明顯的增加。創(chuàng)建文件過程中,進(jìn)程會(huì)中斷,因此不要在正常運(yùn)行時(shí)系統(tǒng)上做此操作。因此校驗(yàn)結(jié)果并根據(jù)具體的服務(wù)需要,決定是否要進(jìn)行調(diào)優(yōu)。 原文鏈接:http://www.cubrid.org/blog/dev-platform/how-to-tune-java-garbage-collecti...

    leap_frog 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<