親愛滴伙伴們,大家好。上篇講了一起ADG主備切換異常的故障處理,最近又遇到一個ADG的問題,做下分享。事情是這樣的,一哥們急急忙忙的跑過來說:
“魏大濕,我手上的ADG實時同步死活開不起來!”
“之前實時同步是好的么?”
“是好的,都同步好久了。”
“那實時同步起不來之前你做了啥操作沒?”
“就在主庫新增了一些數(shù)據(jù)文件。”
“那之前在主庫新增數(shù)據(jù)文件的時候是正常的,是吧!”
“是的,之前是好的,就這次新增數(shù)據(jù)文件就成這樣了。”
...... ...... ......
通過溝通了解到,之前這套庫做過主備切換,已經(jīng)實時同步一段時間了,主庫在新增數(shù)據(jù)文件之后,備庫的實時同步就關(guān)閉了,并且新增數(shù)據(jù)文件在備庫沒有創(chuàng)建。手動開啟實時同步也無法開啟。
環(huán)境介紹:
操作系統(tǒng):Redhat7.6
數(shù)據(jù)庫版本:19.7
是否RAC:是
是否CDB:是
ASM或文件系統(tǒng):ASM
ADG主備庫節(jié)點數(shù):均為2個
注:之前做過主備切換,racdbstd為當前主庫,racdb為當前備庫。
1、查看備庫dbalert日志發(fā)現(xiàn)報ORA-01193:file 26 is not the same file seen at start of recovery。
2、為啥會報文件26不是恢復開始時看到的同一文件呢?繼續(xù)查看主備庫的數(shù)據(jù)文件差異。
主庫:
備庫:
從上圖我們可以看到主庫比備庫多了3個新增的數(shù)據(jù)文件。初步判斷那個26號文件報錯只是表象,真正原因是3個新增數(shù)據(jù)文件同步不過來導致。
3、數(shù)據(jù)文件為啥同步不過來?
新增數(shù)據(jù)文件主備庫同步涉及轉(zhuǎn)換,一般跟db_file_name_convert參數(shù)有關(guān)系,但疑點是就算db_file_name_convert參數(shù)設置有問題,也只是備庫這邊創(chuàng)建的新增數(shù)據(jù)文件路徑不對而已,備庫不會不創(chuàng)建數(shù)據(jù)文件。
主備庫db_file_name_convert參數(shù)核查正常:
嘗試再次開啟實時同步發(fā)現(xiàn)mrp進程沒有啟動,dbalert日志依舊報ORA-01193:file 26 is not the same file seen at start of recovery。
開啟實時同步顯示成功:
查看v$managed_standby發(fā)現(xiàn)備庫接受主庫的redo信息正常,但同步進程(MRP)沒有啟動
備庫Dbalert日志依舊報錯
4、在確認數(shù)據(jù)庫參數(shù)及其他tns等配置均正常的情況下,懷疑觸發(fā)BUG。在MOS上搜了一把,12C之前有ORA-01193報錯的BUG,但沒有發(fā)現(xiàn)19C類似報錯的文章,而且12C及之前的BUG現(xiàn)象不一致。好吧,既然新建數(shù)據(jù)文件無法自動同步過來,那我們還是使用基于scn增量備份恢復的方式把故障解決了。
5、查看當前備庫的SCN。
在主庫創(chuàng)建standbycontrolfile,并基于備庫查詢的SCN在主庫做增量備份。
6、將主庫創(chuàng)建的standbycontrolfile及增量備份集傳至備庫,記錄備庫當前數(shù)據(jù)文件的路徑以便重建備庫控制文件后rename數(shù)據(jù)文件,并將standby_file_management設置為manual。具體的上篇介紹過了,這里就不細說了。
7、將備庫實例shutdown并啟動至nomount,重建控制文件后mount。并rename備庫原有數(shù)據(jù)文件路徑。
8、查看備庫數(shù)據(jù)文件路徑發(fā)現(xiàn)只有新增數(shù)據(jù)文件路徑是異常的。
9、注冊備份集信息
RMAN>catalog start with /OGG noprompt;
10、由于新增數(shù)據(jù)文件41、42及43在備庫不存在,需要先restore,如果直接recover會報錯。
11、restore出來的數(shù)據(jù)文件并不是控制文件中的路徑,在主庫對應的目錄,我們需要asmcmd進入ASM中把文件詳細路徑找出來,然后做rename。
12、再次查看備庫控制文件中的數(shù)據(jù)文件路徑,確認恢復正常后,開始recover。
13、恢復完成后,將數(shù)據(jù)庫啟動至open,并開啟實時同步成功。注意:在recover之后,mount狀態(tài)下,redofile、standbyredofile及tempfile文件路徑均是不正確的,但不需要額外處理,只要將數(shù)據(jù)庫啟動至open,數(shù)據(jù)庫會自動將其修改成正確路徑。另外如果發(fā)現(xiàn)其他節(jié)點的standbyredo file路徑錯誤的時候,只要在路徑錯誤的節(jié)點開啟實時同步就自動恢復正常。
錯誤路徑截圖:
14、在主庫新增表空間之后發(fā)現(xiàn)備庫此時可正常同步了。
主庫:
備庫查詢到新增test表空間已創(chuàng)建:
總結(jié):
問題很詭異,在配置均正常的情況下,新增數(shù)據(jù)文件在備庫沒有創(chuàng)建,且實時同步失敗。MOS也查不到相關(guān)信息,疑似觸發(fā)BUG。在沒有workroud的前提下,這種ADG同步的系列故障,均可通過scn增量恢復大法解決,盡量避免備庫重建費時費力的工作。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/130152.html
19C?DG?Broker配置和測試 img{ display:block; margin:0 auto !important; width:100%; } body{ width:75%; ...
摘要:年月日,遷移服務解決方案在城市峰會中正式發(fā)布。遷移服務向分布式架構(gòu)升級的直接路徑基于上述問題和挑戰(zhàn),同時經(jīng)過螞蟻十年數(shù)據(jù)庫架構(gòu)升級的先進經(jīng)驗,螞蟻金服為客戶打造了這款一站式數(shù)據(jù)遷移解決方案遷移服務,簡稱。 2019年1月4日,OceanBase遷移服務解決方案在ATEC城市峰會中正式發(fā)布。螞蟻金服資深技術(shù)專家?guī)熚膮R和技術(shù)專家韓谷悅共同分享了OceanBase遷移服務的重要特性和業(yè)務實踐...
摘要:年月日,遷移服務解決方案在城市峰會中正式發(fā)布。遷移服務向分布式架構(gòu)升級的直接路徑基于上述問題和挑戰(zhàn),同時經(jīng)過螞蟻十年數(shù)據(jù)庫架構(gòu)升級的先進經(jīng)驗,螞蟻金服為客戶打造了這款一站式數(shù)據(jù)遷移解決方案遷移服務,簡稱。 2019年1月4日,OceanBase遷移服務解決方案在ATEC城市峰會中正式發(fā)布。螞蟻金服資深技術(shù)專家?guī)熚膮R和技術(shù)專家韓谷悅共同分享了OceanBase遷移服務的重要特性和業(yè)務實踐...
閱讀 1353·2023-01-11 13:20
閱讀 1699·2023-01-11 13:20
閱讀 1211·2023-01-11 13:20
閱讀 1903·2023-01-11 13:20
閱讀 4161·2023-01-11 13:20
閱讀 2751·2023-01-11 13:20
閱讀 1397·2023-01-11 13:20
閱讀 3664·2023-01-11 13:20