問題概述
當前xx移動賬務A數據庫遷移需搭建ADG同步,現有存儲已擴容,添加46塊共享磁盤,但賬務A數據庫各節點上存在未知用處的共享磁盤(未使用狀態),且節點上磁盤數量不一致,導致存儲擴容后,AIX主機掃描磁盤出現各節點磁盤盤符不一致情況。
系統環境
操作系統:AIX 7.1
部署業務:賬務A數據庫(Oracle 12c RAC集群)
節點ip:節點1:192.168.X.1 節點2:192.168.X.2
存儲:HP XP24000 存儲
操作說明
涉及操作主要是從主機方面來處理ASM存儲擴容及出現盤符不一致問題。
操作流程
1. 掃描磁盤
執行掃盤命令:cfgmgr -v
注意:需要在每個節點服務器上都要執行此命令,掃描出機器中新增的物理磁盤。
2. 確認新增磁盤情況
在2個節點服務器上查看磁盤設備看是否系統成功識別,當前看到兩節點服務器新增存儲磁盤已識別;但由于數據庫兩節點磁盤數量不一致,添加后的共享磁盤盤符不一致,如下所示:
#數據庫節點服務器1
xxx:/home/xxx>lsdev -Cc disk | egrep hdisk1[0-9][0-9]hdisk101 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk102 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk103 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk104 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk105 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk106 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
......
......
hdisk144 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk145 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk146 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk147 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk148 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
注:紅色標記為節點1服務器上已存在磁盤,hdisk104-hdisk149這46塊為掃描后新增磁盤。
#數據庫節點服務器2
xxx:/home/xxx>lsdev -Cc disk | egrep hdisk1[0-9][0-9]hdisk101 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk102 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk103 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk104 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk105 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk106 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk107 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk108 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
……
……
hdisk151 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk152 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
hdisk153 Available 0B-00-02 XP MPIO Disk XP24000 Fibre
注:紅色標記為節點2服務器上已存在磁盤,hdisk108-hdisk153這46塊為掃描后新增磁盤。
3. 查看兩節點新增46塊磁盤的設備信息
確認是否一一對應為同一塊硬盤設備。
首先查看節點1 hdisk104硬盤設備與節點2hdisk108硬盤設備:
節點1上hdisk104是掃盤后新增的第一塊硬盤,節點2上hdisk108是掃盤第一塊硬盤。
#數據庫節點服務器1
xxx:/home/xxx>lsattr -El hdisk104 |grep lun_id
lun_id 0x60000000000000 Logical Unit Number ID False
------------------------------------------------------------------------
#數據庫節點服務器2
xxx:/home/xxx>lsattr -El hdisk108 |grep lun_id
lun_id 0x60000000000000 Logical Unit Number ID False
查看節點1 hdisk149硬盤設備與節點2 hdisk153硬盤設備:
注:節點1上hdisk149是掃盤后新增的第一塊硬盤,節點2上hdisk153是掃盤第一塊硬盤。
#數據庫節點服務器1
xxx:/home/xxx>lsattr -El hdisk149 |grep lun_id
lun_id 0x8d000000000000 Logical Unit Number ID False
----------------------------------------------------------------------
#數據庫節點服務器2
xxx:/home/xxx>lsattr -El hdisk153 |grep lun_id
lun_id 0x8d000000000000 Logical Unit Number ID False
我們查看了兩節點服務器上對應新增硬盤設備的lun_id,發現設備lun_id相同可以確定是同一塊硬盤設備。到此可以通過遍歷方式獲取兩節點服務器上新增磁盤設備信息中的lun_id,確認對應設備是來自同一塊硬盤硬盤存儲設備。
#!/bin/ksh
#此腳本為遍歷獲取掃盤后新增硬盤的lun_id信息
#腳本要在兩臺節點上都執行,比對兩節點服務器上的輸出信息即可
while read line
do
lunid=`lsattr -El $line | grep lun_id |awk {print $2} `
echo ${line}” ”${lunid}
#hdisk.count文件為兩節點服務器上執行腳本時對應節點服務器上新增存儲塊設備列表(eg:hdisk104,可通過lsdev -Cc disk命令獲?。?/span>
done
由于ASM擴容對硬盤有強一致性要求,遍歷確認硬盤信息是必要的步驟(此處篇幅過長,只展示獲取腳本,其他不作贅述)。
4. 修改硬盤設備盤符
修改硬盤設備盤符在當前情況有兩種處理方式
修改兩臺節點上新增硬盤設備盤符
只修改節點1上新增硬盤設備盤符
由于節點2服務器上硬盤盤符劃分信息比節點1服務器上盤符劃分要多4個,修改節點1新增硬盤盤符與節點2新增硬盤盤符保持一致是可行的。為減少風險操作,避免故障發生,此處選擇第二種方式:只修改節點1上新增硬盤設備盤符。
另外需要注意修改盤符需要從大到小的順序修改,避免重復盤符出現,導致失敗。
為保證安全性,通常我們先執行修改一塊設備的磁盤盤符,修改后提交到數據庫側進行測試。示例如下:
#節點1服務器上操作
#修改新增的最后一塊硬盤hdisk149,與節點2上最后一塊硬盤盤符保持一致,修改成hdisk153
#執行命令(root權限)如下:
xxx:/home/xxx> rendev -l hdisk149 -n hdisk153
#查看修改后hdisk153 lun_id 及/dev目錄下hdisk153塊設備及rhdisk153字符設備是否已更改過來
xxx:/home/xxx> lsattr -El hdisk153 |grep lun_id
lun_id 0x8d000000000000 Logical Unit Number ID False
xxx:/home/xxx> ls -l /dev/*disk153
brw------- 1 root system 15,149 Mar 16 16:34 /dev/hdisk153
crw------- 1 root system 15,149 Mar 18 09:01 /dev/rhdisk153
如上所示,修改后hdisk153硬盤設備lun_id未變動,/dev/目錄下塊設備和字符設備均已修改成功。
接下來修改rhdisk153字符設備權限及塊設備hdisk153 reserve_policy屬性:
#節點1和節點2服務器需要執行操作
#執行命令(root權限)如下:
xxx:/home/xxx> chdev -l hdisk153 -a reserve_policy=no_reserve
xxx:/home/xxx> chown oracle:dba /dev/rhdisk153
xxx:/home/xxx> chmod 660 /dev/rhdisk153
修改成功后,告知數據庫側測試添加rhdisk153,看數據庫中是否可以識別到。此示例中數據庫側識別成功,之后執行批量化修改其他硬盤設備(部分遍歷操作腳本如下)。
#!/bin/ksh
#此腳本為遍歷修改節點1上新增硬盤設備盤符(共45塊,除去hdisk149已操作)
#腳本在節點1服務器上執行
while read line1 line2
do
rendev -l ${line1} -n ${line2}
done#hdisk2.count文件為節點1與節點2對應新增硬盤設備(塊設備名)倒序排列列表
#示例內容如下(共45行):
#hdisk148 hdisk152
#hdisk147 hdisk151
#······
#hdisk104 hdisk108
#!/bin/ksh
#此腳本為遍歷修改新增硬盤設備eserve_policy及對應字符設備權限
#示例中共45塊,除去hdisk149已操作
#腳本在節點1和節點2服務器上執行,需要root權限
while read line1 line2
do
chdev -l ${line1} -a reserve_policy=no_reserve
chown oracle:dba /dev/${line2}
chmod 660 /dev/${line2}
done#hdisk_rhdisk.count文件為節點上與節點2上對應新增硬盤塊設備及字符設備對應列表
#示例內容如下(共45行):
#hdisk108 rhdisk108
#hdisk109 rhdisk109
#······
#hdisk151 rhdisk151
#hdisk152 rhdisk152
問題總結
根據此次問題的發生及處理方式有以下幾點總結:
ASM磁盤擴容對共享存儲的要求:硬盤設備盤符一樣且是同一塊硬盤設備。
遇到磁盤盤符修改操作,查看各節點對應硬盤設備是否是同一塊硬盤可查看硬盤lun_id信息。
批量化操作執行的前提是已驗證過執行過程的可行性、準確性。
更多精彩干貨分享
點擊下方名片關注
IT那活兒
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/129814.html
摘要:問題九庫控制文件擴展報錯庫的擴展報錯,用的是裸設備,和還是原來大小,主庫的沒有報錯,并且大小沒有變,求解釋。專家解答從報錯可以看出,控制文件從個塊擴展到個塊時報錯,而裸設備最大只支持個塊,無法擴展,可以嘗試將參數改小,避免控制文件報錯。 鏈接描述引言 近期我們在DBASK小程序新關聯了運維之美、高端存儲知識、一森咖記、運維咖啡吧等數據領域的公眾號,歡迎大家閱讀分享。 問答集萃 接下來,...
摘要:一般用到最多的軟件就是分區助手,分區助手可以調整我們磁盤的空間,也可以重新可視化磁盤分區。這里簡單的記錄如何使用分區助手將磁盤重新格式化分區。當然這是在我們的分區助手軟件中操作的。利用分區助手是不是很簡單一般我們新購買的磁盤默認就一個盤符,或者是我們在給電腦系統重新做系統的時候需要調整盤符。一般用到最多的軟件就是分區助手,分區助手可以調整我們磁盤的空間,也可以重新可視化磁盤分區。在這篇文章中...
摘要:本文記錄一些下的卷管理和配置方法。例如上面的命令創建了一個名叫的,并將全部劃分用于。使用查看的分配情況,下面是該命令的輸出樣例格式化。格式化時需要指定一個日志設備,可以用剛剛創建的日志類型的對應的設置名,或者使用一個已經存在的日志設備。 我們知道,現在操作系統都具有默認的卷管理系統來管理磁盤。詳見存儲技術之卷管理和文件系統??傮w來說,從下向上分為物理磁盤(PV)、邏輯卷組(VG)、邏輯...
摘要:平臺采用分布式存儲系統作為虛擬化存儲,用于對接虛擬化計算及通用數據存儲服務,消除集中式網關,使客戶端直接與存儲系統進行交互,并以多副本糾刪碼多級故障域數據重均衡故障數據重建等數據保護機制,確保數據安全性和可用性。云計算平臺通過硬件輔助的虛擬化計算技術最大程度上提高資源利用率和業務運維管理的效率,整體降低 IT 基礎設施的總擁有成本,并有效提高業務服務的可用性、可靠性及穩定性。在解決計算資源的...
閱讀 1353·2023-01-11 13:20
閱讀 1699·2023-01-11 13:20
閱讀 1211·2023-01-11 13:20
閱讀 1902·2023-01-11 13:20
閱讀 4161·2023-01-11 13:20
閱讀 2751·2023-01-11 13:20
閱讀 1397·2023-01-11 13:20
閱讀 3664·2023-01-11 13:20