摘要:核心組件故障恢復(fù)核心組件故障恢復(fù)核心組件故障恢復(fù)本篇目錄組件的故障恢復(fù)組件的故障恢復(fù)的故障恢復(fù)的故障恢復(fù)容器引擎的恢復(fù)容器引擎的恢復(fù)組件的故障恢復(fù)組件的故障恢復(fù)組件的故障恢復(fù)是的核心管理組
APIServer、Controller Manager、Scheduler 是 Kubernetes 的核心管理組件,在 UK8S 集群中,默認(rèn)配置三臺(tái) Master 節(jié)點(diǎn),每臺(tái) Master 節(jié)點(diǎn)上均部署安裝了這些核心組件,各個(gè)組件通過(guò)負(fù)載均衡對(duì)外提供服務(wù),確保集群的高可用。
當(dāng)某個(gè)組件出現(xiàn)故障時(shí),請(qǐng)逐臺(tái)登錄三臺(tái) Master 節(jié)點(diǎn),通過(guò) systemctl status ${PLUGIN_NAME}
確認(rèn)組件狀態(tài),如組件不可用,可通過(guò)以下步驟進(jìn)行恢復(fù):
# 將一臺(tái)健康 Master 節(jié)點(diǎn)的內(nèi)網(wǎng) IP 配置為環(huán)境變量,便于從健康節(jié)點(diǎn)拷貝相關(guān)文件
export IP=10.23.17.200
# 從健康節(jié)點(diǎn)拷貝 APIServer、Controller Manager、Scheduler 組件二進(jìn)制安裝包
## 1.16 及以下 UK8S 版本,K8S 組件統(tǒng)一安裝在 hyperkube 文件中
scp root@IP:/usr/local/bin/hyperkube /usr/local/bin/hyperkube
## 1.17 及以后 UK8S 版本,K8S 組件以獨(dú)立二進(jìn)制文件形式安裝
scp root@IP:/usr/local/bin/{kube-apiserver,kube-controller-manager,kube-scheduler} /usr/local/bin/
# 拷貝 APIServer、Controller Manager、Scheduler 組件服務(wù)文件
scp root@IP:/usr/lib/systemd/system/{kube-apiserver.service,kube-controller-manager.service,kube-scheduler.service} /usr/lib/systemd/system/
# 拷貝 APIServer、Controller Manager、Scheduler 組件配置文件
scp root@IP:/etc/kubernetes/{apiserver,controller-manager,kube-scheduler.conf} /etc/kubernetes/
# 拷貝 kubectl 二進(jìn)制文件
scp root@IP:/usr/local/bin/kubectl /usr/local/bin/kubectl
# 拷貝 kubeconfig
scp -r root@IP:~/.kube ~/
# 修改 APIServer 配置參數(shù)
vim /etc/kubernetes/apiserver # 將 advertise-address 參數(shù)配置為故障節(jié)點(diǎn) IP
# 啟用服務(wù)
systemctl enable --now kube-apiserver kube-controller-manager kube-scheduler
# 配置 APIServer 負(fù)載均衡器的內(nèi)外網(wǎng) IP(僅在開(kāi)啟外網(wǎng) APIServer 功能情況下需要配置外網(wǎng) IP)
scp root@IP:/etc/sysconfig/network-scripts/ifcfg-lo:internal /etc/sysconfig/network-scripts/ifcfg-lo:internal
scp root@IP:/etc/sysconfig/network-scripts/ifcfg-lo:external /etc/sysconfig/network-scripts/ifcfg-lo:external
systemctl restart network
Kubelet、Kube-proxy 部署在每個(gè) Master / Node 節(jié)點(diǎn)上,分別負(fù)責(zé)節(jié)點(diǎn)注冊(cè)及流量轉(zhuǎn)發(fā)。
注:2020.6.12 以前創(chuàng)建的 UK8S 集群中,Master 節(jié)點(diǎn)上默認(rèn)不安裝 Kubelet,不能通過(guò)
kubectl get node
顯示。
# 將一臺(tái)健康節(jié)點(diǎn)的內(nèi)網(wǎng) IP 配置為環(huán)境變量,便于從健康節(jié)點(diǎn)拷貝相關(guān)文件
export IP=10.23.17.200
# 從健康節(jié)點(diǎn)拷貝 Kubelet、Kube-proxy 組件二進(jìn)制安裝包
## 1.16 及以下 UK8S 版本,K8S 組件統(tǒng)一安裝在 hyperkube 文件中,如在上一環(huán)節(jié)中已執(zhí)行過(guò)此操作可忽略
scp root@IP:/usr/local/bin/hyperkube /usr/local/bin/hyperkube
## 1.17 及以后 UK8S 版本,K8S 組件以獨(dú)立二進(jìn)制文件形式安裝
scp root@IP:/usr/local/bin/{kubelet,kube-proxy} /usr/local/bin/
# 準(zhǔn)備目錄
mkdir -p /opt/cni/net.d
mkdir -p /opt/cni/bin
mkdir -p /var/lib/kubelet
# 配置文件拷貝、服務(wù)文件
scp root@$IP:/etc/kubernetes/{kubelet,kubelet.conf,kube-proxy.conf,ucloud} /etc/kubernetes/
scp root@$IP:/usr/lib/systemd/system/{kubelet.service,kube-proxy.service} /usr/lib/systemd/system/
scp root@$IP:/etc/kubernetes/set-conn-reuse-mode.sh /etc/kubernetes/
scp root@$IP:/etc/rsyslog.conf /etc/
scp root@$IP:/opt/cni/bin/{cnivpc,loopback,host-local} /opt/cni/bin/
scp root@$IP:/opt/cni/net.d/10-cnivpc.conf /opt/cni/net.d/
# 修改配置參數(shù)
# 修改 --node-ip、--hostname-override 為待修復(fù)節(jié)點(diǎn) IP
# 修改 --node-labels 中 topology.kubernetes.io/zone、failure-domain.beta.kubernetes.io/zone 為待修復(fù)節(jié)點(diǎn)可用區(qū)(cn-bj2-02)
# 修改 --node-labels 中 UHostID、node.uk8s.ucloud.cn/resource_id 為待修復(fù)節(jié)點(diǎn)資源 ID(uhost-xxxxxxxx)
vim /etc/kubernetes/kubelet
# 禁用swap
swapoff -a
# 啟用服務(wù)
systemctl enable --now kubelet kube-proxy
# 將一臺(tái)健康 Master 節(jié)點(diǎn)的內(nèi)網(wǎng) IP 配置為環(huán)境變量,便于從健康節(jié)點(diǎn)拷貝相關(guān)文件
export IP=10.23.17.200
# 準(zhǔn)備目錄
mkdir -p /data/docker
rm -rf /var/lib/docker
ln -s /data/docker /var/lib/docker
# 安裝包下載及安裝
wget https://download.docker.com/linux/centos/7/x86_64/stable/Packages/docker-ce-19.03.14-3.el7.x86_64.rpm
wget https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.4.3-3.2.el7.x86_64.rpm
wget https://download.docker.com/linux/centos/7/x86_64/stable/Packages/docker-ce-cli-19.03.14-3.el7.x86_64.rpm
yum install *.rpm -y
# 拷貝配置及服務(wù)文件
scp root@$IP:/usr/lib/systemd/system/docker.service /usr/lib/systemd/system/
scp root@$IP:/etc/docker/daemon.json /etc/docker/
# 啟用服務(wù)
systemctl enable --now docker
3.2 Containerd 容器引擎# 將一臺(tái)健康 Master 節(jié)點(diǎn)的內(nèi)網(wǎng) IP 配置為環(huán)境變量,便于從健康節(jié)點(diǎn)拷貝相關(guān)文件
export IP=10.23.17.200
# 準(zhǔn)備目錄
mkdir -p /etc/containerd
mkdir -p /data/containerd
mkdir -p /data/log/pods
ln -s /data/containerd /var/lib/containerd
ln -s /data/log/pods /var/log/pods
# 安裝包下載及安裝
wget https://download.docker.com/linux/centos/7/x86_64/stable/Packages/containerd.io-1.4.3-3.2.el7.x86_64.rpm
yum install containerd.io-1.4.3-3.2.el7.x86_64.rpm
# 拷貝配置文件
scp root@$IP:/etc/containerd/{config.toml,containerd.toml} /etc/containerd/
scp root@$IP:/usr/lib/systemd/system/containerd.service /usr/lib/systemd/system/
scp root@$IP:/usr/local/bin/crictl /usr/local/bin/
scp root@$IP:/etc/crictl.yaml /etc/
# 啟用服務(wù)
systemctl start containerd
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/127163.html
摘要:對(duì)于存儲(chǔ)資源,的節(jié)點(diǎn)默認(rèn)系統(tǒng)盤(pán)。節(jié)點(diǎn)創(chuàng)建時(shí)可選擇數(shù)據(jù)盤(pán)掛載亦可在節(jié)點(diǎn)創(chuàng)建完成后在主機(jī)側(cè)掛載,如節(jié)點(diǎn)掛載有數(shù)據(jù)盤(pán),將用于存放本地鏡像的,否則本地鏡像等將保存在系統(tǒng)盤(pán)。 集群節(jié)點(diǎn)配置推薦本篇目錄1. Master 配置推薦2. 如何選擇 Node 配置大小1. Master 配置推薦Master 規(guī)格跟集群規(guī)模有關(guān),集群規(guī)模越大,所需要的 Master 規(guī)格也越高,不同集群規(guī)模的,Master ...
摘要:節(jié)點(diǎn)作為承載工作負(fù)載的實(shí)體,是一個(gè)非常重要的對(duì)象,在實(shí)際運(yùn)營(yíng)過(guò)程中,節(jié)點(diǎn)會(huì)出現(xiàn)各種問(wèn)題,本文簡(jiǎn)要描述下節(jié)點(diǎn)的各種異常狀態(tài)及排查思路。預(yù)防節(jié)點(diǎn)該文檔為預(yù)防節(jié)點(diǎn)的開(kāi)源方案,不提供,僅做參考,請(qǐng)謹(jǐn)慎使用。節(jié)點(diǎn)作為承載工作負(fù)載的實(shí)體,是 Kubernetes 一個(gè)非常重要的對(duì)象,在實(shí)際運(yùn)營(yíng)過(guò)程中,節(jié)點(diǎn)會(huì)出現(xiàn)各種問(wèn)題,本文簡(jiǎn)要描述下節(jié)點(diǎn)的各種異常狀態(tài)及排查思路。節(jié)點(diǎn)狀態(tài)說(shuō)明節(jié)點(diǎn)情況說(shuō)明處理辦法Read...
摘要:完全兼容原生的,以私有網(wǎng)絡(luò)為基礎(chǔ),并整合了等云產(chǎn)品。綜合資源有效利用率錯(cuò)誤容忍度兩個(gè)因素,在不考慮業(yè)務(wù)混合部署業(yè)務(wù)總體規(guī)模大小的情況下,我們建議生產(chǎn)環(huán)境的節(jié)點(diǎn)應(yīng)該介于核至核之間。模式是一個(gè)用于負(fù)載均衡的內(nèi)核功能。產(chǎn)品概念UCloud Container Service for Kubernetes (UK8S)是一項(xiàng)基于Kubernetes的容器管理服務(wù),你可以在UK8S上部署、管理、擴(kuò)展你...
摘要:宋體自年被開(kāi)源以來(lái),很快便成為了容器編排領(lǐng)域的標(biāo)準(zhǔn)。宋體年月,樂(lè)心醫(yī)療的第一個(gè)生產(chǎn)用集群正式上線。所以于年推出后,樂(lè)心醫(yī)療的運(yùn)維團(tuán)隊(duì)在開(kāi)會(huì)討論之后一致決定盡快遷移到。Kubernetes 自 2014 年被 Google 開(kāi)源以來(lái),很快便成為了容器編排領(lǐng)域的標(biāo)準(zhǔn)。因其支持自動(dòng)化部署、大規(guī)模可伸縮和容器化管理等天然優(yōu)勢(shì),已經(jīng)被廣泛接納。但由于 Kubernetes 本身的復(fù)雜性,也讓很多企業(yè)的...
摘要:客戶端庫(kù),為需要監(jiān)控的服務(wù)生成相應(yīng)的并暴露給。根據(jù)配置文件,對(duì)接收到的警報(bào)進(jìn)行處理,發(fā)出告警。再創(chuàng)建一個(gè)來(lái)告訴需要監(jiān)控帶有為的背后的一組的。什么是Prometheus關(guān)于PrometheusPrometheus 是一套開(kāi)源的系統(tǒng)監(jiān)控報(bào)警框架。它的設(shè)計(jì)靈感源于 Google 的 borgmon 監(jiān)控系統(tǒng),由SoundCloud 在 2012 年創(chuàng)建,后作為社區(qū)開(kāi)源項(xiàng)目進(jìn)行開(kāi)發(fā),并于 2015 ...
摘要:模式選擇是中的關(guān)鍵組件其主要功能是在和其后端之間進(jìn)行負(fù)載均衡。詳見(jiàn)后續(xù)測(cè)試數(shù)據(jù)對(duì)于集群規(guī)模中等,數(shù)量不多的,推薦選擇。模式下,使用負(fù)載均衡代替了。漏洞修復(fù)記錄HTTP/2漏洞升級(jí)說(shuō)明Runc容器逃逸漏洞修復(fù)說(shuō)明cloudprovider更新20.10.1集群節(jié)點(diǎn)配置推薦1、Master配置推薦Master規(guī)格跟集群規(guī)模有關(guān),集群規(guī)模越大,所需要的Master規(guī)格也越高,不同集群規(guī)模的,Mas...
閱讀 430·2024-11-07 18:25
閱讀 130684·2024-02-01 10:43
閱讀 923·2024-01-31 14:58
閱讀 893·2024-01-31 14:54
閱讀 82948·2024-01-29 17:11
閱讀 3224·2024-01-25 14:55
閱讀 2036·2023-06-02 13:36
閱讀 3133·2023-05-23 10:26