摘要:演講嘉賓簡(jiǎn)介蔡松露子嘉,阿里云云數(shù)據(jù)庫(kù)總架構(gòu)師,主要負(fù)責(zé)阿里云技術(shù)以及阿里云數(shù)據(jù)庫(kù)整體架構(gòu)等工作。也就是說(shuō)以上的四點(diǎn)只是達(dá)到了云原生數(shù)據(jù)庫(kù)的門(mén)檻值,還并不代表是這一個(gè)云原生的數(shù)據(jù)庫(kù)。
摘要:POLARDB是阿里云ApsaraDB數(shù)據(jù)庫(kù)團(tuán)隊(duì)研發(fā)的基于云計(jì)算架構(gòu)的下一代關(guān)系型數(shù)據(jù)庫(kù),其最大的特色是計(jì)算節(jié)點(diǎn)與存儲(chǔ)節(jié)點(diǎn)分離,借助優(yōu)秀的RDMA網(wǎng)絡(luò)以及最新的塊存儲(chǔ)技術(shù)。POLARDB不但滿(mǎn)足了公有云計(jì)算環(huán)境下用戶(hù)業(yè)務(wù)快速?gòu)椥詳U(kuò)展的剛性需求,同時(shí)也滿(mǎn)足了互聯(lián)網(wǎng)環(huán)境下用戶(hù)對(duì)數(shù)據(jù)庫(kù)服務(wù)器高可用的需求。本文就帶領(lǐng)大家了解什么是“云原生數(shù)據(jù)庫(kù)”,云原生數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn)是什么,如何定義以及為何如此定義?為大家介紹下一代云原生數(shù)據(jù)庫(kù)POLARDB的架構(gòu)、產(chǎn)品設(shè)計(jì)、未來(lái)工作等內(nèi)容。
以下內(nèi)容根據(jù)演講嘉賓視頻分享以及PPT整理而成,PPT下載鏈接。
演講嘉賓簡(jiǎn)介:蔡松露(子嘉),阿里云云數(shù)據(jù)庫(kù)總架構(gòu)師,主要負(fù)責(zé)阿里云POLARDB、NoSQL技術(shù)以及阿里云數(shù)據(jù)庫(kù)整體架構(gòu)等工作。在搜索引擎、NoSQL數(shù)據(jù)庫(kù)、分布式系統(tǒng)、操作系統(tǒng)內(nèi)核等領(lǐng)域有深厚積累與豐富的經(jīng)驗(yàn)。
本文主要內(nèi)容有:
一、什么是云原生數(shù)據(jù)庫(kù)
二、云原生數(shù)據(jù)庫(kù)POLARDB架構(gòu)實(shí)現(xiàn)
三、云原生數(shù)據(jù)庫(kù)POLARDB產(chǎn)品設(shè)計(jì)
一、什么是云原生數(shù)據(jù)庫(kù)
POLARDB是一個(gè)云原生數(shù)據(jù)庫(kù),關(guān)于云原生,演講者團(tuán)隊(duì)在ICDE上做了相關(guān)闡述。本文通過(guò)視頻整理,從架構(gòu)和產(chǎn)品設(shè)計(jì)方面介紹POLARDB的架構(gòu)和實(shí)現(xiàn)。
首先介紹實(shí)現(xiàn)云原生的門(mén)檻(PPT內(nèi)容如下圖所示),一個(gè)云原生的數(shù)據(jù)庫(kù)必須擁有出色的性能,有上百萬(wàn)的QPS,規(guī)模很容易擴(kuò)展到上百TB,同時(shí)在版本升級(jí)時(shí)盡量滿(mǎn)足零宕機(jī),最重要的一點(diǎn)是百分百兼容開(kāi)源生態(tài)。門(mén)檻的定義,我們可以通過(guò)下面例子理解,一輛車(chē)可能有很拉風(fēng)的外觀(guān),又有很快的速度,但是這輛車(chē)不能被直接稱(chēng)為跑車(chē),也有可能是山寨車(chē)。也就是說(shuō)以上的四點(diǎn)只是達(dá)到了云原生數(shù)據(jù)庫(kù)的門(mén)檻值,還并不代表是這一個(gè)云原生的數(shù)據(jù)庫(kù)。
下面介紹實(shí)現(xiàn)云原生的標(biāo)準(zhǔn),首先我們看下圖中所展示的,這些年數(shù)據(jù)庫(kù)的演變。從數(shù)據(jù)庫(kù)的規(guī)模來(lái)看,我們現(xiàn)如今處在一個(gè)數(shù)據(jù)爆炸的時(shí)代,從線(xiàn)性增長(zhǎng)到如今指數(shù)級(jí)別的增長(zhǎng),數(shù)據(jù)庫(kù)領(lǐng)域的核心理論也在發(fā)生變化,分布式系統(tǒng)領(lǐng)域中的CAP理論是指導(dǎo)我們?cè)O(shè)計(jì)系統(tǒng)的原則和基石,但是這個(gè)理論在最近幾年也在發(fā)生改變,同時(shí),最近也出現(xiàn)了很多的理論算法,例如paxos,raft等,如何應(yīng)用這些算法到數(shù)據(jù)庫(kù)架構(gòu)的設(shè)計(jì)中是一個(gè)問(wèn)題。另外,客戶(hù)也在發(fā)生變化,以前的數(shù)據(jù)庫(kù)客戶(hù)來(lái)自于銀行,政府或者全世界前500強(qiáng)企業(yè),但現(xiàn)在的形式已經(jīng)發(fā)生了巨大的轉(zhuǎn)變,現(xiàn)在數(shù)據(jù)庫(kù)的主體變成了互聯(lián)網(wǎng)+,IOT等公司。此外,基礎(chǔ)設(shè)施也在發(fā)生變化,以前用的是IDC等,現(xiàn)在很多新興的業(yè)務(wù)都往云上遷移,而且在這個(gè)過(guò)程中一切都是在線(xiàn)的,包括用戶(hù)與數(shù)據(jù)。
下圖很好地展示了如今的數(shù)據(jù)爆炸形勢(shì)。下圖出自互聯(lián)網(wǎng)女皇米克爾的互聯(lián)網(wǎng)形勢(shì)報(bào)告,通過(guò)報(bào)告,下圖將互聯(lián)網(wǎng)大概分為三個(gè)時(shí)代,第一是PC互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)主要由PC產(chǎn)生;第二是移動(dòng)互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)產(chǎn)生自衣食住行,社交,工作等多個(gè)方面;第三是物聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)由傳感器和終端設(shè)備產(chǎn)生,數(shù)據(jù)量從以前的線(xiàn)性增長(zhǎng)變成了指數(shù)級(jí)別的增長(zhǎng)。數(shù)據(jù)爆炸使得處理數(shù)據(jù)的成本越來(lái)越大,怎么采集數(shù)據(jù),怎么存儲(chǔ)數(shù)據(jù),怎么搬運(yùn)分析數(shù)據(jù),都變得愈加復(fù)雜。操作數(shù)據(jù)的復(fù)雜性直接帶來(lái)的后果就是,數(shù)據(jù)很難再被利用。但是,在這個(gè)新時(shí)代,數(shù)據(jù)像是石油,價(jià)值非常之大。
下圖解釋了CAP理論是怎么變化的。CAP中C代表一致性,A代表可用性,P代表分區(qū)容忍性,CAP的核心在于指出了當(dāng)網(wǎng)絡(luò)分區(qū)發(fā)生時(shí),一致性和可用性是無(wú)法被完美地保證,無(wú)法同時(shí)被滿(mǎn)足。C和A不是0和1的關(guān)系,而是99%和1%的關(guān)系,也就是說(shuō)C和A不是互斥關(guān)系,它們是可以無(wú)限逼近的。在有些場(chǎng)景下,P問(wèn)題和A問(wèn)題可以建模成相同的問(wèn)題,谷歌大神Jeff Dean有篇論文中對(duì)這個(gè)問(wèn)題做了很好的闡述,他認(rèn)為在某些場(chǎng)景下,P問(wèn)題本質(zhì)上就是A問(wèn)題。P產(chǎn)生可能有兩種情況,第一種,可能是網(wǎng)卡宕機(jī)了導(dǎo)致機(jī)器發(fā)生了網(wǎng)絡(luò)分區(qū),也可能是交換機(jī)掛掉導(dǎo)致一堆機(jī)器也掛了。網(wǎng)卡掛掉了,看上去像機(jī)器在系統(tǒng)中消失了,但本質(zhì)上和宕機(jī)沒(méi)有區(qū)別,因?yàn)殄礄C(jī)看上去也是機(jī)器突然消失了,所以在這種情況下,P問(wèn)題就是A問(wèn)題。第二種,機(jī)器的硬件不穩(wěn)定,比如磁盤(pán)很卡導(dǎo)致響應(yīng)請(qǐng)求很慢,這時(shí)候取決于怎么建模, P或A問(wèn)題都可以解釋。Paxos的核心在于每做一個(gè)決定時(shí),多數(shù)派同意就行,可以容忍少數(shù)派不同意,所以Paxos對(duì)網(wǎng)絡(luò)分區(qū)是有容忍性的,如果三個(gè)副本中的一個(gè)副本寫(xiě)的比較慢或者出現(xiàn)了問(wèn)題,在Paxos下不會(huì)影響其他兩個(gè)副本,仍然會(huì)正確返回結(jié)果。當(dāng)發(fā)生大規(guī)模的宕機(jī)時(shí),如果系統(tǒng)中使用Paxos利用拓?fù)淙萑虇蝹€(gè)交換機(jī)掛掉的情況。如果多個(gè)交換機(jī)掛掉,甚至出現(xiàn)了3-4個(gè)網(wǎng)絡(luò)分區(qū),作為一個(gè)數(shù)據(jù)庫(kù),追求的是百分百的C,其次才是A。但是,時(shí)間上,多個(gè)交換機(jī)全部掛掉的幾率非常小,相反,幾臺(tái)機(jī)器出問(wèn)題的概率非常大,所以應(yīng)該著重于解決常見(jiàn)問(wèn)題,之后使得C和A無(wú)限逼近。
下面介紹客戶(hù)發(fā)生的變化,如下圖所示。客戶(hù)對(duì)數(shù)據(jù)庫(kù)的需求正不斷演變,首先客戶(hù)希望數(shù)據(jù)庫(kù)更靈活,尤其對(duì)一些創(chuàng)業(yè)公司來(lái)說(shuō),機(jī)會(huì)是非常重要的,例如,當(dāng)出現(xiàn)熱點(diǎn)新聞,或者舉辦雙十一的活動(dòng),公司很不希望數(shù)據(jù)庫(kù)成為效率的瓶頸。此外,客戶(hù)希望降低使用數(shù)據(jù)庫(kù)的成本,也希望數(shù)據(jù)庫(kù)更高效,能夠花更少的錢(qián)買(mǎi)到更多的能力。同時(shí),客戶(hù)希望數(shù)據(jù)庫(kù)更敏捷,假設(shè)一個(gè)公司在舉辦雙十一活動(dòng)時(shí),系統(tǒng)掛1個(gè)小時(shí)或1分鐘是完全不同的概念,也就是說(shuō)客戶(hù)希望在有故障發(fā)生時(shí),數(shù)據(jù)庫(kù)是靈活的,自治的,能快速?gòu)膹墓收现谢謴?fù)過(guò)來(lái)。總結(jié)一下,現(xiàn)階段,客戶(hù)對(duì)數(shù)據(jù)庫(kù)的要求是,彈性,低成本,高性能,業(yè)務(wù)永續(xù)性。
在新時(shí)代,數(shù)據(jù)是實(shí)時(shí)在線(xiàn)產(chǎn)生,收集,清洗,存儲(chǔ),分析的(即Everything is Online),再實(shí)時(shí)的應(yīng)用到算法訓(xùn)練模型上。在中國(guó),大概有70%的新興公司都遇到了數(shù)據(jù)化的挑戰(zhàn),數(shù)據(jù)化的挑戰(zhàn)也影響到了客戶(hù)的業(yè)務(wù)。如下圖中列出了遇到的一些挑戰(zhàn),主要有高成本,能力不足(沒(méi)有專(zhuān)業(yè)的工程師,無(wú)法實(shí)現(xiàn)數(shù)據(jù)的備份,數(shù)據(jù)挖掘等功能),數(shù)據(jù)孤島化(數(shù)據(jù)散落在各個(gè)IDC或自建的機(jī)房中,沒(méi)有被很好的利用),數(shù)據(jù)規(guī)模很大(難以存儲(chǔ),搬運(yùn),分析,利用)。
以上提到的挑戰(zhàn)促使我們?cè)O(shè)計(jì)云原生的數(shù)據(jù)庫(kù),根據(jù)總結(jié)的挑戰(zhàn),得出了設(shè)計(jì)云原生數(shù)據(jù)庫(kù)的標(biāo)準(zhǔn),如下圖所示。首先,云原生數(shù)據(jù)庫(kù)必須是HTAP的,是一整套解決方案,不僅滿(mǎn)足TP的需求也滿(mǎn)足AP的需求,使得TP和AP不需要遠(yuǎn)程同步,再做數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)之間沒(méi)有延遲,同時(shí),能用一份存儲(chǔ)同時(shí)完成TP和AP,明顯降低了用戶(hù)的存儲(chǔ)成本;另外,云原生數(shù)據(jù)庫(kù)應(yīng)是serverless的,可以將存儲(chǔ)進(jìn)行分級(jí),將成本降到最低,并且在serverless下的升降配非常簡(jiǎn)單;最后,云原生數(shù)據(jù)庫(kù)必須是智能化的,能提供一些SQL優(yōu)化,索引等,能實(shí)時(shí)監(jiān)控診斷,也能提供管理系統(tǒng)方便成本控制。
下面將詳細(xì)介紹做HTAP的原因,如下圖所示。首先,HTAP對(duì)于分析來(lái)說(shuō),不存在任何延遲,對(duì)于實(shí)時(shí)性要求較高的業(yè)務(wù)是非常重要的,比如說(shuō)實(shí)時(shí)反欺詐,過(guò)海關(guān)時(shí)需要調(diào)查的信息。同時(shí),在架構(gòu)中不需要同步,共用一份存儲(chǔ)后,成本也會(huì)降低,不需要額外復(fù)制副本。AP和TP在計(jì)算層是被分開(kāi)的,物理上完全隔離,可以在不同的維度擴(kuò)展AP和TP,當(dāng)AP的需求多,TP需求少時(shí),可以擴(kuò)展AP的結(jié)點(diǎn),反之,擴(kuò)展TP的結(jié)點(diǎn),同時(shí),AP也對(duì)TP不會(huì)造成干擾。
下面介紹實(shí)現(xiàn)Serverless的原因,如下圖所示。原因主要在于兩個(gè)方面,一個(gè)是成本,客戶(hù)只為使用或存儲(chǔ)付費(fèi),而且客戶(hù)可以根據(jù)自己的業(yè)務(wù)模型定制不同的存儲(chǔ)級(jí)別,比如說(shuō)冷存儲(chǔ)或熱存儲(chǔ)。這使得用戶(hù)的消費(fèi)呈現(xiàn)階梯性,不會(huì)出現(xiàn)很大的躍遷。用戶(hù)在剛辦網(wǎng)站,流量還很少時(shí),這時(shí)候可以采用serverless架構(gòu),在存儲(chǔ)層使用冷存儲(chǔ),雖然延遲可能會(huì)大一些,但這是最經(jīng)濟(jì)的做法。隨著業(yè)務(wù)的擴(kuò)大,也可以在計(jì)算層繼續(xù)使用Serverless架構(gòu),在存儲(chǔ)層將冷存儲(chǔ)換成熱存儲(chǔ),業(yè)務(wù)再次擴(kuò)大時(shí),可以在計(jì)算層加一些結(jié)點(diǎn),這樣很大的提高了靈活性。
下面介紹提供智能化的原因,如下圖所示。很多創(chuàng)業(yè)公司一開(kāi)始支出較少,各方面的人才配置并不會(huì)齊全,云原生數(shù)據(jù)庫(kù)的智能化能夠告訴這些創(chuàng)業(yè)公司,該如何應(yīng)對(duì)遇到的一些問(wèn)題。同時(shí),系統(tǒng)需要告訴用戶(hù)此時(shí)此刻全鏈路的狀況,存在哪些問(wèn)題,如何解決。有了這些功能之后,能幫助用戶(hù)從小白成為數(shù)據(jù)庫(kù)專(zhuān)家,分布式系統(tǒng)專(zhuān)家,財(cái)務(wù)安全專(zhuān)家。
二、云原生數(shù)據(jù)庫(kù)POLARDB架構(gòu)實(shí)現(xiàn)
下文從架構(gòu),產(chǎn)品設(shè)計(jì)與未來(lái)工作介紹POLARDB。下圖展現(xiàn)了POLARDB的整體架構(gòu),藍(lán)色的線(xiàn)代表數(shù)據(jù)流,紅色的線(xiàn)為控制流。控制流主要負(fù)責(zé)POLARDB生命周期的管理,數(shù)據(jù)流展現(xiàn)數(shù)據(jù)在整個(gè)系統(tǒng)中流轉(zhuǎn)的情況。在設(shè)計(jì)POLARDB時(shí)遵循以下四個(gè)原則,第一為存儲(chǔ)計(jì)算分離,全用戶(hù)態(tài),零拷貝。在架構(gòu)的存儲(chǔ)層使用三副本,采用變種raft算法,允許亂序的提交確認(rèn)和應(yīng)用,亂序也會(huì)引入一些問(wèn)題。在設(shè)計(jì)POLARDB時(shí),大量采用新硬件,例如RDMA,3D XPOINT等。
下面介紹進(jìn)行存儲(chǔ)計(jì)算分離的原因,如下圖所示,上面一層為計(jì)算層,下面一層為存儲(chǔ)層,兩層使用RDMA連接。在計(jì)算層有一個(gè)主結(jié)點(diǎn)負(fù)責(zé)讀寫(xiě)請(qǐng)求,還有一些備結(jié)點(diǎn),只負(fù)責(zé)接收讀請(qǐng)求。存儲(chǔ)計(jì)算分離的好處在于對(duì)一體化架構(gòu)的數(shù)據(jù)庫(kù)進(jìn)行水平切分,相當(dāng)于切成了兩層,對(duì)于這兩層以前必須使用相同的硬件,現(xiàn)在可以根據(jù)這兩層不同的特點(diǎn)定制不同的硬件策略。例如,在計(jì)算層更關(guān)注CPU和內(nèi)存,在存儲(chǔ)層更關(guān)注I/O響應(yīng)時(shí)間和I/O成本,所以分離之后,針對(duì)這兩層做出的硬件差別是很大的,這種差別又會(huì)帶來(lái)新的紅利,這些紅利又可以釋放給用戶(hù),這就是有時(shí)候技術(shù)優(yōu)秀,成本還低的原因。在計(jì)算層,計(jì)算不持有數(shù)據(jù),很方便進(jìn)行遷移,在存儲(chǔ)層,從原來(lái)大一統(tǒng)的架構(gòu)中拆分出來(lái),可以針對(duì)存儲(chǔ)(分布式文件系統(tǒng))有自己的復(fù)制策略,高可用的策略。相較于以前大一統(tǒng)的架構(gòu)設(shè)計(jì),如果對(duì)存儲(chǔ)做一些策略會(huì)干擾到計(jì)算,對(duì)計(jì)算做策略可能干擾到存儲(chǔ)。存儲(chǔ)分離出來(lái)后,很方便進(jìn)行池化,池化的好處在于沒(méi)有碎片,也不會(huì)有不均衡的情況出現(xiàn)。如果有不均衡,存儲(chǔ)層可以自己進(jìn)行遷移。存儲(chǔ)計(jì)算分離也能方便實(shí)現(xiàn)serverless。
下圖展示了全用戶(hù)態(tài)的設(shè)計(jì),有用戶(hù)態(tài)的文件系統(tǒng),有Libpfs(分布式文件系統(tǒng)),有本地類(lèi)似于網(wǎng)關(guān)的polarswitch,有用戶(hù)態(tài)的IO棧,用戶(hù)態(tài)的網(wǎng)絡(luò)。POLARDB性能的提升很大一部分來(lái)自于全用戶(hù)態(tài)和對(duì)新硬件的利用。消除進(jìn)程切換,以及內(nèi)存拷貝帶來(lái)的收益非常大。
下圖是對(duì)文件系統(tǒng)的詳細(xì)解釋?zhuān)募到y(tǒng)的特點(diǎn)是使用POSIX API,對(duì)DB層的侵入較小。同時(shí),它是一個(gè)靜態(tài)庫(kù),直接鏈接到數(shù)據(jù)庫(kù)進(jìn)程中。分布式系統(tǒng)的元數(shù)據(jù)是通過(guò)PAXOS進(jìn)行同步的,帶來(lái)的好處是,多臺(tái)機(jī)器看到的是同一個(gè)目錄,當(dāng)用戶(hù)去操作目錄時(shí),PAXOS可以在底部做一個(gè)串行,所以不會(huì)存在數(shù)據(jù)沖突的問(wèn)題。在每個(gè)計(jì)算層的節(jié)點(diǎn)上,都會(huì)有對(duì)元數(shù)據(jù)的緩存,目的是做訪(fǎng)問(wèn)加速。
下圖展示了ParallelRaft算法,亂序會(huì)讓寫(xiě)入加速,帶來(lái)接近翻倍的性能提升。
架構(gòu)也用到了大量的新硬件,如下圖所示,包括RDMA,3D XPOINT,演講者團(tuán)隊(duì)正在研究的Open-Channel SSD。雖然SSD已經(jīng)工業(yè)化很多年了,主流的存儲(chǔ)都是SSD,但是目前對(duì)SSD的應(yīng)用還存在很多問(wèn)題。因?yàn)镾SD的軟件和硬件并不是非常匹配,導(dǎo)致我們對(duì)SSD的使用存在浪費(fèi),浪費(fèi)一方面來(lái)自性能以及壽命。Open-Channel SSD方式對(duì)IO性能和壽命的影響最終反映到成本上,都比以前有了很大的提升。
下圖展現(xiàn)了POLARDB和MySQL的對(duì)比結(jié)果,讀性能相較于MySQL提高了5-6倍,寫(xiě)性能提高了3倍左右。同時(shí),性能也在不斷提升。
三、云原生數(shù)據(jù)庫(kù)POLARDB產(chǎn)品設(shè)計(jì)
接下來(lái)介紹一些產(chǎn)品設(shè)計(jì)的特點(diǎn),主要從五個(gè)維度設(shè)計(jì)產(chǎn)品,如下圖所示,首先是性能,應(yīng)該很方便地就能擴(kuò)展到上百萬(wàn)QPS,而且RT很低;存儲(chǔ)可以很方便的擴(kuò)展到100TB,也很方便的縮回來(lái);彈性上,版本升級(jí)時(shí),盡量做到零宕機(jī),在存儲(chǔ)層,計(jì)算層可以方便進(jìn)行scale-up以及scale-out;目前100%能兼容MySQL5.6;在可用性方面,承諾99.95%的可用性,99.999%的可靠性。在數(shù)據(jù)安全方面,演講者團(tuán)隊(duì)會(huì)做定時(shí)的snapshot,并實(shí)時(shí)上傳到OSS,提供物理備份和邏輯備份。在可用性上,主結(jié)點(diǎn)和readonly結(jié)點(diǎn)可以很方便的進(jìn)行角色切換。
產(chǎn)品設(shè)計(jì)上是讀寫(xiě)分離的,如下圖所示,有一個(gè)結(jié)點(diǎn)是主結(jié)點(diǎn)接收讀寫(xiě)請(qǐng)求,可以很方便地進(jìn)行scale-up,其他結(jié)點(diǎn)都是只讀結(jié)點(diǎn),只讀結(jié)點(diǎn)可以很方便的進(jìn)行scale-out。讀能力和只讀結(jié)點(diǎn)的數(shù)量呈線(xiàn)性正比。
可擴(kuò)展性方面,如下圖所示,可以在計(jì)算層做scale-out和scale-up,從用戶(hù)看來(lái)存儲(chǔ)層是在做scale-up,但因?yàn)榈讓邮欠植际轿募到y(tǒng),當(dāng)存儲(chǔ)水位比較高時(shí)可以很方便的加入新的存儲(chǔ)結(jié)點(diǎn),所以本質(zhì)上是scale-out。
在數(shù)據(jù)遷移方面,如下圖所示,假設(shè)你是一個(gè)RDS的用戶(hù),通過(guò)備份到OSS,在POLARDB的實(shí)例里加載OSS上的備份的數(shù)據(jù)新生成POLARDB的實(shí)例,也可以通過(guò)DTS進(jìn)行數(shù)據(jù)實(shí)時(shí)的遷移。在未來(lái)還可以提供一種方式,將POLARDB做成slave,直接掛到RDS的結(jié)點(diǎn)上,把數(shù)據(jù)實(shí)時(shí)的同步。如果用戶(hù)使用的是第三方商用的數(shù)據(jù)庫(kù),因?yàn)镈TS支持的數(shù)據(jù)庫(kù)類(lèi)型非常多,所以建議使用DTS。
在數(shù)據(jù)可靠性上,如下圖所示,目前在官網(wǎng)上購(gòu)買(mǎi)到的版本是在一個(gè)AZ里面的三副本。
未來(lái)工作中,在DB引擎層未來(lái)會(huì)提供多寫(xiě)的能力,而且數(shù)據(jù)庫(kù)引擎層會(huì)引入新的組件例如CacheFusion,最大提升計(jì)算層的性能。未來(lái)會(huì)支持更多的數(shù)據(jù)庫(kù)類(lèi)型,在存儲(chǔ)層會(huì)應(yīng)用更多新的硬件,對(duì)某些IO進(jìn)行加速,會(huì)用Open-Channel SSD對(duì)性能進(jìn)一步提升,成本進(jìn)一步降低。在掃描時(shí),做計(jì)算下推,使回到計(jì)算層的數(shù)據(jù)盡量少。演講者希望現(xiàn)有的分布式文件系統(tǒng)和數(shù)據(jù)庫(kù)聯(lián)系的更緊密,能感知InnoDB的語(yǔ)義。
原文鏈接
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/17751.html
摘要:演講嘉賓簡(jiǎn)介蔡松露子嘉,阿里云云數(shù)據(jù)庫(kù)總架構(gòu)師,主要負(fù)責(zé)阿里云技術(shù)以及阿里云數(shù)據(jù)庫(kù)整體架構(gòu)等工作。也就是說(shuō)以上的四點(diǎn)只是達(dá)到了云原生數(shù)據(jù)庫(kù)的門(mén)檻值,還并不代表是這一個(gè)云原生的數(shù)據(jù)庫(kù)。 摘要:POLARDB是阿里云ApsaraDB數(shù)據(jù)庫(kù)團(tuán)隊(duì)研發(fā)的基于云計(jì)算架構(gòu)的下一代關(guān)系型數(shù)據(jù)庫(kù),其最大的特色是計(jì)算節(jié)點(diǎn)與存儲(chǔ)節(jié)點(diǎn)分離,借助優(yōu)秀的RDMA網(wǎng)絡(luò)以及最新的塊存儲(chǔ)技術(shù)。POLARDB不但滿(mǎn)足了公...
摘要:月日,阿里云發(fā)布全新一代云數(shù)據(jù)庫(kù)產(chǎn)品,采用第三代分布式共享存儲(chǔ)架構(gòu),實(shí)現(xiàn)計(jì)算節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)分離,使計(jì)算引擎和存儲(chǔ)引擎均擁有快速擴(kuò)展能力。而在云數(shù)據(jù)庫(kù)廠(chǎng)商中,阿里云則實(shí)現(xiàn)了性能的倍,成為世界級(jí)的云數(shù)據(jù)庫(kù)引導(dǎo)者。9月21日,阿里云發(fā)布全新一代云數(shù)據(jù)庫(kù)產(chǎn)品POLARDB,采用第三代分布式共享存儲(chǔ)架構(gòu),實(shí)現(xiàn)計(jì)算節(jié)點(diǎn)和存儲(chǔ)節(jié)點(diǎn)分離,使計(jì)算引擎和存儲(chǔ)引擎均擁有快速擴(kuò)展能力。它是首個(gè)國(guó)產(chǎn)的通用高性能自研數(shù)...
閱讀 3011·2021-10-12 10:12
閱讀 3065·2021-09-22 16:04
閱讀 3297·2019-08-30 15:54
閱讀 2609·2019-08-29 16:59
閱讀 2920·2019-08-29 16:08
閱讀 874·2019-08-29 11:20
閱讀 3500·2019-08-28 18:08
閱讀 656·2019-08-26 13:43