【摘要】ICDE是數(shù)據(jù)庫領(lǐng)域最高權(quán)威的國際頂級學(xué)術(shù)會議之一,與 VLDB、SIGMOD 并稱數(shù)據(jù)庫領(lǐng)域三大頂會(CCF A類)。會議主要收錄研究機(jī)構(gòu)以及科技企業(yè)在數(shù)據(jù)庫領(lǐng)域最前沿、最頂級的研究成果。2025年度的ICDE將于5月19日到5月23號在香港召開。Serverless分布式數(shù)據(jù)庫是華為云數(shù)據(jù)庫創(chuàng)新LAB的重點積累和研究的方向之一。本次ICDE,華為云數(shù)據(jù)庫創(chuàng)新LAB聯(lián)合中國人民大學(xué)提出一種在分布式數(shù)據(jù)庫系統(tǒng)中實時數(shù)據(jù)遷移的方法Promi:Progressive Live Migration in Distributed Database Systems。
數(shù)據(jù)分區(qū)是分布式數(shù)據(jù)庫系統(tǒng)中的一項基本技術(shù),但傾斜和動態(tài)的工作負(fù)載通常會導(dǎo)致節(jié)點之間的負(fù)載分布不平衡。實時遷移對于通過在節(jié)點之間重新分配數(shù)據(jù)分區(qū)來解決這種不平衡至關(guān)重要。然而,現(xiàn)有的遷移方法要么繼續(xù)在過載節(jié)點上處理繁重的事務(wù)負(fù)載,要么在遷移期間阻止和中止實時事務(wù),無法同時實現(xiàn)快速負(fù)載平衡和事務(wù)零停機(jī)時間。
本文提出了一種實時數(shù)據(jù)遷移方法Promi,它以小分區(qū)而不是整個分區(qū)的粒度逐步遷移數(shù)據(jù)。為了確??焖儇?fù)載平衡,我們提出了一種基于圖的遷移調(diào)度程序,該調(diào)度程序優(yōu)先考慮熱小分區(qū)的遷移,并最大限度地減少遷移期間的潛在分布式事務(wù)。為了實現(xiàn)零停機(jī)時間并提高系統(tǒng)性能,我們提出了一個事務(wù)管理器,它根據(jù)當(dāng)前遷移狀態(tài)智能路由和調(diào)度所涉及的事務(wù)。我們進(jìn)行了大量實驗,將Promi與各種實時遷移方法進(jìn)行了比較。結(jié)果表明,與最先進(jìn)的方法相比,Promi實現(xiàn)了高達(dá)1.5倍的吞吐量,并將負(fù)載平衡時間減少了高達(dá)60%。