華為云計算 云知識 什么是數(shù)據(jù)倉庫
什么是數(shù)據(jù)倉庫

數(shù)據(jù)倉庫 是一種用來存儲和分析結構化數(shù)據(jù)的特殊類型的 數(shù)據(jù)庫 。數(shù)據(jù)倉庫擅長對來自不同來源的數(shù)據(jù)進行聚合和關聯(lián),從而發(fā)掘出數(shù)據(jù)中隱藏的商業(yè)價值。在企業(yè)的經營決策,商業(yè)情報分析等領域都起著至關重要的作用。

隨著數(shù)據(jù)庫技術和分布式技術的長足發(fā)展,數(shù)據(jù)倉庫也朝著 分布式數(shù)據(jù)庫 的架構演進。目前比較流行的分布式數(shù)據(jù)倉庫架構是MPP(Massive-Parallel Processing)架構。MPP架構特性如下:

MPP架構的數(shù)據(jù)倉庫一般由多個對等的數(shù)據(jù)計算節(jié)點構成。

MPP架構的數(shù)據(jù)倉庫中的數(shù)據(jù)被按照某種規(guī)則近乎均勻地分配到每一個計算節(jié)點上。

每個計算節(jié)點都獨立擁有其計算資源(CPU/內存等)和被分配的數(shù)據(jù)。

節(jié)點之間不存在任何共享的計算資源或數(shù)據(jù),因此也被稱為無共享(share-nothing)架構系統(tǒng)。

MPP數(shù)據(jù)倉庫為客戶的應用提供統(tǒng)一的計算入口,上層應用并不感知數(shù)據(jù)倉庫內部的集群節(jié)點規(guī)模和數(shù)據(jù)分片情況,做到了數(shù)據(jù)分庫分表的透明。

MPP架構主要的特點就是查詢任務可以在所有的計算節(jié)點上被并行地執(zhí)行,可以更加快速地返回計算的結果。每一個查詢任務都會被平均地分配到所有的計算節(jié)點上并行地執(zhí)行,這大大縮短了查詢所需要的時間。

MPP架構可以通過簡單地增加或減少計算節(jié)點數(shù)達到改變系統(tǒng)容量的目的,以應付更加靈活的現(xiàn)代企業(yè)計算的需要。

基于MPP架構的新一代數(shù)據(jù)倉庫,普遍具有性能出眾,兼容性好(針對底層的硬件和上層的應用),擴展性強,成本可控等顯著特點,因而近年來越來越受到廣大企業(yè)用戶的青睞。

您可以將PostgreSQL 數(shù)據(jù)遷移 到GaussDB(DWS)集群。GaussDB(DWS)集群是OLAP場景的數(shù)據(jù)庫,PostgreSQL是OLTP場景的獨立數(shù)據(jù)庫。因此,不支持將GaussDB(DWS) 數(shù)據(jù)庫遷移 到PostgreSQL。