HBase介紹

數(shù)據(jù)存儲(chǔ)使用HBase來承接,HBase是一個(gè)開源的、面向列(Column-Oriented)、適合存儲(chǔ)海量非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)的、具備高可靠性、高性能、可靈活擴(kuò)展伸縮的、支持實(shí)時(shí)數(shù)據(jù)讀寫的分布式存儲(chǔ)系統(tǒng)。更多關(guān)于HBase的信息,請(qǐng)參見:https://hbase.apache.org/。

存儲(chǔ)在HBase中的表的典型特征:

大表(BigTable):一個(gè)表可以有上億行,上百萬列

面向列:面向列(族)的存儲(chǔ)、檢索與權(quán)限控制

稀疏:表中為空(null)的列不占用存儲(chǔ)空間

MRS服務(wù)的HBase組件支持計(jì)算存儲(chǔ)分離,數(shù)據(jù)可以存儲(chǔ)在低成本的 云存儲(chǔ) 服務(wù)中,包含 對(duì)象存儲(chǔ)服務(wù) ,并支持跨AZ 數(shù)據(jù)備份 。并且MRS服務(wù)支持HBase組件的二級(jí)索引,支持為列值添加索引,提供使用原生的HBase接口的高性能基于列過濾查詢的能力。

HBase結(jié)構(gòu)

HBase集群由主備Master進(jìn)程和多個(gè)RegionServer進(jìn)程組成。如圖HBase結(jié)構(gòu)所示。

圖1 HBase結(jié)構(gòu)

HBase介紹