Hive是建立在Hadoop上的 數(shù)據(jù)倉庫 基礎(chǔ)構(gòu)架。它提供了一系列的工具,可以用來進(jìn)行數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),這是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數(shù)據(jù)的機(jī)制。Hive定義了簡單的類SQL查詢語言,稱為HiveQL,它允許熟悉SQL的用戶查詢數(shù)據(jù)。Hive的數(shù)據(jù)計算依賴于MapReduce、Spark、Tez。
Hive主要特點如下:
海量結(jié)構(gòu)化數(shù)據(jù)分析匯總。
將復(fù)雜的MapReduce編寫任務(wù)簡化為SQL語句。
靈活的數(shù)據(jù)存儲格式,支持JSON,CSV,TEXTFILE,RCFILE,SEQUENCEFILE,ORC(Optimized Row Columnar)這幾種存儲格式。
鏈接:https://support.huaweicloud.com/productdesc-mrs/mrs_08_001101.html
華為云推薦:
MapReduce服務(wù) https://support.huaweicloud.com/mrs/index.html