選擇分布列的時候,一般遵循下面三個原則:
1.盡量選擇離散值比較多的列,保證數(shù)據(jù)均勻分布。分布均勻是為了避免木桶效應,各個DN對等執(zhí)行。
2.在滿足第一條原則的情況下,不要選擇存在常量過濾的列。
3.滿足前兩條原則的情況下,盡量選擇關(guān)聯(lián)字段或聚合字段做分布列,這種方式是為了避免數(shù)據(jù)節(jié)點之間數(shù)據(jù)重分布,降低IO的開銷從而提升關(guān)聯(lián)操作和聚合操作的性能。

檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
選擇分布列的時候,一般遵循下面三個原則:
1.盡量選擇離散值比較多的列,保證數(shù)據(jù)均勻分布。分布均勻是為了避免木桶效應,各個DN對等執(zhí)行。
2.在滿足第一條原則的情況下,不要選擇存在常量過濾的列。
3.滿足前兩條原則的情況下,盡量選擇關(guān)聯(lián)字段或聚合字段做分布列,這種方式是為了避免數(shù)據(jù)節(jié)點之間數(shù)據(jù)重分布,降低IO的開銷從而提升關(guān)聯(lián)操作和聚合操作的性能。
