在HBase中,表被分割成區域,並由區域伺服器提供服務。區域被列族垂直分為“Stores”。Stores被保存在HDFS檔。下麵顯示的是HBase的結構。
注意:術語“store”是用於區域來解釋存儲結構。

HBase有三個主要組成部分:客戶端庫,主伺服器和區域伺服器。區域伺服器可以按要求添加或刪除。
主伺服器
主伺服器是 -
- 分配區域給區域伺服器並在Apache ZooKeeper的幫助下完成這個任務。
- 處理跨區域的伺服器區域的負載均衡。它卸載繁忙的伺服器和轉移區域較少佔用的伺服器。
- 通過判定負載均衡以維護集群的狀態。
- 負責模式變化和其他元數據操作,如創建表和列。
區域
區域只不過是表被拆分,並分佈在區域伺服器。
區域伺服器
區域伺服器擁有區域如下 -
- 與客戶端進行通信並處理數據相關的操作。
- 句柄讀寫的所有地區的請求。
- 由以下的區域大小的閾值決定的區域的大小。
需要深入探討區域伺服器:包含區域和存儲,如下圖所示:

存儲包含記憶體存儲和HFiles。memstore就像一個高速緩存。在這裏開始進入了HBase存儲。數據被傳送並保存在Hfiles作為塊並且memstore刷新。
Zookeeper
- Zookeeper管理是一個開源專案,提供服務,如維護配置資訊,命名,提供分佈式同步等
- Zookeeper代表不同區域的伺服器短暫節點。主伺服器使用這些節點來發現可用的伺服器。
- 除了可用性,該節點也用於追蹤伺服器故障或網路分區。
- 客戶端通過與zookeeper區域伺服器進行通信。
- 在模擬和獨立模式,HBase由zookeeper來管理。
上一篇:
下一篇:
HBase安裝