hbase能存多少数据-hbase存储结果(5-14-74)

更新时间：2025-01-16 分类：HBase 浏览量：2

HBase本文目录一览：

1、HBase采用了列式存储的方式，将数据按列存储，适合存储大规模、稀疏的数据。传统数据库则采用了行式存储，将数据按行存储，适合存储结构化的数据。

2、hbase使用的是jdk提供的ConcurrentSkipListMap，并对其进行了的封装，Map结构是KeyValue，KeyValue的形式。Concurrent表示线程安全。

3、数据模型：HBase采用列式存储模型，数据被组织成行和列的形式，每一行都有一个唯一的行键来标识。行键是按照字典顺序排序的，方便进行范围查询。每个列族包含一系列列，列被动态定义，可以根据实际需要灵活增减。

4、Hbase还有很多特性，比如不支持join查询，但你存储时可以用：parent-child tuple 的方式来变相解决。由于它是Google BigTable的 Java 实现，你可以参考一下：google bigtable 。

5、HBase采用了类似Google Bigtable的数据模型，即一个稀疏的、分布式的、持久化的多维映射表，每个表都由行键、列族、列限定符和时间戳组成。

6、Hbase是列存储的非关系数据库。传统数据库MySQL等，数据是按行存储的。其没有索引的查询将消耗大量I/O 并且建立索引和物化视图需要花费大量时间和资源。

1、HBase是一个基于Apache Hadoop的面向列的NoSQL数据库，是Google BigTable的开源实现。它运行在HDFS之上，为Hadoop提供类似于BigTable规模的服务。

2、总的来说，虽然HBase的数据模型看起来像是面向行的（因为数据是以行的形式展现的），但其底层的存储结构实际上是面向列的。这种设计使得HBase在处理大量数据时具有高效性和可扩展性。

3、面向列：HBase是一个面向列的数据库，这意味着它按列存储数据而不是按行存储数据。这种面向列的存储方式使得HBase非常适合处理大量的读请求和进行列级别的操作。

在底层实现上，HBase使用了基于Hadoop的分布式文件系统HDFS来存储数据，并且使用了一种称为LSM-Tree（Log-Structured Merge-Tree）的数据结构来管理数据。

hbase的核心数据结构为LSM树。LSM树分为内存部分和磁盘部分。内存部分是一个维护有序数据集合的数据结构。

RowKey 与nosql数据库们一样，RowKey是用来检索记录的主键。

所以hbase大多数读要走磁盘，所以读很慢。每次刷写会生成新的Hfile，Hfile很小并且数量多的时候会影响查询的速度。所以要进行合并。

HBase应用举例 Hbase适合需对数据进行随机读操作或者随机写操作、大数据上高并发操作，比如每秒对PB级数据进行上千次操作以及读写访问均是非常简单的操作。淘宝指数是Hbase在淘宝的一个典型应用。

hbase客户端通过rpc调用将put、delete数据请求提交到对应的regionserver，regionserver对请求进行处理，并将数据最终写入hfile中，进行持久化保存。hbase为了保证随机读取的性能，所以hfile里面的rowkey是有序的。

MemStore 无论是对 HBase 的写入还是读取性能都至关重要，其中 flush 操作又是 MemStore 最核心的操作。

HBase将数据分布在多台服务器上，通过水平扩展的方式来应对海量数据的存储需求。它使用了类似于Google的Bigtable的数据模型，将数据按照行和列的方式进行存储，支持快速的随机读写操作。