艾码汇小程序开发建站技术资源分享知识及实践经验

hbase 数据结构-hbase数据设计(8-9-41)

更新时间：2024-09-23 分类：HBase 浏览量：2

HBase本文目录一览：

1、HBase性能优化-Rowkey&列族设计
2、hbase使用面向行的存储方式
3、HBase是什么?为什么要使用HBase?

HBase性能优化-Rowkey&列族设计

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。设计的RowKey应均匀的分布在各个HBase节点上，避免数据热点现象。

HBase性能优化-Rowkey&列族设计必须在设计上保证RowKey的唯一性。由于在HBase中数据存储是Key-Value形式，若向HBase中同一张表插入相同RowKey的数据，则原先存在的数据会被新的数据覆盖。

我们先来看.META.表，假设HBase中只有两张用户表：Table1和Table2，Table1非常大，被划分成了很多Region，因此在.META.表中有很多条Row用来记录这些Region。

访问HBASE table中的行，只有三种方式：通过单个RowKey访问、通过RowKey 的range（正则）、全表扫描。

HBase的Rowkey是按照ASCII有序设计的，我们在设计Rowkey时要充分利用这点。比如视频网站上对影片《泰坦尼克号》的弹幕信息，这个弹幕是按照时间倒排序展示视频里，这个时候我们设计的Rowkey要和时间顺序相关。

hbase使用面向行的存储方式

1、HBase采用了列式存储的方式，将数据按列存储，适合存储大规模、稀疏的数据。传统数据库则采用了行式存储，将数据按行存储，适合存储结构化的数据。

2、其方式有全表扫描、通过单个行健访问、通过一个行健的区间来访问。RowKey与nosql数据库们一样，RowKey是用来检索记录的主键。访问HBASE table中的行，只有三种方式：通过单个RowKey访问、通过RowKey 的range（正则）、全表扫描。

3、hbase使用的是jdk提供的ConcurrentSkipListMap，并对其进行了的封装，Map结构是KeyValue，KeyValue的形式。Concurrent表示线程安全。

HBase是什么?为什么要使用HBase?

1、HBase是一种分布式、可扩展的NoSQL数据库，它是基于Hadoop的HDFS文件系统构建的。HBase被设计用来处理海量数据，并提供高可靠性、高性能的读写操作。

2、hbase的主要用途是用于存储非结构化和半结构化的稀疏数据，被广泛应用于大数据存储和实时数据查询场景。

3、HBase的主要用途是作为大数据存储系统，用于存储非结构化和半结构化的稀疏数据。大数据存储：HBase是一个分布式、可伸缩的大数据存储系统，能够存储数十亿行甚至更多的数据。

4、HBase的定位是hadoop的数据库，电脑培训发现是一个典型的Nosql，所以HBase是用来在大量数据中进行低延迟的随机查询的。

上一篇： 查看详情 +hbase的应用场景范例-hbase为何适合画像(5-11-61)
下一篇： 查看详情 +hbase有什么用-hbase的地位(7-15-96)

艾码汇 | 站长工具| 实用工具| 在线计算 | 程序模板 | 源码插件 | 网页模板 | 视频教程 | 网页特效 | AE模板 | PPT模板 | Word模板

本站资源均来自公开的网络收集，如有侵权若侵犯了您的合法权益，请及时来信通知我们，给您带来的不便，我们深表歉意。

本站发布的文章及附件仅限用于学习和研究目的.请勿用于商业或违法用途，如有需要请支持正版。

Copyright © 2024 艾码汇 All Rights Reserved.

滇ICP备2024033036号-1

返回顶部