Timetombs

泛义的工具是文明的基础,而确指的工具却是愚人的器物

66h / 117a
,更新于 2025-01-05T12:19:33Z+08:00 by   1072b1b

[HBase] KeyValue

版权声明 - CC BY-NC-SA 4.0

KeyValue12是HBase的最底层的核心存储结构,也是数据最终格式持久化的格式。这里分析一下格式细节。

1 概述

一个KeyValue代表着一行数据中的具体的某一列。比如你的一行数据有10列,那么最终会有10个KeyValue存储下来(没有修改删除的情况下)。此外KeyValue只有添加操作,没有删除修改的操作。基于以上两点,使得HBase具备列一下的特性:

  1. SchemaLess : 最小存储单元是列,所以可以不必事先定义好有那些行列结构。
  2. 版本管理:只有添加操作,删除和修改是通过新增新版本的KeyValue来处理的。这点和git类似,只增加,不修改。

2 格式

任何文件存储本质上都是一堆byte[],KeyValue也不例外,它也是一个不固定长度的byte[],按照如下的格式定义。

HBase KeyValue Format

整体上看格式还是比较简单的,属于一个简版的TLV3格式(无Type)。

2.1 Key

Key的总长度由KeyLength定义,具体由以下5部分构成。

2.1.1 Row

Row也就是我们常说的RowKey。2byte的RowLength决定了其最大长度Short#MAX_VALUE=32KB

2.1.2 Family

1byte的FamilyLength决定了其最大长度最大长度Byte#MAX_VALUE=127byte

2.1.3 Qualifier

没有独立存储Qualifier的长度,由KeyLength-RowLength-2-FamilyLength-1-Timestamp8-Type1的来。

2.1.4 Timestamp

固定8byte的时间戳。

2.1.5 Type

固定1byte的类型4

public static enum Type {
    Minimum((byte)0),
    Put((byte)4),

    Delete((byte)8),
    DeleteFamilyVersion((byte)10),
    DeleteColumn((byte)12),
    DeleteFamily((byte)14),

    // Maximum is used when searching; you look from maximum on down.
    Maximum((byte)255);

    private final byte code;

    Type(final byte c) {
      this.code = c;
    }
}

2.2 Value

4byte的ValueLength决定了其最大长度Integer#MAX_VALUE=4GB

3 总结

KeyValue的设计带来了很大的灵活性,SchemaLess的核心支撑。不过代价也是巨大的,就是Key的大量冗余重复,HBase会使用压缩算法进行压缩。但是我们在设计Table(RowKey,Family,Qualifier)5时,也需要尽量考虑其大小问题。

4 参考

HBase原理(hbasefly.com)
HBase原理-数据读取流程解析(hbasefly.com)

下一篇 : [HBase] Region Split Policy