本文共 544 字,大约阅读时间需要 1 分钟。
列族存储 的设计源于google的bigtable论文,该论文对以后的列族存储(如:HBASE,Cassandra,Hypertable)的实现产生了深远的影响。
先来看看熟悉的Excel表格,它有助于我们理解列族存储的模型,如图 1 所示
电子表格是一个二维的表格,通过“行号+列号”(3+C)可以快速地找到对应的单元格的值(column Family)。和健值存储类似,可以在这个单元格里存储任意类型的值。
图 1
我们可以将“行号+列号”看成单元格的健,单元格的值为值,如图 2:
图 2
这和列族存储很类似,每个单元格只会通过已知的行列标识符找到。并且,想电子表格一样,可以在任何时候向任何单元格插入数据,而不必为每一行插入所有列的数据。现在我们对图中的健进行扩展,如图 3:
图 3
除了行健和列名,列族存储的健还有列族名和时间戳这两个部分。列族通常用来将一些具有练习的列归在一起,时间戳运行值保存多个版本。
列族存储有点儿像三维的立方体(行,列,时间)被硬生生压缩成一维的健和值,当我们把这个一维的健值还原成二维的表时,会发现这个表是非常稀疏的。关系型数据库存储稀疏的数据不太在行,而列族存储就是为这个设计的。此外,列族系统还有良好德扩展性,可用性以及弱模式等优点。
转载地址:http://tjuwi.baihongyu.com/