hbase使用教程(hbase教程菜鸟教程简单易懂)

在Hadoop系统框架当中,大家所熟知的HDFS是分布式文件系统,而Hbase才是数据存储的数据库,这两者之间的联系是非常紧密的,Hbase使用HDFS作为分布式数据存储。

关于分布式存储,Hbase的重要性不言而喻,那么今天我们就来为大家分享Hbase教程菜鸟教程。
传统数据的数据处理,主要是关系型数据库,这样的数据库在面对大规模的数据存储任务时,就出现了明显的不足,大数据时代的数据,规模大、新增快、格式多样,因此传统的关系型数据库已经不能适应新的需求。

hbase使用教程(hbase教程菜鸟教程简单易懂)

在这样的背景下,非关系型数据库开始成为主流的选择,而为了更大地拓展数据存储潜力,Google首先研发了BigTable,这也是Hbase的原型。

Hbase是一个面向列的非关系型数据库,弱化了传统的表结构,而是采取Column Family(常译为列族/列簇)来对数据进行分类。一个列族包含多个列,一个列族的多个列之间通常也具有某种关系,比如相似或同种类别。所以列族可以看作是某种分类(归类)。

每个类别里都会有具体的信息,它们就相当于一个个标识符(变量名),在Hbase中叫做Column Qualifier(列修饰符)。列修饰符位于列族里面用来标识一条条数据。

在Hbase中一个列族(Column Family)和一个列修饰符(Column Qualifier)组合起来才叫一个列(Column),使用冒号(:)分割,列族:列修饰符。

在传统数据库中每一行的唯一标识符叫做主键,在Hbase中叫做row key(行键)。数据在进入Hbase时都会被打上一个时间戳,这个时间戳可以作为版本号来使用。

一个行键、列族、列修饰符、数据和时间戳组合起来叫做一个单元格(Cell)。这里的行键、列族、列修饰符和时间戳其实可以看作是定位属性(类似坐标),最终确定了一个数据。

今天的Hbase教程菜鸟教程,主要是对于Hbase的数据存储结构方面的简介,Hbase与HDFS联合起来,是Hadoop实现分布式存储的基石,在整个Hadoop生态系统当中的重要性非同一般。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发表评论

登录后才能评论