随着数据量的增多,数据的类型也不像原来那样都是结构化数据,还有非结构化数据;
Hbase时google 的bigtable的开源实现,
Bigtable | Hbase | |
---|---|---|
文件存储系统 | GFS | HDFS |
海量数据处理 | MR | MR |
协同管理服务 | chubby | zookeeper |
虽然有了HDFS和MR,但是对于数据的实时处理是比较困难的,没有办法应对数据的爆炸式增长;
Hbase和传统的数据库之间的联系与区别:
- 1,数据类型方面:Hbase数据库没有复杂的数据类型,只是单纯将数据作为字符串存储在表中;
- 2,数据操作方面:Hbase没有复杂的联结查询;
- 3,数据存储方面:Hbase是列存数据库,可以存储海量数据;
- 4,数据索引方面:Hbase也是支持索引的;
- 5,数据维护方面:Hbase在更新/修改时会保留原来版本,为新版本加一个时间戳作为新版本或者删除时也并不会直接删除,而是做一个标志表示其被删除了;