Hbase简介

news2024/11/15 12:46:21

HBase简介

一、HBase简介

1. HBase简介

(1) apache的顶级项目,hadoop的数据库,分布式、大规模的大数据存储。

在这里插入图片描述

在这里插入图片描述

HBase是Google的BigTable的开源java版本,建立在hdfs之上的,分布式、列存储、非关系(nosql、key-value)、支持实时读写的数据库

HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。

Hbase面向列存储,构建于Hadoop之上,类似于Google的BigTable,提供对10亿级别表数据的快速随机实时读写!

(2) HBase****的结构

主键(rowkey)

列簇(column family )

列(column)

时间戳(timestamp)

在这里插入图片描述

二、HBase的特点

l HBase仅能通过主键来查询数据

l 可存储结构化和半结构化的数据

l 所有的数据使用字节数据byte[]来存储

l 可以横向扩展,也就是说可以通过不断的增加服务器来提高存储能力实现真正的海量存储

l 一张表可以存储几百万列,几十亿行数据

l 面向列存储,k-v(散列hash y=hash(x))

l 稀疏矩阵:非零元素很少,分布没有任何的规律,三元组(行号、列号、非零元素的值)存储

在这里插入图片描述

l 强一致性

在这里插入图片描述

l 自动分区

通过region分布在集群上

l 自动故障转移

l hadoop/hdfs集成:HBase是建立在hdfs之上

l MapReduce:对mr进行了改进,数据处理的效率可以达MR的到1000倍以上

l JAVA API:通过javaapi对hbase进行编程

l 命令行:Hbase的shell命令

2. hdfs

顺序访问,存储效率很低

三、HBase的应用场景

1. 对象存储(OSS)

图片、视频、新闻、网页都可以存储在hbase中
在这里插入图片描述

2. 时序数据

每个数据都带有时间戳,比如传感器的数据

3. 推荐画像

用户画像的数据其实就是一个大的稀疏矩阵,比如蚂蚁金服

4. OLAP

实时的在线联机分析系统,比如天猫的双十一或者京东618的可视化大屏

注意:OLTP(在线事务分析系统)的区别,建立在关系数据库之上,支持事务回滚

5. Feeds流

典型的应用就是微信的聊天记录、朋友圈、点赞、评论

6. 爬虫数据的存储

四、HBase的发展过程

年代事件
2006年11月Google发布了BigTable的论文
2007年10月第一个可用的HBase版本,基于Hadoop
2008年1月成为apache的顶级项目

五、HBase和RDBMS的比较

1. RDBMS(关系数据库管理系统:mysql、sqlserver、oracle)

l 数据库以表的形式独立存在

l 支持FAT(dos)、NTFS(windows)、EXT(linux)等文件系统

l 主键(primary key)

l 分库分表

l 表由行、列、单元格

l 支持向上扩展

l 使用sql(增删改查)

l 面向行存储

l ACID的特性
在这里插入图片描述

l 结构化的数据(二维表格)

l 支持事务(transaction)

l 支持join(连接,全连接(full join笛卡尔乘积),自然连接(inner join),左连接(left join),右连接(right join))

l 中心化

2. HBse

l 以表的形式存在

l 使用行键(row key)

l 分布式存储

l 行键、列簇、列、时间戳

l 支持向外扩展

l 使用命令行、java api和Mapreduce、Spark、Flink来访问HBase表数据

l 面向列存储

l 不支持acid,但是遵循cap原则

l 结构化和半结构化的数据

l 不支持事务

l 不支持join

l 分布式

六、HBase和HDFS的比较

1. HDFS

分布式,不是一个文件系统,无法快速的查询数据

2. HBase

建立在HDFS上,为大型表提供快速查询数据

七、HBase和Hive的比较

1. Hive

l 数据仓库,它的本质就是相当于将hdfs的文件和mysql中做了一个一一对应的映射,可以通过HQL(类sql,是hive的sql,把每一条hql都转换为一个mr程序)进行数据的管理。

l hive主要用于数据分析、清洗等,适用于离线数据,延迟很高

l hive基于HDFS和MapReduce,将数据存储在hdfs的datanode上,hql转换为一个mr程序执行

2. HBase

l NoSql:面向列的非关系型数据库

l 用于存储结构化和非结构化的数据

l 基于hdfs:HBase的存储文件HFile存储在hdfs的datanode上,被regionserver以region(分区)的形式进行管理

l 延迟较低,适合olap(实时的联机分析系统,比如天猫双十一的实时成交数据可视化大屏)

八、NoSQL数据库

l SQL数据库

按行存储,主要操作增删改查,常见的数据库有mysql、sqlserver、oracle

l NoSQL

非关系数据库,或者叫不仅仅是关系数据库,key/value格式的数据库,常见的有redis(高速缓存比如秒杀抢购系统)、memcache、mongodb(文档)、hbase

l hive

并不是一个数据库,仅仅是一个数据仓库的工具

oSQL数据库**

l SQL数据库

按行存储,主要操作增删改查,常见的数据库有mysql、sqlserver、oracle

l NoSQL

非关系数据库,或者叫不仅仅是关系数据库,key/value格式的数据库,常见的有redis(高速缓存比如秒杀抢购系统)、memcache、mongodb(文档)、hbase

l hive

并不是一个数据库,仅仅是一个数据仓库的工具

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/452961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MySQL(复合查询)

文章目录 0 前言1 基本查询2 多表查询3 自连接4 子查询4.1 单行子查询4.2 多行子查询4.3 多列子查询4.4 在from子句中使用子查询4.5 合并查询4.5.1 union4.5.3 union all 0 前言 相关内容已经准备好了 链接:https://gitee.com/ding-xushengyun/linux__cpp/blob/ma…

2023/4/23周报

目录 摘要 论文阅读 1、标题和现存问题 2、矩阵分解(MF)和图神经网络 3、GNN_MF框架 4、项目聚集和社会聚集 5、实验准备和结果 2、深度学习 1、GCN 2、代码实例 总结 摘要 本周在论文阅读上,阅读了一篇基于GNN的矩阵分解推荐算法…

【机器学习】 多维kd-tree的python实现

一、说明 本篇主要介绍一个用python实现kd-tree的代码,以及围绕代码实现的kd-tree原理。期望能够为读者打开另一个视角,看待kd-tree的好处。 二、什么是K维树? K-D 树(也称为 K 维树)是一种二叉搜索树,其中…

甘蔗种植成本居高不下 培育良种和提高机械化覆盖率或成行业破局关键

一、甘蔗种植行业概述及分类 甘蔗是一种重要的经济农作物,是世界上最重要的糖料作物及较有发展潜力的可再生能源作物,现广泛种植于热带及亚热带地区,最大的甘蔗生产国是巴西、印度和中国。 根据观研报告网发布的《中国甘蔗种植市场发展态势分…

matlab 点云滤波(中值、均值、高斯滤波)代码

点云中值、均值、高斯滤波 介绍一下滤波函数 smoothdata: 对含噪数据进行平滑处理 B smoothdata(___,method) 为上述任一语法指定平滑处理方法。例如,B smoothdata(A,sgolay) 使用 Savitzky-golay 滤波器对 A 中的数据进行平滑处理。Method-平滑处理方法 "…

java实现修改excel中数据格式

目录 背景:过程:方案:个人想法:总结:1、清楚边界,全局观2、工欲善其事,必先利其器3、别总想着改源码,别总觉得自己做不出来,要给自己积极的心理暗示。有用。 背景&#x…

基于深度强化学习训练《街头霸王·二:冠军特别版》通关关底 BOSS -智能 AI 代理项目上手

文章目录 SFighterAI项目简介实现软件环境项目文件结构 运行指南环境配置验证及调整gym环境: gym-retro 游戏文件夹错误提示及解决Could not initialize NNPACK!错误提示:libGL error: MESA-LOADER: failed to open swrast 运行测试训练模型查看曲线 Tip…

《Redis设计与开发》读书笔记

《Redis设计与实现》读书笔记 简单动态字符串 SDS的定义 结构: buf数组:用于保存字符串 len属性:记录SDS中保存字符串的长度 free属性:记录buf中未使用字节数量 遵循C字符串以空字符串结尾的惯例,保存空字符串的…

默认成员函数之构造函数,构造函数的特点,创建,调用与对象创建的一语双关,默认构造函数等

内置类型与自定义类型 C当中的类型的话分为两类:一种就是内置类型/基本类型,就是c语言自带的那些类型基本类型,如int, char, double, 指针(任何类型的指针,因为指针就是地址嘛)等等;还有就是自…

某安全对抗行走APP逆向分析

1.定位url 抓包: https://api5.xxxx.com/xxx-rest-service/message/fun_getnearby 看一下参数: opentime:时间戳 reqdata:base64编码 sign 未知,需要解密 # -*- coding: utf-8 -*- # @Author : Codeooo # @Time : 2022-10-14import frida, sysm199a = "&qu…

learn_C_deep_5 (语句和表达式的概念、if语句的多种语法结构、C语言有没有布尔类型、“零值”的比较)

目录 语句和表达式的概念 if语句的多种语法结构 注释的便捷方法(环境vs) if语句执行的过程 逻辑与&& 逻辑或|| 运算关系的顺序 ​编辑 C语言有没有布尔类型 C99标准 sizeof(bool)的值为多少? _Bool原码 BOOL、TRUE、…

IT_开发提测标准规范

背景 公司 IT 规模小,开发提测质量差,流程不规范,导致测试任务重,于是推行 :IT_开发提测标准规范,正文如下;拟定开发提测标准规范后,测试与项目经理内部评审后,发至IT群…

低相位噪声链路调试分析

上图为原始状态,与项目结项评审指标差不多,确实存在几个噪声比较差的点。 频率分布大约在几Hz,20K,50K左右。 由于测试时由子卡进行输出,采用直接进行直接输出,以看出,明显的尖峰已经没有了,只剩下20K左右的尖峰,但是总体来说,效果很差,可能时单端输出的问题。试…

【SVN已解决】svn下载成功图标不显示解决方法

介绍 这里是小编成长之路的历程,也是小编的学习之路。希望和各位大佬们一起成长! 以下为小编最喜欢的两句话: 要有最朴素的生活和最遥远的梦想,即使明天天寒地冻,山高水远,路远马亡。 一个人为什么要努力&a…

【小技巧】word文档编辑技巧(一)

文章目录 一、显示显示导航显示所有字符 二、格式格式-三级目录格式-文本格式-图格式-表格式-公式格式-参考文献 三、小技巧交叉引用连续交叉引用表/图目录等自动更新分节符设置页眉/页码word转pdf带导航 一、显示 显示导航 开启导航:视图->显示框->导航窗格…

《春琴抄》庭有枇杷树,今已亭亭如盖矣~

《春琴抄》庭有枇杷树,今已亭亭如盖矣~ 谷崎润一郎(1886年7月24日~1965年7月30日),日本近代小说家,唯美派文学主要代表人物之一,《源氏物语》现代文的译者。 代表作有《刺青》《春琴抄》《细雪》…

客户体验的重要性和企业发展的紧密联系

近年来,随着企业数字化转型的加速,客户服务的意义越来越被人们所重视。客户服务的质量不仅直接影响到客户满意度和忠诚度,而且会间接影响到企业的品牌口碑和市场竞争力。然而,目前市面上的很多企业帮助中心搭建平台,可…

【油猴脚本】ChatGPT 智能 Prompts 提示词助手

chatGPT 插件脚本 中文 Prompt 训练对话框 ChatGPT 智能 Prompts 可以为你带来更好的使用体验助你训练好用的ChatGPT:添加快捷指令(prompts)新增:论文专家角色、支持自动发送、固定智能助手…还有更多需求可以到仓库Issues里发起…

Qt Quick - ScrollView

Qt Quick - ScrollView 使用总结 一、概述二、使用四、分级五、滚动条控制六、触摸vs.鼠标交互七、美化 一、概述 ScrollView 为用户定义的内容提供滚动功能。类似QScrollArea 的功能。 二、使用 第一个例子展示了ScrollView的最简单用法。 ScrollView {width: 200height: …

本周大新闻|MR头显或成WWDC23重头戏;PICO 4 Pro本周开售

本周XR大新闻,AR方面,彭博社Mark Gurman确认XR头显将成为WWDC重头戏,同时将兼容iPad应用;Inprentus将发布用于AR光波导方案的闪耀光栅工艺;富采展示0.12英寸蓝光Micro LED;锐思华创公布多层光波导PGU&#…