第2章-信息技术发展之存储和数据库(第二部分)
- 3 存储和数据库
- 3.1 存储系统架构
- 3.2 存储技术
- 3.3 数据库体系结构
- 3.4 常用存储数据库类型优缺点
3 存储和数据库
3.1 存储系统架构
存储系统架构 | DAS | NAS | SAN |
---|---|---|---|
安装难易度 | 不一定 | 简单 | 困难 |
数据传输协议 | SCSI/FC/ATA | TCP/IP | FC |
传输对象 | 数据块 | 文件 | 数据块 |
使用标准文件共享协议 | 否 | 是(NFS/CIFS…) | 否 |
异种操作系统文件共享 | 否 | 是 | 需要转换设备 |
集中式管理 | 不一定 | 是 | 需要管理工具 |
管理难易度 | 不一定 | 以网络为基础,容易 | 不一定,但通常很难 |
提高服务器效率 | 否 | 是 | 是 |
灾难忍受度 | 低 | 高 | 高,专有方案 |
适合对象 | 中小组织服务器捆绑磁盘(JBOD) | 中小组织SOHO 族组织部门 | 大型组织数据中心 |
应用环境 | 局域网 文档共享程度低 独立操作平台 服务器数量少 | 局域网 文档共享程度高 异质格式存储需求高 | 光纤通道储域网 网络环境复杂 文档共享程度高 异质操作系统平台 服务器数量多 |
业务模式 | 一般服务器 | Web服务器 多媒体资料存储 文件资料共享 | 大型资料库 数据库等 |
档案格式复杂度 | 低 | 中 | 高 |
容量扩充能力 | 低 | 中 | 高 |
3.2 存储技术
要素 | 具体内容 | |||
---|---|---|---|---|
存储技术 | 分类 | 分类要素 | 具体分类 | 举例 |
服务器类型 | 封闭系统的存储 | 大型机等服务器 | ||
开放系统的存储 | 麒麟、欧拉、UNIX、Linux等操作系统的服务器 | |||
外挂存储根 据连接方式 | 直连式存储DAS | |||
网络化存储FAS | 网络接入存储(NAS)和存储区域网络(SAN) | |||
内容 | 1.存储虚拟化是“云存储”核心技术之一,它把来自一个或多个网络的存储资源整合起来,向用户提供一个抽象的逻辑视图,用户可以通过这个视图中的统一逻辑接口来访问被整合的存储资源。用户在访问数据时并不知道真实的物理位置。它带给人们直接的好处是提高了存储利用率,降低了存储成本,简化了大型、复杂、异构的存储环境的管理工作。 2.数据存储建类似于文件系统的逻辑容器。它隐藏了每个存储设备的特性,形成一个统一的模型,为虚拟机提供磁盘。存储虚拟化技术帮助系统管理虚拟基础架构存储资源,提高资源利用率和灵活性,提高应用正常运行时间。 3.绿色存储技术是指从从节能环保的角度出发,用来设计生产能效更佳的存储产品,降低数据存储设备的功耗,提高存储设备每瓦性能的技术。绿色存储技术的核心是设计运行温度更低的处理器和更有效率的系统,生产更低能耗的存储系统或组件,以绿色理念为指导的存储系统最终是存储量、性能、能耗三者的平衡。 | |||
数据结构模型 | 1 .数据结构模型是数据库系统的核心。 2.数据结构模型=结构化(规定了数据如何被描述(例如树、表等)+操纵数据的方法(添加、删除、显示、维护) 3.常见的数据结构模型有三种:层次模型、网状模型和关系模型,层次模型和网状模型又统称为格式化数据模型。 | |||
结构模型 | 特点 | |||
层次模型 | 用“树”结构表示实体集之间的关联,其中实体集(用矩形框表示)为结点,而树中各结点之间的连线表示它们之间的关联。缺点并不是所有事物都是层次关系 | |||
网状模型 | 用网状结构表示实体类型及其实体之间的联系。用有向图结构表示实体类型及实体间联系的数据结构模型称为网状模型。以记录为数据的存储单位。记录包含若干数据项。网状数据库是导航式数据库,用户在操作数据库时不但说明要做什么,还要说明怎么做。 | |||
关系模型 | 在关系结构的数据库中用二维表格的形式表示实体以及实体之间的联系的模型。 | |||
常用的数据库类型 | 数据库类型 | 特点 | ||
关系型数据库(SQL) | 关系型数据库支持事务的ACID原则,即原子性、一致性、隔离性、 持久性,这四种原则保证在事务过程当中数据的正确性 | |||
非关系型数据(NoSQL) | 非关系型数据库是分布式的、非关系型的、不保证遵循ACID原则的数据存储系统; NoSQL数据存储不需要固定的表结构,通常也不存在连接操作。有键值数据库、列存储数据库、面向文档数据库、图形数据库 | |||
数据仓库 | 特点 | 数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用于支持管理决策 | ||
组成 | 具体内容 | |||
数据源 | 内部和外部数据,是数据仓库系统的基础,是整个系统的数据源泉。 | |||
数据的存储与管理 | 它是整个数据仓库系统的核心 | |||
联机分析处理(OLAP)服务器 | 基于关系数据库的广OLAP (ROLAP) | 基本数据和聚合数据均存放在RDBMS之中 | ||
基于多维数据组织的OLAP (MOLAP) | 基本数据和聚合数据均存放于多维数据库中 | |||
基于混合数据组织的OLAP (HOLAP) | 基本数据存放于关系数据库管理系统(RDBMS)中,聚合数据存放于多维数据库中 | |||
前端工具 | 包括各种查询工具、报表工具、分析工具、数握挖掘v工具以及各种基于数据仓库或数据集市的应用开发工具 |
3.3 数据库体系结构
3.4 常用存储数据库类型优缺点
类型 | 特点 | 描述 |
---|---|---|
关系型数据库 | 优点 | 1.容易理解:二维表结构是非常贴近逻辑世界的一个概念,关系模型相对网状、层次等其他模型来说更容易理解 2.使用方便:通用的SQL语言使得操作关系型数据库非常方便 3.易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率 |
缺点 | 1.数据读写必须经过SQL解析,大量数据、高并发下读写性能不足(对于传统关系型数据库来说,硬盘IO是一个很大的瓶颈) 2.具有固定的表结构,因此扩展困难 3.多表的关联查询导致性能欠佳 | |
非关系型数据库 | 优点 | 1.高并发:大数据下读写能力较强(基于键值对的,可以想象成表中的主键和值的对应关系,且不需要经过SQL层的解析,所以性能非常高) 2.基本支持分布式:易于扩展,可伸缩(因为基于键值对,数据之间没有耦合性,所以非常容易水平扩展) 3.简单:弱结构化存储 |
缺点 | 1 .事务支持较弱 2.通用性差 3.无完整约束,复杂业务场景支持较差 |