1.2 数据模型

news2025/1/12 23:32:03

思维导图:

 

 

 

前言:

**1.2.1 什么是模型**

- **定义**:模型是对现实世界中某个对象特征的模拟和抽象。例如,一张地图、建筑设计沙盘或精致的航模飞机都可以视为具体的模型。

- **具体模型与现实生活**:具体模型可以很容易地让人联想到现实生活中的事物。例如,航模飞机不仅模拟了飞机的起飞、飞行和降落,还抽象了其基本特征,如机头、机身、机翼和机尾。

**1.2.2 数据模型的定义**

- **数据模型**:数据模型也是一种模型,主要对现实世界中的数据特征进行抽象。具体来说,数据模型用于描述数据、组织数据和操作数据。

- **为什么需要数据模型**:计算机无法直接处理现实世界中的具体事物,所以需要先将这些事物数字化。数据模型是这一过程中用来表示和处理现实世界中的人、物、活动和概念的工具。简而言之,数据模型是对现实世界的模拟。

**1.2.3 数据模型与数据库系统**

- **基于数据模型的数据库系统**:现存的所有数据库系统都是基于某种数据模型构建的。

- **数据模型的重要性**:数据模型是数据库系统的核心和基础。为了更好地学习和理解数据库,首先需要了解数据模型的基本概念。

**总结**:数据库技术沿着数据模型的主线发展。数据模型为现实世界中的对象和概念提供了一个抽象的、数字化的表示方式,是数据库系统的基石。

**1.2.1 两类数据模型**

---

**数据模型的要求**:

- **真实性**:真实地模拟现实世界。
- **可理解性**:为人容易理解。
- **实现性**:易于在计算机上实现。

>由于难以全面满足上述要求,根据不同的使用对象和应用目的,数据库系统中通常会采用不同的数据模型。

---

**模型的分类**:

1. **概念模型(Conceptual Model)**:
   - 也称为信息模型。
   - 从用户的角度对数据和信息进行建模。
   - 主要用于数据库设计阶段。

2. **逻辑模型和物理模型**:
   - **逻辑模型**:
     - 包括层次模型、网状模型、关系模型、面向对象数据模型、对象关系数据模型和半结构化数据模型等。
     - 从计算机系统的角度对数据进行建模。
     - 主要用于数据库管理系统的实现。
   - **物理模型**:
     - 数据的底层抽象,描述数据在系统内部的表示和存取方式。
     - 描述数据在存储介质(如磁盘、磁带)上的存储和访问方式。
     - 面向计算机系统,其实现是DBMS的任务。

---

**抽象过程**:

1. 从**现实世界**中抽象出信息结构(不依赖于特定的计算机系统) → **概念模型**。
2. 将概念模型转换为计算机上某个DBMS支持的数据模型 → **逻辑/物理模型**。

![抽象过程示意图](图1.7)

*图1.7 现实世界中客观对象的抽象过程*

---

**模型转换责任**:

- 从**现实世界**到**概念模型**:由数据库设计人员完成。
- 从**概念模型**到**逻辑模型**:可以由数据库设计人员完成,也可以使用数据库设计工具辅助完成。
- 从**逻辑模型**到**物理模型**:主要由数据库管理系统完成。

---

**后续内容预告**:

- 接下来将首先介绍概念模型和数据模型的组成要素。
- 然后,将深入探讨三个主要的数据模型。

---

**总结**:数据模型是数据库系统的核心和基础。不同阶段和目的下需要采用不同的数据模型,从而更好地模拟和实现现实世界中的数据结构和组织方式。

 1.2.2 概念模型

- **定义与重要性**:
  - **桥梁**:概念模型是现实世界与机器世界的中介层。
  - **用途**:用于信息世界的建模,为数据库设计人员提供工具,也是他们与用户之间的交流媒介。
  - **特点**:需具有强大的语义表达能力,简单、明确、易于用户理解。

- **信息世界的基本概念**:
  1. **实体 (Entity)**:客观存在的独特事物,例如一个职工、一个部门等。
  2. **属性 (Attribute)**:描述实体的特性,例如学生的学号、姓名等。
  3. **码 (Key)**:唯一标识实体的属性集。
  4. **实体型 (Entity Type)**:具有相同属性的实体的特性和性质的抽象表示。
  5. **实体集 (Entity Set)**:同一种类型实体的集合,例如所有学生。
  6. **联系 (Relationship)**:描述实体内部或实体之间的连接。包括一对一、一对多和多对多联系。

- **概念模型的表示方法 - 实体-联系方法**:
  - **背景**:PP.S.Chen在1976年提出。
  - **方法**:使用E-R图 (E-R diagram) 描述现实世界的概念模型。
  - **详细讲解**:关于如何从现实世界中抽取实体和联系以及如何建立E-R图将在第7章进行讲解。

---

这样的笔记格式将重要信息简明扼要地展现出来,有助于复习和快速理解。

 1.2.3 数据模型的组成要素

- **定义**:数据模型是一套精确定义的概念,用以描述系统的静态特性、动态特性及完整性约束。

数据模型主要由三部分组成:

1. **数据结构**:
    - **定义**:描述数据库的组成对象以及对象之间的联系。
    - **内容**: 
      - 对象的类型、内容、性质:例如,关系模型中的域、属性、关系等。
      - 数据之间的联系:例如,网状模型中的系型。
    - **重要性**:是描述数据模型性质的关键部分,如层次模型、网状模型和关系模型。
    - **目标**:描述系统的静态特性。

2. **数据操作**:
    - **定义**:对数据库对象的实例执行的允许操作及其规则的集合。
    - **种类**:主要包括查询和更新(插入、删除、修改)。
    - **要求**:数据模型应定义操作的确切含义、符号、规则及实现操作的语言。
    - **目标**:描述系统的动态特性。

3. **数据的完整性约束条件**:
    - **定义**:是一组完整性规则,用于保证数据的正确性、有效性和一致性。
    - **通用约束**:如关系模型中的实体完整性和参照完整性。
    - **特定约束**:例如,规定学生成绩不及格的科目数和教授的退休年龄。
    - **目的**:数据模型应反映其必须遵循的完整性约束,并提供定义完整性约束的机制。

1.2.4 常用的数据模型

**概览**:
在数据库领域中,逻辑数据模型主要有以下几种:

1. **层次模型 (Hierarchical Model)**
2. **网状模型 (Network Model)**
3. **关系模型 (Relational Model)**
4. **面向对象数据模型 (Object-Oriented Data Model)**
5. **对象关系数据模型 (Object-Relational Data Model)**
6. **半结构化数据模型 (Semistructured Data Model)**

---

- **层次模型与网状模型 (Format Models)**:
  - 在20世纪70-80年代初盛行。
  - 两者在使用和实现时都与数据库物理层的复杂结构有关。
  - 逐渐被关系模型取代,但因为很多早期应用是基于它们的,所以某些国家如美国和欧洲国家仍在使用。

- **面向对象数据模型**:
  - 20世纪80年代起,面向对象的方法在计算机领域产生了深远影响。
  - 促进了面向对象数据模型的研究和发展。
  - 为了支持面向对象模型,许多关系数据库厂商对关系模型做了扩展,产生了**对象关系数据模型**。

- **半结构化数据模型**:
  - 随Internet的发展,Web上的半结构化、非结构化数据变得越来越重要。
  - 产生了以XML为代表的半结构化和非结构化数据模型。

- **本章重点**:
  - 主要介绍层次模型、网状模型和关系模型。
  - 新型的数据模型会在第13章中进行详细讨论。

---

**数据结构的角度**:
- 数据模型主要由数据结构、数据操作和数据完整性约束条件组成。
- 在这里,我们重点介绍三种模型的数据结构。

**格式化模型的特点**:
- 实体用记录表示,其属性对应于记录的数据项或字段。
- 实体间的联系转换为记录之间的两两联系。
- 数据结构的单位是基本层次联系。这意味着两个记录及它们之间的一对多(或一对一)联系。

---

总结: 数据模型为我们提供了一个框架来思考如何在数据库中表示和组织数据。从层次模型到半结构化数据模型,每种模型都有其特定的应用和优势。在设计数据库时,选择合适的数据模型至关重要,因为它直接影响到数据的组织、存储和检索效率。

 1.2.5 层次模型

---

**定义与历史背景**  
层次模型是数据库系统中的早期数据模型,其数据组织方式是树形结构。它的典型代表是IBM公司1968年推出的IMS(Information Management System)。这是一个大型的商用数据库管理系统,曾被广泛应用。

---

**1.层次模型的数据结构**  
- **基本特点**  
  1. 有且仅有一个无双亲节点的根节点。
  2. 除根节点外的节点有且仅有一个双亲节点。
- **组织方式**  
  - 每个节点代表一个记录类型。
  - 记录类型间的联系用有向边表示,表现为父子之间的一对多关系。
  - 每个记录类型包含多个字段,字段表示实体的属性。
  - 记录类型和字段必须具有唯一的名称。
  - 同一记录类型中各个字段不能同名。
  - 记录类型可以定义排序字段,称为码字段,用于唯一地标识记录值。
  - 层次模型中有兄弟节点和叶节点,兄弟节点共享同一个父节点,而叶节点无子节点。

  **例子**:图1.9展示了一个层次模型,其中有多个节点如R₁、R₂等,它们之间存在层次关系。

---

**2.层次模型的数据操纵与完整性约束**  
- **基本操作**  
  1. 查询
  2. 插入
  3. 删除
  4. 更新
- **完整性约束**  
  - 插入操作需要相应的父节点存在。
  - 删除一个父节点会同时删除其所有子节点。

  **例子**:如图1.11所示,删除某个教研室会导致其下的所有教员信息丢失。

---

**3.层次模型的优缺点**  
- **优点**  
  1. 数据结构简单,清晰。
  2. 高查询效率,因为记录之间的联系常由指针实现。
  3. 提供良好的完整性支持。
- **缺点**  
  1. 非层次性联系难以表示。
  2. 表示多对多联系或多双亲节点的联系较为困难。
  3. 查询子节点必须通过父节点。
  4. 命令程序化,导致灵活性降低。

---

**结论**  
层次模型适合描述具有一对多的层次联系的实体。其直观性和易理解性是其突出的优点,但在某些复杂的实际应用中,它的局限性也较为明显。

1.2.6 网状模型 

---

**简介**:
- 网状模型反映非层次性的事物联系,解决层次模型在表示非树形结构时的不足。
- 典型代表为DBTG系统(亦称CODASYL系统)。

---

**1. 数据结构**

**定义**: 在数据库中,网状模型满足:
(1) 允许一个以上的结点无双亲。
(2) 一个结点可以有多于一个的双亲。

**特性**:
- 与层次模型比较,网状模型更具普遍性。
- 允许多个结点没有双亲,结点可有多个双亲,还可有复合联系。
- 层次模型是网状模型的特例。

**示例**: 图1.12展示了网状模型的不同形式。

**应用场景**: 学生选课系统中,学生与课程之间存在多对多的关系,通过引入选课记录来组织数据。

---

**2. 数据操纵与完整性约束**

- 网状模型比层次模型拥有较为宽松的完整性约束条件。
- DBTG提供了多种完整性概念和语句,如:
    1. 记录码概念:唯一标识记录的数据项集合。
    2. 确保父-子关系为一对多关系。
    3. 支持父-子记录之间的约束条件。

---

**3. 优缺点**

**优点**:
1. 直观地描述现实世界。
2. 存取效率高,性能良好。

**缺点**:
1. 结构复杂,难以掌握。
2. DDL和DML复杂,需要嵌入高级语言中,难以掌握和使用。
3. 需要选择合适的存取路径,加重了编程负担。

---

**总结**: 网状模型提供了一个能够更为直观地描述非层次性事物联系的方法。尽管它具有较高的存取效率和能够准确描述多对多的关系等优点,但其结构的复杂性和对程序员的要求较高使其使用受到一定限制。

1.2.7 关系模型

**概述**:
- 关系模型是数据库中最重要的数据模型。
- 1970年,E.F.Codd首次提出关系模型,为数据库技术奠定理论基础。
- 1981年,Codd获得ACM图灵奖。
- 20世纪80年代,大部分新的数据库管理系统都支持关系模型。

---

**1.关系模型的数据结构**:
- **基于数学**: 关系模型基于严格的数学概念。
- **关系**: 一张二维表;例:学生登记表。
- **元组**: 一张表中的一行。
- **属性**: 一张表中的一列;例:学号、姓名、年龄等。
- **码**: 可以唯一确定一个元组的属性组;例:学号。
- **域**: 同一数据类型的值的集合,决定了属性的取值范围。
- **分量**: 元组中的一个属性值。
- **关系模式**: 描述关系的方式,表示为“关系名(属性1,属性2,…,属性n)”。
- **规范性**: 关系中的每一个分量必须是不可分的数据项。

---

**2.关系模型的数据操纵与完整性约束**:
- **数据操纵**: 包括查询、插入、删除和更新。
- **完整性约束**: 
  - 实体完整性
  - 参照完整性
  - 用户定义的完整性
- **操作方式**: 关系模型中的数据操作基于集合,操作对象和结果均为关系。

---

**3.关系模型的优缺点**:
**优点**:
1. 基于严格的数学概念。
2. 概念单一,数据结构简单、清晰。
3. 存取路径对用户透明,具有高度的数据独立性。

**缺点**:
1. 查询效率可能较低。
2. 系统内部的查询优化增加了DBMS的开发难度。

---

**1.3 数据库系统的结构**:
- 从应用开发人员角度看,数据库系统通常采用三级模式结构。
- 从最终用户角度看,数据库系统的结构有多种,如单用户、主从式、分布式、客户-服务器等。
- 本章将详细介绍数据库系统的模式结构。

---

 

 

总结:

---

**重点**:
1. **定义**:数据模型是一个用于描述、构造和操作数据库的概念框架,它定义了所需的数据结构、关系及操作约束。
2. **关系模型**: 理解关系模型的组成(如关系、元组、属性、码等)及其规范性要求是核心内容。
3. **完整性约束**: 包括实体完整性、参照完整性和用户定义的完整性。
4. **三级模式结构**:外模式、概念模式和内模式的理解与区别。
5. **其他数据模型**: 除关系模型外,还需了解层次模型、网状模型、对象关系模型等。

---

**难点**:
1. **规范化**: 理解不同的规范化级别(如第一范式、第二范式等)及其为何需要。
2. **查询优化**: 虽然对于大部分应用开发者不是直接内容,但理解其背后的原理对于数据库性能优化是关键。
3. **完整性约束的应用**: 在实际应用中如何有效地使用和维护这些约束。
4. **数据模型转换**: 如何从概念模型(如E-R图)转换到关系模型。

---

**易错点**:
1. **混淆术语**:如将“关系”与“关系数据库”、“元组”与“记录”等概念混淆。
2. **规范化过程**:在进行数据库设计时,可能会错误地跳过某些规范化步骤或将数据模型规范化到不适当的级别。
3. **完整性约束的违反**:在进行数据操作时,可能会违反某些约束条件,如插入违反实体完整性的数据。
4. **误解数据模型的用途**:如将关系模型与对象关系模型混淆,或将它们用于不适合的场景。

---

总体来说,理解数据模型的基础概念是关键,但同时也需要注意其中的细节和特定的应用场景,以避免常见的误区和错误。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1061882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

剑指offer——JZ55 二叉树的深度 解题思路与具体代码【C++】

一、题目描述与要求 二叉树的深度_牛客题霸_牛客网 (nowcoder.com) 题目描述 输入一棵二叉树,求该树的深度。从根结点到叶结点依次经过的结点(含根、叶结点)形成树的一条路径,最长路径的长度为树的深度,根节点的深度…

【简单了解一下红黑树】

文章目录 红黑树1.简介2.为什么需要红黑树?3.性质4. 红黑树的效率4.1 红黑树效率4.2 红黑树和AVL树的比较 5.AVL树 vs 红黑树5.1 AVL树5.2 红黑树5.3 如何选择 红黑树 1.简介 红黑树是一种自平衡的二叉查找树,是一种高效的查找树。它是由 Rudolf Bayer …

微信公众号开发与本地调试详细教程

在进行微信公众号开发时,本地调试是一个关键的步骤。本文将详细介绍如何进行微信公众号开发并在本地环境中进行调试。我们将以Nginx为例,演示如何配置虚拟主机,使用ngrok进行内网穿透,以及进行网页授权和JS SDK的测试。 1. 准备工…

Compose Canvas基础

Compose Canvas基础 前言Canvas是什么drawxxx()绘制方法drawCircle 画圆不填充颜色设置线条的宽度 drawRect 画矩形drawPoints 画点pointMode drawOval 画椭圆drawLine 画线drawRoundRect 画圆角矩形drawArc 绘制弧形或扇形useCenter drawPath 画自定义图形 总结 前言 阅读本文…

【C++ 学习 ㉕】- 万字详解 unordered_map 和 unordered_set(哈希表的查找和容器的模拟实现)

目录 一、unordered_map 的基本介绍 二、unordered_set 的基本介绍 三、相关练习 3.1 - 在长度 2N 的数组中找出重复 N 次的元素 3.2 - 存在重复元素 3.3 - 两句话中的不常见单词 四、哈希表的查找 4.1 - 哈希表的基本概念 4.2 - 哈希函数的构造方法 4.3 - 处理冲突的…

用go获取IPv4地址,WLAN的IPv4地址,本机公网IP地址详解

文章目录 获取IPv4地址获取WLAN的IPv4地址获取本机公网IP地址 获取IPv4地址 下面的代码会打印出本机所有的IPv4地址。这个方法可能会返回多个IP地址,因为一台机器可能有多个网络接口,每个接口可能有一个或多个IP地址。 package mainimport ("fmt&…

阿里云服务器地域和可用区查询表_地域可用区大全

阿里云服务器地域和可用区有哪些?阿里云服务器地域节点遍布全球29个地域、88个可用区,包括中国大陆、中国香港、日本、美国、新加坡、孟买、泰国、首尔、迪拜等地域,同一个地域下有多个可用区可以选择,阿里云服务器网分享2023新版…

批量剪辑技巧:视频去色处理,让色彩焕然一新!

你是否曾经遇到过这样的问题:大量视频需要处理,但色彩总是达不到你的要求?现在,我们将向你展示如何通过批量剪辑技巧,轻松去除视频原色,让色彩焕然一新! 首先,我们要进入【视频剪辑…

##***

本文涵盖了一种名为"快速编写论文,课设辅助器"的智能人工智能(AI)系统。该系统旨在提供高效的论文和课程设计撰写辅助功能。通过利用先进的自然语言处理和机器学习算法,该系统能够自动生成与特定主题相关的内容&#xf…

苹果mac电脑securecrt下载 附securecrt破解文件

SecureCRT for Mac是一款由VanDyke Software公司开发的终端仿真软件,专为Mac OS X系统设计,用于提供安全SSH、Telnet和其他协议的远程访问和管理。它适用于各种操作系统和设备,如Windows、Linux和UNIX等,为Mac用户提供了广泛的连接…

嵌入式学习笔记(46) NandFlash的结构

9.2.1 Nand的单元组织:block与page(大页Nand与小页Nand) (1)Nand的页和以前讲过的块设备(尤其是硬盘)的扇区是类似的。扇区最早在磁盘中是512字节,后来也有些高级硬盘扇区不是512字节,而是1024…

高中生自学Python,这里给大家一些建议

高一学业压力比较重,如果你还是选择自学Python,每天可以抽出一两个小时来学习的话,也是可以的。下面是我给你的5点建议: 找浅显易懂,例子比较好的教程,从头到尾看下去。不要看很多本,专注于一本…

C/C++:[Error] ld returned 1 exit status 解决方案

好久没用了,今天写了会儿代码,各种BUg,emmmmmm 出现了很多次以下这个问题:[Error] ld returned 1 exit status 可能问题&解决方式: 常见的语法/单词拼写错误:常见的Main,printf,scanf等拼写错误 函数名或者声明有…

行与走,放慢自己,思考回顾。

为什么要出去行与走? 1、出去行与走看到祖国的大美风景,可以更深刻的认识到我们祖国的美好。 2、可以放空心情,排除掉积攒在写字楼内的方格子里面的郁闷和烦恼。 3、可以为自己的身体和心灵找一个安静和清澈净土。 4、在行和走之间&#…

GB28181学习(六)——实时视音频点播(数据传输部分)

GB28181系列文章: 总述:https://blog.csdn.net/www_dong/article/details/132515446 注册与注销:https://blog.csdn.net/www_dong/article/details/132654525 心跳保活:https://blog.csdn.net/www_dong/article/details/132796…

SpringCloud-Bus

接上文 SpringCloud-消息组件 1 注册Bus Bus需要基于一个具体的消息队列实现&#xff0c;比如RabbitMQ.还使用最开始的服务拆分项目&#xff0c;比如现在借阅服务的某个接口调用时&#xff0c;能给用户服务和图书服务发送一个通知。 首先父项目导入SpringCloud依赖 <depend…

MySQL数据库单表查询

素材: 表名: worker-- 表中字段均为中文&#xff0c;比如 部门号 工资 职工号 参加工作 等 CREATE TABLE worker ( 部门号 int(11) NOT NULL, 职工号 int(11) NOT NULL, 工作时间 date NOT NULL, 工资 float(8,2) NOT NULL, 政治面貌 varchar(10) NOT NULL DEFAULT 群…

力扣 -- 1027. 最长等差数列

解题步骤&#xff1a; 参考代码&#xff1a; class Solution { public:int longestArithSeqLength(vector<int>& nums) {int nnums.size();int ret2;unordered_map<int,int> hash;//这里可以先把nums[0]存进哈希表中&#xff0c;方便后面i从1开始遍历hash[num…

Python的函数

近期遇到了一个没怎么看懂的Python函数的形式。 def twoSum(self, nums: List[int], target: int) -> List[int]: 后来上网查了资料。

剑指offer——JZ35 复杂链表的复制 解题思路与具体代码【C++】

一、题目描述与要求 复杂链表的复制_牛客题霸_牛客网 (nowcoder.com) 题目描述 输入一个复杂链表&#xff08;每个节点中有节点值&#xff0c;以及两个指针&#xff0c;一个指向下一个节点&#xff0c;另一个特殊指针random指向一个随机节点&#xff09;&#xff0c;请对此链…