数据结构及八种常用数据结构简介

news2024/11/18 15:35:21

data-structure

数据结构是一种存在某种关系的元素的集合。“数据” 是指元素;“结构” 是指元素之间存在的关系,分为 “逻辑结构” 和 “物理结构(又称存储结构)”。

常用的数据结构有 数组(array)、栈(stack)、队列(queue)、链表(linked list)、树(tree)、图(graph)、堆(heap)、散列表(hash)。


开局一张图 内容全靠编!
data-structure and algorithm

1、定义

数据结构是一种存在某种关系的元素的集合。“数据” 是指元素;“结构” 是指元素之间存在的关系,分为 “逻辑结构” 和 “物理结构(又称存储结构)”。

常用的数据结构有 数组(array)、栈(stack)、队列(queue)、链表(linked list)、树(tree)、图(graph)、堆(heap)、散列表(hash)。

数据结构与算法常作为一个术语出现,这里的算法用来操作数据结构中的元素的,如检索、插入、删除、更新、排序等。

数据的逻辑结构和物理结构是数据结构的两个密切相关的方面,同一逻辑结构可以对应不同的存储结构。同时,算法的设计取决于数据的逻辑结构,而算法的实现却依赖于指定的存储结构。

2、研究对象

2.1、逻辑结构

逻辑结构是指反映数据元素之间的逻辑关系的数据结构,其中逻辑关系是指数据元素之间的前后间关系,而与它们的存储位置无关。

逻辑关系包括:

  • 集合:数据结构中的元素除了 “属于同一集合” 的关系外,别无其它关系。
  • 线性关系:数据结构中的元素存在一对一的相互关系。
  • 树形结构:数据结构中的元素存在一对多的相互关系。
  • 图形结构:数据结构中的元素存在多对多的相互关系。
2.2、物理结构

物理结构是指数据在计算机存储空间的存放形式。

数据物理结构是数据结构在计算机中的表示(又称映像),它包括数据元素的机内表示和逻辑关系的机内表示。

数据元素的机内表示:
用二进制位(bit)的位串表示数据元素,通常称这种位串为节点(node)。当数据元素由若干个数据项组成时,位串中与各数据项对应的子位串称为数据域(data field)。因此,节点是数据元素的机内表示。

逻辑关系的机内表示:
逻辑关系的机内表示可以分为顺序映像和非顺序映像,常用两种存储结构,即顺序存储结构和非顺序存储结构。顺序映像借助数据元素在存储器内的相对位置来表示数据元素之间的逻辑关系,非顺序映像借助指示数据元素存储位置的指针来表示数据元素之间的逻辑关系。

物理结构的实现方法分为顺序存储和非顺序存储。

  • 顺序存储:
    • 特点:借助数据元素在存储器中的相对位置来表示数据元素之间的逻辑关系。
    • 常用的有 顺序存储 等。
  • 非顺序存储:
    • 特点:借助指示数据元素存储位置的指针来表示数据元素之间的逻辑关系。
    • 常用的有 链式存储、索引存储、哈希存储 等。

3、分类

数据结构有很多种,一般来说,按照其逻辑结构可以分为 线性结构 和 非线性结构 两大类。

3.1、线性结构

线性结构是指各个数据元素之间具有线性关系。栈、队列 等就属于线性结构。从数据结构的角度来看,其有以下特点:

  • 线性结构是非空集。
  • 线性结构有且仅有一个开始结点和终端结点。
  • 线性结构的所有结点都最多只有一个直接前驱结点和一个直接后继结点。
3.2、非线性结构

非线性结构是指各个数据元素之间有多个对应关系。数组、树、图 等就属于非线性结构。从数据结构的角度来看,其有以下特点:

  • 非线性结构是非空集。
  • 非线性结构的一个结点可能有多个直接前驱节点和多个直接后继节点。

4、常用数据结构

常用数据结构包括 数组(array)、栈(stack)、队列(queue)、链表(linked list)、树(tree)、图(graph)、堆(heap)、散列表(hash)。

4.1、数组(array)

数组是一种聚合数据类型,它是将具有相同类型的若干变量有序的组织在一起的集合。一个数组可以分解为多个数组元素。按照元素类型,数组可以分为 整型数组、字符型数组、浮点型数组 等。数组元素是通过下标进行访问的,且下标从 0 开始。

// java 定义一个数组
String[] strings = new String[] { "zed", "fizz", "ahri" }

优点:

  • 根据下标遍历和检索速度快。

缺点:

  • 数组大小固定后无法扩容。
  • 数组只能存储同一类型的数据。
  • 插入、删除操作慢,因为要移动其他元素。

适用场景:检索多、增删少的情况。

4.2、栈(stack)

栈是一种特殊的线性表,它只能在表的一个固定端进行数据元素的插入和删除。栈按照 先进后出或后进先出 的原则存储数据,即先插入的数据被压入栈底,后插入的元素放在栈顶。读数据时,从栈顶开始读。插入亦称入栈,读取亦称出栈。

栈

适用场景:栈长应用于实现递归功能方面的场景。

注:线性表是一种最简单的数据结构。

4.3、队列(queue)

队列和栈一样,也是一种特殊的线性表。队列按照 先进先出 的原则存储数据。和栈不同的是,队列只允许在一端进行插入操作,在另一端进行读取操作。插入操作的一端称为队尾,取出操作的一端称为队首。

队列

适用场景:由于其先进先出的特点,队列常用在多线程应用中。

4.4、链表(linked list)

链表是一种数据元素按照 链式存储结构 存储的数据结构,这种存储结构具有在物理上非连续的特点。链表由一系列数据结点组成,每个数据结点包含数据域和指针域两部分,其中指针域存放了数据结构中下一个元素的存放地址。链表数据结构中数据元素的逻辑关系是通过链表中指针的链接次序来实现的。根据指针的指向,链表可以形成不同的结构,如单链表、双向链表、循环链表等。

链表

优点:

  • 不需要初始化容量,可以任意增删元素。
  • 插入和删除操作速度很快,只需要改变前后两个结点的指针域即可。

缺点:

  • 因为含有大量指针域,所以占用空间较大。
  • 查找元素时需要遍历链表,非常耗时。

适用场景:数据量小、插入删除操作多的情况。

4.5、树(tree)

树是一种典型的非线性数据结构,它是由 n(n >= 1)各有限节点组成的具有层次关系的集合。

树

其特点是:

  • 每个节点有零个或多个子节点。
  • 没有父节点的节点称为根节点。
  • 每一个非根节点只有一个父节点。
  • 除根节点外,每个子节点可以分为多个不相交的子树。

树 数据结构有很多扩展结构,如二叉树、平衡树、 B 树、B+ 树、红黑树等。其中最常用的是二叉树。

二叉树插入、删除元素很快,且在查找方面也有很多优化算法,所以二叉树既有数组的优点,也有链表的好处,是两者的优化方案,在处理大批量动态数据方面非常有用。

树的种类:

  • 无序树:树的任意节点的子节点没有顺序关系。
  • 有序树:树的任意节点的子节点有顺序关系。
  • 二叉树:树的任意节点至多包含两颗子树。
  • 满二叉树:叶子节点都在同一层且除叶子节点外的所有结点有且只有两个子节点。
  • 完全二叉树:对于一颗二叉树,假设其深度为 d(d > 1),除第 d 层外的所有节点构成满二叉树,且第 d 层所有节点从左向右连续紧密的排列。
  • 平衡二叉树:它是一棵空树或左右两个子树的高度差的绝对值不超过 1,并且左右两个子树都为平衡二叉树,同时,平衡二叉树必定为二叉搜索树。
  • 二叉搜索树:若任意节点的左子树不为空,则左子树上的所有节点值均小于该节点的值;若任意节点的右子树不为空,则右子树上的所有节点值均大于该节点的值;任意节点的左右子树也为二叉搜索树。
  • 哈夫曼树:带权路径最短的二叉树称为哈夫曼树或最优二叉树。
  • 红黑树:红黑树是一种特殊的二叉搜索树,除了二叉搜索树的特点外,其还包括一下特性:1、每个节点为黑色或红色;2、根节点时黑色;3、若叶子节点为 null 或 nil,则其为黑色;4、若一个节点为红色,则其子节点必须为黑色;5、从一个节点到该节点的子孙各路径上包含相同数目的黑节点。
  • B 树:详见 /database/about mysql.md。
  • B + 树:详见 /database/about mysql.md。
4.6、图(graph)

图是另一种非线性数据结构。是由顶点的有穷集合 V 和边的集合 E 组成。数据结点一般称为顶点,而边是顶点的有序偶对。如果两个顶点之间存在一条边,那么就表示这两个顶点具有相邻关系。

按照顶点指向的方向可分为有向图和无向图。

图

图是一种较复杂的数据结构,在存储数据上有着较复杂和高效的算法,如 邻接矩阵、邻接表、十字链表、邻接多重表、边集数组等存储结构。

4.7、堆(heap)

堆是一种特殊的树数据结构,一般讨论的堆都是二叉堆。堆的特点是根节点的值是所有节点中的最大值或最小值,为最大值时称为最大堆或大根堆;为最小值时称为最小堆或小根堆。且所有子节点也是堆结构。

堆

适用场景:因堆有序的特点,所以常用来做排序。

4.8、散列表(hash)

散列表也叫哈希表,源自于散列函数(hash function),其思想是如果在结构中存在关键字和 T 相等的记录,那么必定在 f(T) 的存储位置可以找到该记录,这样就可以不用比较而直接获取需要查找的记录。

散列表

f 即为散列函数,又称哈希函数。则散列表是将 key 通过散列函数转换成一个整型数字,然后将该数字对数组长度进行取余,取余即是数组的下标,最后将 value 存放在该下标所对应的数组空间里。这种存储结构充分利用了数组的查找优势,所以查找速度很快。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1226300.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

debian10 开启rdp安装firefox,firefox 中文乱码

debian10 开启rdp安装firefox apt -y install tigervnc-standalone-server apt -y install xrdp tigervnc-standalone-server systemctl enable xrdpapt install firefox-esrmstsc连接 firefox-settings-general-fonts-advanced-Simplified Chinese

【LeetCode:2342. 数位和相等数对的最大和 | HashMap + 模拟 】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

【开源】基于Vue和SpringBoot的微信小程序的音乐平台

项目编号: S 055 ,文末获取源码。 \color{red}{项目编号:S055,文末获取源码。} 项目编号:S055,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块三、系统展示 四、核心代码4.1 查询单首…

R语言的入门学习

目录 准备工作导入csv数据集选择前200行作为数据集展示数据集的前/后几N行宏观分析删除缺失值构建直方图导出为图片 R语言常见图像类型例1:散点图例2:散点矩阵图 准备工作 安装教程: R语言和RStudio的下载安装(非常简便舒适&…

脚本(JavaScript)-练手-简单的随机音乐播放器

浅浅的写个简单的随机音乐播放脚本(可移动),注释很详细,直接上源码 效果: // UserScript // name 播放音乐脚本 // namespace 代码对我眨眼睛 // version 1.2 // description 在API上请求音乐链接并随机自动连续播放音乐&…

【Python3】【力扣题】303. 区域和检索 - 数组不可变

【力扣题】题目描述: 【Python3】代码: 1、解题思路:从列表中获取指定下标的所有元素,求和。 知识点:列表[start:end]:切片。从列表中获取起始下标start(含)到结束下标end&#xf…

Redis(地理空间Geospatial和HyperLogLog)

Geospatial: Redis中的Geospatial提供了一种存储和处理地理空间数据的能力,这对于许多应用非常有用。以下是Redis中的Geospatial的一些作用: 1. 地理位置查询:可以存储地理位置的坐标信息,并且可以通过查询指定半径范…

数据库的三范式(Normalization)

数据库的三范式(Normalization)是关系数据库设计中的基本理论原则,旨在减少数据冗余和提高数据库的数据组织结构。三范式通过将数据分解为更小的表,并通过关系建立连接,使得数据库设计更加灵活、规范和容易维护。在这篇…

【csapp lab】lab2_bomblab

文章目录 前言实验内容phase_1phase_2phase_3phase_4phase_5phase_6secret_phase 前言 刚做了csapp lab2,记录一下。 我这里用的的系统环境是Ubuntu22.04,是64位系统,与用32位系统可能有所差异。 实验共包括七个阶段,每个阶段考…

湖北成人自考毕业学位申请照片要求及自拍制作方法

湖北成人自考学位申请需要上传照片是为了身份验证和学籍管理的目的。通过上传照片,学校可以确认申请者的身份,并将照片与其他申请信息进行关联。这有助于提高学校对学生的管理效率,确保学籍信息的准确性。同时,照片也用于学位证书…

基于FPGA的五子棋(论文+源码)

1.系统设计 在本次设计中,整个系统硬件框图如下图所示,以ALTERA的FPGA作为硬件载体,VGA接口,PS/2鼠标来完成设计,整个系统可以完成人人对战,人机对战的功能。系统通过软件编程来实现上述功能。将在硬件设计…

计算机硬件的基本组成

一、冯诺依曼结构 存储程序: “存储程序”的概念是指将指令以二进制代码的形式事先输入计算机的主存储器,然后按其在存储器中的首地址执行程序的第一条指令,以后就按该程序的规定顺序执行其他指令,直至程序执行结束。 冯诺依曼计…

C语言每日一题(33)随机链表的复制

力扣138 随机链表的复制 题目描述 给你一个长度为 n 的链表,每个节点包含一个额外增加的随机指针 random ,该指针可以指向链表中的任何节点或空节点。 构造这个链表的 深拷贝。 深拷贝应该正好由 n 个 全新 节点组成,其中每个新节点的值都…

理论与实践相结合之Cisco Packet Tracer网络模拟器安装教程

简介 Packet Tracer是由思科设计的跨平台可视化仿真工具,它允许用户创建网络拓扑以模仿计算机网络和使用命令行界面来模拟配置思科路由器和交换机。Packet Tracer的用户界面为拖放式,允许用户根据自己的需要添加和删除模拟的网络设备。 Packet Tracer很…

卡片排列-第15届蓝桥第二次STEMA测评Scratch真题精选

[导读]:超平老师的《Scratch蓝桥杯真题解析100讲》已经全部完成,后续会不定期解读蓝桥杯真题,这是Scratch蓝桥杯真题解析第159讲。 第15届蓝桥杯第2次STEMA测评已于2023年10月29日落下帷幕,编程题一共有6题,分别如下&…

cesium雷达扫描(模糊圆效果)

cesium雷达扫描(模糊圆效果) 1、实现思路 使用ellipse方法加载圆型,修改ellipse中‘material’方法重写自己的glsl来实现当前效果 1、示例源码 index.html <!DOCTYPE html> <html lang="en"><head><!<

如何将vscode和Linux远程链接:

如何将vscode和Linux远程链接&#xff1a; Remote - SSH - 远程登录Linux 安装Remote - SSH 我们下载完后&#xff0c;就会出现这些图标 这里点一下号 查看一下我们的主机名&#xff0c;并复制 输入ssh 用户名主机名 这里是要将ssh这个文件要放在主机下的哪个路径下&#xff…

最强人工智能ChatGPT引领AIGC发展

从公众号转载&#xff0c;关注微信公众号掌握更多技术动态 --------------------------------------------------------------- ——AI不会淘汰所有人&#xff0c;但会淘汰不懂AI的人 一、最强人工智能GPT-4 Turbo 在前不久的OpenAI开发者大会&#xff0c;正值Chatgpt3.5发布一…

微信第三方平台开发重点概念流程梳理

标题 微信开发的亿点点概念第三方平台代开发流程亿些概念开发流程 代公众号使用JS SDK一些概念具体流程引用 微信开发的亿点点概念 AppID&#xff1a;AppID是不同类型的产品的账号ID,是账号的唯一标识符。例如公众号的AppID、小程序的AppID、开放平台的AppID、第三方平台的App…

C++之内建函数对象

C之内建函数对象 算术仿函数 #include<iostream> using namespace std; #include<functional>//内建函数对象头文件 //内建函数对象 算术仿函数void test() {// negate 一元仿函数 取反仿函数negate<int>n;cout << n(100) << endl;//plus 二元仿…