TryHackMe 第3天 | Pre Security (中)

news2025/1/16 19:10:35

该学习路径讲解了网络安全入门的必备技术知识,比如计算机网络、网络协议、Linux命令、Windows设置等内容。上一篇中简短介绍了计算机网络相关的知识,本篇博客将记录 网络协议 部分。

How the web works?

DNS in detail

DNS (Domain name system,域名解析系统),它为我们提供了一种简单的方式去与互联网上的设备进行通信。

在网络中,数据包要依照 IP 地址来寻找目的地,对于设备而言,IP 地址非常清晰。但对于人类而言,如果要记住每一个想访问的页面的 IP 地址,似乎有点不太现实。因此人们采用域名来代替 IP 地址,日后人们只需要记住域名就可以,域名和 IP 地址之间的转换工作就交给 DNS 处理。这就是 DNS 的作用。

Domain hierarchy

域名也有对应的层次结构,如下图所示:

在域名中, 层级大小从右往左逐渐递减。按照图上内容,我们可以总结出域名的各层结构:

  • TLD (Top-level domain),顶级域名,位于域名最右边。最常见的顶级域名就是 .com。顶级域名一般有两种类型,gTLD ( generic TLD,通用顶级域名) 和 ccTLD (country code TLD,国家代码顶级域)。
  • Second-level domain,二级域名。以 baidu.com 为例,baidu 就是二级域名。在注册域名时,二级域名只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-”(不能以连字符开头或结尾,也不能有连续连字符)。
  • Subdomain,子域名。子域名位于二级域名左侧。以 pan.baidu.com 为例,pan 就是子域名。子域名和二级域名一样,只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-” 构成。子域名没有个数限制,但是必须保证整体的域名长度控制在 253 个字符以内。
DNS record type

DNS 不仅仅适用于网站,因为它还存在多种类型的 DNS record (DNS 记录)。

  • A record,该记录是 IPv4 地址解析结果
  • AAAA record,该记录是 IPv6 地址解析结果
  • CNAME record,该记录会解析到另一个域名上,也称 别名记录。比如 tryhackme 有一个商城子域名 store.tryhackme.com,它的 CNAME 记录为 shops.shopify.com,那么 DNS 的解析顺序就是 store.tryhackme.com --> shops.shopify.com --> shops.shopify.com 的 IP 地址。
  • MX record,该记录会解析到收件人域名的邮箱服务器。这样我们的邮件才能知道该发往何处。
  • TXT record,该记录是自由文本字段,可以存储任何基本文本的数据。该记录有多种用途,最常见的是列出有权代表域名发送电子邮件的服务器,这有助于打击垃圾邮件和识别是否为伪造身份的邮件。
DNS request

DNS 请求过程如下图所示:

  1. 请求域名时,计算机首先会查看本地缓存。若本地缓存存在,则直接使用;不存在就会向 Recursive DNS (递归DNS) 服务器发出请求。
  2. Recursive DNS 服务器通常由 ISP 提供,但也可以自行选择。收到请求后,递归 DNS 服务器也会先查询其本地缓存。若本地缓存中存在,则直接返回结果,请求结束;若无法找到,则会从 Root DNS (根 DNS) 服务器中进行寻找。
  3. 根 DNS 服务器是互联网的 DNS 主心骨,它们的工作是根据请求将其重定向到正确的 TLD (顶级域名) 服务器上。比如要访问 www.tryhackme.com,根 DNS 服务器会将其转给 .com 顶级域名服务器去处理。
  4. TLD 服务器保存的是能正确回应 DNS 请求的 Authoritative server (权威服务器)的记录。权威服务器也被称为域名的 nameserver (名称服务器)。一个域名通常会有多个名称服务器,以便在其中一个出现故障时作为备份。
  5. 权威 DNS 服务器负责存储特定域名的 DNS record,也负责对域名的 DNS record进行更新。根据记录的 record 类型不同,DNS record 会被发送回递归 DNS 服务器,在那里进行本地缓存,以便将来的请求,然后再将 DNS record 转发给发起请求的计算机。

HTTP in detail

HTTP (Hypertext transfer protocol),超文本传输协议。它是一套用于与网络服务器通信的规则,用于传输网页数据(包括 HTML、图像、视频等)。

HTTPS (Hypertext transfer protocol secure),是 HTTP 的安全版本。HTTPS 的数据经过加密,因此它能阻止别人看到你发送和接受的数据,也可以确保你在与正确的网络服务器沟通而不是和冒充的服务器。

Requests & responses

当我们访问网站时,浏览器需要向网络服务器发起 requests (请求),然后服务器再给我们 responses (响应)。

但在请求时,我们需要告诉浏览器访问这些资源的具体方式和它们所在的地点,这就是 URL (Uniform resource locator,统一资源定位器) 的作用所在。下图展示了 URL 的所有功能,但注意,不是所有的请求都会用到这些功能:

  • Scheme,它表明用何种协议访问资源,如 HTTP、HTTPS、FTP
  • User,有些服务需要认证身份,可以在 URL 中输入用户名和密码
  • Host (Domain),我们想访问的域名或 IP 地址
  • Port,我们想连接的端口号
  • Path,我们想访问的资源名字或位置
  • Query string,额外信息位,比如 /blog?id=1 就表示要访问 /blog 路径,且希望获得 id=1 的文章。
  • Fragment,对请求的实际页面上的某个位置的引用。通常用于内容较长的页面,可以直接链接到页面的某一部分。
HTTP methods

HTTP methods 是客户端发起 HTTP 请求时预期的一个操作。HTTP methods 有很多方法,但更常见的还是 GET 和 POST 方法。

  • GET,用于从 Web 服务器上获取资源
  • POST,用于向 Web 服务器提交数据,并可能创建新的记录
  • PUT,向 Web服务器提交数据以进行信息更新
  • DELETE,从 Web 服务器上删除信息或记录
HTTP status codes

当 Web 服务器响应了我们的 HTTP 请求时,它会发送一个 HTTP 响应数据包,其中就包含了 status codes (状态码)。这些状态码用于告知客户端请求的结果及可能的处理方式,一般可以分为五种:

  • 1xx,information response。告知客户端其请求的一部分已被接受,接下来应该继续发送请求的其余部分。
  • 2xx,success。告知客户端请求成功。
  • 3xx,redirection。告知客户端请求重定向到另一个资源。
  • 4xx,client errors。告知客户端请求出现了问题。
  • 5xx,server errors。告知客户端,服务器在处理请求时出现了问题。

常见的状态码如下表所示:

200 - OK请求成功
201 - Created资源已创建 (例如新用户或新的博文)
301 - Moved permanently将浏览器重定向到一个新网页,或告诉搜索引擎该网页已转移到其他地方
302 - Found与 301 类似,但不同的是该状态码表示暂时性的更改,在不久的将来可能会再次更改
400 - Bad request告诉浏览器请求中出现了错误或丢失了某些内容
401 - Not authorised未进行身份授权前,不允许查看该资源
403 - Forbidden无论用户是否登录,都没有权限访问该资源
404 - Page not found资源不存在
405 - Method not allowed资源不允许使用该请求方式请求
500 - Internal server error服务器在处理请求时遇到某种错误,无法正确处理
503 - Service unavailable服务器由于超负荷或正在进行维护,无法处理请求
Headers

Headers 信息分为 请求 headers 和 响应 headers。前者通常由客户端发送给 Web 服务器;后者是 Web 服务器对于客户端请求的响应。

常见的 请求 headers 包含:

  • Host,一些 Web 服务器上会托管多个网站,通过该信息可以告诉服务器要访问的网站,否则就是访问服务器的默认网站。
  • User-Agent,客户端的浏览器软件和版本号,告知服务器你使用的浏览器软件有助于它为你的浏览器正确格式化网站。
  • Content-Length,向 Web 服务器发送数据时,该信息会告诉服务器该请求有多少数据,这样服务器能确保不会丢失任何数据。
  • Accept-Encoding,告诉 Web 服务器浏览器支持哪些类型的压缩方法,以便在互联网上传输数据时将数据压缩得更小。
  • Cookie,发送给 Web 服务器以让服务器记住关于用户的信息。

常见的 响应 headers 包含:

  • Set-Cookie,每次请求时需要发送回 Web 服务器的要存储的数据。
  • Cache-Control,再次请求之前,响应内容在浏览器缓存中的存储时间。
  • Content-Type,告知客户端返回的数据类型,如 HTML、图像、视频等。通过该信息,浏览器就能知道如何处理这些数据。
  • Content-Encoding,确定了压缩数据的方法。
Cookies

Cookies 是存储在用户电脑上的一小段数据,当用户从 Web 服务器上收到 Set-Cookie 头信息时,Cookie 就被保存下来了。之后,每一次请求都会向 Web 服务器发送这个 Cookie 数据。由于 HTTP 是无状态的,所以 Cookie 可以用于提示 Web 服务器用户的身份、用户是否登陆过、用户的个人设置等。

Cookie 示意图

Cookie 可以用于多种目的,但最常用于网站验证。Cookie 的值通常不是明文,而是不易被人猜到的唯一密文。

How websites work

当我们访问一个网页时,浏览器会向 Web 服务器发送请求,请求有关我们正在访问的页面的信息。网站由两个主要部分组成:

  • Front end (前端),用户侧,这是浏览器渲染网站的方式
  • Back end (后端),服务器侧,处理用户请求并响应

前端页面由 HTML、JavaScript、CSS 三部分组成。HTML 用于构建网站并定义其结构,JavaScript 用于实现交互功能,CSS 用来让网站更加漂亮。首先简单介绍 HTML。

HTML

HTML 是网站的编程语言,元素 (也被称为 标签)是 HTML 页面的组成部分,他告诉浏览器如何显示内容。比如下面就是一段 HTML 代码:

<!DOCTYPE html> <!-- 定义页面是 HTML5 文档-->
<html> <!-- HTML 页面的根元素 -->
    <head> <!-- 该元素包含有关页面的信息 -->
        <title>Page Title</title>
    </head>
    <body> <!-- 该元素定义 HTML 文档的正文 -->
        <h1>Example Heading</h1> <!-- 大标题元素-->
        <p>Example paragraph..</p> <!-- 段落元素 -->
    </body>
</html>

元素也可以包含一些属性,比如 class 属性,这样可以被用来为元素设计样式。一个元素可以有多个属性,每个属性都有自己独特的用途。

元素还可以拥有 唯一的 id属性,这是元素的唯一标识。id属性一般用于样式设计和 JavaScript 识别。

JavaScript

JavaScript (JS) 是世界上最流行的编程语言之一,可以让网页实现交互,如果没有 JS,那么网页就不会有互动元素。

JS 添加在页面源代码中,用 <script> 标记,也可以通过 src 属性远程包含。

Sensitive data exposure

假如网站没有适当保护终端用户的敏感明文信息时,就会发生敏感数据泄露。

如上图所示,通过开发者工具查看源代码后,发现其中出现了未被删除的敏感信息。这些情况往往是开发人员之前用于测试,但后面忘记删除导致。这种敏感数据泄露可能会被攻击者利用,扩大攻击面。

因此,在进行安全检查时,第一步就是查看源代码,看看是否有敏感信息泄露的问题。

HTML injection

HTML 注入指页面上显示未经过滤的用户输入时发生的漏洞。如果网站未对用户输入进行消毒和过滤,而该输入被用于该页面,则攻击者就可以在该网页中注入 HTML 代码。

如上图所示,网页并未对用户输入进行任何过滤。假设攻击者构建了一段恶意 HTML 或 JS 代码就会被直接执行。

上图可能还体现不出危害,那我们假设这样一个场景,网页在登录界面有 HTML 注入漏洞。攻击者可以构造一个恶意的表单提交元素 <form>,这样恶意表单会被执行。后面普通用户使用该表单进行登录时,其用户名和密码就被传输给攻击者了。

因此防止 HTML 注入漏洞的规则就是决不相信用户输入。为防止恶意输入,开发人员应该在使用用户输入前就对其内容进行过滤消毒。

Putting it all together

根据前面的介绍,可以总结出浏览器访问一个网页时它会进行的操作:

  1. 当我们请求网页时,电脑需要知道对应 Web 服务器的 IP 地址。这是需要使用 DNS 来获取。
  2. 获得 IP 地址后,将使用 HTTP 协议与服务器发起对话,请求网页资源。
  3. 服务器收到请求,将 HTML、JS、CSS、图像等信息响应回去。
  4. 浏览器收到这些信息,将其正确地格式化,显示出来。
Other components

在访问一个网页时,涉及到的技术绝对不止上述步骤所提到的。接下来会简要介绍几个可能会存在的技术。

Load balancers

Load balancers,负载均衡。当一个网站的流量相当巨大或者服务器要运行一个高可用性的应用程序时,一台服务器可能无法胜任。此时就可以架设多个服务器进行负载均衡,其一是可以确保高流量网站能处理负载,其二是当服务器反应迟钝时可以提供故障切换。

负载均衡在收到请求时会使用不同算法来确定选择哪个服务器处理请求,这些算法包括 round-robin (轮询算法,将请求依次发送到每个服务器) 和 weighted (加权算法,检查服务器当前处理的请求数,将请求发送给最不繁忙的服务器)。

负载均衡还会对每台服务器进行定期检查,确保它们运行正常,这叫做 health check。当服务器响应不当或没有响应,负载均衡将停止发送流量,直至服务器再次做出适当响应。

CDN

CDN (Content delivery networks),内容分发网络。CDN 允许托管网站上的静态文件到世界各地的服务器上。当用户请求网站时,CDN 会计算距离用户最近的服务器物理位置,并将请求发送到该服务器上。这有效地减少了网站访问时间。

Databases

数据库用于存储网站中的用户信息,Web 服务器可以与数据库通信,进而可以存储和调用其中的数据。常见的数据库有 MySQL、MSSQL、MongoDB、Postgres 等。

WAF

WAF (Web application firewall),网络应用防火墙。它位于网络请求到 Web 服务器之间,主要目的就是保护 Web 服务器免受黑客攻击或 DDos攻击。它能分析网络请求中常见的攻击技术,分析请求是否来自真正的浏览器而不是机器人。

How web servers work
Web server

Web 服务器是一种软件,它侦听传入的连接,然后利用 HTTP 协议向客户端传送网络内容。常见的 Web 服务器软件有 Apache、Nginx、IIS 和 NodeJS。Web 服务器本质上也是从软件设置中定义的根目录上传输文件。比如我们要请求一张图片,实际上 Web 服务器就在本地路径 /var/www/html/picture.jpg (假设是这个路径) 上将该图片传输过去。

Virtual host

虚拟主机。Web 服务器可以托管具有不同域名的多个网站,这就是基于 虚拟主机 技术做到的。Web 服务器会检查 HTTP 请求头中的 Host 字段,并将其与虚拟主机进行匹配,若匹配成功,则会提供正确的网站;不匹配的话则提供默认网站。

Static & dynamic content

静态内容就是永不改变的内容,如图片、JS代码、CSS、HTML等。这些文件都是直接从 Web 服务器发送而来,不会对其进行任何更改。

动态内容指可以随不同请求而改变的内容。比如博客首页会根据文章热度改变展示的博文,博客的搜索页面也会根据不同的搜索词显示不同结果。这些内容的更改都由后端完成,我们无法知道后端做了什么。

Scripting & backend languages

后端语言可以与数据库交互、调用外部服务、处理用户传入的数据等,这些正是网站与用户互动的关键所在。常见后端语言有 PHP、Python、Ruby、NodeJS、Perl 等。

在客户侧是看不到任何的后端语言代码的,因为它在后台完成活动。不过虽然看不到后端代码,但它们仍然会给 Web 程序带来安全问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2154503.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构】排序算法系列——快速排序(附源码+图解)

快速排序 接下来我们将要介绍的是排序中最为重要的算法之一——快速排序。 快速排序&#xff08;英语&#xff1a;Quicksort&#xff09;&#xff0c;又称分区交换排序&#xff08;partition-exchange sort&#xff09;&#xff0c;最早由东尼霍尔提出。快速排序通常明显比其…

XXL-JOB环境搭建

2.快速入门 2.1 下载源码 a.源码下载地址: github地址 gitee地址 2.2.环境搭建&#xff1a; a.初始化调度数据库: 1.请下载项目源码并解压&#xff0c;获取 “调度数据库初始化SQL脚本” 并执行即可 b.编译源码: 1.解压源码,按照maven格式将源码导入IDE, 使用maven进行…

【Python】使用国内镜像安装conda并创建python环境

conda介绍&#xff1a; Conda 是一个开源的包管理系统和环境管理系统&#xff0c;由 Continuum Analytics 开发。它的主要作用是简化科学计算中软件包和依赖的安装和升级&#xff0c;并允许用户轻松地在不同的环境中切换。Conda 的设计初衷是为了简化 Python 环境的搭建和管理&…

海洋大地测量基准与水下导航系列之二国外海底大地测量基准和海底观测网络发展现状(上)

海底大地控制网建设构想最先由美国斯克里普斯海洋研究所(Scripps Institution of Oceanography,SIO)提出&#xff0c;目前仅有少数发达国家具备相应技术条件。美国、日本、俄罗斯和欧盟等发达国家通过布测先进的海底大地控制网&#xff0c;不断完善海洋大地测量基准基础设施&am…

go 运行报错missing go.sum entry for module providing package

运行&#xff1a; #清理go.mod中不再需要的模块&#xff0c;并且会添加缺失的模块条目到go.sum中 go mod tidy

【全网最全】2024华为杯数学建模C题高质量成品查看论文!【附带全套代码+数据】

题 目&#xff1a; ___基于数据驱动下磁性元件的磁芯损耗建模 完整版获取&#xff1a; 点击链接加入群聊【2024华为杯数学建模助攻资料】&#xff1a;http://qm.qq.com/cgi-bin/qm/qr?_wv1027&kxtS4vwn3gcv8oCYYyrqd0BvFc7tNfhV7&authKeyedQFZne%2BzvEfLEVg2v8FOm%…

线段树优化dp,CF 413E - Maze 2D

目录 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 二、解题报告 1、思路分析 2、复杂度 3、代码详解 一、题目 1、题目描述 2、输入输出 2.1输入 2.2输出 3、原题链接 413E - Maze 2D 二、解题报告 1、思路分析 对于(li, l) -> (ri, r) …

nginx upstream转发连接错误情况研究

本次测试用到3台服务器&#xff1a; 192.168.10.115&#xff1a;转发服务器A 192.168.10.209&#xff1a;upstream下服务器1 192.168.10.210&#xff1a;upstream下服务器2 1台客户端&#xff1a;192.168.10.112 服务器A中nginx主要配置如下&#xff1a; log_format main…

接口加解密及数据加解密

目录 一、 加解密方式介绍 1.1 Hash算法加密 1.2. 对称加密 1.3 非对称加密 二、 我们要讲什么&#xff1f; 三、 接口加解密 四、 数据加解密 一、 加解密方式介绍 所有的加密方式我们可以分为三类&#xff1a;对称加密、非对称加密、Hash算法加密。 算法内部的具体实现…

Mysql高级篇(中)—— SQL优化之查询截取分析

SQL优化之查询截取分析 一、慢查询日志&#xff08;1&#xff09;简述&#xff08;2&#xff09;如何开启&#xff08;3&#xff09;慢查询日志分析工具介绍(了解)&#xff08;4&#xff09;官方工具 mysqldumpslow简述如何使用 二、SHOW PROCESSLIST三、&#xff08;了解&…

网络安全详解

目录 引言 一、网络安全概述 1.1 什么是网络安全 1.2 网络安全的重要性 二、网络安全面临的威胁 2.1 恶意软件&#xff08;Malware&#xff09; 2.2 网络钓鱼&#xff08;Phishing&#xff09; 2.3 中间人攻击&#xff08;Man-in-the-Middle Attack&#xff09; 2.4 拒…

让C#程序在linux环境运行

今晚花一些时间&#xff0c;总结net程序如何在linux环境运行的一些技术路线。 1、采用.Net Core框架 NET Core 使用了 .NET Core Runtime&#xff0c;它可以在 Windows、Linux 和 macOS 等多个操作系统上运行。可以采用Visual Studio生成Linux版本的dll。 在Linux系统中&…

救生圈检测系统源码分享

救生圈检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Visio…

Python基础学习(3)

目录 一&#xff0c;函数 1&#xff0c;函数的定义 2&#xff0c;函数的参数 1&#xff0c;默认值 2&#xff0c;传参 3&#xff0c;返回值 4&#xff0c;变量的作用域 5&#xff0c;函数的调用 二&#xff0c;常用数据结构 1&#xff0c;列表 列表的定义 列表的特性…

机器学习的应用领域

机器学习在许多领域有广泛的应用&#xff0c;下面列出了一些主要的应用领域及其典型应用&#xff1a; 1. 图像识别 人脸识别&#xff1a;用于解锁手机、自动标记照片、监控安全系统。物体识别&#xff1a;应用于自动驾驶汽车、机器人、医疗影像分析中&#xff0c;帮助机器理解…

vue3 TagInput 实现

效果 要实现类似于下面这种效果 大致原理 其实是很简单的,我们可以利用 element-plus 组件库里的 el-tag 组件来实现 这里我们可以将其抽离成一个公共的组件,那么现在有一个问题就是通讯问题 这里我们可以利用父子组件之间的通讯,利用 v-model 来实现,父组件传值,子组…

蓝桥杯15届C/C++B组省赛题目

问题描述 小蓝组织了一场算法交流会议&#xff0c;总共有 5050 人参加了本次会议。在会议上&#xff0c;大家进行了握手交流。按照惯例他们每个人都要与除自己以外的其他所有人进行一次握手 (且仅有一次)。但有 77 个人&#xff0c;这 77 人彼此之间没有进行握手 (但这 77 人与…

Unity数据持久化4——2进制

概述 基础知识 各类型数据转字节数据 文件操作相关 文件相关 文件流相关 文件夹相关 练习题 using System; using System.Collections; using System.Collections.Generic; using System.IO; using System.Text; using UnityEngine;public class Exercises1 : MonoBehaviour {/…

金融科技与银行业的数字化转型

随着科技的迅猛发展&#xff0c;金融科技已经成为推动银行业数字化转型的重要力量。从移动支付到区块链&#xff0c;再到人工智能&#xff0c;这些新兴技术正逐渐改变银行的运作方式&#xff0c;不断提高银行的服务效率、提升客户体验&#xff0c;并推动整个金融生态系统的变革…

大数据-143 - ClickHouse 集群 SQL 超详细实践记录!

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff08;已更完&#xff09;HDFS&#xff08;已更完&#xff09;MapReduce&#xff08;已更完&am…