TryHackMe 第3天 | Pre Security (二)

news2024/9/23 0:21:09

该学习路径讲解了网络安全入门的必备技术知识,比如计算机网络、网络协议、Linux命令、Windows设置等内容。上一篇中简短介绍了计算机网络相关的知识,本篇博客将记录 网络协议 部分。

How the web works?

DNS in detail

DNS (Domain name system,域名解析系统),它为我们提供了一种简单的方式去与互联网上的设备进行通信。

在网络中,数据包要依照 IP 地址来寻找目的地,对于设备而言,IP 地址非常清晰。但对于人类而言,如果要记住每一个想访问的页面的 IP 地址,似乎有点不太现实。因此人们采用域名来代替 IP 地址,日后人们只需要记住域名就可以,域名和 IP 地址之间的转换工作就交给 DNS 处理。这就是 DNS 的作用。

Domain hierarchy

域名也有对应的层次结构,如下图所示:

在域名中, 层级大小从右往左逐渐递减。按照图上内容,我们可以总结出域名的各层结构:

  • TLD (Top-level domain),顶级域名,位于域名最右边。最常见的顶级域名就是 .com。顶级域名一般有两种类型,gTLD ( generic TLD,通用顶级域名) 和 ccTLD (country code TLD,国家代码顶级域)。
  • Second-level domain,二级域名。以 baidu.com 为例,baidu 就是二级域名。在注册域名时,二级域名只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-”(不能以连字符开头或结尾,也不能有连续连字符)。
  • Subdomain,子域名。子域名位于二级域名左侧。以 pan.baidu.com 为例,pan 就是子域名。子域名和二级域名一样,只能使用 63 个字符,且只能使用 a-z 0-9 和 连字符 “-” 构成。子域名没有个数限制,但是必须保证整体的域名长度控制在 253 个字符以内。
DNS record type

DNS 不仅仅适用于网站,因为它还存在多种类型的 DNS record (DNS 记录)。

  • A record,该记录是 IPv4 地址解析结果
  • AAAA record,该记录是 IPv6 地址解析结果
  • CNAME record,该记录会解析到另一个域名上,也称 别名记录。比如 tryhackme 有一个商城子域名 store.tryhackme.com,它的 CNAME 记录为 shops.shopify.com,那么 DNS 的解析顺序就是 store.tryhackme.com --> shops.shopify.com --> shops.shopify.com 的 IP 地址。
  • MX record,该记录会解析到收件人域名的邮箱服务器。这样我们的邮件才能知道该发往何处。
  • TXT record,该记录是自由文本字段,可以存储任何基本文本的数据。该记录有多种用途,最常见的是列出有权代表域名发送电子邮件的服务器,这有助于打击垃圾邮件和识别是否为伪造身份的邮件。
DNS request

DNS 请求过程如下图所示:

  1. 请求域名时,计算机首先会查看本地缓存。若本地缓存存在,则直接使用;不存在就会向 Recursive DNS (递归DNS) 服务器发出请求。
  2. Recursive DNS 服务器通常由 ISP 提供,但也可以自行选择。收到请求后,递归 DNS 服务器也会先查询其本地缓存。若本地缓存中存在,则直接返回结果,请求结束;若无法找到,则会从 Root DNS (根 DNS) 服务器中进行寻找。
  3. 根 DNS 服务器是互联网的 DNS 主心骨,它们的工作是根据请求将其重定向到正确的 TLD (顶级域名) 服务器上。比如要访问 www.tryhackme.com,根 DNS 服务器会将其转给 .com 顶级域名服务器去处理。
  4. TLD 服务器保存的是能正确回应 DNS 请求的 Authoritative server (权威服务器)的记录。权威服务器也被称为域名的 nameserver (名称服务器)。一个域名通常会有多个名称服务器,以便在其中一个出现故障时作为备份。
  5. 权威 DNS 服务器负责存储特定域名的 DNS record,也负责对域名的 DNS record进行更新。根据记录的 record 类型不同,DNS record 会被发送回递归 DNS 服务器,在那里进行本地缓存,以便将来的请求,然后再将 DNS record 转发给发起请求的计算机。

HTTP in detail

HTTP (Hypertext transfer protocol),超文本传输协议。它是一套用于与网络服务器通信的规则,用于传输网页数据(包括 HTML、图像、视频等)。

HTTPS (Hypertext transfer protocol secure),是 HTTP 的安全版本。HTTPS 的数据经过加密,因此它能阻止别人看到你发送和接受的数据,也可以确保你在与正确的网络服务器沟通而不是和冒充的服务器。

Requests & responses

当我们访问网站时,浏览器需要向网络服务器发起 requests (请求),然后服务器再给我们 responses (响应)。

但在请求时,我们需要告诉浏览器访问这些资源的具体方式和它们所在的地点,这就是 URL (Uniform resource locator,统一资源定位器) 的作用所在。下图展示了 URL 的所有功能,但注意,不是所有的请求都会用到这些功能:

  • Scheme,它表明用何种协议访问资源,如 HTTP、HTTPS、FTP
  • User,有些服务需要认证身份,可以在 URL 中输入用户名和密码
  • Host (Domain),我们想访问的域名或 IP 地址
  • Port,我们想连接的端口号
  • Path,我们想访问的资源名字或位置
  • Query string,额外信息位,比如 /blog?id=1 就表示要访问 /blog 路径,且希望获得 id=1 的文章。
  • Fragment,对请求的实际页面上的某个位置的引用。通常用于内容较长的页面,可以直接链接到页面的某一部分。
HTTP methods

HTTP methods 是客户端发起 HTTP 请求时预期的一个操作。HTTP methods 有很多方法,但更常见的还是 GET 和 POST 方法。

  • GET,用于从 Web 服务器上获取资源
  • POST,用于向 Web 服务器提交数据,并可能创建新的记录
  • PUT,向 Web服务器提交数据以进行信息更新
  • DELETE,从 Web 服务器上删除信息或记录
HTTP status codes

当 Web 服务器响应了我们的 HTTP 请求时,它会发送一个 HTTP 响应数据包,其中就包含了 status codes (状态码)。这些状态码用于告知客户端请求的结果及可能的处理方式,一般可以分为五种:

  • 1xx,information response。告知客户端其请求的一部分已被接受,接下来应该继续发送请求的其余部分。
  • 2xx,success。告知客户端请求成功。
  • 3xx,redirection。告知客户端请求重定向到另一个资源。
  • 4xx,client errors。告知客户端请求出现了问题。
  • 5xx,server errors。告知客户端,服务器在处理请求时出现了问题。

常见的状态码如下表所示:

200 - OK请求成功
201 - Created资源已创建 (例如新用户或新的博文)
301 - Moved permanently将浏览器重定向到一个新网页,或告诉搜索引擎该网页已转移到其他地方
302 - Found与 301 类似,但不同的是该状态码表示暂时性的更改,在不久的将来可能会再次更改
400 - Bad request告诉浏览器请求中出现了错误或丢失了某些内容
401 - Not authorised未进行身份授权前,不允许查看该资源
403 - Forbidden无论用户是否登录,都没有权限访问该资源
404 - Page not found资源不存在
405 - Method not allowed资源不允许使用该请求方式请求
500 - Internal server error服务器在处理请求时遇到某种错误,无法正确处理
503 - Service unavailable服务器由于超负荷或正在进行维护,无法处理请求
Headers

Headers 信息分为 请求 headers 和 响应 headers。前者通常由客户端发送给 Web 服务器;后者是 Web 服务器对于客户端请求的响应。

常见的 请求 headers 包含:

  • Host,一些 Web 服务器上会托管多个网站,通过该信息可以告诉服务器要访问的网站,否则就是访问服务器的默认网站。
  • User-Agent,客户端的浏览器软件和版本号,告知服务器你使用的浏览器软件有助于它为你的浏览器正确格式化网站。
  • Content-Length,向 Web 服务器发送数据时,该信息会告诉服务器该请求有多少数据,这样服务器能确保不会丢失任何数据。
  • Accept-Encoding,告诉 Web 服务器浏览器支持哪些类型的压缩方法,以便在互联网上传输数据时将数据压缩得更小。
  • Cookie,发送给 Web 服务器以让服务器记住关于用户的信息。

常见的 响应 headers 包含:

  • Set-Cookie,每次请求时需要发送回 Web 服务器的要存储的数据。
  • Cache-Control,再次请求之前,响应内容在浏览器缓存中的存储时间。
  • Content-Type,告知客户端返回的数据类型,如 HTML、图像、视频等。通过该信息,浏览器就能知道如何处理这些数据。
  • Content-Encoding,确定了压缩数据的方法。
Cookies

Cookies 是存储在用户电脑上的一小段数据,当用户从 Web 服务器上收到 Set-Cookie 头信息时,Cookie 就被保存下来了。之后,每一次请求都会向 Web 服务器发送这个 Cookie 数据。由于 HTTP 是无状态的,所以 Cookie 可以用于提示 Web 服务器用户的身份、用户是否登陆过、用户的个人设置等。

Cookie 示意图

Cookie 可以用于多种目的,但最常用于网站验证。Cookie 的值通常不是明文,而是不易被人猜到的唯一密文。

How websites work

当我们访问一个网页时,浏览器会向 Web 服务器发送请求,请求有关我们正在访问的页面的信息。网站由两个主要部分组成:

  • Front end (前端),用户侧,这是浏览器渲染网站的方式
  • Back end (后端),服务器侧,处理用户请求并响应

前端页面由 HTML、JavaScript、CSS 三部分组成。HTML 用于构建网站并定义其结构,JavaScript 用于实现交互功能,CSS 用来让网站更加漂亮。首先简单介绍 HTML。

HTML

HTML 是网站的编程语言,元素 (也被称为 标签)是 HTML 页面的组成部分,他告诉浏览器如何显示内容。比如下面就是一段 HTML 代码:

<!DOCTYPE html> <!-- 定义页面是 HTML5 文档-->
<html> <!-- HTML 页面的根元素 -->
    <head> <!-- 该元素包含有关页面的信息 -->
        <title>Page Title</title>
    </head>
    <body> <!-- 该元素定义 HTML 文档的正文 -->
        <h1>Example Heading</h1> <!-- 大标题元素-->
        <p>Example paragraph..</p> <!-- 段落元素 -->
    </body>
</html>

元素也可以包含一些属性,比如 class 属性,这样可以被用来为元素设计样式。一个元素可以有多个属性,每个属性都有自己独特的用途。

元素还可以拥有 唯一的 id属性,这是元素的唯一标识。id属性一般用于样式设计和 JavaScript 识别。

JavaScript

JavaScript (JS) 是世界上最流行的编程语言之一,可以让网页实现交互,如果没有 JS,那么网页就不会有互动元素。

JS 添加在页面源代码中,用 <script> 标记,也可以通过 src 属性远程包含。

Sensitive data exposure

假如网站没有适当保护终端用户的敏感明文信息时,就会发生敏感数据泄露。

如上图所示,通过开发者工具查看源代码后,发现其中出现了未被删除的敏感信息。这些情况往往是开发人员之前用于测试,但后面忘记删除导致。这种敏感数据泄露可能会被攻击者利用,扩大攻击面。

因此,在进行安全检查时,第一步就是查看源代码,看看是否有敏感信息泄露的问题。

HTML injection

HTML 注入指页面上显示未经过滤的用户输入时发生的漏洞。如果网站未对用户输入进行消毒和过滤,而该输入被用于该页面,则攻击者就可以在该网页中注入 HTML 代码。

如上图所示,网页并未对用户输入进行任何过滤。假设攻击者构建了一段恶意 HTML 或 JS 代码就会被直接执行。

上图可能还体现不出危害,那我们假设这样一个场景,网页在登录界面有 HTML 注入漏洞。攻击者可以构造一个恶意的表单提交元素 <form>,这样恶意表单会被执行。后面普通用户使用该表单进行登录时,其用户名和密码就被传输给攻击者了。

因此防止 HTML 注入漏洞的规则就是决不相信用户输入。为防止恶意输入,开发人员应该在使用用户输入前就对其内容进行过滤消毒。

Putting it all together

根据前面的介绍,可以总结出浏览器访问一个网页时它会进行的操作:

  1. 当我们请求网页时,电脑需要知道对应 Web 服务器的 IP 地址。这是需要使用 DNS 来获取。
  2. 获得 IP 地址后,将使用 HTTP 协议与服务器发起对话,请求网页资源。
  3. 服务器收到请求,将 HTML、JS、CSS、图像等信息响应回去。
  4. 浏览器收到这些信息,将其正确地格式化,显示出来。
Other components

在访问一个网页时,涉及到的技术绝对不止上述步骤所提到的。接下来会简要介绍几个可能会存在的技术。

Load balancers

Load balancers,负载均衡。当一个网站的流量相当巨大或者服务器要运行一个高可用性的应用程序时,一台服务器可能无法胜任。此时就可以架设多个服务器进行负载均衡,其一是可以确保高流量网站能处理负载,其二是当服务器反应迟钝时可以提供故障切换。

负载均衡在收到请求时会使用不同算法来确定选择哪个服务器处理请求,这些算法包括 round-robin (轮询算法,将请求依次发送到每个服务器) 和 weighted (加权算法,检查服务器当前处理的请求数,将请求发送给最不繁忙的服务器)。

负载均衡还会对每台服务器进行定期检查,确保它们运行正常,这叫做 health check。当服务器响应不当或没有响应,负载均衡将停止发送流量,直至服务器再次做出适当响应。

CDN

CDN (Content delivery networks),内容分发网络。CDN 允许托管网站上的静态文件到世界各地的服务器上。当用户请求网站时,CDN 会计算距离用户最近的服务器物理位置,并将请求发送到该服务器上。这有效地减少了网站访问时间。

Databases

数据库用于存储网站中的用户信息,Web 服务器可以与数据库通信,进而可以存储和调用其中的数据。常见的数据库有 MySQL、MSSQL、MongoDB、Postgres 等。

WAF

WAF (Web application firewall),网络应用防火墙。它位于网络请求到 Web 服务器之间,主要目的就是保护 Web 服务器免受黑客攻击或 DDos攻击。它能分析网络请求中常见的攻击技术,分析请求是否来自真正的浏览器而不是机器人。

How web servers work
Web server

Web 服务器是一种软件,它侦听传入的连接,然后利用 HTTP 协议向客户端传送网络内容。常见的 Web 服务器软件有 Apache、Nginx、IIS 和 NodeJS。Web 服务器本质上也是从软件设置中定义的根目录上传输文件。比如我们要请求一张图片,实际上 Web 服务器就在本地路径 /var/www/html/picture.jpg (假设是这个路径) 上将该图片传输过去。

Virtual host

虚拟主机。Web 服务器可以托管具有不同域名的多个网站,这就是基于 虚拟主机 技术做到的。Web 服务器会检查 HTTP 请求头中的 Host 字段,并将其与虚拟主机进行匹配,若匹配成功,则会提供正确的网站;不匹配的话则提供默认网站。

Static & dynamic content

静态内容就是永不改变的内容,如图片、JS代码、CSS、HTML等。这些文件都是直接从 Web 服务器发送而来,不会对其进行任何更改。

动态内容指可以随不同请求而改变的内容。比如博客首页会根据文章热度改变展示的博文,博客的搜索页面也会根据不同的搜索词显示不同结果。这些内容的更改都由后端完成,我们无法知道后端做了什么。

Scripting & backend languages

后端语言可以与数据库交互、调用外部服务、处理用户传入的数据等,这些正是网站与用户互动的关键所在。常见后端语言有 PHP、Python、Ruby、NodeJS、Perl 等。

在客户侧是看不到任何的后端语言代码的,因为它在后台完成活动。不过虽然看不到后端代码,但它们仍然会给 Web 程序带来安全问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2156200.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

19 基于51单片机的倒计时音乐播放系统设计

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 五个按键&#xff0c;分别为启动按键&#xff0c;则LCD1602显示倒计时&#xff0c;音乐播放 设置按键&#xff0c;可以设置倒计时的分秒&#xff0c;然后加减按键&#xff0c;还有最后一个暂停音乐…

基于 Web 的工业设备监测系统:非功能性需求与标准化数据访问机制的架构设计

目录 案例 【说明】 【问题 1】(6 分) 【问题 2】(14 分) 【问题 3】(5 分) 【答案】 【问题 1】解析 【问题 2】解析 【问题 3】解析 相关推荐 案例 阅读以下关于 Web 系统架构设计的叙述&#xff0c;回答问题 1 至问题 3 。 【说明】 某公司拟开发一款基于 Web 的…

BERT的代码实现

目录 1.BERT的理论 2.代码实现 2.1构建输入数据格式 2.2定义BERT编码器的类 2.3BERT的两个任务 2.3.1任务一&#xff1a;Masked Language Modeling MLM掩蔽语言模型任务 2.3.2 任务二&#xff1a;next sentence prediction 3.整合代码 4.知识点个人理解 1.BERT的理论 B…

代码随想录算法训练营第58天|卡码网 117. 软件构建、47. 参加科学大会

1. 卡码网 117. 软件构建 题目链接&#xff1a;https://kamacoder.com/problempage.php?pid1191 文章链接&#xff1a;https://www.programmercarl.com/kamacoder/0117.软件构建.html 思路&#xff1a;使用BFS BFS的实现思路&#xff1a; 拓扑排序的过程&#xff0c;其实就两步…

Java : 图书管理系统

图书管理系统的作用&#xff1a; 高效的图书管理 图书管理系统通过自动化管理&#xff0c;实现了图书的采编、编目、流通管理等操作的自动化处理&#xff0c;大大提高了图书管理的效率和准确性。 工作人员可以通过系统快速查找图书信息&#xff0c;实时掌握图书的借还情况&…

经典报童问题的2类扩展实例:带广告的报童问题和多产品报童问题

文章目录 1 引言2 经典报童问题3 带广告的报童问题3.1 论文解读3.2 样本均值近似方法 4 多产品报童问题4.1 论文解读4.2 算法模型4.3 简单实例求解4.4 复杂实例求解 5 总结6 相关阅读 1 引言 中秋已过&#xff0c;国庆未至&#xff0c;趁着这个空窗期&#xff0c;学点新知识&a…

解决DockerDesktop启动redis后采用PowerShell终端操作

如图&#xff1a; 在启动redis容器后&#xff0c;会计入以下界面 &#xff1a; 在进入执行界面后如图&#xff1a; 是否会觉得界面过于单调&#xff0c;于是想到使用PowerShell来操作。 步骤如下&#xff1a; 这样就能使用PowerShell愉快地敲命令了&#xff08;颜值是第一生…

AttributeError: ‘Sequential‘ object has no attribute ‘predict_classes‘如何解决

今天跟着书敲代码&#xff0c;报错&#xff1a; Sequential object has no attribute predict_classes&#xff0c;如图所示&#xff1a; 上网百度&#xff0c;发现predict_classes函数在新版本中已经删除了&#xff0c;需要使用 model.predict() 替代 model.predict_classes()…

【java面经速记】Mysql和ES数据同步

目录 Mysql业务数据库 ES查询数据库 数据同步方案 同步双写 异步双写&#xff08;MQ方式&#xff09; 基于Mysql的定时扫描同步 基于Binlog实时同步 使用canal监听binlog同步数据到es&#xff08;流行方案&#xff09; 拓展:mysql的主从复制原理 canal原理&#xff1a…

Via浏览器自动关闭CSDN弹窗

不知道大家有没有突发灵感迫切需要在手机上搜索一些技术性博客的时候。 不知道大家是不是搜索到的基本都是CSDN的文章。 不知道大家是否也被CSDN各种弹窗确认搞得心态爆炸。 不知道大家现在在手机上用的是什么浏览器&#xff0c;一直以来&#xff0c;我用的都是夸克&#xf…

时钟的配置

在使用51单片机时&#xff0c;系统使用的时钟源是一个外部晶体振荡器&#xff0c;频率为12M。由于51单片机每个指令周期都是12分频的&#xff0c;所以实际工作频率仅为1M。2440作为一种性能远高于51的Soc&#xff0c;主频肯定要远远高于51&#xff0c;因此2440有着比51单片机复…

【Android】DataBinding的运用

引言 之前对databinding有了基础的运用与介绍&#xff0c;但databinding的用处不单单在于Text的绑定&#xff0c;接下来就一起看看吧&#xff01; 意义&#xff1a;让布局文件承担了部分原本属于页面的工作&#xff0c;使页面与布局耦合度进一步降低。允许用户界面&#xff0…

Maven-一、分模块开发

Maven进阶 文章目录 Maven进阶前言创建新模块向新模块装入内容使用新模块把模块部署到本地仓库补充总结 前言 分模块开发可以把一个完整项目中的不同功能分为不同模块管理&#xff0c;然后模块间可以相互调用&#xff0c;该篇以一个SSM项目为目标展示如何使用maven分模块管理。…

操作系统之I/O设备管理

I/O系统的组成 I/O系统的结构 微机I/O系统 总线型I/O系统结构,CPU与内存之间可以直接进行信息交换&#xff0c;但是不能与设备直接进行信息交换&#xff0c;必须经过设备控制器。 主机I/O系统 I/O系统可能采用四级结构&#xff0c;包括主机、通道、控制器和设备。一个通道…

神经网络面试题目

1. 批规范化(Batch Normalization)的好处都有啥&#xff1f;、 A. 让每一层的输入的范围都大致固定 B. 它将权重的归一化平均值和标准差 C. 它是一种非常有效的反向传播(BP)方法 D. 这些均不是 正确答案是&#xff1a;A 解析&#xff1a; ‌‌‌‌  batch normalization 就…

TikTokDownloader 开源项目操作教程

TikTokDownloader TikTokDownloader 是一个开源的多功能视频下载工具&#xff0c;它专门用于从抖音和TikTok平台下载无水印的视频、图集和直播内容。这个工具支持批量下载账号作品、收藏内容&#xff0c;并可以采集详细数据。它提供了命令行和Web界面&#xff0c;具有多线程下…

图像处理基础知识点简记

简单记录一下图像处理的基础知识点 一、取样 1、释义 图像的取样就是图像在空间上的离散化处理,即使空间上连续变化的图像离散化, 决定了图像的空间分辨率。 2、过程 简单描述一下图象取样的基本过程,首先用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个…

re题(38)BUUCTF-[FlareOn6]Overlong

BUUCTF在线评测 (buuoj.cn) 运行一下.exe文件 查壳是32位的文件&#xff0c;放到ida反汇编 对unk_402008前28位进行一个操作&#xff0c;我们看到运行.exe文件的窗口正好是28个字符&#xff0c;而unk_402008中不止28个数据&#xff0c;所以猜测MessageBoxA&#xff08;&#x…

十一、 JDK17 新特性梳理

文章目录 为什么是JDK17语法层面新特性1、文本块2 、Switch 表达式增强3、instanceof的模式匹配4、var 局部变量推导 模块化及类封装1、记录类 record2 、隐藏类 Hidden Classes3 、密封类 Sealed Classes4、模块化 Module System1 、什么是模块化2、声明一个module3 、require…

从零开始讲DDR(4)——Xilinx方案

本文依据的是xilinx的PG150文档&#xff0c;主要介绍的是xilinx的ultrascale系列中内存资源的使用。 一、方案概述 Xilinx UltraScale™架构中的DDR3/DDR4 SDRAM ip核旨在支持高性能的内存接口解决方案。这些ip可以用于将DDR3和DDR4 SDRAM内存类型集成到设计中&#xff0c;提供…