【计算机网络-自顶向下方法】应用层(HTTP、FTP)

news2024/12/22 20:20:18

1. Principles of network applications

创建一个网络应用

  创建一个网络应用的核心,是编写一个分布式程序,使其可以运行在不同的端系统上,并能通过网络相互通信。(例如,web服务器软件与浏览器软件)
  应用程序只运行在终端上(只在端系统上开发应用),应用程序员不需要为网络核心设备编写程序,我们默认可以调用一些API,这极大地方便了网络应用的开发和快速部署。
  我们不需要为网络核心设备编写程序的原因:一方面会浪费大量的时间与精力,另一方面网络的核心设备我们是不接触不到的。

1.1 网络应用架构

  在开发一个应用程序之前,首先要决定采用什么样的网络应用架构,网络应用架构规定了在各个端系统上组织应用程序的方法,目前有两种主流的网络应用架构:

  • 客户-服务器架构(Client-server) 中心化的架构
  • 对等架构(Peer-to-peer ,P2P) 没有服务器的概念
1.1.1 客户-服务器架构

服务器(server)

  • 有一台总是在线的主机,上面运行着服务器程序 (server) (有请求要及时响应请求)。
  • 服务器主机 (server machine) 具有永久的、众所周知的地址。
  • 服务器端会在很多地方部署大量的计算集群

客户(client)

  • 用户终端上运行一个客户程序 (client),需要时与服务器程序通信,请求服务。
  • 客户机(client machine)使用动态地址,通常不会总是在线

  客户只与服务器通信,客户之间不通信

1.1.2 P2P架构
  • 没有总是在线的服务器主机。
  • 任意一对端系统(对等方)可以直接通信。
  • 对等方多为用户自己的计算机,使用动态地址。
  • 每个对等方既可请求服务,也可提供服务。
  • 典型的P2P应用:BT、迅雷、Skype、PPLive。
1.1.3 两种架构的比较
客户-服务器架构P2P架构
资源集中:资源(服务)只在某些固定的终端上提供资源分散:任何终端都可以提供资源(服务)
优点:资源发现简单优点:易于扩容、均衡网络流量
缺点:集中式计算带来的问题,如服务端扩容压力、网络流量不均衡、响应延迟长缺点:资源发现困难,社会问题(版权、安全性等)
1.2 不同终端上的进程通信

  进程: 主机上运行的程序.

  在同一台主机中,由操作系统来提供进程之间的通信。在不同的主机上,通过交换报文进行通信。在一次确定的通信会话中,总能标示一方为客户进程,另一方为服务器进程:

  • 客户进程:主动发起请求的进程
  • 服务器进程:接收请求的进程

套接字(socket):进程与网络的接口(应用程序和网络之间的一扇门)。

  • 发送报文:发送进程将报文推到门外
  • 门外的运输设施(因特网)将报文送到接收进程的门口
  • 接收报文:接收进程打开门,即可收到报文

套接字是应用层和传输层的接口,也是应用程序和网络之间的API。
在这里插入图片描述
  每个进程需要一个标识,以便其它进程能够找到它,那么进程如何该如何标识自己?可以用进程所在主机的地址来标识进程吗?

答案是不能,因为同一个主机上可能运行着许多进程,我们用端口号来区分同一个主机上的不同进程

进程标识包括:

  • 主机地址
  • 与该进程关联的端口号

端口号的例子:HTTP server使用端口80,Mail server使用端口25

1.3 应用需要什么样的传输服务

  在创建一个应用程序时,开发者需要选定一种传输服务。

  1. Data integrity(数据完整性)
    • 有些应用(如音视频)可以容忍一定程度的数据丢失。
    • 有些应用(如加密的文件)要求完全可靠的数据传输。
  2. Timing(时效性)
    • 有些应用(如网络电话,交互式网络游戏)要求延迟保证。
    • 有些应用(如邮件传输)对延迟不敏感。
  3. Throughput(吞吐量)
    • 有些应用(如多媒体)要求保证最低可用带宽。
    • 有些应用(称弹性应用,微信文字信息)可以适应各种可能的带宽。
  4. Security
    • 加密,数据完整性,……
1.4 因特网能够提供的传输服务

  因特网提供2种传输服务,分别用TCP和UDP协议实现。

  1. TCP service:
    • 面向连接:保证传输顺序。
    • 可靠传输:不出错。
    • 流量控制:发送进程不会“压垮”接收进程。
    • 拥塞控制: 网络超载时抑制发送进程。
    • 不提供:及时性,最低带宽保证,安全性
  2. UDP service:
    • 通过因特网接收和发送报文。
    • 不提供:顺序保证,可靠传输,流量控制,拥塞控制,及时性,最低带宽保证,安全性。
    • 相对于TCP延迟相对小一点,但可能会丢包。
1.5 应用层协议
  1. 应用层协议定义:
    • 报文类型:request, response
    • 报文语法:报文中的字段及其描述。
    • 报文语义:各字段中信息的含义。
    • 发送/响应报文应遵循的规则。
  2. 公共域协议:
    • 在RFC文档中定义。
    • 允许互操作。
    • e.g., HTTP, SMTP
  3. 专用协议:
    • e.g., Skype
1.6 小结
  1. 为创建一个新的网络应用,需要:
    • 选择一种网络应用架构:客户-服务器 or P2P
    • 选择一种网络服务:TCP or UDP
    • 确定一个端口号
    • 定义应用层协议(可以用已有的协议,如HTTP…)
    • 编写客户程序和服务器程序(调用套接字接口)
  2. 网络应用和应用层协议:
    • 应用层协议只是网络应用的一部分
    • 网络应用还包括客户程序、服务器程序等
  3. 要求掌握的概念:
    • 客户-服务器模型
    • 网络应用编程接口

2. Web and HTTP

Web应用画像
  1. 应用层资源:网页(web pages)
  2. 网络应用架构:客户-服务器架构
    • 客户:浏览器
    • 服务器:web服务器
  3. 要求的网络服务:TCP服务
  4. 端口号:80
  5. 应用层协议:HTTP(Hyper Text Transfer Protocol)HTTPS(在安全性能上做了优化)
一些术语
  • Web page由一些对象(object)组成。
  • 对象简单来说就是文件,可以是HTML文件、图像、Java小程序、音频文件,…
  • 每个对象通过一个URL (Uniform Resource Locator) 获取,例如:
    在这里插入图片描述
  • HTML(Hyper Text Markup Language)是一种格式语言,用于描述页的内容和显示方式。
  • HTML文件是用HTML语言编写的超文本文件,需要通过专门的浏览器软件进行展示。
  • Web页通常包含一个HTML基本文件和若干引用对象,每个引用对象在文档中用其URL给出。
  • 超文本文件:包含超链接的文件,超链接中的文字包含有连接到文档中其他位置或者其它文档的链接,允许从当前阅读位置直接切换到超链接所指向的位置。
  • 超文本(Hyper text):一种信息组织方式,通过超链接将各种不同空间的文字信息组织成网状文本。
2.1 超文本传输协议–HTTP 概述

Web采用客户-服务器模式:

  • client: 浏览器请求、接收和显示web对象。
  • server: Web服务器应客户请求发送对象。

HTTP协议:定义了浏览器和web服务器之间的通信规则。

HTTP的主要版本:HTTP 1.0(RFC 1945)和 HTTP 1.1(RFC 2068)

HTTP为什么要使用TCP服务:Web服务器并不保留客户所请求的信息,HTTP协议是无状态的,为了发送文件的稳定。

HTTP使用TCP服务过程:

  • 客户发起到服务器 80 端口的 TCP 连接(客户端创建一个套接字)
  • 服务器接受(服务器端监听80端口)来自客户的TCP连接(服务器端创建一个套接字)
  • 浏览器和服务器交换HTTP报文 (通过各自的套接字)
  • 关闭TCP 连接(关闭各自的套接字)
2.2 非持久连接和持久连接

主要区别:在一个TCP连接上只能传输一个对象还是能传输多个对象。

2.2.1 非持久 HTTP
  • 在一个TCP连接上最多发送一个对象。
  • HTTP/1.0 使用非持久连接。

内容获取过程:

  假设用户输入以下URL:http://www.someSchool.edu/someDepartment/home.index (包含文本及10个Jpeg图像)

  1. HTTP客户发起到以下HTTP 服务器进程的连接 www.someSchool.edu on port 80。
  2. www.someSchool.edu上的HTTP服务器在端口80等待TCP连接,接受连接,并通知客户。(建立连接)
  3. HTTP客户将一个HTTP请求报文(包含URL)写入它的套接字,报文指示希望获取以下对象:someDepartment/home.index
  4. HTTP服务器接收请求报文,构造包含所请求对象的响应报文,将报文写入它的套接字中。(请求对象)
  5. HTTP 服务器关闭TCP连接。(关闭连接)
  6. HTTP 客户接收包含HTML文件的响应报文,显示HTML文件,解析文件发现有10个引用的jpeg对象。
  7. 对于每个jpeg对象,重复步骤 1-6(要进行十次)。

非持久HTTP的响应时间:

  RTT (Round-Trip Time):一个小分组从客户发送到服务器,再返回客户的时间。

相应的时间主要包括:

  • 建立TCP连接用时一个RTT。
  • 发送HTTP请求至收到响应的前几个字节用时一个RTT。
  • 传输文件的时间。

  请求一个对象用时2RTT(忽略对象传输时间),则上面题目中请求一个完整的网页用时22RTT(11个对象)

非持久HTTP 的问题:

  获取每个对象需要一次TCP连接,每个TCP连接需要消耗操作系统资源,浏览器需要打开多个TCP连接来获取一个网页。

2.2.2 持久 HTTP
  • 在一个TCP连接上可以发送多个对象。
  • HTTP/1.1 缺省使用持久连接。
  • 服务器在发送响应后保持连接。
  • 同一对客户-服务器之间的后续HTTP报文可以在该连接上传输。

持久HTTP又分为:

  • 无流水线方式:客户仅当收到前一个响应后再发送新的请求(串行)。
  • 流水线方式:客户每解析到一个引用对象就可以发送请求,可在一个RTT时间内请求所有引用对象。

针对上面的问题:

  • 无流水线方式:需要花费12个RTT(一次TCP连接、显示HTML文件的请求、10个文件的10次请求)。
  • 流水线方式:只需花费3个RTT(一次TCP连接、显示HTML文件的请求、10个文件的1次请求)。
2.3 HTTP 报文格式
  1. 请求报文:客户发往服务器
  2. 响应报文:服务器发往客户

 HTTP报文由ASCII文本构成。

 HTTP请求报文:

HTTP请求报文:

报头包括:
在这里插入图片描述
上传表单输入:

  • Post 方法
    • Web页通常包含表单输入。
    • 输入的表单内容放在报文体中上传到服务器。
  • URL 方法
    • 使用 GET 方法。
    • 输入内容放在请求行的URL字段中上传,如:www.somesite.com/animalsearch?monkeys&banana。

HTTP方法:
在这里插入图片描述
HTTP 响应报文:
在这里插入图片描述
HTTP 响应状态代码:
在这里插入图片描述

2.4 用户与服务器交互: cookie

四个组成部分:

  • HTTP响应报文中的cookie首部行。
  • HTTP请求报文中的cookie 首部行。
  • 保存在用户主机的cookie文件,由用户的浏览器管理。
  • Web网站的后端数据库。

例子:Susan第一次访问某个电子商务网站,当HTTP请求报文到达该网站时,网站为其创建:

  • 一个ID
  • 在后端数据库中为该ID建立一个表项。

Cookies: 保存"状态":
在这里插入图片描述

Cookies交互的两种方式:

  • 服务端:信息保存在服务端的后端数据库,返回ID给客户。
  • 客户端:信息发回客户端,保存在cookie文件中,并随请求报文发送给服务器。
2.5 Web缓存(代理服务器)

在这里插入图片描述

代理服务器: 代表原始服务器满足HTTP请求的网络实体,保存最近请求过的对象的拷贝。

用户要设置浏览器:所有HTTP请求首先发往web缓存。

浏览器将HTTP请求发送给web缓存:

  • 对象在web缓存中: web缓存返回对象。
  • 对象不在web缓存中:web缓存从原始服务器获取对象,缓存在本地,然后返回给客户。

Q:web缓存如何知道对象的原始服务器?
A: HTTP请求头中的host首部行指出了原始服务器

Web cache既是服务器又是客户:

  • 对于浏览器来说是服务器。
  • 对于原始服务器来说是客户。

  Web cache通常由ISP提供,多级ISP可能形成多级web缓存。

Web caching 的作用:

  • 减少客户请求的响应时间。
  • 减少机构接入链路上的流量。

Cache Example:
原始:

链路升级:

安装Web Cache:
在这里插入图片描述

2.6 条件 GET

代理服务器如何发现缓存的对象是不是最新的?
在这里插入图片描述

2.7 小结
  • 因特网上的每个资源(对象)都可以通过URL访问
  • HTTP使用TCP连接
    • 非持续HTTP
    • 持续HTTP
  • 客户与服务器交互:
    • 报文请求/响应
  • HTTP服务器是无状态的,利用cookie技术可以保存用户状态
  • 使用web缓存提高请求-响应速度:
    • 使用条件get获得最新的对象副本

3. File Transfer and FTP

3.1 文件传输应用画像

在这里插入图片描述

  • 应用层资源:文件
  • 网络应用架构:客户-服务器
  • 使用传输服务:TCP
  • 端口号:21、20
  • 应用层协议:FTP
    • 使用命令/响应交互(不是像HTTP那样使用报文交互)
    • 通常情况下,用户通过FTP用户代理与文件服务器交互
3.2 FTP用户代理

在这里插入图片描述

3.3 使用分离的控制连接和数据连接

在这里插入图片描述

  • 控制连接:
    • 使用端口21,传送客户命令和服务器响应。
    • 控制连接在整个会话期间一直保持。
  • 数据连接:
    • 使用端口20,传输文件。
    • 每个数据连接只传输一个文件,发送方用关闭连接表示一个文件传输结束。
3.4 建立连接
  1. 服务器在端口21等待客户。
    在这里插入图片描述

  2. 客户使用临时端口号建立连接。
    在这里插入图片描述

  3. 客户选择一个临时端口号,在该端口上等待服务器的连接请求。
    在这里插入图片描述

  4. 客户在控制连接上用PORT命令将临时端口号发送给服务器。
    在这里插入图片描述

  5. 服务器使用端口20与客户机给出的端口建立连接。
    在这里插入图片描述

3.5 有关控制连接与数据连接的问题

Q:为什么将控制连接与数据连接分开?
A:不会混淆数据与命令/响应,简化协议设计和实现;在传输文件的过程中可以继续执行其它的操作;便于控制传输过程(如客户可以随时终止传输)

Q:为什么用关闭数据连接的方式结束文件传输?
A:允许动态创建文件(不需预先告知文件的大小)

3.6 FTP小结
  • 使用TCP协议,服务器端口号21、20
  • 采用命令/响应交互方式
  • 使用两条TCP连接:
    • 控制连接(端口21):会话期间始终保持
    • 数据连接(端口20):每条连接仅传输一个文件,且客户与服务器角色交换

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1066980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

为什么很多编程语言中数组都是从0开始编号?

文章来源于极客时间前google工程师−王争专栏。 如何实现随机访问? 什么是数组? 数组(Array)是一种线性表数据结构。它用一组连续的内存空间,来存储一组具有相同类型的数据。 线性表,顾名思义,线性表就…

林沛满-TCP之在途字节数

本文整理自:《Wireshark网络分析的艺术 第1版》 作者:林沛满 著 出版时间:2016-02 我一直谨记斯蒂芬霍金的金玉良言—每写一道数学公式就会失去一半读者。不过为了深度分析网络包,有时候是不得不计算的,好在小学一年级…

DirectX12_Windows_GameDevelop_3:Direct3D的初始化

引言 查看龙书时发现,第四章介绍预备知识的代码不太利于学习。因为它不像是LearnOpenGL那样从头开始一步一步教你敲代码,导致你没有一种整体感。如果你把它当作某一块的代码进行学习,你跟着敲会发现,总有几个变量是没有定义的。这…

【C++设计模式之策略模式】分析及示例

描述 策略模式(Strategy Pattern)是一种行为型设计模式,它允许在运行时根据不同的情况选择算法的行为。该模式将算法的定义封装成一组易于切换和替换的类,使得算法可以独立于其使用者进行变化。 原理 策略模式通过将具体的算法…

FastThreadLocal 快在哪里 ?

FastThreadLocal 快在哪里 ? 引言FastThreadLocalset如何获取当前线程私有的InternalThreadLocalMap ?如何知道当前线程使用到了哪些FastThreadLocal实例 ? get垃圾回收 小结 引言 FastThreadLocal 是 Netty 中造的一个轮子,那么为什么放着…

前端到底有多卷?可以转行吗?

我前几天招人,前后端各招一个人。 后端一天大概60多个投简历的。 前端岗位发出去,我吃了个饭,1小时回来 收到300多份简历…… 是一位HR回复的前端卷到什么程度的回答! 下面我们来看两组官方纰漏的数据: 2023届全国高…

Git 学习笔记 | Git 的简介与历史

Git 学习笔记 | Git 的简介与历史 Git 学习笔记 | Git 的简介与历史Git 简介Git 历史 Git 学习笔记 | Git 的简介与历史 Git 简介 Git是分布式版本控制系统(Distributed Version Control System,简称 DVCS),分为两种类型的仓库&…

100M跨境电商服务器能同时容纳多少人访问?

​  随着“出国”“出海”需求的业务量增多,网络的不断发展,服务商开始在带宽资源配备上作出各种改进。无论是纯国际带宽还是优化回国带宽租用,我们都可以独享,并且享受到大带宽。一般,做跨境电商业务的群体&#xf…

黑客都是土豪吗?真实情况是什么?

黑客的利益链条真的这么大这么好么,连最外围的都可以靠信息不对称赚普通人大学毕业上班族想都不敢想的金钱数目,黑客们是不是基本都是土豪 网络技术可以称为黑客程度的技术是不是真的很吃香?如果大部分大学生的智力资源都用在学习网络技术,会不会出现僧…

如何杜绝聊天泄密事件的发生呢(企业如何管理通讯工具,防止员工聊天泄密)

在现代企业中,员工之间的沟通是必不可少的。然而,随着科技的发展,员工聊天泄密的风险也日益增加。企业需要采取一系列措施来防止员工聊天泄密,以保护企业的核心竞争力和商业机密。本文将介绍一些有效的防止员工聊天泄密的方法。 1…

PHP8的匿名类-PHP8知识详解

PHP8支持通过new class 来实例化一个匿名类。所谓匿名类,就是指没有名称的类,只能在创建时使用new语句来声明它们。 匿名类是一种没有命名的即时类,可以用于简单的对象封装和实现接口。 以下是PHP 8中匿名类的基本语法示例: $ob…

Springboot使用Aop保存接口请求日志到mysql(及解决Interceptor拦截器中引用mapper和service为null)

一、Springboot使用Aop保存接口请求日志到mysql 1、添加aop依赖 <!-- aop日志 --><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-aop</artifactId></dependency> 2、新建接口保存数据…

VsCode 常见的配置、常用好用插件

1、自动保存&#xff1a;不用装插件&#xff0c;在VsCode中设置一下就行 2、设置ctr滚轮改变字体大小 3、设置选项卡多行展示 这样打开了很多个文件&#xff0c;就不会导致有的打开的文件被隐藏 4、实时刷新网页的插件&#xff1a;LiveServer 5、open in browser 支持快捷键…

FM100/FM101协议系列-快速充电接口芯片

产品描述&#xff1a; FM100/FM101是一款支持Quick Charge 2.0&#xff08;QC 2.0&#xff09;快速充电协议的充电接口控制器 IC&#xff0c;可自动识别快速充电设备类型&#xff0c;并通过QC2.0协议与设备握手&#xff0c;使之获得设备允许的安全最高充电电压&#xff0c;在保…

为什么程序员必须坚持写技术博客?

当你申请一份工作的时候&#xff0c;你的简历通常大概只有两页的篇幅。当你接受面试的时候&#xff0c;你通常会跟面试官聊上一两个小时。以如此简短的简历和如此短暂的面试来评估一名软件开发人员的技能非常困难&#xff0c;所以雇主以此判定某个人是否适合某个工作岗位也颇具…

VB.NET vs. VB6.0:现代化编程语言 VS 经典老旧语言

目录 ​.NET背景&#xff1a; 特点: VB6.0背景&#xff1a; 特点: 两者之间的不同: 总结: 升华: .NET背景&#xff1a; VB.NET一种简单&#xff0c;现代&#xff0c;面向对象计算机编程语言&#xff0c;有微软开发&#xff0c;VB.NET是一种基于.NET Framework的面向对象…

基于Dockerfile搭建LNMP

目录 一、基础环境准备 1、环境前期准备 二、部署nginx&#xff08;容器IP 为 172.18.0.10&#xff09; 1、配置Dockerfile文件 2、配置nginx.conf文件 3、构建镜像、启动镜像 三、部署mysql 1、配置Dockerfile文件 2、配置my.conf文件 3、构建镜像、启动镜像 5、验…

Linux 基本指令(上)

文章内容&#xff1a; 1. ls 指令 语法&#xff1a; ls [选项][目录或文件] 功能&#xff1a;对于目录&#xff0c;该命令列出该目录下的所有子目录与文件。对于文件&#xff0c;将列出文件名以及其他信息。 单个ls显示当前目录下的文件和目录 常用选项&#…

5MW风电永磁直驱发电机-1200V直流并网Simulink仿真模型

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

【Redis学习笔记二】三种特殊数据类型、事务的基本操作、锁、持久化、发布订阅、主从复制、哨兵模式

文章目录 三种特殊数据类型geospatial 地理位置Hyperloglog 基数统计Bitmaps 事务基本操作悲观锁乐观锁 持久化RDB&#xff08;Redis Database&#xff09;AOF&#xff08;Append Only File&#xff09;拓展 Redis发布订阅命令原理缺点应用 redis主从复制概念作用为什么使用集群…