Python的HTTP库及示例

news2024/11/19 17:25:34

13.3  HTTP库

HTTP(Hyper Text Transfer Protocol)是一个客户端和服务器端请求和应答的标准。客户端是终端用户,服务器端是网站。客户端发起一个到服务器上指定端口的HTTP请求,服务器向客户端发回一个状态行和响应的消息。

可以使用下面的模块创建Internet Server:

(1)socketserver:以socket为基础,创建一般性的IP Server。

(2)http:通过http模块中的子模块server和client提供各种网络服务。

13.3.1  socketserver模块

socketserver模块提供了一个架构来简化网络(包括服务器)的编写工作,用户不需要使用低级的socket模块。

socketserver模块包含的基本类如下:

(1)TCPServer((hostname, port), handler):支持TCP的服务器。其中,hostname是主机名称,通常是空白字符串;port是通信端口号码;handler是BaseRequestHandler类的实例变量。

(2)UDPServer((hostname, port), handler):支持UDP的服务器。其中,hostname是主机名称,通常是空白字符串;port是通信端口号码;handler是BaseRequestHandler类的实例变量。

(3)UnixStreamServer((hostname, port), handler):使用UNIX网域socket支持串流导向协议(stream-oriented protocol)的服务器。其中,hostname是主机名称,通常是空白字符串;port是通信端口号码;handler是BaseRequestHandler类的实例变量。

(4)UnixDatagramServer((hostname, port), handler):使用UNIX网域socket支持数据通信协议(datagram-oriented protocol)的服务器。其中,hostname是主机名称,通常是空白字符串;port是通信端口号码;handler是BaseRequestHandler类的实例变量。

下面是socketserver模块中类的类变量:

(1)request_queue_size:存储要求队列的大小,该队列用于传给socket的listen()方法。

(2)socket_type:返回服务器使用的socket类型,可以是socket.SOCK_STREAM或socket.SOCK_DGRAM。

下面是socketserver模块中类的属性与方法:

(1)address_family:可以是socket.AF_INET或socket.AF_UNIX。服务器的通信协议群组。

(2)fileno():返回服务器socket的整数文件描述元(integer file descriptor)。

(3)handle_request():创建一个处理函数类的实例变量,以及调用handle()方法处理单一请求。

(4)RequestHandlerClass:存储用户提供的请求处理函数类。

(5)server_address:返回服务器监听用的IP地址与通信端口号码。

(6)serve_forever():操作一个循环来处理无限的请求。

下面的示例演示StreamRequestHandler类的使用。

import socketserver

port = 50007

class myRequestHandler(socketserver.StreamRequestHandler):

    def handle(self):

        print ("Connection by ", self.client_address)

        self.wfile.write("data")

s = socketserver.TCPServer(("", port), myRequestHandler)

s.serve_forever()

13.3.2  server模块

http模块的子模块server提供了各种HTTP服务,主要包括BaseHTTPServer类、CGIHTTPServer类及SimpleHTTPServer类。

server模块以socketserver模块为基础,并且很少直接使用。server模块定义了两个基类来操作基本的HTTP服务器(网站服务器)。

server模块的第一个基类是HTTPServer类,其语法如下:

class HTTPServer((hostname, port), RequestHandlerClass)

HTTPServer类由socketserver.TCPServer类派生。此类先创建一个HTTPServer对象并监听(hostname, port),然后使用RequestHandlerClass来处理要求。

server模块的第二个基类是BaseHTTPRequestHandler类,其语法如下:

class BaseHTTPRequestHandler(request, client_address, server)

用户必须创建一个BaseHTTPRequestHandler类的子类来处理HTTP请求。如果要处理GET请求,就必须重新定义do_GET()方法;如果要处理POST请求,就必须重新定义do_POST()方法。

下面是BaseHTTPRequestHandler类的类变量:

(1)BaseHTTPRequestHandler.server_version。

(2)BaseHTTPRequestHandler.sys_version。

(3)BaseHTTPRequestHandler.protocol_version。

(4)BaseHTTPRequestHandler.error_message_format。

每一个BaseHTTPRequestHandler类的实例变量都有以下属性:

(1)client_address:返回一个2-tuple(hostname, port),为客户端的地址。

(2)command:识别请求的种类,可以是GET、POST等。

(3)headers:返回一个HTTP表头。

(4)path:返回请求的路径。

(5)request_version:返回请求的HTTP版本字符串。

(6)rfile:包含输入流。

(7)wfile:包含输出流。

每一个BaseHTTPRequestHandler类的实例变量都有以下方法:

(1)handle():请求分派器。此方法会调用以“do_”开头的方法,如do_GET()、do_POST()等。

(2)send_error(error_code [, error_message]):将错误信号传输给客户端。

(3)send_response(response_code [, response_message]):传输响应表头。

(4)send_header(keyword, value):写入一个MIME表头到输出流,此表头包含表头的键值及其值。

(5)end_header():用来识别MIME表头的结尾。

下面的示例演示BaseHTTPRequestHandler类的使用方法。

import http.server

htmlpage = """

<html><head><title>Web Page</title></head>

<body>Hello Python</body></html>"""

class myHandler(http.server.BaseHTTPRequestHandler):

    def do_GET(self):

        if self.path == "/":

            self.send_response(200)

            self.send_header("Content-type", "text/html")

            self.end_headers()

            self.wfile.write(htmlpage)

        else:

            self.send_error(404, "File not found")

           

myServer = http.server.HTTPServer(("", 80), myHandler)

myServer.serve_forever()

SimpleHTTPServer类可以处理HTTP server的请求,也可以处理所在目录的文件,即HTML文件。SimpleHTTPRequestHeader类的语法格式如下:

class SimpleHTTPRequestHandler(request, (hostname, port), server)

SimpleHTTPRequestHeader类有以下两个属性:

(1)SimpleHTTPRequestHeader.server_version。定义服务器模块的级别

(2)SimpleHTTPRequestHeader.extensions_map:一个字典集,用于映射文件扩展名与MIME类型。

下面的示例演示SimpleHTTPRequestHandler类的使用方法。

import http.server

myHandler = http.server.SimpleHTTPRequestHandler

myServer = http.server.HTTPServer(("", 80), myHandler)

myServer.serve_forever()

CGIHTTPRequestHeader类除了可以处理所在目录的HTML文件外,还可以运行客户端执行CGI(Common Gateway Interface)脚本。CGIHTTPRequestHeader类的语法格式如下:

class CGIHTTPRequestHandler(request, (hostname, port), server)

CGIHTTPRequestHeader类的属性cgi_directories包含一个可以存储CGI脚本的文件夹列表。

下面的示例演示CGIHTTPRequestHandler类的使用方法。

import cgihttpserver

import BaseHTTPServer

class myHandler(http.server.CGIHTTPRequestHandler):

    cgi_directories = ["/cgi-bin"]

myServer = http.server.HTTPServer(("", 80), myHandler)

myServer.serve_forever()

13.3.3  client模块

client模块主要处理客户端的请求。client模块的HTTPConnection类创建并返回一个connection对象。HTTPConnection类的语法格式如下:

class HTTPConnection ([hostname [, port]])

如果参数port没有设置,默认值是80。如果所有的参数都没有设置,就必须使用connect()方法自行连接。以下3个HTTPConnection类的实例变量都会连接到相同的服务器:

import http.client

h1 = http.client.HTTPConnection ("www.cwi.nl")

h2 = http.client.HTTPConnection ("www.cwi.nl:80")

h3 = http.client.HTTPConnection ("www.cwi.nl", 80)

HTTPConnection类的实例变量的方法如下:

(1)endheaders():写入一行空白给服务器,表示这是客户端请求表头的结尾。

(2)connect([hostname [, port]]):创建一个连接。

(3)getresponse():返回服务器的状态。

(4)request():向服务器发送请求。

(5)putheader(header, argument1 [, ...]):写入客户端请求表头的表头行。每一行包括header、一个冒号(:)、一个空白及argument。

(6)putrequest(request, selector):写入客户端请求表头的第一行。参数 request可以是 GET、POST、PUT或HEAD,参数selector是要打开的文件名称。

(7)send(data):调用endheaders()方法后,传输数据给服务器。

下面的示例返回http://www.python.org/News.html文件,并将此文件保存为一个新文件。

【例13.3】使用HTTPConnection类(源代码\ch13\13.3.py)。

import http.client
#指定主机名称
url = "www.python.org"
#指定打开的文件名称
urlfile = "/News.html"
#连接到主机
host = http.client.HTTPConnection (url)
#写入客户端要求表头的第一行
host.request("GET", urlfile)
#获取服务器的响应
r1=host.getresponse()
#打印服务器返回的状态
print(r1.status,r1.reason)
#将file对象的内容存入新文件
file = open("13.1.html", "w")
#读取网页内容,以utf-8方式保存
str = r1.read().decode("utf-8")
#寻找文本
print(str.find("mlive"))
#写到文件并将'xa0'替换为空字符
file.write(str.replace('\xa0',''))
#关闭文件
file.close()

保存并运行程序,即可将http://www.python.org/News.html文件的内容保存在13.1.html文件中。

-------------------------------------------

本文节选自《Python编程从零开始学(视频教学版)》,本次内容发布,获得作者和出版社授权。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502532.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ICV: 2025年全球QKD产业规模有望达到25亿美元

近日&#xff0c;专注于量子、智能驾驶等前沿科技领域的国际咨询机构ICV发布了《全球量子安全通信产业研究报告》&#xff0c;报告主要内容包括量子安全通信的概念、量子密钥分发 (QKD)发展历程、QKD的优势、产业链、应用领域、QKD产业规模及预测、全球主要参与者。 量子安全通…

ubuntu18.04中PCL点云库依赖的安装以及PCL点云库和Eigen的卸载与安装

一、PCL点云库依赖的安装、遇到问题的解决方法 sudo add-apt-repository ppa:v-launchpad-jochen-sprickerhof-de/pcl sudo apt-get update sudo apt-get install libpcl-all 以上是官方给出的&#xff0c;但是会出很多报错&#xff0c;这里建议自己配置。 配置步骤&#xff…

【Android学习专题】安卓样式学习(学习内容记录)

学习记录内容来自《Android编程权威指南&#xff08;第三版&#xff09;》 样式调整和添加 调整颜色资源&#xff08;res/values/colors.xml&#xff09; 格式&#xff1a; 添加样式&#xff08;res/values/styles.xml&#xff09;&#xff0c;&#xff08;创建BeatBox项目时…

开源狂潮让巨头惨败!谷歌内部文件曝光:我们和OpenAI都没有护城河

因为开源&#xff0c;AI军备竞赛&#xff0c;谷歌和OpenAI全是输家&#xff1f; 来源丨新智元 重磅&#xff01; 谷歌的一份名为《我们没有护城河&#xff0c;OpenAI也没有》的内部文件疑似被泄露&#xff0c; 今天早上&#xff0c;外媒SemiAnalysis公布了这份重磅炸弹泄露…

日撸 Java 三百行day45

文章目录 说明day45 冒泡排序1. 基本思路2.代码 说明 闵老师的文章链接&#xff1a; 日撸 Java 三百行&#xff08;总述&#xff09;_minfanphd的博客-CSDN博客 自己也把手敲的代码放在了github上维护&#xff1a;https://github.com/fulisha-ok/sampledata day45 冒泡排序 …

IP地址技术原理

IP地址用于唯一地标识一个网络设备&#xff08;如计算机、路由器等&#xff09;在互联网或局域网中的位置。IP地址由32位二进制数表示&#xff0c;通常分为4个8位二进制数&#xff0c;每个数用点号隔开&#xff0c;如106.110.92.215。IP地址可用于数据传输、网络管理和安全控制…

Springboot +Flowable,服务任务ServiceTask执行的三种方式(一)

一.简介 ServiceTask 从名字上看就是服务任务&#xff0c;它的图标是像下面这样&#xff0c;截图如下&#xff1a; ServiceTask 一般由系统自动完成&#xff0c;当流程走到这一步的时候&#xff0c;不会自动停下来&#xff0c;而是会去执行我们提前在 ServiceTask 中配置好的…

托福高频真词List06 // 附阅读真题 14:26~15:12 // 15:12~16:12

目录 生词 熟词 阅读真题 生词 inducecausecause the formation of increasestimulate&#xff08;导致&#xff09; v 导致 inevitableunavoidable certainnecessary&#xff08;不可避免地&#xff09; adj 不可避免的accommodateallowv 顺应 modestreasonablesmall modera…

【Git 教程】—git指令详细解析,上机操作,简单易懂

目录 一. 集中式和分布式的区别 1. 集中式版本控制工具 2. 分布式版本控制工具 3. 基本概念 4. 配置信息 二. 创建本地仓库&#xff08;git init) 三.基础指令 1. 获取git版本号 2.查看文件的状态 3. 查看提交记录 4. 版本回退 5. git reflog 6. .gitignore文件…

数据机房温湿度监控系统解决应用案例

机房温湿度监控系统之POE以太网温湿度传感器解决方案 物联网工业级高精度传感器 以太网智能RJ45温湿度传感器&#xff08;POE12VDC供电型&#xff09; 智 能 传 感 器 介 绍 目 录 一、关键词…………………………………………………………………………3 二、 产品概述…

51单片机 | DS18B20 温度传感器实验

系统设计 设计要求 (1) 主体电路包括晶振、复位、电源指示电路&#xff0c;预留程序下载接口&#xff1b; (2) 要求能够实现温度数值的自动显示&#xff0c;值根据实际温度变化自动变化。 (3) 并按照题目要求完成程序源码编写、调试及关键代码注释。 设计任务 使用给定硬件…

C++两个区间的比较?——STL之equal()算法和mismatch()算法

equal&#xff08;&#xff09;算法 检验相等性 bool equal(InputIterator1 beg,InputIterator1 end&#xff0c;InputIterator2 cmpBeg)bool equal(InputIterator1 beg,InputIterator1 end&#xff0c;InputIterator2 cmpBeg,BinaryPredicate op) 第一形式判断区间…

mongodb命令使用

查询副本集当前状况(需要将命令行切换到需要查询的副本集中) rs.status() 查询数据库当前情况 sh.status() 查询数据分片情况 db.集合名称.getShardDistribution() 查看集合当前情况 db.集合名称.stats() 查看集合是否开启分片 db.集合名称.stats().sharded 查看mong…

Python网络编程(一)——了解IP和端口的基础知识以及socket的简单实现

系列文章目录 Python网络编程&#xff08;一&#xff09;——了解IP和端口的基础知识以及socket的简单实现 了解IP和端口的基础知识以及socket的简单实现 系列文章目录前言获取本机设备名和IP获取远程设备的IP地址将IPv4地址转换成以十六进制形式表示二进制数据获取端口的服务…

数据结构 -- 共用体Union

在数据结构 -- 结构体Struct一文中详细介绍了结构体的定义以及内存对齐。在C语言中&#xff0c;还有另外一种和结构体非常类似的语法&#xff0c;叫做共用体&#xff08;Union&#xff09;&#xff0c;也称为联合体。它的定义格式为&#xff1a; union 共用体名{成员列表 };1. …

【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)

论文题目&#xff1a; Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制 红外小目标数据集 目标个数分布&#xff1a;约90%图片中只有一个目标&#xff0c;约10%图片有多个目标&#xff08;在稀疏/显著的方法中&am…

网文助手。

网文助手 简述 网文助手&#xff0c;免费高质量小说资料网站&#xff0c;支持笔记本和手机端&#xff0c;主要有以下功能。 随机生成小说男女姓名&#xff0c;和尊称随机生成地域和势力名称随机生成功法秘籍、招式战技、法宝兵器、丹药和阵法随机生成妖兽、凶地、天材地宝随…

Prometheus监控报警+Grafana loki日志聚合系统

Prometheus监控报警Grafana loki日志聚合系统 参考文档 https://blog.csdn.net/m0_57480266/article/details/121190725?spm1001.2101.3001.6650.1&utm_mediumdistribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-121190725-blog-111992382.235%5Ev3…

二十一、线索转换3:线索的备注转化为客户联系人的备注

功能需求 3.线索的备注信息--》客户备注 4.线索的备注---》联系人备注 5.线索市场活动关系---》联系人市场活动关系 流程图 代码实现&#xff1a;线索的备注转化为客户联系人的备注 1.clueRemarkMapper /*** 根据线索id 查询备注2*/List<ClueRemark> selectInitialC…

Windows本地MySQL升级

一、删除原来的MySQL 删除 C:\Programs Files、C:\Programs Files(x86)、C:\ProgramData 中的所有MySQL目录 找到MySQL数据库中的data保存到其他位置&#xff0c;升级后可以恢复数据库数据 【备份数据】 删除注册表中MySQL的信息 计算机\HKEY_LOCAL_MACHINE\SYSTEM\ControlSet…