【Python爬虫】使用request和xpath爬取高清美女图片

news2025/1/16 16:57:49

  📝个人主页:哈__

期待您的关注 

目录

🎈 urlib.request

 🔥具体的方法

✈ lxml

🔥xpath的基本语法

1. 基本路径

2. 选择节点

3. 谓语(Predicates)

4. 通配符

5. 选择多个路径

6. 函数

7. 运算符

8. 轴(Axes)

🔥🔥🔥爬取美女图片

 1.定期请求头

2.获取页面源码

3.爬取我们需要的图片 

一点点小问题

源码如下


使用Python爬虫需要使用以下两个库。

🎈 urlib.request

urllib.request 是 Python 标准库中的一个模块,它提供了用于打开和读取 URLs(统一资源定位符)的接口。通过使用这个模块,你可以很容易地发送 HTTP 和 HTTPS 请求,并处理响应。以下是对 urllib.request 的简要介绍:


urllib.request 模块允许你执行以下操作:

  1. 发送 HTTP/HTTPS 请求:你可以使用 urllib.request.urlopen() 函数或 urllib.request.Request 类与 URL 交互,发送 GET、POST 等请求。
  2. 处理响应:返回的响应对象(通常是 http.client.HTTPResponse 的一个实例)包含了服务器的响应,如状态码、响应头和响应体。你可以使用响应对象的方法如 read() 来读取响应体内容。
  3. 添加请求头:通过创建 urllib.request.Request 对象,你可以为请求添加自定义的请求头,如 User-Agent、Referer 等。
  4. 处理异常urllib.request 模块定义了各种异常,如 urllib.error.HTTPError 和 urllib.error.URLError,以便你能够优雅地处理请求失败和错误情况。
  5. 数据编码:对于 POST 请求,你可能需要将数据编码为适当的格式(如 application/x-www-form-urlencoded 或 multipart/form-data),urllib.parse 模块提供了相关的函数来辅助完成这些任务。
  6. 处理重定向和会话urllib.request 模块能够自动处理 HTTP 重定向,并且可以通过使用 urllib.request.OpenerDirector 和处理器(如 urllib.request.HTTPCookieProcessor)来管理 HTTP 会话和 cookie。
  7. 使用代理:通过设置环境变量或使用 urllib.request.ProxyHandler,你可以配置 urllib.request 使用代理服务器发送请求。

以下代码是一个示例

import urllib.request  
  
# 定义要请求的 URL  
url = 'http://example.com'  
  
# 发送 GET 请求  
with urllib.request.urlopen(url) as response:  
    # 读取响应内容  
    html = response.read()  
      
# 打印响应内容(这里以字符串形式打印,实际可能需要根据需要进行解码)  
print(html.decode('utf-8'))

 🔥具体的方法

 urllib.request.urlopen(url, data=None, timeout=socket._GLOBAL_DEFAULT_TIMEOUT, *, cafile=None, capath=None, cadefault=False, context=None)
  • 功能:打开指定的 URL,并返回一个响应对象。
  • 参数
    • url:要打开的 URL。
    • data(可选):如果请求需要发送数据(如 POST 请求),则将其指定为字节串。
    • timeout(可选):设置请求的超时时间,以秒为单位。
    • cafilecapathcadefault(可选):用于 SSL 证书的验证。
    • context(可选):SSL 上下文对象,允许你定制 SSL 设置。
  • 返回值:一个响应对象,可以使用 .read().getcode().getheader(name) 等方法获取响应内容、状态码和头部信息。

urllib.request.Request(url, data=None, headers={}, method=None, origin_req_host=None, unverifiable=False)
  • 功能:创建一个请求对象,该对象可以被 urlopen() 或自定义的 opener 使用。
  • 参数
    • url:要请求的 URL。
    • data(可选):POST 请求的数据。
    • headers(可选):一个字典,包含自定义的请求头。
    • method(可选):HTTP 请求方法,如 'GET'、'POST' 等。
    • origin_req_host 和 unverifiable(可选):通常不需要手动设置。
  • 返回值:一个 urllib.request.Request 对象。

urllib.request.urlretrieve(url, filename=None, reporthook=None, data=None)
  • url (str): 要下载的文件的 URL。
  • filename (str, optional): 可选参数,指定保存文件的本地路径和文件名。如果未指定,则使用 URL 中最后的路径组件作为文件名,并保存在当前工作目录下。
  • reporthook (callable, optional): 可选参数,一个回调函数,它将在下载过程中被多次调用,并传递三个参数:一个块号(block number)、一个块大小(block size in bytes)、以及文件总大小(total file size in bytes)。这可以用于实现下载进度的报告。
  • data (bytes, optional): 可选参数,如果提供,它应该是一个字节对象,将被发送到服务器作为 POST 请求的数据。这通常用于发送表单数据或上传文件。

urllib.request.install_opener(opener)
  • 功能:全局安装一个 opener。此后,urlopen() 将使用这个 opener 发送请求。
  • 参数:一个实现了 OpenerDirector 接口的对象。

urllib.request.build_opener([handler, ...])
  • 功能:创建一个 opener 对象,该对象使用提供的处理器(handler)列表来处理请求。
  • 参数:一个或多个处理器对象,如 ProxyHandlerHTTPHandlerHTTPSHandler 等。
  • 返回值:一个 opener 对象。

自定义处理器

你可以通过继承 urllib.request.BaseHandler 或其子类(如 HTTPHandlerHTTPSHandler 等)来创建自定义的处理器。这些处理器可以处理请求的不同方面,如代理、cookie、重定向等。

✈ lxml

在Python中,XPath通常与解析HTML或XML文档的库结合使用,例如lxmlBeautifulSoup。这些库提供了对XPath表达式的支持,使得在HTML/XML文档中查找和提取数据变得简单。下面我将以lxml库为例,介绍Python中XPath的使用。

🔥xpath的基本语法

1. 基本路径

  • /: 从根节点开始选择。
  • //: 从文档中的任意位置开始选择。
  • .: 选择当前节点。
  • ..: 选择当前节点的父节点。

2. 选择节点

  • nodename: 选取此节点的所有子节点。
  • @: 选取属性。例如,@lang 会选取名为 lang 的属性。

3. 谓语(Predicates)

谓语用于查找某个特定的节点或者包含某个指定的值的节点。

  • [1]: 选择第一个子节点。
  • [last()]: 选择最后一个子节点。
  • [last()-1]: 选择倒数第二个子节点。
  • [position()]: 选择某个位置上的节点。
  • [text()]: 选择包含文本的节点。
  • [attr=value]: 选择属性值等于某个值的节点。例如,[@lang='en'] 会选择 lang 属性值为 en 的节点。

4. 通配符

  • *: 匹配任何元素节点。
  • @*: 匹配任何属性节点。

5. 选择多个路径

通过在路径表达式中使用 | 运算符,可以选择多个路径。


6. 函数

XPath包含超过一百个内建函数,这些函数可用于字符串值、数值、日期和时间比较、节点和QName处理、序列处理以及逻辑比较等。一些常用的函数有:

  • text(): 获取节点文本。
  • contains(string1, string2): 如果 string1 包含 string2,则返回 true,否则返回 false。
  • starts-with(string1, string2): 如果 string1 以 string2 开头,则返回 true,否则返回 false。
  • last(): 返回当前上下文中节点的最后一个节点的位置。
  • local-name(): 返回当前节点的本地名称。
  • namespace-uri(): 返回当前节点的命名空间URI。
  • name(): 返回当前节点的名称。
  • string(): 将节点或节点集转换为字符串。
  • string-length(): 返回字符串的长度。
  • substring(string, start, length): 返回字符串的子字符串。
  • concat(string1, string2, ...): 连接两个或多个字符串。
  • normalize-space(string): 规范化字符串中的空白字符。

7. 运算符

XPath 支持一系列运算符,如:

  • orand:逻辑运算符。
  • =!=<><=>=:比较运算符。
  • +-*divmod:算术运算符。

8. 轴(Axes)

XPath 轴可以定义相对于当前节点的节点集。以下是一些常用的轴:

  • child: 选取当前节点的所有子节点。
  • parent: 选取当前节点的父节点。
  • ancestor: 选取当前节点的所有先辈(父、祖父等)。
  • ancestor-or-self: 选取当前节点及其所有先辈。
  • descendant: 选取当前节点的所有后代(子、孙等)。
  • descendant-or-self: 选取当前节点及其所有后代。
  • following: 选取文档中当前节点的结束标签之后的所有节点。
  • preceding: 选取文档中当前节点的开始标签之前的所有节点。
  • following-sibling: 选取当前节点之后的所有同辈节点。
  • preceding-sibling: 选取当前节点之前的所有同辈节点。
  • self: 选取当前节点。

下边是一个xpath使用的小教程。

from lxml import html  
  
# 假设我们有一个HTML字符串  
html_string = """  
<html>  
<head>  
    <title>Example Page</title>  
</head>  
<body>  
    <div class="content">  
        <h1>Welcome to the Example Page</h1>  
        <p class="intro">This is an example paragraph.</p>  
        <ul>  
            <li><a href="https://example.com/item1">Item 1</a></li>  
            <li><a href="https://example.com/item2">Item 2</a></li>  
        </ul>  
    </div>  
</body>  
</html>  
"""  
  
# 使用lxml的html模块将HTML字符串解析为HTML文档对象  
tree = html.fromstring(html_string)  
  
# 使用XPath表达式查找标题(title)元素  
title = tree.xpath('//title/text()')[0]  
print(f"Title: {title}")  
  
# 使用XPath表达式查找所有链接(a)元素的href属性  
links = tree.xpath('//a/@href')  
for link in links:  
    print(f"Link: {link}")  
  
# 使用XPath表达式查找具有特定类的段落(p)元素的内容  
intro_text = tree.xpath('//p[@class="intro"]/text()')[0]  
print(f"Intro text: {intro_text}")

行了不多说了,直接开始我们的主线,爬取美女图片。

🔥🔥🔥爬取美女图片

我要爬取的页面在这里:https://aspx.sc.chinaz.com/query.aspx?keyword=%E7%BE%8E%E5%A5%B3%E5%9B%BE%E7%89%87&issale=&classID=11&navindex=0&page=1

这个链接将会作为我们的url,但并不是固定的,我会把它写成一个动态url,拼接我们要爬取的页码。

 1.定期请求头

我们使用爬虫来访问网页的话可能会因为一些请求头部的信息校验过不去而被阻拦,我们定制一个有请求头的request出来。

先打开我们要爬取的网页,右键点击检查,之后在弹出的功能栏中找到网络模块。

这时候你点进去大概率会什么都没有,我们刷新页面再看。

这时就会有很多的网络请求,我们的目的是爬取图片,那我们就要知道这些图片是哪一个网络请求加载出来的,看图中的红色箭头指向的一个请求,这个就请求就是我们请求的这个美女图片的网页,我们上边给出的网址就是这个。我们从这个请求中拿取我们需要的请求头信息。

这里我只拿了Cookie和User-Agent。下方就是我们的请求头信息。

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0'
    ,
    'Cookie': 'cz_statistics_visitor=d8de5b1d-e51b-4986-734a-dee6c9baa136; Hm_lvt_aecc9715b0f5d5f7f34fba48a3c511d6=1715078740; Hm_lpvt_aecc9715b0f5d5f7f34fba48a3c511d6=1715078752; Hm_lvt_398913ed58c9e7dfe9695953fb7b6799=1715078772; _clck=wz5o14%7C2%7Cflk%7C0%7C1588; _clsk=1196i88%7C1715078773199%7C1%7C1%7Cu.clarity.ms%2Fcollect; ASP.NET_SessionId=a5jbwhq5z4sq25coftwlvkg4; Hm_lpvt_398913ed58c9e7dfe9695953fb7b6799=1715078929'
}

请求头的定制代码如下。注意我们的url是动态拼接的,需要根据传过来的页码来爬取第几页。

def create_request(page):
    url = f'https://aspx.sc.chinaz.com/query.aspx?keyword=%E7%BE%8E%E5%A5%B3%E5%9B%BE%E7%89%87&issale=&classID=11&navindex=0&page={page}'
    request = urllib.request.Request(url, headers=headers)
    return request

2.获取页面源码

把我们的请求头传进来,然后调用urllib中的request方法获取返回对象,然后通过第二行代码把网页内容读取出来。

def get_content(request):
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content

3.爬取我们需要的图片 

想要拿到这些图片,我们就要知道这些图片的url到底是什么,我们接着去目标网页看源码,右键->检查->元素。

 分析这个html代码的结构,找到我们图片是被哪个div包着的。


看到class为imgload的div下的结构了吗?这些机构就是我们一个一个的图片,我们想要获取的信息都在这里。一共有两个div,一个叫做im,另一个叫做heis,im当中保存着图片的地址,heis中保存着图片的名称,不信的话你可以把鼠标移动到im中的img标签的src上,看看能不能跳转到这个图片中。我们下载图片,就要使用xpath去把im中的img标签的路径描述出来。


这里其实是有坑的,下方的div中的img根本没有src看到了吗?这里使用了懒加载的方式,你不进行滑动是根本不显示这个src的,所以我们要获取的不是src,而是data-src。


 xpath代码。name_list就是获取所有图片的名称,src_list就是获取所有图片的地址。以图片地址为例。

  1. 我们寻找所有id值为“ulcontent”的div
  2. 然后找到这个div下所有class值为“im”的div
  3. 找class值为“im”的div下的a标签
  4. 然后找到a标签下的img标签
  5. 获取img标签的data-src属性的值。
 name_list = tree.xpath('//div[@id="ulcontent"]//div[@class="heis"]//a/text()')
 src_list = tree.xpath('//div[@id="ulcontent"]//div[@class="im"]//a/img/@data-src')

有了xpath路径,我们就可以通过以下代码进行下载了。一定要注意斜杠的问题,我们爬下来的路径都是反斜杠,我们替换一下,同时添加一个https协议,就可以调用request库中的方法下载了。

  for i in range(len(name_list)):
        pic_url = "https:" + src_list[i]
        pic_url = pic_url.replace('\\',"/")
        pic_url = "https:" + pic_url
        urllib.request.urlretrieve(url=pic_url,filename="./站长素材/"+name_list[i]+".jpg")

一点点小问题

但是你可能会发现,我们爬取的都是缩略图,并不是高清图,我们的页面结构分析的没问题,但就是爬取的图片并不是真正的图片,真正的图片在这个网页中。 

所以我们的代码要变一变,我们先把这个网页爬下来,然后再次通过request请求去访问这个网页,然后分析一下这个网页的结构,拿到这里的图片。

源码如下

import urllib.request
from lxml import etree

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36 Edg/124.0.0.0'
    ,
    'Cookie': 'cz_statistics_visitor=d8de5b1d-e51b-4986-734a-dee6c9baa136; Hm_lvt_aecc9715b0f5d5f7f34fba48a3c511d6=1715078740; Hm_lpvt_aecc9715b0f5d5f7f34fba48a3c511d6=1715078752; Hm_lvt_398913ed58c9e7dfe9695953fb7b6799=1715078772; _clck=wz5o14%7C2%7Cflk%7C0%7C1588; _clsk=1196i88%7C1715078773199%7C1%7C1%7Cu.clarity.ms%2Fcollect; ASP.NET_SessionId=a5jbwhq5z4sq25coftwlvkg4; Hm_lpvt_398913ed58c9e7dfe9695953fb7b6799=1715078929'
}
def create_request(page):
    url = f'https://aspx.sc.chinaz.com/query.aspx?keyword=%E7%BE%8E%E5%A5%B3%E5%9B%BE%E7%89%87&issale=&classID=11&navindex=0&page={page}'
    request = urllib.request.Request(url, headers=headers)
    return request


def get_content(request):
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content


def download(html):
    tree = etree.HTML(html)
    name_list = tree.xpath('//div[@id="ulcontent"]//div[@class="heis"]//a/text()')
    src_list = tree.xpath('//div[@id="ulcontent"]//div[@class="im"]//a/@href')
    for i in range(len(name_list)):
        pic_url = "https:" + src_list[i]
        pic_url = pic_url.replace('\\',"/")
        # 再次发送请求
        request = urllib.request.Request(pic_url, headers=headers)
        response = urllib.request.urlopen(request)
        # 获得高清图片的页面源码
        content = response.read().decode('utf-8')
        tree2 = etree.HTML(content)
        # 找到高清图片的地址
        pic = tree2.xpath('//div[@class="container"]//div[@class="img-box"]/img/@src')[0]
        pic = "https:" + pic
        urllib.request.urlretrieve(url=pic,filename="./站长素材高清/"+name_list[i]+".jpg")


if __name__ == '__main__':
    request = create_request('1')
    html = get_content(request)
    download(html)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1653602.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙内核源码分析(工作模式篇) | CPU的七种工作模式

本篇说清楚CPU的工作模式 工作模式(Working mode) 也叫操作模式&#xff08;Operating mode&#xff09;又叫处理器模式&#xff08;Processor mode&#xff09;&#xff0c;是 CPU 运行的重要参数&#xff0c;决定着处理器的工作方式&#xff0c;比如如何裁决特权级别和报告异…

文献速递:深度学习医学影像心脏疾病检测与诊断--基于深度学习的低剂量SPECT心肌灌注图像去噪:定量评估与临床表现

Title 题目 Deep learning–based denoising of low‑dose SPECT myocardialperfusion images: quantitative assessment and clinical performance 基于深度学习的低剂量SPECT心肌灌注图像去噪&#xff1a;定量评估与临床表现 01 文献速递介绍 单光子发射计算机断层扫描&a…

Options API:选项式 API改成Composition API:组合式 API的留言板

让我欢喜让我忧 改成Composition API:组合式 API的代码&#xff0c; <template><!-- start --><span class"span_checkbox">操作<input type"checkbox" v-model"showInput" value"操作" /></span><…

Learning Continuous Image Representation with Local Implicit Image Function

CVPR2021https://github.com/yinboc/liif 问题引入 图像普遍都是使用像素来表示的&#xff0c;而现实世界是连续的&#xff0c;所以本文借鉴3D中neural implicit representation的思想&#xff0c;以连续的方式表示图像&#xff1b;模型输入坐标值和坐标附近的特征&#xff0…

区块链 | NFT 水印:Review on Watermarking Techniques(二)

&#x1f34d;原文&#xff1a;Review on Watermarking Techniques Aiming Authentication of Digital Image Artistic Works Minted as NFTs into Blockchains 1 半脆弱和可逆水印 鲁棒性好的水印技术通常会产生非常低透明度。正如前面所述&#xff0c;由于透明度在处理数字…

OpenGL 入门(四)—— 贴纸与美颜滤镜

本篇我们来介绍贴纸效果与美颜滤镜的实现。 1、贴纸效果 贴纸实际上是一个图片&#xff0c;用 Bitmap 加载图片后用 OpenGL 渲染到指定的位置上。我们举例添加一个耳朵贴纸&#xff1a; 1.1 获取人脸位置 上一篇我们在讲大眼滤镜时&#xff0c;在 Native 层除了获取到人脸 5…

【数据库表的约束(下)】

文章目录 一、自增长主键二、唯一键约束三、外键约束总结 一、自增长主键 这个约束的功能是&#xff1a; 你不用管我&#xff0c;也不需要插入我这一列的数据&#xff0c;我会保证自己与其他数据不冲突&#xff0c;并且是连续的。 创建一个表&#xff0c;表格内容如下&#x…

Tkinter组件:Checkbutton

Tkinter组件&#xff1a;Checkbutton Checkbutton&#xff08;多选按钮&#xff09;组件用于实现确定是否选择的按钮。Checkbutton 组件可以包含文本或图像&#xff0c;你可以将一个 Python 的函数或方法与之相关联&#xff0c;当按钮被按下时&#xff0c;对应的函数或方法将被…

保护公司机密:避免员工带着数据说拜拜

公司的核心资产之一就是数据。无论是客户信息、研发代码、内部决议、财务报告、商业合同、设计图纸等都是公司的重要资产。如果这些数据在员工离职时被带走&#xff0c;或在员工在职期间不当行为导致数据泄露&#xff0c;将给公司带来重大损失。 然而&#xff0c;保护这些数据…

大模型微调之 在亚马逊AWS上实战LlaMA案例(四)

大模型微调之 在亚马逊AWS上实战LlaMA案例&#xff08;四&#xff09; 在 Amazon SageMaker JumpStart 上微调 Llama 2 以生成文本 Meta 能够使用Amazon SageMaker JumpStart微调 Llama 2 模型。 Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合&#x…

漏洞伴随App无时不在,该怎么办?

漏洞攻击、加密被破坏以及数据泄露是App面临的三大重要安全风险&#xff0c;无论开发者如何防范&#xff0c;攻击者往往会找到新的方法&#xff0c;并依靠最新的工具来破坏App安全性。 统计数据表明&#xff0c;大约82&#xff05;的漏洞是在App程序代码中发现的。如果尽快发现…

百度百科怎么修改词条

百度百科是一个由网民编辑内容的网络百科全书&#xff0c;支持用户添加或修改词条。以下是关于如何修改百度百科词条的详细步骤和注意事项。 1. 登录百度百科账户 首先&#xff0c;你需要登录到百度百科账户。如果你还没有百度账号&#xff0c;你需要先注册一个。注册完成后&a…

【vue+el-upload】当action=“#“,代表不使用默认上传,使用自定义上传,http-request获取文件流

el-upload有多种上传行为&#xff1a; 1、立即上传&#xff1a; 当 action 属性被赋予一个有效的 URL 时&#xff0c;一旦用户选择了文件&#xff0c;el-upload 组件会立即自动将文件上传到指定的服务器地址。 2、不立即上传&#xff08;自定义触发&#xff09;&#xff1a; 如…

2024-5-3学习笔记 虚拟继承原理

目录 原理 总结 前面提到过&#xff0c;解决菱形继承产生的数据二义性问题和数据冗余&#xff0c;就需要用到虚拟继承&#xff0c;关于它是如何解决的&#xff0c;我们来一起研究。 class Person { public :string _name ; // 姓名 }; class Student : virtual public Perso…

微软exchange邮箱发送

使用java发送exchange类型的邮件&#xff0c;foxmail中配置如下图&#xff1a; 需要的maven依赖如下&#xff1a; <dependency><groupId>com.microsoft.ews-java-api</groupId><artifactId>ews-java-api</artifactId><version>2.0</ve…

以gitee为例的git入门使用指北

安装git 在linux中我们首先需要使用 sudo apt install git来下载git 在windows中可以下载msysGit 链接&#xff1a;https://git-scm.com/download/win gitee准备 申请账号 建立仓库 ​ 点击新建仓库 这里一般是私有库&#xff0c;点击创建&#xff0c;这时你就拥有一个线上…

LearnOpenGL(九)之材质

一、材质 在现实世界里&#xff0c;每个物体会对光产生不同的反应。比如&#xff0c;钢制物体看起来通常会比陶土花瓶更闪闪发光&#xff0c;一个木头箱子也不会与一个钢制箱子反射同样程度的光。在opengl中&#xff0c;我们可以针对每种表面定义不同的材质(Material)属性来模…

Web自动化测试入门:前端页面的组成分析详解!

在进行Web自动化测试时&#xff0c;了解前端页面的组成是非常重要的&#xff0c;因为页面的不同元素和交互会直接影响测试的实施和结果。本文将从0到1详细规范地介绍前端页面的组成。 1. 页面结构 一个典型的前端页面通常由HTML、CSS和JavaScript三部分组成。HTML负责页面的整…

STL速查

容器 (Containers) 图解容器 支持随机访问 stringarrayvectordeque支持支持支持支持 string 类 构造函数 string(); ------创建一个空的字符串 例如: string str;string(const char* s); ------使用字符串s初始化string(const string& str); ------拷贝构造 赋值操作…

Spring中FactoryBean的作用和实现原理

Spring中FactoryBean的作用和实现原理 BeanFactory与FactoryBean&#xff0c;相信很多刚翻看Spring源码的同学跟我一样很好奇这俩货怎么长得这么像&#xff0c;分别都是干啥用的。 BeanFactory是Spring中Bean工厂的顶层接口&#xff0c;也是我们常说的SpringIOC容器&#xff…