高效使用 Guzzle:POST 请求与请求体参数的最佳实践

news2024/11/20 0:43:31

亿牛云代理.png

介绍

在现代爬虫技术中,高效发送 HTTP 请求并处理响应数据是关键步骤之一。Guzzle 是一个强大的 PHP HTTP 客户端,广泛应用于发送同步和异步请求。本文将介绍如何使用 Guzzle 发送 POST 请求,特别是如何传递请求体参数,并结合代理 IP 技术实现高效的数据抓取。同时,我们将分析 Guzzle 对同步和异步请求的不同处理方式。

技术分析

1. Guzzle 基础知识
Guzzle 提供了一个简单的接口来发送 HTTP 请求,并支持多种选项,如 JSON 数据传递、错误处理、并发请求等。首先,我们需要确保 Guzzle 已正确安装:

composer require guzzlehttp/guzzle

2. 发送 POST 请求
使用 Guzzle 发送 POST 请求时,可以通过 json 选项来传递请求体参数。下面的示例展示了如何使用 Guzzle 发送一个包含 JSON 数据的 POST 请求:

use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$data = [
    'payItemId' => 'S-112-948-MTNMOMO-20052-200040001-1',
    'amount' => 1000,
];

$response = $client->post($url, [
    'json' => $data,
]);

$body = $response->getBody()->getContents();
$result = json_decode($body, true);

3. 使用代理 IP
为了避免被封禁,爬虫程序常使用代理 IP 技术。以下代码展示了如何使用亿牛云爬虫代理来发送请求:

use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';
// 使用亿牛云爬虫代理 www.16yun.cn
$proxy = 'http://username:password@$proxy.16yun.cn:12345'; 

$data = [
    'payItemId' => 'S-112-948-MTNMOMO-20052-200040001-1',
    'amount' => 1000,
];

$response = $client->post($url, [
    'json' => $data,
    'proxy' => $proxy, // 设置代理 IP
]);

$body = $response->getBody()->getContents();
$result = json_decode($body, true);

4. Guzzle 的同步和异步处理
Guzzle 提供了对同步和异步请求的支持,这使得它在处理大量请求时非常灵活。

  • 同步请求:同步请求是指程序在发送请求时会等待响应返回后再继续执行。它适用于需要逐步处理每个请求结果的场景。
use GuzzleHttp\Client;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$response = $client->get($url);
$body = $response->getBody()->getContents();
echo $body;
  • 异步请求:异步请求允许程序在发送请求后立即继续执行,不必等待响应返回。它适用于需要同时发送大量请求的场景。
use GuzzleHttp\Client;
use GuzzleHttp\Promise\PromiseInterface;

$client = new Client();
$url = 'https://example.com/api/endpoint';

$promise = $client->getAsync($url);
$promise->then(
    function (ResponseInterface $response) {
        echo $response->getBody()->getContents();
    },
    function (RequestException $e) {
        echo $e->getMessage();
    }
);

$promise->wait(); // 等待所有异步请求完成

5. 实战示例:采集新闻网站数据
以下示例展示了如何使用 Guzzle 和亿牛云爬虫代理来采集多个新闻网站的数据:

use GuzzleHttp\Client;
use GuzzleHttp\Pool;
use GuzzleHttp\Psr7\Request;

$client = new Client();
// 使用亿牛云爬虫代理 www.16yun.cn
$proxy = 'http://username:password@$proxy.16yun.net:12345';

$urls = [
    'https://news.ycombinator.com/',
    'https://www.bbc.com/news',
    'https://www.cnn.com/',
];

$requests = function ($urls) {
    foreach ($urls as $url) {
        yield new Request('GET', $url);
    }
};

$pool = new Pool($client, $requests($urls), [
    'concurrency' => 5,
    'options' => [
        'proxy' => $proxy, // 设置代理 IP
    ],
    'fulfilled' => function ($response, $index) {
        // 请求成功时的处理逻辑
        $body = $response->getBody()->getContents();
        echo "Response from index {$index}: " . substr($body, 0, 100) . "\n";
    },
    'rejected' => function ($reason, $index) {
        // 请求失败时的处理逻辑
        echo "Request {$index} failed: {$reason}\n";
    },
]);

$promise = $pool->promise();
$promise->wait();
结论

本文介绍了如何使用 Guzzle 发送 POST 请求并传递请求体参数,以及如何结合代理 IP 技术实现高效的爬虫数据抓取。通过实际代码示例,我们展示了如何采集多个新闻网站的数据。同时,我们分析了 Guzzle 对同步和异步请求的不同处理方式。Guzzle 的灵活性和强大的功能使其成为 PHP 开发中不可或缺的工具。希望本文能为您在实际项目中使用 Guzzle 提供参考和帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896220.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Windows 网络发现是什么意思?如何启用?

什么是 Windows 网络发现 Windows 网络发现是一项使计算机能够在本地网络中发现并与其他设备通信的功能。通过网络发现,用户可以在网络上轻松找到和访问其他计算机、打印机和共享资源。这对于家庭网络和小型办公室环境尤为重要,因为它简化了设备互联和资…

【RAG检索增强生成】MaxKB:构建企业级知识库问答系统(Ollama+Qwen2)

目录 引言1、MaxKB概述1.1 定义与目标1.2 特点与优势 2、MaxKB原理3、MaxKB架构4、基于MaxKBOllamaQwen2搭建本地知识库4.1 环境准备4.2 部署MaxKB4.3 部署Ollama4.4 部署运行qwen24.5 知识库配置4.5.1登录 MaxKB 系统4.5.2上传文档4.5.3设置分段规则 4.6 模型配置4.7 创建应用…

pytest-yaml-sanmu(七):使用fixture返回值

fixture 是 pytest 中非常重要的功能,大部分项目都可能会用到 fixture。 pytest 的内置标记 usefixtures 可以帮助用例自动的使用 fixture 1. 创建 fixture pytest 中的 fixtures 大致有两个用途 在用例执行之前、执行之后,自动的执行 通过 fixture …

如何在Qt使用uchardet库

如何在 Qt 中使用 uchardet 库 文章目录 如何在 Qt 中使用 uchardet 库一、简介二、uchardet库的下载三、在Qt中直接调用四、编译成库文件后调用4.1 编译工具下载4.2 uchardet源码编译4.3 测试编译文件4.4 Qt中使用 五、一些小问题5.1 测试文件存在的问题5.2 uchardet库相关 六…

Linux关于文件的高级命令

tree命令 tree命令用于以树状图的形式显示目录结构。它可以帮助用户快速了解目录和文件的层次关系,非常适合用于浏览和理解大型文件系统的结构。 基础用法 显示当前目录的树状结构:tree 显示指定目录的树状结构:tree 指定目录路径 tree命…

比尔・盖茨谈AI市场狂热现象;腾讯推出TransAgents文学翻译框架

🦉 AI新闻 🚀 比尔・盖茨谈AI市场狂热现象 摘要:微软联合创始人比尔・盖茨在《下一个伟大的构想》播客节目中表示,目前AI市场的狂热程度远超互联网泡沫,准入门槛低,融资额巨大,处于前所未见的…

大华设备接入GB28181视频汇聚管理平台EasyCVR安防监控系统的具体操作步骤

智慧城市/视频汇聚/安防监控平台EasyCVR兼容性强,支持多协议接入,包括国标GB/T 28181协议、GA/T 1400协议、部标JT808协议、RTMP、RTSP/Onvif协议、海康Ehome、海康SDK、大华SDK、华为SDK、宇视SDK、乐橙SDK、萤石云SDK等,并能对外分发RTMP、…

高效批量调整视频色彩:一键实现视频饱和与色度优化,提升视觉体验

在数字时代,视频已成为我们记录生活、分享故事的重要工具。然而,你是否曾因为视频色彩不够饱满、色度不够鲜明而感到困扰?今天,我要为你介绍一款神奇的软件——它能让你的视频色彩焕然一新,提升视觉体验,它…

uniapp+vue3+echarts编写微信小程序

uniappvue3echarts编写微信小程序 记录一下自己uniapp使用echarts开发图表,之前网上找了很多,本以为应该是挺常见的使用方式,没想到引入之路居然这么坎坷,在Dcloud插件市场,使用最多的:echarts-for-wx 但是…

前端面试题5(前端常见的加密方式)

前端常见的加密方式 在前端进行数据加密主要是为了保护用户的隐私和提升数据传输的安全性。前端数据加密可以采用多种方法,以下是一些常见的加密技术和方法: 1. HTTPS 虽然不是直接的前端加密技术,但HTTPS是保障前端与后端数据传输安全的基…

icopppppppppppppppppppp

写文章 深入理解Windows异步机制:IOCP的工作原理与应用 ​ 目录 收起 一、IOCP简介 二、IOCP工作流程 三、IOCP的使用 四、IOCP案例实战 五、常见问题和解答 Windows异步机制中的IOCP(Input/Output Completion Port)是一种高效的异步…

Linux Static Keys和jump label机制

文章目录 前言一、asm goto二、API使用2.1 低版本API2.2 高版本API 三、jump label四、源码分析4.1 数据结构4.2 static_key_false4.3 jump_label_init4.4 __jump_label_transform4.5 static_key_slow_inc/dec 五、__jump_table节5.1 内核5.2 内核模块 六、修改内存代码6.1 x86…

RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对!CVPR自动驾驶最in挑战赛赛道,全球冠军被算力选手夺走了

RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对!CVPR自动驾驶最in挑战赛赛道,全球冠军被算力选手夺走了。 本文详细比较了四种 RAG 工业落地方案 ——Qanything、RAGFlow、FastGPT 和智谱 RAG,重…

2. 创建kvm虚拟机

创建kvm虚拟机 一、创建kvm虚拟机1、virt-manager 图形化工具2、virt-install 命令行工具3、查看虚拟机 一、创建kvm虚拟机 1、virt-manager 图形化工具 2、virt-install 命令行工具 [rootlocalhost ~]# virt-install --namevm02_centos79 \ > --graphics vnc,listen0.0.0…

AI产品经理能力模型的重点素质:人文素养和灵魂境界

在AI产品经理的能力模型中,我最想提的差异化关键点,就是“人文素养和灵魂境界”。 1 为什么“人文素养和灵魂境界”非常重要? 一、“人文素养和灵魂境界”如何影响AI产品设计? 例1:面对一个具体的AI场景&#xff0…

android deep links即scheme uri跳转以及googlePlay跳转配置

对于googlePlay的Custom URL就是googlePlay上APP网址: https://play.google.com/store/apps/details?idcom.yourapp如果是国内一些应用,则考虑market://包名等方式,自行百度。 对于Android URI Scheme: 首先需要在Manifest xm…

AR视频技术与EasyDSS流媒体视频管理平台:打造沉浸式视频体验

随着增强现实(AR)技术的飞速发展,其在各个领域的应用日益广泛。这项技术通过实时计算摄影机影像的位置及角度,将虚拟信息叠加到真实世界中,为用户带来超越现实的感官体验。AR视频技术不仅极大地丰富了我们的视觉体验&a…

Cortex-A510——内核及汇编

Cortex-A510——内核及汇编 小狼http://blog.csdn.net/xiaolangyangyang 1、异常等级 2、异常等级切换 同步异常: 1、SVC/HVC/SMC; 2、MMU引发的异常(内核态EL1发生,发生后不会进行异常等级切换…

边界无限陈佩文:红蓝对抗安全演练常态化的各方分析

虽然常态化演练尚未正式开始,但我们仍然希望对各方的表现进行一些分析和预测,以辅助我们对市场的判断和决策。同时,也希望通过这些初步的见解,抛砖引玉,引发更多有价值的讨论和观点。 “船停在码头是最安全的&#xf…

深度学习1

1.支持向量机Support Vector Machine(SVM)是一种对数据二分类的线性分类器,目的是寻找一个超平面对样本进行分割,广泛应用人像识别,手写数字识别,生物信息识别。 二维空间分割界是一条直线,在三…