【Delphi 爬虫库 1】GET和POST方法

news2024/12/24 9:02:43

文章目录

    • 1.最简单的Get方法实现
    • 2.可自定义请求头、自定义Cookie的Get方法实现
    • 3.提取响应协议头
    • 4.实现Post请求完成单词翻译

爬虫的基本原理是根据需求获取信息并返回。就像当我们感到饥饿时,可以选择自己烹饪食物、外出就餐,或者订外卖一样。在编程中,使用 GET 和 POST 方法可以根据需求获取信息。

在 Delphi 中,有许多控件可以实现 GET 和 POST 方法,例如 Indy 组件等。然而,由于 Indy 组件庞大且使用起来不是很方便,在多线程环境下容易出现崩溃等问题。因此,我重新封装了 WinInet 单元,以更方便、快捷地实现 GET 和 POST 方法。

1.最简单的Get方法实现

下面的代码实现了返回百度的首页源代码:

// 返回百度首页源码
procedure TForm1.Button1Click(Sender: TObject);
var
  strResponse: AnsiString;
begin
  strResponse:= InetHttp(Edit1.Text);
  Memo4.Text:= UTF8Decode(strResponse);
end;

这里InetHttp是重载函数,不但可以返回字符串,也可以返回流或者直接下载文件到本地,如果需要获取图片那么返回流会更方便。

function InetHttp(const AURL: string; Stream: TStream; APost: TStrings = nil): Boolean; overload;
function InetHttp(const AURL: string; APost: TStrings = nil): AnsiString; overload;
function InetHttp(const AURL: string; FileName: string; APost: TStrings = nil): Boolean; overload;

2.可自定义请求头、自定义Cookie的Get方法实现

在上面的示例中展示了最基本的 GET 请求,但在许多情况下,我们需要自定义请求头,因为有时对方服务器会对请求头进行检测。通常,我们会先进行抓包,然后将抓取到的请求头发送出去。

重新修改代码,让其支持自定义请求头

procedure TForm1.Button1Click(Sender: TObject);
var
  strResponse: AnsiString;
  http: THTTP;
  Url: string;
  Header: string;
begin
  Url := Edit1.Text;
  if not CheckBox1.Checked then
  begin
    strResponse := InetHttp(Url);
    Memo4.Text := UTF8Decode(strResponse);
  end
  else
  begin
    http := THTTP.Create;
    try
      if CheckBox2.Checked then
        http.NoCookie:= True;
      http.HttpRequestHeaders.Text := Memo1.Text;
      strResponse := http.GetString(Url);
      Memo4.Text := UTF8Decode(strResponse);
    finally
      http.Free;
    end;
  end;
end;

请添加图片描述
还有一个注意的地方,我们有时候需要在自定义请求头中自定义Cookies,可以添加代码http.NoCookie:= True;来设置,否则程序会自己维护Cookies

3.提取响应协议头

有时候一些重要的信息会在响应协议头,比如Cookies,我们需要提取出来。封装单元中已经做了提取处理,这里只需要一行代码即可。

Memo3.Text:= http.HttpResponseHeaders.Text;

4.实现Post请求完成单词翻译

下面实现了"apple"翻译成了"苹果"

procedure TForm1.Button3Click(Sender: TObject);
var
  strResponse: AnsiString;
  http: THTTP;
  Url: string;
  Header: string;
  PostBody: TStrings;
begin
  Url := 'https://fanyi.qq.com/api/translate';
  Header :=
    'Accept: application/json, text/javascript, */*; q=0.01' + #13#10 +
    'Accept-Encoding: gzip, deflate' + #13#10 +
    'Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6' + #13#10 +
    'Connection: keep-alive' + #13#10 +
    'Content-Type: application/x-www-form-urlencoded; charset=UTF-8' + #13#10 +
    'Origin: https://fanyi.qq.com' + #13#10 +
    'Referer: https://fanyi.qq.com/' + #13#10 +
    'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/109.0.0.0 Safari/537.36 Edg/109.0.1518.100' + #13#10 +
    'X-Requested-With: XMLHttpRequest' + #13#10;

  http := THTTP.Create;
  PostBody := TStringList.Create;
  try
    http.HttpRequestHeaders.Text := Header;
    PostBody.Text :=
      'source=en' + #13#10 +
      'target=zh' + #13#10 +
      'sourceText=apple' + #13#10 +
      'sessionUuid=translate_uuid' + GenerateTimestamp(Now, True).ToString;
    strResponse := http.GetString(Url, PostBody);
    Memo4.Text := UTF8Decode(strResponse);
    Memo3.Text := http.HttpResponseHeaders.Text;
  finally
    PostBody.Free;
    http.Free;
  end;
end;

这里Header的数据与PostBody的数据都是通过抓包所得。
请添加图片描述

成功返回了我们需要的数据:

{“sessionUuid”:“translate_uuid1713009200766”,“translate”:{“errCode”:0,“errMsg”:“”,“sessionUuid”:“translate_uuid1713009200766”,“source”:“en”,“target”:“zh”,“records”:[{“sourceText”:“apple”,“targetText”:“苹果”,“traceId”:“ca242e6218b845a8b1abf10b0610328f”}],“full”:true,“options”:{}},“dict”:null,“suggest”:null,“errCode”:0,“errMsg”:“ok”}

上面是一段json数据,下一篇文章将讲解如何在json数据中提取我们所需要的数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1591895.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

d盘无法格式化说另一个正在使用怎么办

在日常生活和工作中,我们经常会遇到需要对电脑硬盘进行格式化的情况。然而,有时在尝试格式化D盘时,会遇到一个常见的错误提示:“另一个程序正在使用此文件,因此无法进行操作”。这个提示可能会让许多人感到困惑&#x…

煤化工废水末端杂盐母液主流处置技术,你一定要了解么!

煤化工废水零排放的意义 随着能源结构的转型升级,现代煤化工产业也将有力推动绿色可再生市场的健康发展。“十一五”时期我国先后建成多个现代煤化工首批示范工程,基本实现了工艺流程贯通、产出合格产品的目标,但在水系统优化、废水处理等方…

水箱缺水保护使用元件

水箱缺水保护一般使用哪种液位传感器?液位传感器分为接触式和非接触式,能点科技的光电接触式需要在水箱上开孔安装,非接触式分为两种,一种是光电分离式,一种是电容式传感器。 光电一体式液位传感器内部器件都是树脂胶…

IPv4头部

IPv4头部 互联网协议(IP)的核心部分,用于在互联网上传输数据包。IPv4头部包含多个字段,这些字段对于正确地路由和传递数据至目的地至关重要。IPv4头部通常是20字节长,但可以因选项字段的存在而更长。以下是IPv4头部各个…

【Java探索之旅】方法的概念 定义 执行流程 实参与形参的交互

🎥 屿小夏 : 个人主页 🔥个人专栏 : Java编程秘籍 🌄 莫道桑榆晚,为霞尚满天! 文章目录 📑前言一、方法的概念及定义1.1 方法的概念1.2 方法的定义 二、方法的调用执行过程2.1 执行流…

【matlab非线性规划工具箱安装1 SeDuMi 1.3工具箱】

【matlab非线性规划工具箱安装1 SeDuMi 1.3工具箱】 该博客是非线性手眼标定代码中所依赖的matlab工具箱的安装内容,除了进行手眼标定以外,该工具箱还可以用于其他的非线性规划问题 手眼标定传送门: 【从零开始进行高精度手眼标定 eye in …

【Unity】常见性能优化

1 前言 本文将介绍下常用的Unity自带的常用优化工具,并介绍部分常用优化方法。都是比较基础的内容。 2 界面 2.1 Statistics窗口 可以简单查看Unity运行时的统计数据,当前一帧的性能数据。 2.1.1 Audio 音频相关内容。 Level:音量大小&a…

学习javaEE的日子 Day36 字符流

Day36 1.字符流 应用场景:操作纯文本数据 注意:字符流 字节流编译器 编译器:可以识别中文字符和非中文字符,非中文字符获取1个字节(一个字节一个字符),编译器会根据编码格式获取中文字符对应的…

Python测试框架 —— pytest与unittest的区别!

前言 在Python中进行测试时,两个最流行的测试框架是unittest和pytest。虽然它们的目标相同,但它们之间存在许多不同之处。 本文将详细比较它们在用例编写规则、前置和后置方法、参数化、断言功能、用例执行和报告生成等方面的差异,并适当补…

分类预测 | Matlab实现SSA-LSSVM麻雀算法优化最小二乘支持向量机数据分类预测

分类预测 | Matlab实现SSA-LSSVM麻雀算法优化最小二乘支持向量机数据分类预测 目录 分类预测 | Matlab实现SSA-LSSVM麻雀算法优化最小二乘支持向量机数据分类预测分类效果基本介绍程序设计参考资料 分类效果 基本介绍 1.Matlab实现SSA-LSSVM麻雀算法优化最小二乘支持向量机数据…

本地知识库搭建教程来了,跟着做就行

你是不是常常因为找不到几个月前那个重要的工作笔记而头疼?或者是厌倦了反复在互联网的海洋中搜寻相同的信息?一个本地的知识库可能是你需要的解决方案。今天,我就要为你分享如何简单地搭建起自己的知识库,让你的信息更有组织、更…

别等Sora了!字节跳动旗下国产AI工具Dreamina,AI视频生成虽不完美,但够惊艳!

别等 Sora 了,试试字节跳动的 Dreamina!Dreamina 是剪映旗下的一个 AI 创作平台,目前支持「文生图」、「智能画布」和「视频生成」功能。 Dreamina 官网:https://dreamina.jianying.com/ai-tool/home 之前对 Dreamina 的「文生图…

大数据------JavaWeb------JDBC(完整知识点汇总)

JDBC 定义 全称为Java数据库连接(Java DataBase Connectivity):是使用java语句来操作所有关系型数据库的一套API JDBC本质 它是官方定义的一套操作所有关系型数据库的规则(即接口),各个数据库厂商会去实现…

socat神器解密:网络数据传输的利器

欢迎来到我的博客,代码的世界里,每一行都是一个故事 socat神器解密:网络数据传输的利器 前言socat简介基本用法常见功能常见功能:1. 端口转发和数据重定向:2. 加密和解密数据流: 高级功能1. 代理服务器和隧…

Tomcat启动闪退的10个解决小技巧

引言 大家好!在我们日常开发中,使用Tomcat作为Web服务器是相当常见的。 然而,遇到Tomcat启动后立即闪退的问题也不是什么稀罕事。 这种情况可能会让人感到困惑和沮丧,特别是当你急需完成一个项目或者修复一个重要的bug时。 不过…

单链表的创建与修改

链表的分类: 链表可按照:1.双向,单向。2.循环,不循环。3.带头,不带头。 根据不同组合可分为8类。其中不带头单项不循环链表为单链表。 单链表的第一个节点为头节点: 节点的创建: 通过这样一…

2024 年排名前 5 的 CSS 框架

文章目录 1、Bootstrap2、Tailwind CSS3、Foundation4、Bulma5、UIKit 1、Bootstrap Bootstrap框架是由Twitter的设计师Mark Otto和Jacob Thornton合作开发的,于2011年8月在GitHub上发布。它是目前最受欢迎的前端框架之一,被广泛应用于各种Web项目中。Bo…

基于机器学习预测岗位薪资

本文根据某招聘网站抓取的岗位信息,来预测该岗位平均薪资。 数据预处理 数据示例如下: 因为本文重点介绍如何实现预测,因此对于数据的预处理部分讲解一下处理逻辑: 1、统一薪资的单位,要么统一为年薪(万/…

【Linux】序列化与反序列化{服客编程/守护进程/JSON}

文章目录 1.引入2. 静态成员函数3.TCP:传输控制协议4.守护进程4.0前台进程4.1介绍4.2认识4.3会话4.3ps axj4.4理解4.5/dev/null4.6守护进程和孤儿进程 5.JSON6.完整代码6.1Makefile6.2Socket.hpp6.3Protocol.hpp6.4Log.hpp6.5Daemon.hpp6.6TcpServer.hpp6.7Client.c…

PBXAI:将疾病预测转为沿知识图谱的随机游走

PBXAI:将疾病预测转为沿知识图谱的随机游走 PBXAI 知识图谱构建 病人特征与知识图谱连接 强化学习 疾病发展路径的生成PBXAI 流程PBXAI 算法设计 论文: https://arxiv.org/ftp/arxiv/papers/2010/2010.08300.pdf 代码:https://github.co…