用Rust和cURL库做一个有趣的爬虫

news2024/11/24 11:44:08

以下是一个使用 Rust 和 cURL 库的下载器程序,用于从wechat下载音频。此程序使用了 [/get_proxy] 提供的代码。

在这里插入图片描述

extern crate curl;

use std::io::{self, Read};
use std::process::exit;
use curl::easy::Easy;

fn main() {
    let url = "https://www.wechat.com/audio/"; // 目标 URL
    let proxy_url = "https://www.duoip.cn/get_proxy"; // 爬虫IP服务器 URL

    // 创建一个 cURL 实例
    let mut easy = Easy::new();

    // 设置爬虫IP服务器
    easy.set_proxy(proxy_url).unwrap();

    // 设置目标 URL
    easy.set_url(url).unwrap();

    // 设置头部信息
    easy.set_header("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36").unwrap();

    // 设置保存到文件的路径
    let out_path = "./wechat_audio.mp3";
    let mut out_file = io::Cursor::new(Vec::new());

    // 设置写入文件的回调函数
    easy.set_write_function(|data| {
        out_file.write(data).unwrap();
        Ok(data.len())
    }).unwrap();

    // 执行下载
    let res = easy.perform();

    // 检查下载结果
    if res.is_err() {
        println!("下载失败: {}", res.unwrap_err());
        exit(1);
    }

    // 将下载的数据保存到文件中
    let mut file = io::File::create(out_path).unwrap();
    file.write_all(&out_file.into_inner()).unwrap();

    println!("下载完成: {}", out_path);
}

这个程序首先从 get_proxy 获取爬虫IP服务器地址,然后使用 cURL 库下载 [www.wechat.com] 上的音频文件。下载完成后,文件会被保存到本地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1123514.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图片base64说明

将一张图片数据编码成一串字符串,使用该字符串代替图片地址url 前端页面中常见的base64图片引入方式: 优点: ①、base64格式的图片是文本格式,占用内存小,转换后的大小比例大概为1/3,降低了资源服务器的…

C#开发的OpenRA游戏之金钱系统(4)

C#开发的OpenRA游戏之金钱系统(4) 前面已经分析怎么样找到资源收割的位置,接着下来就是怎么样移动到资源的坐标,以及怎么样进行收割资源。现在就来分析这个相关的代码,这些功能都在文件HarvestResource.cs里,声明了一个类HarvestResource。 类HarvestResource就是在确定…

SAP从入门到放弃系列之QM样本确定-采样过程的采样方案

目录 一、概述二、AQL概念三、系统操作 一、概述 样本确定过程中可以有百分比、固定样本、参考采样方案(Sample Schema)三种方式。其中百分比、固定样本的采样方案是比较号理解的,但是参考采样方案中相对逻辑更复杂,再参考采样方…

微信视频号视频下载新手用户该如何下载保存到本地?三个方法教会你

微信视频号是一个非常受欢迎的平台,提供了各种有趣和有价值的视频内容。想要将这些视频下载保存到本地可以帮助你随时观看和分享。下面,我将为你介绍几种方法。 方法一:使用第三方应用 1. 在微信客户端中搜索并获取一个一个支持微信视频号下…

YOLOV8目标检测——最全最完整模型训练过程记录

文章目录 前言1 下载yolov8([网址](https://github.com/ultralytics/ultralytics))2 配置conda环境3 用pycharm打开文件3 训练自己的YOLOV8数据集4 run下运行完了之后没有best.pt文件5 导出为onnx文件6 yolov8应用完整案例(免费且包含源代码、…

AHK v2中一个问号两个问号代表啥意思

一个问号: 函数入参以一个问号为后缀表示传参时省略该参数则相应变量就unset。 两个问号: 合并运算符. 如果左操作数(必须是一个变量) 有一个值, 它就成为结果, 并跳过右分支. PS. 三元操作符

【30】c++设计模式——>状态模式

状态模式概述 状态模式是一种行为型设计模式,它可以让一个对象在其内部状态发生变化时更改其行为。通过将每个状态封装成一个独立的类,我们可以使状态之间互相独立,并且使得状态的切换变得更加灵活、可扩展。(多个状态之间可以相…

CSS边框线段样式

让我为大家介绍一下边框样式吧!如果大家想更进一步了解边框的使用,可以阅读这一篇文章:CSS边框border 属性描述none没有边框,即忽略所有边框的宽度(默认值)solid边框为单实线dashed边框为虚线dotted边框为点线double边框为双实线 代码演示&…

XPS就是分一下峰没你想的那么简单!-科学指南针

还记得前一段时间的一篇刷屏的经典文章吗! 林雪平大学(Linkping University)的Grzegorz Greczynski和Lars Hultman二人发表观点性文章,对诺奖得主K. Siegbahn推荐的XPS校准方法可能存在的问题进行了阐述与批评,并提出建议。文章原标题为“Compromising S…

XPS测试能谱数据如何处理-科学指南针

本文将分三部分介绍如何用ORIGIN软件处理XPS测试能谱数据: 1、多元素谱图数据处理 2、剖面分析数据处理 3、复杂谱图的解叠 一、多元素谱图的处理: 1、将ASC码文件用NOTEPAD打开: 2、复制Y轴数值。打开ORIGIN,将Y轴数据粘贴到B&am…

栈和队列(8.4)

1. 栈 1.1 栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。 进行数据插入和删除操作的一端 称为栈顶,另一端称为栈底。 栈中的数据元素遵守后进先出 LIFO ( Last In First Out )…

移远通信联合产业中坚力量共同发起倡议,推动5G RedCap技术演进和应用创新发展

10月20-21日,2023年中国5G发展大会在上海召开。会议第二日,“5G轻量化(RedCap)技术演进和应用创新发展”论坛同步举办。 作为5G及RedCap技术发展的先行力量,移远通信受邀出席论坛。同时,公司副总经理刘明辉…

Go 类型全解:常量与变量大全!

一、类型确定值 类型确定值是与特定数据类型明确绑定的。类型确定值在 Go 中占有很大一部分领域,包括但不限于常量、变量、函数返回值、结构体字段等。下面是对类型确定值的的示例: 类型确定值在变量声明中 当你在变量声明中明确指定了类型&#xff0…

PLC MODBUS-ASCII协议通信( LRC校验码SCL计算FC)

Modbus-RTU协议在RS485总线上有RTU和ASCII两种传输格式,其中RTU协议应用比较多,ASCII协议很少使用。有些仪表可能会使用到ASCII协议,这篇博客我们简单介绍下MODBUS-ASCII协议,ASCII协议使用的是文本传输,整个数据包是可打印字符。 帧头一般是冒号: 帧尾是换行符\r\n。 有…

【每日一题】老人的数目

文章目录 Tag题目来源题目解读解题思路方法一:遍历 其他语言python3 写在最后 Tag 【遍历】【数组】【2023-10-23】 题目来源 2678. 老人的数目 题目解读 找出乘客中年龄严格大于 60 的人数。 解题思路 方法一:遍历 本题比较简单,直接遍…

智慧燃气巡检管理系统

我们知道燃气设施的巡检、巡查是运维工作中一项重要的基础工作,而巡检人员主要靠手动记录,回到公司后还得再进行录入归档、导入照片,然后打印装订等,涉及工作量也是不小的;还有人员更替,易造成人员对燃气设…

【设计模式】概括

设计模式 什么是设计模式 设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性、程序的重用性。 设计模式分类 创建型模式,共五种:工厂…

Java方法区

方法区 Java方法区(Method Area),在Java虚拟机(JVM)内存结构中是一个非常重要的组成部分。方法区是用来存储类信息、常量、静态变量以及即时编译器编译后的代码等数据的内存区域。 内部结构 类元数据(Cl…

Python数据挖掘 | 升级版自动查核酸

📕作者简介:热爱跑步的恒川,致力于C/C、Java、Python等多编程语言,热爱跑步,喜爱音乐的一位博主。 📗本文收录于恒川的日常汇报系列,大家有兴趣的可以看一看 📘相关专栏C语言初阶、C…

常见的状态转移矩阵和对应的运动模型

状态转移矩阵的形式取决于我们所建模的系统的动态特性。对于不同的运动模型,状态转移矩阵将会有所不同。以下是一些常见的状态转移矩阵和对应的运动模型: 恒定速度模型: 这是你给出的模型,其中物体假设以恒定速度移动。 恒定加速…