【Python爬虫项目实战】Python爬虫采集某外包平台数据保存本地

news2025/4/26 17:11:18

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、开发工具
二、环境搭建
三、数据来源查询分析
四、代码实现
- 1. 发送请求
- 2.数据获取
- 3.解析数据
- 4. 保存数据
总结

前言

今天给大家介绍的是Python爬虫某外包平台数据，在这里给需要的小伙伴们帮助，并且给出一点小心得。

目标网址

一、开发工具

Python版本： 3.6

相关模块：

import requests

import parsel

import csv

import re

二、环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

文中完整代码及文件，评论区留言

三、数据来源查询分析

浏览器中打开我们要抓的页面
按F12进入开发者工具，查看我们想要的外包平台数据
这里我们需要页面数据就可以了

目标网址

四、代码实现

1. 发送请求

response = requests.get(url=url, headers=headers)

2.数据获取

print(response.text)

3.解析数据

    selectors = parsel.Selector(response.text)  
   
    divs = selectors.css('.itemblock')  
    for div in divs:  
       
        title = div.css('div.title a::attr(title)').get()  
        modelName = div.css('div.modelName::text').get().strip()  
        num = div.css('div.browser div:nth-child(2) span::text').get().strip()  
        num_1 = div.css('div.browser div:nth-child(3) span::text').get().strip()  
        status = div.css('span.status::text').get().strip()  
        price = div.css('span.price::text').get().strip()  
        href = div.css('div.title a::attr(href)').get()

4. 保存数据

csv_writer.writerow(dit)
        print(title, modelName, num, num_1, status, price, href)

总结

今天的分享到这里就结束了

顺便给大家推荐一些Python爬虫视频教程，希望对大家有所帮助：

Python爬虫实战案例教程合集

对文章有问题的，或者有其他关于python的问题，可以一起讨论
觉得我分享的文章不错的话，可以粉一下我，或者给文章点赞(/≧▽≦)/

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/150313.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Python爬虫项目实战】Python爬虫采集某外包平台数据保存本地

文章目录

前言

一、开发工具

二、环境搭建

三、数据来源查询分析

四、代码实现

1. 发送请求

2.数据获取

3.解析数据

4. 保存数据

总结

相关文章

架构设计---搜索引擎的原理

从0.5到4.0，OceanBase单机分布式一体化的技术演进｜DTCC 2022

信道模型：卫星→地面

异常流量发现与分析案例

数字孪生关键技术及其在电力行业应用场景

前端组件库自定义主题切换探索-01-方案借鉴与思路参考

C++ stack和queque

u盘格式化后数据能恢复吗？当然可以，5步恢复U盘数据

新C++(4):模板

数据库，计算机网络、操作系统刷题笔记29

联合证券|主力加仓电气设备、有色金属等行业

如何在Windows中轻松扩大C盘？

Linux信号通信之信号

Spire.Office 8.1.1 for .NET 是 Spire.Office 7.12.5吗

持续交付-Jenkinsfile 语法

openEuler委员会主席江大勇：激发原创力量，逐梦数智未来

PyQt学习笔记-基本窗体

国产之光Yakit——POC模拟神器

前端项目-小米商城

VCSA证书过期处理