新年找工作？python带你批量采集招聘数据

news2026/2/12 13:39:49

前言

大家早好、午好、晚好吖 ❤ ~

必备素材:

stealth.min.js
谷歌浏览器+谷歌驱动+selenium3.141.0

不知道怎么弄嘚同学可以私我获取哦~

开发环境:

python 3.8
pycharm 专业版

操作步骤

selenium 模块: 操作浏览器

打开一个浏览器
打开一个网址
获取数据
保存数据

代码展示

导入模块

from selenium import webdriver      # 操作浏览器的
import csv

f = open('招聘.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.writer(f)
csv_writer.writerow(['job_name', 'job_area', 'salary', 'tag_list', 'company_name', 'company_tag_list', 'info_desc'])

1. 打开一个浏览器浏览器驱动(被操作的)

driver = webdriver.Chrome()
for page in range(1, 11):

2. 打开一个网址

    driver.get(f'https://www.*****.com/web/geek/job?query=python%E7%88%AC%E8%99%AB&city=100010000&page={page}')

等待五秒钟如果在五秒以内程序加载完了 3

    driver.implicitly_wait(5)

3. 获取数据定位数据

.job-card-wrapper selector语法

获取到所有的商品信息

    lis = driver.find_elements_by_css_selector('.job-card-wrapper')

二次提取

    for li in lis:
        job_name = li.find_element_by_css_selector('.job-name').text
        job_area = li.find_element_by_css_selector('.job-area').text
        salary = li.find_element_by_css_selector('.salary').text
        tag_list = li.find_element_by_css_selector('.tag-list').text
        源码、解答、教程、资料加Q君羊：261823976##
        company_name = li.find_element_by_css_selector('.company-name').text
        company_tag_list = li.find_element_by_css_selector('.company-tag-list').text
        info_desc = li.find_element_by_css_selector('.info-desc').text
        print(job_name, job_area, salary, tag_list, company_name, company_tag_list, info_desc)

4. 保存数据

        csv_writer.writerow([job_name, job_area, salary, tag_list, company_name, company_tag_list, info_desc])

尾语 💝

好了，今天的分享就差不多到这里了！

完整代码、更多资源、疑惑解答直接点击下方名片自取即可。

有更多建议或问题可以评论区或私信我哦！一起加油努力叭(ง •_•)ง

喜欢就关注一下博主，或点赞收藏评论一下我的文章叭！！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/192387.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

新年找工作？python带你批量采集招聘数据

前言

必备素材:

开发环境:

操作步骤

代码展示

尾语 💝

相关文章

性能测试工具-nmon

Maven实战-2.pom.xml标签说明

【linux】剖析底层——带你详细了解Linux内核源码的构成及其作用（1）

8 加载数据集

局域网中UTP连接，如何实现防止芯片损坏，防止信号产生各种误码，及实现CHIP之间的阻抗匹配

10、条件语句

【BetterBench】2023年美赛辅导

【异常】前端Babel提示 Support for the experimental syntax ‘jsx‘ isn‘t currently enabled

《流浪地球2》看不懂？根服务器、权威解析，专业科普来了

二叉平衡树之红黑树（手动模拟实现）

MySQL详解（四）——高级 2.0

ECharts线性渐变色示例演示（2种渐变方式）

PTA L1-025 正整数A+B（详解）

用户使用苹果AirTag来追踪宠物存在风险，苹果Find My功能用处广

【Faster R-CNN】之 Resize_and_Padding 代码精读

Linux网络：传输层之UDPTCP协议

PyQt5利用Qt Designer制作一个可以拖动获取文件信息的页面

[Golang实战]整理Golang忽略的问题

IPWorks EDI 2022.0.8381 for NET Crack

golang/安装