编译器:Pycharm
效果展示如图
简单原理描述:模拟人工动作爬取页面信息,运行脚本后代码自动打开浏览器获取相关信息,模拟人工进行页面跳转并自动抓取页面信息记录到表格中。
深入原理描述:页面翻转的时候会调用接口,接口中含有数据信息,定义数组存储需要的信息
需要引入的包
from DrissionPage import ChromiumPage import csv import time
这边模拟的是抓取浙江-建筑设计相关的岗位信息
如图总共抓取了3000多条岗位信息
代码
from DrissionPage import ChromiumPage
import csv
import time
f = open('浙江建筑设计612.csv', mode='w', encoding=&