Windows部署定时任务,每天定期执行手机机型爬取

news2024/10/7 16:27:07

项目背景

有一个手机机型自动更新获取的需求,在我写好相关的爬虫后,需要将爬虫部署,并且需要配置定时任务每天定期执行。之前在Mac上开发,现在部门给配了一台windows定期执行。

环境准备

A、安装ChromeDriver

1、我是通过ChromeDriver开发的爬虫,所以首先需要安装好Chrome

查看当前的谷歌版本:
请添加图片描述
然后再到官网上去找对应版本的驱动: ChromeDriver驱动下载

2、配置环境变量
将下载好的压缩文件解压,然后把其中的 exe文件复制到Chrome路径以及Python的安装路径下:
请添加图片描述

配置Chrome的系统环境变量,此电脑→右击属性→高级系统设置→环境变量→用户变量→Path 中新建: …\Chrome\Application
请添加图片描述
如果是使用IDEA安装的Python,可能会找不到具体的安装路径,可以 通过 File→Project Structure→Project 查看:
请添加图片描述
然后我们可以测试一下chromedriver 是否安装成功:

from selenium import webdriver

if __name__ == '__main__':
    #测试chromedriver 是否安装成功
    browser = webdriver.Chrome()
    browser.get('http://www.baidu.com/')

请添加图片描述
**注意:**浏览器版本自动更新后,可能驱动与之不匹配会报错,就需要重新下载与浏览器对应的驱动,覆盖如下两个位置:
1、Chrome安装路径
2、Python的安装路径

B、部署环境

在部署爬虫的时候,有些包的版本可能需要保持一致,例如selenium的版本从4.3以后有较大的变动,删除了find_element_by_xpath 方法,需要使用find_element()方法,不熟悉的话可以改为之前的版本:请添加图片描述

pip install selenium==3.141.0

请添加图片描述

再看Python Packages里面的版本变为了3.141.0。

C、将爬虫任务配置为每天定时爬取

1.创建 mobileSpider.txt,将后缀改为bat,并且在里面写上python执行指令:

python mobileSpider.py

请添加图片描述

2.我们打开任务计划程序,选择创建任务,这里写一个名称用以标记,然后切换到触发器

请添加图片描述

3.在触达器中,我们新建触发器,并且按照自己想要的定时任务配置定期执行的时间与频次。

请添加图片描述

4.我们直接确认,可以在触发器中看到刚刚设置的触发器。

请添加图片描述

5.最后在操作中选择我们要定期执行的指令文件:

请添加图片描述

其中程序或脚本选择要执行的bat文件: D:\dev\code\mobileSpider\mobileSpider.bat
添加参数: D:\dev\code\mobileSpider\mobileSpider.bat
起始于: D:\dev\code\mobileSpider\

注意: 定时任务配置好以后,可以在终端中测试一下,我们进入到 .bat与 .py存放到文件路径内,使用python mobileSpider.py执行,可能会报错:

Traceback (most recent call last):
  File "D:\dev\code\mobileSpider\mobileSpider.py", line 3, in <module>
    from selenium import webdriver
ModuleNotFoundError: No module named 'selenium'

解决方案可以参考这篇博文: 解决Windows下使用cmd执行Python文件报错 ModuleNotFoundError: No module named ‘XXXX‘

解决了上述问题以后,然后就可以正常执行了,并且定时任务也可以成功运行:
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/169361.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JAVA中创建线程池的五种方法及比较

之前写过JAVA中创建线程的三种方法及比较。这次来说说线程池。 JAVA中创建线程池主要有两类方法&#xff0c;一类是通过Executors工厂类提供的方法&#xff0c;该类提供了4种不同的线程池可供使用。另一类是通过ThreadPoolExecutor类进行自定义创建。 目录 一、通过Executors…

c++ - 第25节 - STL之空间配置器

1.什么是空间配置器 空间配置器&#xff0c;顾名思义就是为各个容器高效的管理空间(空间的申请与回收)&#xff0c;在默默地工作。虽然在常规使用STL时&#xff0c;可能用不到它&#xff0c;但站在学习研究的角度&#xff0c;学习它的实现原理对我们有很大的帮助。2.为什么需要…

Javascript 模板模式

模板方法模式的定义和组成 模板方法模式是一种只需使用继承就可以实现的非常简单的模式。 模板方法模式由两部分结构组成&#xff0c;第一部分是抽象父类&#xff0c;第二部分是具体的实现子类。 通常在抽象父类中封装了子类的算法框架&#xff0c;包括实现一些公共方法以及封…

汉(海)明码 | “十六宫格法” 破解汉(海)明码相关题目(附软考经典例题)

文章目录一、前言二、奇偶校验码三、海明码概念四、十六宫格法1.概述2.原理3.填写校验位4.填写数据位5.填写十六宫格首位五、结语一、前言 很多小伙伴在遇到“汉明码”相关的题目时&#xff0c;看了很多的视频&#xff0c;很多文章可能还是云里雾里&#xff0c;作者在备考软考…

Linux:GDB 调试一些函数栈被毁坏的问题

一、背景 GDB调试代码时&#xff0c;偶尔会遇到一些奇怪的现象&#xff1a;函数的参数地址在函数内部被传递给另外的函数&#xff0c;然后发现地址发生了改变&#xff0c;这样的情况称之为函数的栈被毁坏&#xff0c;导致无法重入。 然后被调用的函数里面&#xff0c;访问了非…

5.一个高性能、无侵入的Java性能监控和统计工具,有点东西!

随着所在公司的发展&#xff0c;应用服务的规模不断扩大&#xff0c;原有的垂直应用架构已无法满足产品的发展&#xff0c;几十个工程师在一个项目里并行开发不同的功能&#xff0c;开发效率不断降低。 于是公司开始全面推进服务化进程&#xff0c;把团队内的大部分工程师主要…

应用性能监控系统为企业SAP做定制分析

前言 某汽车总部已部署NetInside应用性能监控系统&#xff0c;使用流量分析系统提供实时和历史原始流量&#xff0c;重点针对SAP系统性能进行分析&#xff0c;以供安全取证、应用事务分析、网络质量监测以及深层网络分析。 本次分析报告包含&#xff1a;定制SAP性能和SAP接口…

微课录屏软件哪个好?小白也能快速上手

相比线下课程&#xff0c;微课有着时间短、知识碎片化、可以循环播放等优点&#xff0c;我们可以在任意场所任意时间打开微课进行学习。那你知道微课是如何制作的吗&#xff1f;大部分微课是通过录屏软件录制电脑上教学内容制作而成的。微课录屏软件哪个好&#xff1f;今天小编…

Python实现哈里斯鹰优化算法(HHO)优化支持向量机分类模型(SVC算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 2019年Heidari等人提出哈里斯鹰优化算法(Harris Hawk Optimization, HHO)&#xff0c;该算法有较强的全…

[疑难杂症2023-001]代码没有任何改变,仅用CI打了一个新镜像,运行出错的可能原因分析

本文由Markdown语法编辑器编辑完成。 1. 前言 近日在项目中&#xff0c;遇到一个比较奇怪的问题。就是代码基本没有做任何修改&#xff0c;只是在配置文件中增加了几行配置&#xff0c;结果用CI的服务器&#xff0c;打了一个新的tag, 然后再运行时&#xff0c;就会出现报错。…

一文带你看懂验证码攻防技术那些事儿

本文目录 验证码为什么越变越复杂&#xff1f; 验证码有哪些破解方式&#xff1f; 验证码如何进行顶层产品能力设计&#xff1f; “天生反骨”的验证码总是让人类头疼不已。 比如最基础的英文数字组合验证码&#xff0c;就已经会让人陷入自我怀疑&#xff1a; “I还是1&am…

【机器学习 - 3】:数据归一化(最值归一化、均值方差归一化)

文章目录数据归一化的使用最值归一化均值方差归一化&#xff08;常用&#xff09;在sklearn中调用归一化&#xff08;鸢尾花数据归一化&#xff09;数据归一化的使用 为什么要使用数据归一化&#xff1f; 举个例子&#xff0c;例如我们要使用KNN算法来预测肿瘤为良性肿瘤或恶性…

Python算法:三种高级排序的方法

前言 声明&#xff1a;本文所有动图来源为菜鸟教程 &#x1f340;作者简介&#xff1a;被吉师散养、喜欢前端、学过后端、练过CTF、玩过DOS、不喜欢java的不知名学生。 &#x1f341;个人主页&#xff1a;红中 &#x1f342;不就是蓝桥杯嘛&#xff0c;干他&#xff01;&#…

Windows系统上的小知识点集合(收藏更新)

1.开机自动运行 如果你写了一段代码或者脚本&#xff0c;甚至某个程序。希望在windows开机之后自动执行&#xff0c;可以按照以下方法操作 对于Windows系统&#xff0c;开机之后当所有的软件初始化完毕之后&#xff0c;会自动运行 C:\Users\&#xff08;你的用户名&#xff…

Elasticsearch入门—— Elasticsearch7.8.0版本索引操作

目录一、创建索引1.1、创建索引概述1.2、创建索引示例1.3、重复创建索引示例二、查看索引2.1、查看所有索引2.2、查看单个索引三、删除索引3.1、删除索引一、创建索引 1.1、创建索引概述 对比关系型数据库&#xff0c;创建索引就等同于创建数据库 1.2、创建索引示例 在 Pos…

matlab/simulink仿真数据的导出暨to workspace模块的使用

matlab/simulink仿真数据的导出 在用simulink仿真的时候&#xff0c;希望把数据导出&#xff0c;用其他软件进一步分析和处理&#xff0c;该如何做呢&#xff1f; 使用下面这个叫做to workspace的模块就可以实现 1 参数设置 把该模块拖出来。双击打开进行设置&#xff0c;会…

贪心策略(一)(选择排序、分割平衡串、买卖股票、跳跃游戏)

贪心算法&#xff08;又称贪婪算法&#xff09;是指&#xff0c;在对问题求解时&#xff0c;总是做出在当前看来是最好的选择。也就是说&#xff0c;不从整体最优上加以考虑&#xff0c;他所做出的是在某种意义上的局部最优解。 贪心选择是指所求问题的整体最优解可以通过一系列…

4、Ubuntu20常用操作_文本编辑文件系统目录和文件操作用户管理和文件权限

Ubuntu系统操作 注销&#xff08;退出Linux系统&#xff09; 在每次使用完后&#xff0c;一定要进行注销&#xff08;或者说退出&#xff09;&#xff0c;以防他人通过你的帐号进入系统。 在Linux提示符下&#xff0c;运行exit命令&#xff0c;即可退出本次登录 或直接按组…

代码随想录刷题训练营第七天|● 454.四数相加II ● 383. 赎金信 ● 15. 三数之和 ● 18. 四数之和 ● 总结

四数相加 看完题后的思路 首先想到了暴力解法,四重for循环,时间复杂度为0(n^4).接着往下想,四数相加不正好是(两数相加)(两数相加)吗,可以依次求出两数相加的结果存入hash表中 和-[下标1,下标2],然后再进行两数相加. 思路 上面的思路中,有两点疑问: (12)(34)(13)(24)吗? 1…

渗透测试基础入门【01】——测试流程(IPC$)

渗透测试基础入门【01】——测试流程&#xff08;IPC$&#xff09; 注意&#xff0c;攻击对方需要对方授权&#xff0c;本文章目的只为教学&#xff0c;不要拿去干违法的事 1 渗透测试流程 授权&#xff08;获取目标用户授权&#xff0c;否则是违法行为&#xff09;信息收集 …