一,案例背景:
小某书平台,利用影刀rpa搜索关键词,然后下载对应文章的图片.
二,思路
1. 登录小某书平台,将网页放大最大【手动完成,作为初始状态】
2. 利用影刀命令【打开输入对话框】获得要搜索的关键词
3.利用命令【填写输入框】接受2的结果,填入搜索框,并点击搜索
4.因为之想下载图文,不涉及视频,所以在点击 【图文】
5.重点来了,本来批量获得相类似的元素一般使用【循环相似元素】或者【循环相似列表】就可以,但是这了面设计一个很重要的概念”懒加载“
三 ,懒加载 介绍
简单说:就是所有的元素不在屏幕上一次展现,这就造成了无法一次取到所有对象的困难.
常用的套路为:无限循环嵌套【循环像素元素】
需要注意的事项为:1.无限循环,必须设定退出条件.2.无限循环必须去重
如何去做,需要更具具体场景去做.这里就不在赘述
四 ,如何是的程序稳定性更好
前三步,已经获得了所有笔记的链接,循环笔记链接列表就可以
每打开一个可以利用一下步骤获得图片中心思想是模拟人工:
1. 点击图片
2.弹出下载图片,点击.随机等待几秒
3.获得笔记题目元素文本,命名下载图片
但是但是但是,下载超过200左右的时候,在运行会发现无发下载
这是为什么呢?
就是:1点击图片后 没有出现2,而是复制图片或者链接.应该是触发了反爬机制
如何解决呢,利用条件分支分情况解决
思路如下,点击图片后,出现下载图片就按照原先处理,没有则利用【网页截图】命令处理一下
五,总结一下
实践出真知,套路得人心
处理懒加载问题得套路要深深记忆在脑袋里,这个是常见得网页自动化的场景,记住思路一通百通.
规避反爬虫机制,有的时候并不一定需要高深的编程知识,更重要的是实践中仔细观察,理清思路.
谢谢大家,希望觉得对大家又帮助的话 ,关注我并多提意见