本文介绍小O网兜入门功能,通过本文用户能够掌握数据采集的基本操作,使用软件提供的模板任务采集指定页面的数据。
基本概念
- 任务文件:新建任务文件,扩展名为 xop,任务的配置、采集数据等信息保存在该文件中,妥善保存文件。
- 采集规则:针对采集网页设置的采集规则,由一组采集动作组成,可自动循环执行。
- 采集动作:采集规则下的动作,提供多种类型的动作,包括打开网页、点击、翻页、采集等动作。
- 数据表:采集数据保存在数据表中,用户根据采集数据结构设置表和字段。
功能简介
启动软件
启动软件后,注册并登陆后,点击左上角开始。
新建任务
在任务向导界面中,新建或打开任务文件。
也可以直接下载配置好的模板任务文件,选择保存任务文件的路径,点击确定打开任务。
如下载模板中没有你想要的,可以加入QQ群与客服联系由客服配置模板。
点击下载模板文件,内含的任务,打开后可直接运行
采集数据
打开任务界面,如下图
启动采集
选择目标动作,点击鼠标右键菜单,选择执行即可启动采集。
- 如下载模板任务,已配置好采集规则,可直接启动采集。
- 如新建模板任务,则需先配置采集规则。
● 执行(单步):仅执行当前选中的动作。
● 执行(循环):从当前选中的动作开始依次执行动作,按配置循环执行。
重置规则
打开页面、翻页动作等个别动作,自身有需执行的记录,如执行完再次执行会提示任务已完成或无记录的提示。如需再次执行,需要重置动作。
● 重置当前动作:在动作上右键菜单,选择重置当前动作,重置当前动作。
● 重置所有动作:选择规则节点,点击右键菜单,选择重置所有动作。
查看数据
点击【数据表】,打开当前任务的数据表,用户通过该界面可以新建数据表、配置数据表、数据字段、导出采集数据、删除重复数据等操作。
导出数据
采集的数据可导出成CSV等文件,同时提供删除重复记录等功能。
配置规则
采集规则决定了任务执行的规则,为本软件高级功能。
新建空任务后,配置采集规则,首先在右侧浏览地址栏输入目标网址,打开该页面。
依次配置“数据表”、“新建规则”
配置数据表
对照网页内容,依次新建表、修改表名、字段名。
配置规则
新建采集规则,并借助右侧的网页树和网页浏览器配置规则及动作参数。
新建规则后,默认会添加打开网页、扫描页面、读取数据、跳转步骤等动作,下图A区
配置动作参数,不同类型动作对应不同参数,用以控制动作执行,下图B区。
规则配置详细内容见知识库专题。
收藏页面
用户浏览网页,可以将目标网页收藏至收藏夹中,待后续进入软件时打开。
选中网页节点,点击鼠标右键,可打开、删除页面。
<本文完>