一、xhs【帖子/笔记/视频】采集工具链接
(请复制链接至浏览器,进行数据采集)
http://106.53.68.168:9920/xhs-keyword-spider
能爬取到的属性字段如图1 (点击右侧下拉按钮,可任选字段)
图1·属性字段
二、爬取规则
1、通过搜索关键词抓取,标题或内容描述中包含该关键词的帖子均可被爬取至本地。(见图2)
图2·关键词搜索框
2、搜索模式有4种(见图3),分别对应xhsAPP平台的数据搜索模式(搜索模式中的【默认】模式,等于同时选中以上[综合]、[最新]、[最热]3种搜索模式,数据量是3者之和)。
图3·搜索模式
3、组合词爬取规则:举个栗子,搜索的关键词为"北京圆明园",能爬取到组合词连续的帖子,文本格式为“...北京圆明园...”;还能爬取到组合词不连续出现的帖子,文本格式为“...北京...圆明园...”。
4、关键词越简短,抓取到的数据越精准哦。每次采集只能输入一个关键词,不建议搜索太长或者不太常见的关键词哦。
5、采集数据时,页面右上角显示【RUNNING】动态图标(见图4),代表程序正在采集数据中。
图4·数据采集时的动态图标
6、采集过程根据数据量的不同,需要几分钟至十几分钟,请耐心等待。采集结束后,右上角的动态图标自动消失,页面下方出现【下载结果】按钮(见图5)。
图5·下载结果按钮
三、爱发电
由于工具内部对接了第三方的付费API,所以,本工具需要付费使用(小额费用哈,不要紧张哈,作者需要你们的支持)。
前往 https://afdian.net/item/13509d64f23b11edb98852540025c377 支付,拍完后在下方输入订单号即可开始抓取。
1、单个关键词/次的抓取费用2元起(会员1.6元哦);
2、根据所选属性字段的爬取难度、是否下载高清图等需求,抓取费用会有所不同(会员8折哦)。
3、会员价开通方式,在付款页面下方的提示中哦。
四、工具使用方法
打开网页链接后,按照网页各步骤的提示进行操作即可,没任何难度。
xhs【笔记/帖子】数据采集工具 链接如下:
http://106.53.68.168:9920/xhs-keyword-spider
附:xhs评/论数据采集工具 链接如下:
http://106.53.68.168:9920/xhs-comment-spider
五、人工采集
如需采集数据量较大、关键词较多,建议联系技术员进行采集。
价格有优惠哦!
六、补充说明
1、费用充值后不接受任何形式的退款(因为钱款打给了AFD平台,并没有直接打款给作者嗷)。
2、如遇任何技术问题,请及时联系技术人员。