Python爬虫之Js逆向案例(1)-京东商品评论数据商品详情数据案例

news2025/1/23 12:55:36

<center>声明:京东商品评论数据&商品详情获取分析仅用于研究和学习,如有侵权,可删除</center>
一次运行程序,同时获取一下内容:

1. 获取整站实时商品详情数据;
2. 获取整站实时商品评论数据;
3. 获取整站实时商品列表数据;

下面会进行以下几步进行分析(下方演示过程全部使用​​chrome​​浏览器);

1.抓包找到对应接口
商店详情​​https://item-soa.jd.com/getWareBusiness?skuId=​​​商品评价​​​https://club.jd.com/comment/skuProductPageComments.action​​​商品相关问题​​​https://question.jd.com/question/getQuestionAnswerList.action​​​问题的回答​​​https://question.jd.com/question/getAnswerListById.action​​

2.编写全局控制参数到配置文件

3.爬虫编写
3.1.公共参数:

名称类型必须描述
keyString调用key(必须以GET方式拼接在URL中)
secretString调用密钥 (复制v:Taobaoapi2014 )
api_nameStringAPI接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cacheString[yes,no]默认yes,将调用缓存的数据,速度比较快
result_typeString[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
langString[cn,en,ru]翻译语言,默认cn简体中文
versionStringAPI版本

3.2商品详情数据代码

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-vxin.taobaoapi2014.cn/jd/item_get/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=10335871600"
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

 3.3商品评论数据代码

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-vxin.taobaoapi2014.cn/jd/item_review/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=71619129750&page=1"
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

3.4商品列表数据代码

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-vxin.taobaoaoi2014.cn/jd/item_search/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&q=女装&start_price=0&end_price=0&page=1&cat=0&discount_only=&sort=&seller_info=no&nick=&seller_info=&nick=&ppath=&imgid=&filter="
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

3.5 CSV

总结:程序一键运行,过程中错误中断自动保存日志到log文件,方便后续分析!但是现在没有添加多线程,大数据量采集数据的话,单线程运行可能需要很久,本案例只是自己纯学习练习使用! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/434022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【数据结构】顺序表的增删查改操作

上一篇文章为大家介绍了对顺序表的简单的使用&#xff0c;【数据结构】顺序表详解_王笃笃的博客-CSDN博客 本篇文章继续完善对顺序表增删查改的操作。 上一篇写到了顺序表的尾部插入&#xff0c;本篇将从头部插入继续完善&#xff1b; 以下为本篇目录&#xff0c;方便阅读 …

Axios请求(对于ajax的二次封装)——Axios拦截器与错误处理

Axios请求&#xff08;对于ajax的二次封装&#xff09;——Axios拦截器与错误处理 知识回调&#xff08;不懂就看这儿&#xff01;&#xff09;场景复现核心干货axios拦截器在请求或响应被处理之前拦截他们移除拦截器给自定义的axios实例添加拦截器实际开发中的自定义拦截器&am…

C++ | 探究拷贝对象时的一些编译器优化

&#x1f451;作者主页&#xff1a;烽起黎明 &#x1f3e0;学习社区&#xff1a;烈火神盾 &#x1f517;专栏链接&#xff1a;C 文章目录 前言一、传值传参二、传引用传参三、传值返回拷贝构造和赋值重载的辨析 四、传引用返回【❌】五、传匿名对象返回六、总计与提炼 前言 在传…

网友感到担忧!iOS 17支持第三方应用商店:这下跟安卓没区别了

苹果此前官宣将于6月6日召开WWDC2023大会&#xff0c;按照往年的惯例&#xff0c;在这次大会上将会推出下一代iOS系统&#xff0c;也就是iOS 17。最近国外有关iOS 17的爆料中提到&#xff0c;迫于欧盟法案压力&#xff0c;iOS 17或将支持第三方应用商店。 2022年3月份&#xff…

springboot+vue社区维修平台(源码+文档)

风定落花生&#xff0c;歌声逐流水&#xff0c;大家好我是风歌&#xff0c;混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的社区维修平台。项目源码以及部署相关请联系风歌&#xff0c;文末附上联系信息 。 目前有各类成品java毕设&#xff0c;需要请看文末联…

Chapter11-最常用的消费类

11.1 整体流程 我们使用 DefaultMQPushConsumer 的时候&#xff0c;一般流程是设置好 GroupName 、NameServer 地址 &#xff0c;以及订阅的 Topic 名称&#xff0c; 然后填充Message 处理函数&#xff0c;最后调用 start &#xff08;&#xff09; 。 11.1.1 上层接口类 Defau…

Qt Quick - SplitView

Qt Quick - SplitView使用总结 一、概述二、属性介绍三、简单使用四、序列化SplitView的状态五、定制化 一、概述 SplitView是一个水平或垂直布局元素的控件&#xff0c;每个元素之间有一个可拖动的分配页面内容的滑块。很像IDE里面的那些窗口。就像下面的简单的布局内容一样。…

调度系统: Quartz

最近在做数据中台架构设计&#xff0c;整体架构设计完后发现数据中台最重要的就是元数据和调度系统。元数据设计参考了atlas、metcat、datahus&#xff0c;模型设计、数据架构、技术架构基本完成。现在设计调度系统&#xff0c;才发现调度系统不像别的系统&#xff0c;主要是理…

缓存与数据库双写一致性几种策略分析

作者&#xff1a;京东零售 于泷 一、背景 在高并发场景中&#xff0c;为防止大量请求直接访问数据库&#xff0c;缓解数据库压力&#xff0c;常用的方式一般会增加缓存层起到缓冲作用&#xff0c;减少数据库压力。引入缓存&#xff0c;就会涉及到缓存与数据库中数据如何保持一…

春天到了,讲讲Spring的工作原理

一、春天到了&#xff0c;讲讲Spring的工作原理 在致力于优质IT知识出版分享的异步社区&#xff0c;有这么一本书——两版累计销售了近10w本&#xff0c;它可是完完全全靠着自己过硬的内容实力打出的这片天&#xff01; 第二版已出版4年&#xff0c;基于Spring 5.x编写&#x…

PostGre数据库操作

菜鸟教程 PostgreSQL 教程 | 菜鸟教程PostgreSQL 教程 PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS)&#xff0c;在灵活的BSD许可证下发行。 PostgreSQL 开发者把它念作 post-gress-Q-L。 PostgreSQL 的 Slogan 是 “世界上最先进的开源关系型数据库”。 参考内容&a…

新库上线 | CnOpenData中国汽车能源消耗量数据

中国汽车能源消耗量数据 一、数据简介 工业和信息化部组织制定的《乘用车燃料消耗量限值》强制性国家标准&#xff08;GB19578-2021&#xff09;于2021年7月1日起正式实施&#xff0c;该标准规定了燃用汽油或柴油燃料、最大设计总质量不超过3500kg的M1类车辆在今后一段时期的燃…

如何开启tiktok之旅

关于tiktok的用户规模&#xff0c;相比国内抖音而言的机会这里就不再多说了&#xff0c;我之所以研究tiktok&#xff0c;是因为有不少客户咨询了我们tiktok加速方案&#xff0c;我们自身是一家纯网络公司&#xff0c;只提供tiktok加速方案而已&#xff0c;但是遭不住需求量大。…

【设计模式】Java 的三种代理模式

文章目录 一、前言二、正文1、静态代理2、动态代理3、Cglib代理Spring中AOP使用代理 三、总结 一、前言 代理(Proxy)模式是一种结构型设计模式&#xff0c;提供了对目标对象另外的访问方式&#xff1b;即通过代理对象访问目标对象。 这样做的好处是&#xff1a;可以在目标对…

什么是转化率优化(CRO)?网站转化率不高,可以看看这篇文章

你是否将人们带到你的网站&#xff0c;但只是让他们中的一小部分人完成了该页面的目标&#xff1f;你可以每天有成千上万的网站访问者到达。但如果你的网站没有设置成鼓励转换&#xff0c;你就不会说服网站访问者去做。这使得他们的整个访问几乎毫无价值&#xff0c;特别是如果…

MySQL-中间件mycat(三)

目录 &#x1f341;高可用方案 &#x1f341;安装配置 HAProxy &#x1f342;安装 HAProxy &#x1f342;启动验证 &#x1f341;配置 Keepalived &#x1f342;安装 Keepalived &#x1f342;修改配置文件 &#x1f342;启动验证 &#x1f342;测试高可用 &#x1f341;mycat …

经典transformer视觉模型总结

Vision Transformer 模型 ViT: AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 是 2020 年 Google 团队提出的将 Transformer 应用在图像分类的模型。 ViT 在 Transformer 架构的视觉模型的地位类似 ResNet 模型。因为其模型“简单”且效果好,可…

Doris单机版安装和初步使用

参考官方文档 https://doris.apache.org/zh-CN/docs/dev/get-starting/ 下载安装包 下载 - Apache Doris Index of /apache/doris/1.2/1.2.2-rc01 前置修改 #修改 /etc/security/limits.conf, 执行命令 vim /etc/security/limits.conf #添加以下 * soft nofile 204800 *…

【模电实验】基尔霍夫定律、叠加定理和戴维南定理验证实验

实验目的 验证基尔霍夫电流定律&#xff08;KCL&#xff09;和电压定律&#xff08;KVL&#xff09;加深对该定理的理解验证叠加定理&#xff0c;加深对该定理的理解验证戴维南定理&#xff0c;掌握有源二端口网络的开路电压&#xff0c;短路电流和入端等效电阻的测定方法通过实…

Pod探针解析及实战(k8s)

一、探针类型 1.1livenessProbe存活探针 用于判断容器是否存活&#xff08;running状态&#xff09;&#xff0c;如果LivenessProbe探针探测到容器不健康&#xff0c;则kubelet杀掉该容器&#xff0c;并根据容器的重启策略做相应的处理。如果一个容器不包含LivenessProbe探针…