爬1688商品---(测试版)

news2025/1/13 3:06:28

半成品.

from DrissionPage import ChromiumPage
import time
from selenium import webdriver
url='https://p4psearch.1688.com/hamlet.html?scene=6&cosite=baidujj_pz&location=re&trackid=885662561117990122602'

page=ChromiumPage()

page.get(url)


def key_wof():
    index1=0
   
    for index in range(1,10):
        index1+=1
        print(f'正在爬取第{index1}页')
        size=0
        # 初始0
        height=200
        # 初始高度
        if(index1>10):
            break
        else:
            for inex_list in page.eles('.offer-item'):
                price1=inex_list.ele('.symbol').inner_html
                prices2=inex_list.ele('.number n-b').inner_html
                price3=inex_list.ele('.number n-s').inner_html
                price=price1+prices2+price3
                # 获取商品价格
                ab=810703814121
                date_base=f'https://detail.1688.com/offer/{ab}.html'
                # 这里是demo链接,具体链接根据实际商品来...

                # 待处理的url
                dit={
                    '商品图片':inex_list.ele('.offer-img').attr('src'),
                    '商品链接':date_base,
                    '商品名称':inex_list.ele('.offer-title two-row').inner_html,
                    '商品价格':price,
                    '商品销量':inex_list.ele('.solt').inner_html,
                    '商品来源商家':inex_list.ele('.name').inner_html,
                    '商品商家状态':inex_list.ele('.ww-link ww-inline ww-online').attr('title'),
                    '商品商家链接':inex_list.ele('.ww-link ww-inline ww-online').attr('href')
                }
                
                # time.sleep(2)
                # 给停留一段时间,让页面数据,进行爬取,--为了防止被验证码动态检测
                page.scroll.to_location(size+200,height+500)
                time.sleep(0.1)
                page.scroll.to_location(size+600,height+700)
                time.sleep(0.2)
                page.scroll.to_location(size+800,height+900)
                time.sleep(0.1)
                page.scroll.to_location(size+990,height+1100)
                page.scroll.to_location(size+1200,height+1300)
                print(dit)
def _key():

    over_list=input('请输入商品名称:')  # 未做处理==========================
    if(over_list==''):
        print('输入为空,请重新输入!')
    else:
        key_wof()
    
_key()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1980204.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ QT开发 学习笔记(3)

C QT开发 学习笔记(3) - WPS项目 标准对话框 对话框类说明静态函数函数说明QFileDialog文件对话框getOpenFileName()选择打开一个文件getOpenFileNames()选择打开多个文件getSaveFileName()选择保存一个文件getExistingDirectory()选择一个己有的目录getOpenFileUrl()选择打幵…

荒原之梦考研:考研二战会很难吗?

考研二战是不是很难,其实很大程度上取决于我们自己,我们能否认清自己的优势,能否指定和执行合理的计划,有没有强大的心理支撑等,都是决定考研二战能否成功,或者能否比较轻松的成功的关键。 在本文中&#…

HCIP重修总笔记(中)

第八节 BGP基础 一、BGP产生背景 BGPBorder Gateway Protocol,边界网关协议)是一种用于自治系统间的动态路出协议,是一种外部网关协议。 自治系统AS:一组同一个管理机构进行管理,对外呈现统一选路策略的路由器的集合。 自治系统编号: …

浅谈基础的图算法——强联通分量算法(c++)

文章目录 强联通分量SCC概念例子有向图的DFS树代码例题讲解[POI2008] BLO-Blockade题面翻译题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 思路AC代码 【模板】割点(割顶)题目背景题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 提示…

数据结构实验报告-顺序表

桂 林 理 工 大 学 实 验 报 告 一、实验名称 实验1 顺序表 二、实验内容: 1.将书中介绍的顺序表的基本算法(如初始化、求长度、插人、删除、输出等)汇总在一起,用一个完整的程序实现顺序表的基本运算,并且编写顺序表的判空、判满等基…

最常见的AI大模型总结

前言:大模型可以根据其主要的应领域和功能,可以分类为“文生文”(Text-to-Text)、“文生图”(Text-to-Image)和“文生视频”(Text-to-Video),都是基于自然语言处理&#…

JVM从入门到放弃

前言:关于JVM,其实有很多大厂开发了不同版本的JVM,比较知名的有:Sun HotSpot VM、BEA JRockit VM、IBM J9 VM、 Azul VM、 Apache Harmony、 Google Dalvik VM、 Microsoft JVM等等。现在使用的比较多的JDK8版本就是Sun HotSpot V…

「C++系列」指针

文章目录 一、指针的定义二、指针的基本概念1. 基本概念2. 案例代码示例 1:基本指针使用示例 2:指针与数组 3. 注意事项 三、指针的用途1. 指针的用途2. 案例代码案例1. 动态内存分配案例2. 函数参数(通过指针修改值)案例3. 数组和…

poky yocto(04):编译在vmware上运行的镜像

编译镜像 bitbake build-appliance-image 得到文件:build-appliance-image-qemux86-64.wic.vmdk 问题的关键来了,如何启动这个东西呢?由名字可知,这是一个vmware的硬盘文件,需要创建一个新的虚拟机加载它。 创建虚拟…

黑神话悟空游戏电脑配置要求 黑神话悟空Steam销量全球两连冠 黑神话悟空苹果笔记本电脑能玩吗 黑神话悟空是什么类型的游戏

相信不少游戏爱好者,近期被《黑神话:悟空》这款游戏刷屏了,备受期待的国产单机大作《黑神话:悟空》将于8月20日全球同步上线,登陆 PC (Steam / Epic / WeGame) 和 PS5 平台。凭借空前的关注度,该游戏有望成为国产游戏行…

sql注入漏洞复现

and 11 正常 and 12 报错 从这就已经说明是sql数字型注入了 上sqlmap验证一下 存在布尔盲注,时间盲注...... 我是在漏洞盒子上提交的,能不能通过看运气吧 下面这个漏洞已经是很久之前的了,现在已经是修复了,当时还是太年轻了...…

文献阅读:扩散波模型的物理信息神经网络

目录 摘要 Abstract 扩散波模型的物理信息神经网络 文献摘要 讨论|结论 理论知识 扩散波动方程(曼宁方程) 梯度停止(Stop-gradient)技术 时分PINN(TPINN) 新结构(fPINN) 实验设置 稳定流问题 等速和扩散问题 非线性速…

基于STM32的简易音频播放系统

目录 引言环境准备工作 硬件准备软件安装与配置系统设计 系统架构硬件连接代码实现 初始化代码音频播放代码应用场景 简易音频播放语音提示系统常见问题及解决方案 常见问题解决方案结论 1. 引言 音频播放系统在日常生活中有着广泛的应用,从简单的语音提示到复杂…

基于Transformer的语音识别与音频分类

重磅推荐专栏: 《大模型AIGC》 《课程大纲》 《知识星球》 本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经…

如果我的发明有修改,需要如何处理?

如果我的发明有修改,需要如何处理?

近期关于云服务器window server 2012屏蔽游戏加速器/IP加速器模拟IP连接限制策略

winr 打开运行 输入 gpedit.msc 找到本地组策略编辑器的对应设置 设置启用即可。

【redis 第七篇章】动态字符串

一、概述 string 类型底层实现的简单动态字符串 sds,是可以修改的字符串。它采用预分配冗余空间的方式来减少内存的频繁分配。 二、SDS动态字符串 动态字符串 是以 \0 为分隔符。最大容量 是 redis 主动分配的一块内存空间,实际存储内容 是具体的存的数…

BACnet 调试工具 工程师必备

文章目录 BACnet 调试工具 工程师必备主要功能软件截图 BACnet 调试工具 工程师必备 官网地址 BACnet(Building Automation and Control Networks)是由美国采暖、制冷与空调工程师学会(American Society of Heating, Refrigerating and Air…

【网络层】IP报文解析和网段划分

文章目录 网络层的作用IP协议协议报头格式网段划分DHCPCIDR划分方案 IP地址的数量限制私有IP地址和公网IP地址LAN和WAN 路由 网络层的作用 前面学习了应用层和传输层,应用层的作用是为用户和应用程序提供网络服务,传输层的作用是提供端口到端口的通信服…

Android 10.0 系统默认蓝牙打开状态栏显示蓝牙图标功能实现

1.前言 在10.0的系统rom定制化开发过程中,在默认系统中,打开蓝牙开关的时候不会状态栏不会显示蓝牙图标,而只有 蓝牙连接成功后会显示蓝牙图标,客户开发需要要求在蓝牙打开的时候在状态栏就显示蓝牙图标,接下来分析下 相关的状态栏图标显示流程,然后实现相关功能 2.系统…