爬虫与DataFrame对象小小结合

news2026/2/15 23:39:49

import pandas as pd
import requests
from lxml import etree
#数据请求
url="https://www.maigoo.com/brand/list_1715.html"
headers={'User-Agent':''}
#数据响应
res=requests.get(url,headers=headers)
tree = etree.HTML(res.text)
#数据解析
title=tree.xpath('.//div[@class="info"]/a/text()')
company=tree.xpath('.//div[@class="info"]//span//text()')
company=" ".join(company).replace('(', '').replace(')', '')#获取数据，进行简单的处理，转成列表类型暂存数据。
company=company.split('  ')
content=tree.xpath('.//div[@class="rongyu dhidden2 c888"]/text()')
adress=tree.xpath('.//div[@class="brandlogo"]/a/@href')
picture=tree.xpath('.//div[@class="brandlogo"]//img/@src')
#数据保存
for i in title,content,adress,picture:
    data = pd.DataFrame([title,company,content,adress,picture],index=['title','company','content','adress','picture'])
print(data.T)

---如有侵权，请即使联系。谢谢~

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1515348.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

vxe-table表格组件的使用已经query函数扩展

最近新项目使用vue3typescript开发后台管理系统，基本上展示内容一致表格的方式展示，所以使用vxe-table组件来开发，主要是为了方便使用工具栏，以及其他表格操作。 vxe-table 开发文档：https://vxetable.cn/#/table/sta…

相关博文： https://juejin.cn/post/7216536069285429285?searchId202403091501088BACFF113F980BA3B5F3 https://www.bilibili.com/video/BV12T411q7dq/?spm_id_from333.337.search-card.all.click qiankun结构： 主应用base：vue3historyv…

通过Maven创建Web工程

通过Maven创建Web工程方式一方式二方式一 1.先创建一个Maven工程 2.把该Maven模块的pom文件里添加一个war 3.选中该Maven模块点击项目架构 4.手动添加一个Web架构方式二 1.也是new一个模块但是直接配置好Web 2.这里就是我IDEA对Maven的设置 3.第一次创建可能…

JavaEE框架学习笔记——Mybatis篇

四、一级缓存五、二级缓存一、Mybatis的Dao编写【mapper代理方式实现】 Mapper代理的开发方式，程序员只需要编写mapper接口（相当于dao接口）即可。Mybatis会自动的为mapper接口生成动态代理实现类。不过要实现mapper代理的开发方式****&am…

酷开科技大内容战略，打破时间和空间的限制畅快追剧！

随着科技的发展，电视作为家庭娱乐中心设备的角色正在发生改变，它不仅仅是家庭的娱乐中心，更是成为连接家庭智能家居的中心枢纽，为家庭带来更为丰富和个性化的娱乐体验。深耕大屏十余年，酷开科技通过技术上的不断突破和…

nacos做注册注册中心go语言实战教程（服务的注册与获取）

背景随着访问量的逐渐增大，单体应用结构渐渐不满足需求，在微服务出现之后引用被拆分为一个个的服务，服务之间可以互相访问。初期服务之间的调用只要知道服务地址和端口即可，而服务会出现增减、故障、升级等变化导致端口和ip也变…

LeetCode Python - 51. N 皇后

目录题目答案运行结果题目按照国际象棋的规则，皇后可以攻击与之处在同一行或同一列或同一斜线上的棋子。 n 皇后问题研究的是如何将 n 个皇后放置在 nn 的棋盘上，并且使皇后彼此之间不能相互攻击。给你一个整数 n ，返回所有不同的 n …

深度学习——SAM(Segment-Anything)代码详解

目录引言代码目录segment-anything 代码详解build_sam.pypredictor.pyautomatic_mask_generator.py 引言从去年年初至今，SAM(Segment Anything )已经问世快一年了，SAM凭借其强大而突出的泛化性能在各项任务上取得了优异的表现，广大的研究者…

ChromeDriver 122 版本为例国内下载地址及安装教程

ChromeDriver 国内下载地址 https://chromedriver.com/download 靠谱千千万万别下载错了先确认 Chrome 浏览器版本以 win64 版本为例那我们下载这一个啊，不要下载错了下载地址贴在这哈 https://storage.googleapis.com/chrome-for-testing-public/122.0.…

linux安全--CentOS7安装Tomcat，远程管理ManagerApp

目录 1.Tomcat安装 2.Tomcat远程管理 1.Tomcat安装下载安装包并解压 tar xf apache-tomcat-7.0.54.tar.gz -C /usr/local/apache-tomcat_7.0.54/tomcat启停启动 ./startup.sh 停止 ./shutdown.sh 2.Tomcat远程管理找到tomcat文件夹中webapps/manager/META-INF/contex…

IDEA中导入eclipse运行的java项目

本篇文章主要的内容是在IDEA中导入eclipse运行的java项目，亲测有效。话不多说，直接开整。前提：先打开idea软件，界面如下： 开始按下方步骤依次走即可。 1、file --> new --> Project from Existing Sources..…

OPPO后端二面，凉了！

这篇文章的问题来源于一个读者之前分享的 OPPO 后端凉经，我对比较典型的一些问题进行了分类并给出了详细的参考答案。希望能对正在参加面试的朋友们能够有点帮助！ Java String 为什么是不可变的? public final class String implements java.io.Seri…

C++提高笔记（三）---STL容器（vector、deque）

1、vector容器 1.1vector基本概念功能：vector数据结构和数组非常相似，也称为单端数组 vector与普通数组区别：不同之处在于数组是静态空间，而vector可以动态扩展动态扩展：并不是在原空间之后续接新空间&#xff0…

ES6（三）：Iterator、Generator、类的用法、类的继承

一、迭代器Iterator 迭代器是访问数据的一个接口，是用于遍历数据结构的一个指针，迭代器就是遍历器 const items[one,two,three];//创建新的迭代器const ititems[Symbol.iterator]();console.log(it.next()); done：返回false表示遍历继续&a…

Kafka MQ 生产者

Kafka MQ 生产者生产者概览尽管生产者 API 使用起来很简单，但消息的发送过程还是有点复杂的。图 3-1 展示了向 Kafka 发送消息的主要步骤。我们从创建一个 ProducerRecord 对象开始，ProducerRecord 对象需要包含目标主题和要发送的内容。我们还可以…

linux命令深入研究——cat

cat命令，“猫”，可以理解为瞄一眼文件内容，其中可以用重定向符号对文件进行一些修改，如增加，删除文件内容，其命令参数如-n，-s，-b可以输出带有行号的行如果想要快速删除文件内容&…

[全志T113]：Tina SDK安装

[全志T113]：Tina SDK安装 SDK安装与补丁 SDK下载地址 https://pan.baidu.com/s/1wxUeYQZaSgAPGorGOVcJxA?pwdtina 1.解压SDK tar -zxvf Tina-Linux-20220815.tar.gz cd Tina-Linux2.安装补丁： $ wget http://dl.mangopi.org/tina/prebuilt.tar.gz …