Python采集周边烤肉店数据,康康哪一家最好吃?

news2024/12/26 15:05:54

人生苦短,我用Python

这不是天气开始突然大范围降温了吗?

降温就要吃烤肉啊 滋辣滋辣的声音特别好听~

放假吃烤肉真的特别快乐~

天冷了,逛街……
天冷了,吃烤肉……
天冷了,喝奶茶……

有温度的冬天,才暖暖的🥩

请添加图片描述
为了造福“烤肉控”们,
今天就用Python爬取一座城市的烤肉店数据,
选出最适合的一家

准备工作🥩

环境

  • python 3.6
  • pycharm
  • requests >>> 发送请求 pip install requests
  • csv >>> 保存数据

在这里插入图片描述

一. 数据来源分析🍖

  1. 确定我们爬取的内容是什么?
    爬取店铺数据
  2. 去找这些东西是从哪里来的
    通过开发者工具进行抓包分析, 分析数据来源

二. 代码实现过程🍖

  1. 发送请求, 对于找到数据包发送请求
  2. 获取数据, 根据服务器给你返回的response数据来的
  3. 解析数据, 提取我们想要的内容数据
  4. 保存数据, 保存到csv文件
  5. 多页爬取, 根据url地址参数变化

代码实现过程🥩

1. 发送请求🍻

url = ''
data = {
    'userid': '266252179',
    'limit': '32',
    'offset': 32,
    'cateId': '-1',
    'q': '烤肉',
    'token': '',
}
headers = {
    'Referer': '',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
}
response = requests.get(url=url, params=data, headers=headers)

200 表示请求成功 状态码 403 表示你没有访问权限

2. 获取数据🍻

print(response.json())

3. 解析数据🍻

result = response.json()['data']['searchResult']
for index in result:
    index_url = f''
    dit = {
        '店铺名称': index['title'],
        '店铺评分': index['avgscore'],
        '评论数量': index['comments'],
        '人均消费': index['avgprice'],
        '所在商圈': index['areaname'],
        '店铺类型': index['backCateName'],
        '详情页': index_url,
    }
    csv_writer.writerow(dit)
    print(dit)

4. 保存数据🍻

f = open('烤肉数据.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '店铺名称',
    '店铺评分',
    '评论数量',
    '人均消费',
    '所在商圈',
    '店铺类型',
    '详情页',
])
csv_writer.writeheader()

5.翻页🍻

for page in range(0, 1025, 32):
    url = ''
    data = {
        'uuid': '6e481fe03995425389b9.1630752137.1.0.0',
        'userid': '266252179',
        'limit': '32',
        'offset': page,
        'cateId': '-1',
        'q': '烤肉',
        'token': '',
    }

获取数据🥩

请添加图片描述

请添加图片描述

其他代码🥩

f = open('烤肉数据1.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=[
    '店铺名称',
    '店铺评分',
    '评论数量',
    '人均消费',
    '所在商圈',
    '店铺类型',
    '详情页',
])

for page in range(0, 1025, 32):
    url = ''
    data = {
        'uuid': '6e481fe03995425389b9.1630752137.1.0.0',
        'userid': '266252179',
        'limit': '32',
        'offset': page,
        'cateId': '-1',
        'q': '烤肉',
        'token': '',
    }
    headers = {
        'Referer': 'https://chs.某tuan.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
    }
    response = requests.get(url=url, params=data, headers=headers)

    result = response.json()['data']['searchResult']
 
    for index
        index_url = f'https://www.meituan.com/meishi/{index["id"]}/'
        # ctrl + D
        dit = {
            '店铺名称': index['title'],
            '人均消费': index['avgprice'],
            '详情页': index_url,
        }
        csv_writer.writerow(dit)
        print(dit)

终于敲完了…

给我馋得…我等下就下去吃肉嘿嘿~ ~ ~

提前祝大家新年快乐!!!

请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/172958.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

p83出现的问题(空指针异常)原因及解决方案

我的GitHub:Powerveil GitHub我的Gitee:Powercs12 (powercs12) - Gitee.com皮卡丘每天学Java相关知识:Mybatis Plus、Spring Security本质原因:我们自己将Article字段的update字段做了自动填充导致自动填充时无法获取当前用户(程…

pytorch Conv2d令人迷惑的几个参数

本篇仅用来记录nn.Conv2d()中容易令人不解的几个参数 1. nn.Conv2d() 的输出维度的计算 相信大家都看过官网给出的计算方式: 直接套公式即可, 但需要注意的是, 最终计算的结果要向下取整. 2. dilation 官方解释为: dilation (int or tuple, optional) – Spacing between k…

贪心 455. 分发饼干

455. 分发饼干 难度简单636 假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。 对每个孩子 i,都有一个胃口值 g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干 j&…

为什么STM32设置Flash地址0x08000000而不是0x00000000?STM32的启动过程

STM32F103ZE芯片存储空间的地址映射关系图。 在MDK编译程序设置ROM和RAM地址时候发现:    IROM1为片上程序存储器,即片上集成的Flash存储器,对该处理器Flash大小为512KB,即0x80000 地址区间为0x8000000~0x0807FFFF  IRAM1为片…

day10文件知识点

模态对话框ajax后台ModelForm校验 目录切换:展示当前文件夹和文件 删除文件夹:嵌套的子文件和子文件夹全部删除 js上传文件到cos(wiki用python上cos上传文件) 进度条的操作(bootstrap)实现 删除文件&#x…

【Linux详解】——进程地址空间

📖 前言:本节将以新的视角看的地址空间的特点,与以前对指针的认识做区分。 目录🕒 1. C/C 地址空间回顾🕒 2. 进程地址空间🕘 2.1 感性理解概念🕘 2.2 如何“画饼”🕘 2.3 区域划分&…

SQL面试题

有3个表S(学生表),C(课程表),SC(学生选课表) S(SNO,SNAME)代表(学号,姓名) C(CNO,CNAME,CTEACHER&…

SAP FICO 定义成本组件结构

成本组件结构定义 我们在使用CK11N核算物料标准成本时候可以看到有项目明细,也可以看到有成本构成,那么问题来了,怎么将项目明细分类到各个成本构成上面呢? 【后台配置路径】: SPRO→控制→产品成本控制→产品成本计划…

【云原生】k8s之包管理器Helm

内容预知 前言 1.Helm的相关知识 1.1 Helm的简介与了解 1.2 Helm的三个重要概念 1.3 Helm2与Helm3的的区别 (1)helm2的部署方式与使用 (2)Helm3的部署与使用 2.Helm在k8s集群中的部署 (1)将Helm安…

【docker概念和实践 3】 注册阿里云账号、应用阿里云数据源

一、说明 阿里云是什么?是出租、出售运算资源的平台。几乎囊括各个领域的运算、存储、服务器、云端资源。阿里云的明星产品四大件是:1、即云服务器ECS、2、云数据库RDS、3、负载均衡SLB 4对象存储OSS。 其它多种服务:云小站_专享特惠_云产品推…

OpenSceneGraph图形状态管理内幕

在这个教程中,我们将了解 Open Scene Graph 如何表示 OpenGL 图形状态,并探索 Open Scene Graph 优化渲染以最小化状态更改次数的一些方法。 推荐:用 3D场景编辑器快速搭建数字孪生场景。 1、OpenGL状态机 Open Scene Graph 最重要的优化之一…

Android的linux内核解耦

1、boot内容查看Boot Image Header,version 2版本包含内容最多,包括了内核、设备树、根目录、recovery设备树,cmdline。boot拆包与内容解析参考1、Android bootimg kernel(boot.img)2、linux的ramdisk解耦2.1、ramdisk…

Python学习笔记——文件操作

输入和输出Python两种输出值的方式: 表达式语句和 print() 函数。第三种方式是使用文件对象的 write() 方法,标准输出文件可以用 sys.stdout 引用。如果你希望输出的形式更加多样,可以使用 str.format() 函数来格式化输出值。如果你希望将输出的值转成字…

H3C路由器带宽保证(命令行)配置方法

1 配置需求或说明 1.1适用产品系列 本案例适用于如MSR810、MSR93X系列的路由器。 1.2配置需求及实现的效果 某企业路由器接入业务有语音业务、管理部门业务和普通业务。要求当网络出现拥塞时,语音业务加速转发,管理部门业务确保转发,剩余或…

小满OKKICRM与金蝶云星空对接集成客户档案

小满OKKICRM与金蝶云星空对接集成客户列表查询(更新列表)&客户新增(小满客户对接金蝶客户-P)数据源平台:小满OKKICRM小满科技成立于2013年,是阿里巴巴集团战略投资的高新技术企业。小满科技以“人工智能大数据”为核心驱动力,为外贸企业提供智能CRM解…

合并所有重叠的区间

Python-合并区间 题目 以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 示例 1: 输入:interva…

【Ajax】模板引擎

一、模板引擎的基本概念渲染UI结构时遇到的问题var rows [] //遍历空数组 $.each(res.data, function (i, item) { // 循环拼接字符串rows.push(<li class"list-group-item"> item.content <span class"badge cmt-date">评论时间&#xff1a;…

87.序列到序列学习(seq2seq)以及代码实现

1. 机器翻译 2. Seq2Seq 双向RNN可以做encoder&#xff0c;但不能做decoder。 3. 编码器-解码器细节 4. 训练 5. 衡量生成序列的好坏的BLEU 上面的公式既加入了段序列的惩罚项&#xff0c;又加入了更难出现的长序列的高权重。 6. 总结&#xff1a; Seq2seq从一个句子生成另一…

【网络通信】【电信运营商实战工程师】思科设备篇-网络工程师必备基础知识

电信运营商实战工程师系列文章. 思科设备篇-网络工程师必备基础知识. 文章目录1. 电信运营商网络设备机房2. 认识并管理运营商网络设备3. GNS3 安装与配置4. IPv4地址及子网划分 VLSM-CIDR 详解5. OSI 七层参考模型及进制转换技巧1. 电信运营商网络设备机房 知识点&#xff1a;…

win-bat批处理命令

基本知识 cmd 与 powershel 命令和关键字不区分大小写&#xff0c;变量名区分大小写 DOS 是磁盘操作系统&#xff1b;命令提示符是 DOS 系统的界面中输入 DOS 命令的提示位置&#xff1b;cmd 是系统运行其自带 DOS 的命令 PID 是 processid&#xff08;进程号&#xff09;&am…