Python获取某乎问答区计算机专业学生应聘保洁这一内容,看看为啥会有此事发生

news2024/12/28 4:17:18

前言

嗨喽,大家好呀~这里是爱看美女的茜茜呐

不知道现在还有多少人玩知某乎,

今天刷话题的时候看到这么一个问答,

这么有趣的话题,咱们就对其问答内容进行采集一下??

效果展示

可以看到,数据咱们就获取下来了,保存就可以了。

开发环境:

  • Python 3.8 / 编译器

  • Pycharm 2021.2版本 / 编辑器

模块使用:

  • requests : 主要用来发 送 HTTP 请求 、 属于第三方模块

  • pprint : 打印模块 、属于第三方模块

  • re :python独有的匹配字符串的模块 、内置模块,无需安装

  • json :该模块就可以完成 JSON 与 Python 两种数据格式的相互转换 、内置模块,无需安装

第三方模块安装:

在cmd里面或者pycharm终端里面进行安装 pip install requests 安装。

代码展示

import requests
import re
import json
import pprint
 
headers = {
    'cookie': '__snaker__id=tx5pc8xnwNvTYvG3; SESSIONID=stAjAfHLiBBtepPE5fTov5aYQJYBLURoM8YhM5jRXqG; JOID=W1EUA0yH_mXOxwv_Jo6gdXoTh844pNVH6uoo1ASq3U7s4ybcDe3ljKTJA_YgcWoL8eX7c_wINvZ6Pe0AjXgWecM=; osd=WloVAUOG9WTMyAr0J4yvdHEShcE5r9RF5esj1Qal3EXt4SndBuzng6XCAvQvcGEK8-r6eP0KOfdxPO8PjHMXe8w=; _zap=ba7095c9-0aae-423f-9975-92c7813e6036; d_c0=ANAWztCFPxaPTkyqOI3cpp5phHc7BJUpFhs=|1675000059; YD00517437729195%3AWM_TID=q1pMuo8yFBhAAQVQURLAPRTyEuWDd2qg; arialoadData=false; YD00517437729195%3AWM_NI=jPZTAA6q1q7YI0MPivmHxhtaLmJ7TBYjTAF34UDD36WmBPrKwe5O4Lfww1472OKDIPEwCz5Ug2Hrtg%2BMm8apy4EH%2BmnIshxyXyWNH2jmJ%2FmJIFwli06F3A4RKje5REwBUXo%3D; YD00517437729195%3AWM_NIKE=9ca17ae2e6ffcda170e2e6ee8fb246a7eb8187c142bbb48bb6d84a969b9e86d46b91bb96a6cb728ceafbd5d82af0fea7c3b92aaa9096b5c44bf6afff92b6538bf083b1ec7eaf98b889f76b90b386d8d74a9bb69ca2c539f88b8ca5b23e95b38eb1f141b5bbfbb0b748a6a9b9d2b73df29185a5cc5c87a98d9bb85fa5ee8893f76de993a3d9e47cbbec8ba9aa67ae97bd89fb739ca799afcb3aaab386d0f0428b9ab98dec3cf69afda2b75a89b6abd6d14fb59e9bb9ee37e2a3; _xsrf=8cfa292c-c915-42f3-b376-a82f56613cc3; Hm_lvt_98beee57fd2ef70ccdd5ca52b9740c49=1676462242,1676547626,1676557107,1676612193; Hm_lpvt_98beee57fd2ef70ccdd5ca52b9740c49=1676612193; captcha_session_v2=2|1:0|10:1676612193|18:captcha_session_v2|88:SWI5MW91WjcybkczamhaT1FOY0lCZWczM1h1UDBvVTBQcXFYcC9JWm9qUXlybkIvbW5MQWFvd1lpeHVLUVVTWg==|68915c879a030053a7c3b5921aa2d5974f5837adb19001b606e891ae08247c14; gdxidpyhxdE=ohaj9Ig0u1f%5CcdLdC0QAEhJE6fplEfZ%2BYp07xr3XVZCJ3JmJQRfzhckh%2BJayuMOQGReJMfCem4ZE2Slz2MHMzY4r5fkAIJpTvzYcqGPHtICLgVWSM6lR5tNj1Y0O0436Gun52GbM9HW9%2F15JME0vJYKLhdSQtwykihOokRLmLbeVXJ4K%3A1676613094284; KLBRSID=2177cbf908056c6654e972f5ddc96dc2|1676612386|1676612191',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36'
}
url = 'https://www.****.com/question/584206512'
html_data = requests.get(url=url, headers=headers).text
json_str = re.findall('<script id="js-initialData" type="text/json">(.*?)</script>', html_data)[0]
json_data = json.loads(json_str)
next_url = json_data['initialState']['question']['answers']['584206512']['next']
answers = json_data['initialState']['entities']['answers']
for key in list(answers.keys()):
    print(answers[key]['content'])

文章我都录制了对应的视频讲解,大家直接在最下方名片领取,包括代码!

尾语

大家觉得有用的话可以来个免费的点赞+收藏+关注,

防止下次我悄悄更新了好东西你却不知道 !!!

希望本篇文章有对你带来帮助 🎉,有学习到一点知识~

躲起来的星星🍥也在努力发光,你也要努力加油(让我们一起努力叭)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/448262.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 远程访问控制 SSH SCP SFTP TCP-Wrappers

SSH&#xff08;secure shell&#xff09;协议 一种安全通道协议&#xff0c;主要用来实现字符界面的远程登录、远程复制等功能。 协议对通信双方的数据传输进行了加密处理&#xff0c;其中包括用户登录时输入的用户口令 SSH客户端<-----------------网络------------------…

android 布局优化

1.绘制和布局加载原理 本文仅供个人学习记录&#xff0c;详细介绍可查看下面链接 Android布局优化&#xff0c;多套方案全面解析 布局优化的原因&#xff1a;布局嵌套过深&#xff0c;或者其他原因导致布局渲染性能不佳&#xff0c;可能会导致应用卡顿。 android绘制原理&am…

5.3 牛顿-科茨公式

学习目标&#xff1a; 理解微积分基础知识&#xff0c;例如导数和微分的概念。学习牛顿-科茨公式的推导过程。这个公式实际上是使用泰勒公式对被积函数进行展开&#xff0c;并使用微积分的基本原理进行简化得到的。学习如何使用牛顿-科茨公式进行数值积分。这通常涉及到将被积…

Ajax超详解(新手入门指南)

文章目录 1. AJAX简介2. 前后端交互3. XHR3.1 XMLHttpRequest对象3.2 获取模拟的后端数据3.3 获取网络数据3.4 使用json-server模拟服务器3.4.1 安装node.js3.4.2 安装并使用json-server 3.5 常见的请求方式3.5.1 GET请求3.5.2 POST请求3.5.3 PUT请求3.5.4 PATCH请求3.5.5 DELE…

【图像分割】Segment Anything(Meta AI)论文解读

文章目录 摘要一、引言二、segment anything任务1.任务2.预训练3.zero shot transfer4.相关任务5.讨论 三*、Segment Anything 模型四、Segment Anything 数据引擎五、Segment Anything 数据集六、Segment Anything RAI分析七、Zero-Shot Transfer 实验1.zero shot 单点有效掩模…

springboot本地local配置覆盖远程Apollo配置(含Apollo配置加载顺序说明)

手打不易&#xff0c;如果转摘&#xff0c;请注明出处&#xff01; 注明原文&#xff1a;https://zhangxiaofan.blog.csdn.net/article/details/130302692 目录 前言 Apollo配置加载顺序 步骤 第一步&#xff1a;Apollo创建properties 第二步&#xff1a;添加namespaces&…

js的dom事件流、事件委托和阻止绑定事件触发

主要讲解事件绑定和事件委托&#xff0c;onclick事件和addEventListener的区别 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge">&l…

IT项目管理计算题【太原理工大学】

计算题好像也没多少考点&#xff0c;主要就是记公式吧&#xff0c;其他的不想看了&#xff0c;直接考啥看啥&#xff0c;就看两个&#xff1a; ① 根据进度网络图写出时间参数表&#xff0c;ES、EF、LS、LF、TF 以及 FF&#xff0c;关键路径&#xff0c;总工期&#xff1b;② 挣…

volatile 保证内存变量可见性的实现原理解析

目录 volatile 的定义 可见性问题 JMM&#xff08;JavaMemoryModel&#xff09; 保证可见性 现代计算机的内存模型 MESI&#xff08;缓存一致性协议&#xff09; 嗅探 总线风暴 volatile 的两条实现原则 volatile 的定义 Java代码在编译后会编程 Java …

GD(兆易创新)系列FLASH进行FPGA和ZYNQ配置固化相操作

写在前面 本文主要针对使用GD&#xff08;兆易创新&#xff09;系列的FLASH做启动配置片时&#xff0c;遇到的相关问题进行简单整理复盘&#xff0c;避免后人踩坑。 本人操作固化芯片型号为&#xff1a;ZYNQ7045、690T&#xff08;复旦微替代型号V7 690T&#xff09;。 7系列…

02-waf绕过漏洞发现之代理池指纹被动探针

WAF绕过-漏洞发现之代理池指纹被动探针 思维导图 漏洞发现触发WAF点-针对xray工具&#xff0c;awvs工具等 1.扫描速度&#xff08;绕过方法&#xff1a;代理池&#xff0c;延迟&#xff0c;爬虫白名单&#xff09;2.工具指纹&#xff08;绕过方法&#xff1a;特征指纹&#x…

Qt Quick - Container

Qt Quick - Container使用总结 一、概述二、使用容器三、管理当前索引四、容器实现 一、概述 Container 提供容器通用功能的抽象基类。Container是类容器用户界面控件的基本类型&#xff0c;允许动态插入和删除Item。DialogButtonBox, MenuBar, SwipeView, 和 TabBar 都是继承…

测试工程师为什么要关注研发效能?

研发效能中的“研发”&#xff0c;指的是广义的研发团队&#xff0c;包含开发、测试、和研发团队内部的产品经理&#xff08;不包含业务部门的产品经理&#xff09;。测试工程师身处其中&#xff0c;作为研发团队的一员&#xff0c;对于整体的效能如何提升也应该了然于胸。这篇…

【论文写作】如何写科技论文?万能模板!!!(以IEEE会议论文为例)

0. 写在前面 常言道&#xff0c;科技论文犹如“八股文”&#xff0c;有固定的写作模式。本篇博客主要是针对工程方面的论文的结构以及写作链条的一些整理&#xff0c;并不是为了提高或者润色一篇论文的表达。基本上所有的论文&#xff0c;都需要先构思好一些点子&#xff0c;有…

「计算机控制系统」5. 模拟设计法

模拟控制器的离散化 数字PID控制器 Smith预估控制 文章目录 模拟控制器的离散化数值积分法一阶后向差分法一阶前向差分法双线性变换法&#xff08;Tustin&#xff09; 零极点匹配法其他方法 数字PID控制器模拟PID控制器的离散化数字PID的改进PID控制各环节的作用PID参数的整定扩…

win11删除的文件不在回收站原因及找回文件方法

win11是微软最新推出的操作系统&#xff0c;它的外观和功能都有所升级。但是&#xff0c;在使用win11的过程中&#xff0c;有时候你会误删一些重要的文件&#xff0c;而这些文件并没有进入回收站&#xff0c;这该怎么办呢&#xff1f;win11删除的文件不在回收站怎么找回&#x…

[强化学习]学习路线和关键词拾零

强化学习学习方法和路线 学习路线 先从基础教材开始&#xff0c;构建RL的知识框架&#xff0c;熟悉关键名词和公式推导&#xff0c;扩展到Model-Free的Value-Based和Policy-Based方法&#xff0c;同时参考github的代码练习。接下来精读几篇经典论文&#xff0c;如DQN,PPO等。…

Node内置模块 【压缩zlib模块】

文章目录 &#x1f31f;前言&#x1f31f;zlib模块&#x1f31f;关于gzip与deflate&#x1f31f;使用zlib&#x1f31f;压缩与解压缩&#x1f31f;案例&#xff1a;压缩&#x1f31f;案例&#xff1a;解压缩 &#x1f31f;服务端gzip压缩&#x1f31f;HTTP配置&#x1f31f;HTT…

Android Binder图文详解和驱动源码分析

文章目录 前言一、跨进程通讯的过程1. AIDL客户端代码2. AIDL服务端代码3. 通信过程a. 发送请求时序图b. 接收请求时序图 二、Binder一次拷贝1. 发送给Binder驱动的数据2. 一次拷贝示意图 三、Binder驱动源码1. 相关数据结构2. 阅读Binder驱动源码 参考 前言 最近在学习Binder…

Jupyter Notebook的安装与使用

Jupyter Notebook Jupyter Notebook介绍Jupyter Notebook使用安装启动创建文件编写代码和文本常用命令配置文件 Anaconda Jupyter Notebook介绍 Jupyter Notebook是一个基于Web的交互式计算环境&#xff0c;可以让用户以文档形式记录代码、数据分析结果和说明文本&#xff0c;并…