2024批量下载知乎回答/文章/想法/专栏/视频/收藏夹,导出excel和pdf

news2024/11/14 15:41:47

之前分享过文章2024 批量下载知乎回答/文章/想法/专栏导出excel和pdf,再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf,今天再加上知乎收藏夹批量下载。

下载所有知乎回答以渤海小吏的号为例 https://www.zhihu.com/people/dai-zong-66/posts :

图片

导出的excel包含所有知乎回答问题标题和链接。

图片

然后用脚本将excel里的回答批量下载:

图片

下载的所有回答html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf,效果如图:

图片

再将所有pdf合成一个pdf文件,效果见网盘https://pan.quark.cn/s/8522433ad346  

图片

每个回答都有原回答链接。

图片

顺便我还下载了渤海小吏这个公众号的所有文章2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数 ,包含留言。

图片

下载所有知乎文章以半佛仙人的号为例 https://www.zhihu.com/people/banfoxianren/posts:

图片

导出的excel数据包含知乎文章标题,链接,评论数和赞同数。

图片

然后用脚本将excel里的文章批量下载:

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf:

图片

再将所有pdf合成一个pdf文件,每篇文章都有原文章链接,效果见网盘https://pan.quark.cn/s/8522433ad346 

图片

下载所有知乎想法以半佛仙人的号为例 https://www.zhihu.com/people/banfoxianren/pins ,导出的excel数据包含想法发布时间,想法链接,想法内容。

图片

之后对excel里的想法链接批量下载,效果如图:

图片

下载html转换后pdf,最后合成一个pdf文件,大小11MB。

图片

顺便我还下载了半佛仙人这个公众号的所有文章 2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数,包含留言。

图片

下载收藏夹以这个为例https://www.zhihu.com/collection/40047806

图片

下载效果:

图片

导出的excel数据包含类型,标题,链接,创建时间,更新时间,简介,评论数,赞同数:

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf:

图片

再将所有pdf合成一个pdf文件,大小200MB,效果见网盘https://pan.quark.cn/s/8522433ad346 

图片

另外我还写了个批量下载知乎问题下的回答工具 :

图片

图片

导出的excel包含每个回答的回答链接,回答作者,回答内容,回答时间和回答更新时间,本来想把回答里的图片也下载了,但是有些回答的图片太多了。

图片

还有最近更新的知乎专栏批量下载,输入专栏链接和cookie就行总有人问我 cookie 到底是什么?  ,有问题加微信 sushengbuhuo 

图片

下载的所有文章html内容,文件名为回答日期加标题。

图片

接着批量将html转换pdf:

图片

再将所有pdf合成一个pdf文件,大小12MB,效果见网盘https://pan.quark.cn/s/8522433ad346 

图片

苏生不惑

这个账号已经持续5年每周更新原创文章,分享些有趣实用的软件/网站和黑科技教程,来跟我一起高效地玩转互联网。

458篇原创内容

公众号

最新原创文章:

加入我的知识星球

2023 更新版:苏生不惑开发过的那些原创工具和脚本

再次更新:2023批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf,文章数据含阅读数/点赞数/在看数/留言数

2024批量下载公众号文章内容/话题/图片/封面/视频/音频,导出excel和pdf,文章数据包含阅读数/点赞数/分享数/留言数

2024 年还有人不会安装使用脚本神器?手把手教你

2024 极品互联网宝藏资源库,聚合全网资源,低调收藏

2024 批量下载知乎回答/文章/想法/专栏导出excel和pdf

再次更新,2024 批量下载知乎回答/文章/想法/专栏/视频导出 excel 和 pdf

2024 批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

一次性搞定微博,苏生不惑又写了个脚本

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2047493.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

关于SQLModel库的一些封装思路和实战,fastzdp_sqlmodel库封装过程中的一些笔记,20240817

概述 最近在对SQLModel做一些封装,本篇文章主要记录封装过程中的一些思路和实战代码。 实现or查询 原本的代码 from typing import Optional from sqlmodel import Field, SQLModel, create_engine, Session, select, or_class Hero(SQLModel, tableTrue):id: O…

【笔记】PUML语法使用

Sequence 时序图 类型:participant 1、排序 order participant NAME order NUMBER 默认是按出现定义的先后顺序排列,如下图。 【Sequence】未定义order的效果图 可以通过自定义改变,使用order关键字,将按ABC进行排序。 partici…

20 以太网帧格式及命名方法

以太网帧格式及命名方法 一、以太网帧格式及命名方法 (一)帧格式及命名标准 1.以太网帧格式 ​ 802.3 以太网帧格式 ​ 以太网帧数据的长度46-1500 ​ 以太网帧的长度64-1518 ​ 帧校验序列(FCS):从目的地址开始…

Binance 如何使用 Quickwit 构建 100PB 日志服务(Quickwit 博客)

三年前,我们开源了 Quickwit,一个面向大规模数据集的分布式搜索引擎。我们的目标很宏大:创建一种全新的全文搜索引擎,其成本效率比 Elasticsearch 高十倍,配置和管理显著更简单,并且能够扩展到 PB 级别的数…

【无标题】乐天HIQ壁挂炉使用

这里写自定义目录标题 1.按键①: 按一下,小液晶显示的温度是所设定的供暖温度; 按二下,小液晶显示的温度是所设定的生活热水温度; 按三下,小液晶显示的温度是所设定的室内温度; 如果忘记按几下的…

HCIE冲刺-----------论述解析

X园区 1.防火墙放行OSPF 2.trunk口阻塞vlan1 3.关闭VPN防环 4.ospf不通检查NSSA区域配置 5.重定向可以在三层口或二层口配置 6.vlan60在ospf的相关配置 Z园区 1.mpls不通检查lo0口配置 2.isis不通检查接口IP与lldp连接 3.确认同级RR还是备份RR 4.确认策略矩阵的访问 python 1…

测试架构师要正直诚实而非率真

目录 正直诚实的重要性 为何需要正直诚实而非仅是率真 如何实践 正直不得罪人的方式 这里是一些关键的问题,在你感觉要“绝对诚实”地表达时考虑 率真这里有若干问题要考虑: 测试架构师作为软件开发团队中的关键角色之一,需要具备多种专…

Python编码系列—Python SQL与NoSQL数据库交互:深入探索与实战应用

🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中…

极狐GitLab 多行命令的 CI 日志管理体验的改进

极狐GitLab 是 GitLab 在中国的发行版,专门面向中国程序员和企业提供企业级一体化 DevOps 平台,用来帮助用户实现需求管理、源代码托管、CI/CD、安全合规,而且所有的操作都是在一个平台上进行,省事省心省钱。可以一键安装极狐GitL…

Python中15个递归函数经典案例解析

文末赠免费精品编程资料~~ 递归是Python编程中一个强大的工具,它允许函数调用自身以解决复杂问题。在本文中,我们将探索15个递归函数的经典案例,从基础到进阶,帮助你理解和掌握递归编程。 1. 阶乘计算 阶乘是一个常见的递归应用…

CSP-CCF 202109-1 数组推导

一、问题描述 二、解答 初版&#xff1a; 只得了60分 #include<iostream> using namespace std; int main() {int n;cin >> n;int B[101] { 0 };int sum_max 0;int sum_min0;//以防错误“使用未初始化的局部变量”&#xff0c;建议所有变量都要初始化&#xf…

2024 Google 开发者大会,沉浸式体验AI社会公益

文章目录 一、现场打卡二、AI 社会公益三、Gemma 模型四、Gemini 模型五、Google Cloud六、现场体验七、带着问题逛展八、学习资源和活动九、结束 Happy Hour 一、现场打卡 大家好&#xff0c;我是小雨。 2024 Google 开发者大会&#xff0c;沉浸式体验AI社会公益 今天我们参加…

ERD Online即将突破 4500 用户的喜悦与展望

亲爱的朋友们&#xff1a; 大家好&#xff01; 今天&#xff0c;我怀着无比激动的心情&#xff0c;要与大家分享一个令人振奋的消息&#xff1a;我们的网站用户即将突破 4500 大关&#xff01; 这一路走来&#xff0c;充满了挑战与艰辛&#xff0c;但每一次的困难都成为了我们前…

2024新型数字政府综合解决方案(十)

新型数字政府综合解决方案融合先进的人工智能、大数据、区块链及云计算技术&#xff0c;旨在通过数据共享、智能分析与自动化处理&#xff0c;打造高效、透明、安全的政务环境&#xff0c;优化服务流程&#xff0c;提升决策科学性&#xff0c;加强信息安全&#xff0c;实现政府…

java入门-成员内部类和静态内部类的访问

&#xff08;一&#xff09;成员内部类 package InnerClass;import javax.print.attribute.standard.MediaSize;public class Outer {//2外部类中的成员private int age99;public static String a;public class Inner{//普通的成员内部类//1.1成员变量public String name;priva…

删除镜像报子镜像依赖错误

1、删除镜像报子镜像依赖错误 出现这个错误的原因是因为有其他镜像依赖需要删除的镜像。 2解决方法 2.1首先查看无法删除的镜像被哪些镜像所依赖 docker image inspect --format{{.RepoTags}} {{.Id}} {{.Parent}} $(docker image ls -q --filter since${image_id}) # ${ima…

数据结构:线性结构之顺序表、链表篇

数据结构&#xff1a;顺序表、链表篇 线性表一、顺序表&#xff08;一&#xff09;顺序表的结构定义&#xff08;二&#xff09;顺序表的功能实现1、初始化2、销毁3、扩容4、插入5、删除 &#xff08;三&#xff09;顺序表例题分析1、删除有序数组中的重复项2、合并两个有序数组…

【Hot100】LeetCode—73. 矩阵置零

目录 1- 思路开辟额外两个一维数组 2- 实现⭐53. 最大子数组和——题解思路 3- ACM 实现 原题连接&#xff1a;73. 矩阵置零 1- 思路 开辟额外两个一维数组 1- 利用额外的两个一维数组 boolean 数组空间&#xff0c;遇到 0 则将当前位置的元素设置为 true 一维 row 数组&…

如何判断一个dll/exe是32位还是64位

通过记事本判断&#xff08;可判断C或者C#&#xff09; 64位、将dll用记事本打开&#xff0c;可以看到一堆乱码&#xff0c;但是找到乱码行的第一个PE&#xff0c;如果后面是d?则为64位 32位、将dll用记事本打开&#xff0c;可以看到一堆乱码&#xff0c;但是找到乱码行的第…

最好用的Linux发行版---WSL

使用debian开发半年&#xff0c;那个号称稳定的操作系统&#xff0c;ubuntu也是基于它的testing版本开发的&#xff0c;在一次设置testing更新后英伟达驱动掉了、引导区无法启动、bios损坏&#xff0c;现在老实了&#xff0c;换回了Window&#xff0c;并且激进的选择了win11&am…