为了方便看看12年来这些号发过的文章 2023 批量下载公众号文章内容/话题/图片/封面/视频/音频,导出文章pdf和抓取文章数据包含阅读数/点赞数/在看数/留言数,我抓取了其中一些号的所有历史文章同步到博客 :
比如深圳卫健委从2014年更新,到2023年共发布文章11050篇 ,第一篇是2014年12月发布的王大平主任带队到市人民医院调研:
微信派从2013年更新,到2023年共发布文章2070篇,第一篇文章是2013年4月发布的 把脉沙龙(一):央视新闻开辟新媒体领域:
人民日报第一篇文章是2013年1月发布的。
央视新闻第一篇文章是2013年 3月发布的。
小众消息从2012年更新,到2023共发布文章2112篇,第一篇文章是2012年11月发布的 假装的艺术:
三表龙门阵第一篇文章是2013年5月发布的 表哥的16碗鸡汤
槽边往事从2012年更新,到2023年发布文章2050篇,第一篇文章是2012年发布的 创始人什么样,公司就什么样
除了抓取文章,我还写了个脚本批量下载某个公众号的所有历史文章批量下载公众号文章内容/话题/图片/封面/音频/视频,导出html,pdf,excel包含阅读数/点赞数/在看数/留言数/赞赏数 ,下载效果如图:
下载的excel文章数据包含文章日期,文章标题,文章链接,文章简介,文章作者,文章封面图,是否原创,IP归属地,阅读数,在看数,点赞数,留言数,赞赏次数,视频数,音频数等,比如深圳卫健委2022年的1000多篇文章阅读数都是10万+,excel数据分析见这篇文章2022年过去,抓取公众号阅读数点赞数在看数留言数做数据分析, 以深圳卫健委这个号为例 。
每篇文章下的留言内容也可以单独导出excel,包含文章日期,文章标题文章链接,留言昵称,留言内容,点赞数,回复和留言时间,比如深圳卫健委在2月份就有1万6千多条留言 sushengbuhuo 。
下载所有文章以莫言老师的公众号为例,包括文章内容(含留言),音频和视频 :
最后将所有文章合并成一个pdf文件(含留言),点击左侧书签跳转到对应文章,在电脑和手机上看方便多了,也不用担心文章被删看不了: