ChatGPT炒股:批量下载北交所上市公司的招股说明书

news2024/9/26 3:28:40

打开北京证券交易所官网,点击发行上市,然后点击公开发行信息披露,然后在查询框里面输入关键词:在北京证券交易所上市招股说明书,然后选择时间,点击查询,就可以看到所有北交所上市公司的招股说明书了,一共4页

查看网页源代码,在network里面,可以看到动态网页的真实地址,然后点击payload,矿业看到动态网页的参数:

然后可以在ChatGPT中输入提示词如下:

你是一个Python编程专家,任务是爬取网站数据,具体步骤如下:

打开网站:

https://www.bse.cn/disclosureInfoController/zoneInfoResult.do?callback=jQuery331_1688797937558?disclosureType=&disclosureTypes%5B%5D=9533&page={0}&companyCd=&fileName=&inquiryList=&startTime=2022-01-01&endTime=2023-07-08&keyword=%E5%8C%97%E4%BA%AC%E8%AF%81%E5%88%B8%E4%BA%A4%E6%98%93%E6%89%80%E4%B8%8A%E5%B8%82%E6%8B%9B%E8%82%A1%E8%AF%B4%E6%98%8E%E4%B9%A6&isLink=1&needFields%5B%5D=companyCd&needFields%5B%5D=xxfcbj&needFields%5B%5D=companyName&needFields%5B%5D=disclosureTitle&needFields%5B%5D=disclosureCode&needFields%5B%5D=disclosurePostTitle&needFields%5B%5D=destFilePath&needFields%5B%5D=publishDate&needFields%5B%5D=fileExt&sortfield=xxssdq&sorttype=asc

其中,Page参数的值是从0到3

获取每页返回的jsonp格式的内容,并打印输出;

去掉jsonp格式内容开头的“jQuery331_1688797937558”字符,

解析嵌套其中的"listInfo"json数据,然后解析嵌套"listInfo"中的"content"json数据;

然后提取"content"中"companyCd"、"companyName"、"destFilePath"、"disclosureTitle"、"publishDate"这些字段内容到F盘“北交所招股说明书.xlsx”;提取到字段内容后要打印输出;

注意:每一步都要输出信息;每页数据爬取后暂停5秒;

程序运行后,数据爬取正常,但是保存到excel表格时出错:

让ChatGPT修复,然后再次运行,成功获取所有上市公司的招股说明书PDF文件下载地址:

接下来,在ChatGPT中输入提示词:

写一段Python程序,来批量下载PDF文件:

F盘有一个文件:北交所招股说明书.xlsx,

读取表格里面的companyName,然后加上“招股说明书”,作为PDF文件名称;

读取表格里面的destFilePath,前面加上“https://www.bse.cn”,作为PDF文件下载的URL地址;

下载所有PDF文件,保存到F盘的文件夹:“北交所招股说明书”

注意:每一步都输出信息;每下载一个PDF文件,暂停5秒;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/738444.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据集【NO.13】复杂场景下的鸟类检测数据集

写在前面:数据集对应应用场景,不同的应用场景有不同的检测难点以及对应改进方法,本系列整理汇总领域内的数据集,方便大家下载数据集,若无法下载可关注后私信领取。关注免费领取整理好的数据集资料!今天分享…

一款可定时发圈和标签群发的微信管理软件是什么样的?

什么是时间管理?它是一种科学的解释,意味着时间的流逝是不可阻挡的,但是可以通过掌握时间来获取更多的改变。那如何在有限的生命里而做更多有意义的事情呢?学习一下时间管理,你一定会从中得到启发和答案的。 1.先确定…

MYSQL建库及查询

目的: 1.创建数据库,删除数据库,查询创建数据的语句,使用数据库,查询当前默认的数据库以及使用的编码方式校验规则 2.数字,文本,日期 在一章表中定义多个字段,要使用提到的所有的数…

vue 多环境打包指令配置及编译

1.创建多环境: 在根目录创建.env.xxx文件,如下为例(我创建了两个) 文件内容主要包括: # 页面标题 VUE_APP_TITLE "标题"# 生产环境配置 ENV production# DNA检测仓储管理系统/生产环境 VUE_APP_BASE_API https://xxxxxx 2.设置: 修改根目录下的package…

Parasoft Jtest 2023.1版本-全新的Jtest让你的Java测试更加容易

测试用例的创建和执行以及测量代码覆盖率是现代开发过程的重要组成部分。新发布的Parasoft Jtest 2023.1增加了重要的新功能,使Java开发和QA团队在测试实践中更具有生产力和效率。 通过使用最新版本的Jtest,您可以在Visual Studio code IDE中提高Java代…

设计模式之二:观察者模式

假定我们需要为Weather-O-Rama公司建立一个气象站系统,除已有的WeatherData有数据源类,还需要更新三个布告板的显示:目前状况(温度、湿度、气压)、气象统计和天气预报。 1 以下是一个可能的实现 class WeatherData { …

雅思口语备考模仿练习有没有用?

如何对于雅思口语进行模仿练习?这是很多同学需要了解的事情,那么接下来就和一起来了解一下雅思口语备考模仿练习有没有用? 模仿练习 1. 方法 众所周知,模仿最基本的方法便是跟读。跟读的途径可以是两种:一种是听录音…

【AcWing算法基础课】第四章 数学知识(未完待续)

文章目录 前言课前温习番外:秦九韶算法核心模板 一、质数1. 试除法判定质数核心模板1.1题目描述1.2思路分析1.3代码实现 2、试除法分解质因数核心模板1.4题目描述1.5思路分析1.6代码实现 二、筛素数1.朴素筛法求素数核心模板2.线性筛法求素数(O(n)&#…

寻找nacos数据库连接名及密码

首先找到resources下的bootstrap.properties 找到其中的 spring.cloud.nacos.username***** spring.cloud.nacos.password**** 这个为nacos登陆的密码 到nacos中找到相应服务配置信息 spring.datasource.druid.urljdbc:mysql://ip地址 spring.datasource.druid.username用户…

防水防尘防震的工业三防平板电脑

工业三防平板电脑是一种具有防尘、防水和防震功能的平板电脑。它们被广泛应用于工业领域,特别是在恶劣环境下的工作场所。这些平板电脑具有坚固耐用的外壳和先进的技术,能够在恶劣的工作条件下提供稳定可靠的性能。 工业三防平板电脑的功能: …

Docker私有仓库搭建与界面化管理

一、关于Registry 官方的Docker hub是一个用于管理公共镜像的好地方,我们可以在上面找到我们想要的镜像,也可以把我们自己的镜像推送上去。 但是有时候我们的使用场景需要我们拥有一个私有的镜像仓库用于管理我们自己的镜像。这个可以通过开源软件Regi…

分享AIGC前沿论文系列二 面向区域级图像理解的端到端多模态大模型GPT4RoI

文章目录 概要论文摘要论文细节获取方式 概要 面向区域级图像理解的端到端多模态大模型 带来了超越图像级理解的全新对话和交互体验 进行丝滑的人机互动,不仅仅是文字级别的人机互动 论文摘要 本文提出对感兴趣区域进行Instruction Tuning,并提出GPT4…

Django基础入门⑬:Django表单实例【表单应用】获取全量书籍信息

Django基础入门⑫:Django 对象查询详解,分组聚合 Django表单实例表单应用编写模板层HTML页面编写视图层逻辑代码配置url路由模式映射页面搜索效果展示表单验证逻辑 获取全量书籍信息实现添加书籍信息 🏘️🏘️个人简介&#xff1a…

jmeter的高阶使用技巧——打印时间戳与年月时分秒

Jmeter中提供了一种函数,可以打印时间戳,如下图 年: yyyy 月:MM 日:dd   时: HH 分: mm 秒:ss 关于时间戳的格式,可以自由组合定义,这里我写成这样 yyyy-M…

443端口被占用,vmware居然也来捣乱

今天搬砖时发现应用起不来了,显示出了熟悉的error *************************** APPLICATION FAILED TO START ***************************~~重点在这块哈 Description:Web server failed to start. Port 443 was already in use.Action:Identify and stop the p…

共创先进软件,驱动装备数字化——同元软控成功举办MWORKS 2023b产品发布会

6月30日,MWORKS 2023b产品发布会与Modelica暨装备数字化研讨会(2023)同期举行。继2023年1月8日发布MWORKS 2023a之后,年内第二个版本如期而至。MWORKS是苏州同元软控信息技术有限公司(简称“同元软控”)历时…

IPO观察丨烧钱7年、押注新药上市,来凯医药正在经历一场关键突围

医药板块的加速回升趋势越来越显著。据Choice数据显示,截至7月6日,7月以来医药相关ETF合计获净申购37.17亿份。拉长期限来看,2023年以来医药相关ETF合计获净申购637.06亿份。根据区间成交均价计算,今年以来有超300亿元资金流入医药…

DAY43:不同路径+不同路径Ⅱ(初始化注意点很多,及时复盘)

文章目录 62.不同路径(注意初始化)BFS深度搜索写法动态规划思路DP数组的含义递推公式DP数组初始化遍历顺序打印dp数组 动态规划写法数组越界的问题for循环执行的问题 63.不同路径Ⅱ(初始化区别)思路DP数组含义递推公式DP数组初始化…

武汉理工大学信息工程学院2023暑期学术夏令营|信息与通信工程方向

目录 武汉理工大学 校训? 1 通信系统的有效性和可靠性 2 关于QAM调制的问题 2.1 什么是调制 2.2 什么是载波调制 2.3 QAM原理 2.4 数字信号QAM调制 2.5 QAM如何实现? 3 看马路上行驶的车辆轮胎为什么倒转 “视觉暂留” 4 6G/4G/5G的经典技…

卫星数据下载指南

1、USGS Earth Explorer(美国地质勘探局地球探测器) EarthExplorer 2、Sentinel Open Access Hub https://scihub.copernicus.eu/dhus/#/home 3、NASA Earthdata Search(美国航天局地球数据搜索) https://search.earthdata.n…