python数据分析 股票预测

news2024/11/16 3:38:55

目录

​​​​​​​一:股票预测数据分析

二:K线图数据分析


​​​​​​​一:股票预测数据分析

1-1 导入需要使用到的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

1-2 读取csv数据

data = pd.read_csv("stock.csv", encoding='gbk')
print(data.head())
          日期     股票代码    名称  ...         成交金额           总市值          流通市值
0  2021/3/15      '600519  贵州茅台  ...         12459955712  2.480000e+12  2.480000e+12
1  2021/3/12      '600519  贵州茅台  ...         8181594631  2.550000e+12  2.550000e+12
2  2021/3/11      '600519  贵州茅台  ...         11521736384  2.570000e+12  2.570000e+12
3  2021/3/10      '600519  贵州茅台  ...         10136910284  2.470000e+12  2.470000e+12
4  2021/3/9       '600519  贵州茅台  ...         16100769579  2.430000e+12  2.430000e+12

[5 rows x 15 columns]

1-3 空值处理

# Index(['收盘价', '最高价', '最低价', '开盘价', '前收盘', '涨跌额', '涨跌幅', '换手率', '成交量', '成交金额','成交量', '流通市值'],
# 删除不需要的列
data.drop(['股票代码', '名称', '日期', ], axis=1, inplace=True)  # 删除操作  # '涨跌额','涨跌幅','成交金额','总市值','流通市值','成交量','换手率'
# 空值所在行删除
data = data.dropna(axis=0, how='any')
print(data.head())
print(data.columns)  # 打印表头
       收盘价      最高价      最低价  ...         成交金额           总市值          流通市值
0      1975.45  2069.80  1951.15  ...  12459955712  2.480000e+12  2.480000e+12
1      2026.00  2077.00  2002.01  ...   8181594631  2.550000e+12  2.550000e+12
2      2048.00  2079.99  1961.48  ...  11521736384  2.570000e+12  2.570000e+12
3      1970.01  1999.87  1967.00  ...  10136910284  2.470000e+12  2.470000e+12
4      1936.99  2000.00  1900.18  ...  16100769579  2.430000e+12  2.430000e+12

[5 rows x 12 columns]
Index(['收盘价', '最高价', '最低价', '开盘价', '前收盘', '涨跌额', '涨跌幅', '换手率', '成交量', '成交金额',
       '总市值', '流通市值'],
      dtype='object')

1-4 两类相关性分析

1-4-1 收盘价 前收盘

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("收盘价和前收盘相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('前收盘', fontsize=8)
plt.scatter(data["收盘价"].values, data["前收盘"].values)
plt.show()

1-4-2 收盘价 开盘价

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("收盘价和开盘价相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('开盘价', fontsize=8)
plt.scatter(data["收盘价"].values, data["开盘价"].values)
plt.show()

1-4-3 涨跌幅 换手率 

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("涨跌幅和换手率相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('换手率', fontsize=8)
plt.scatter(data["收盘价"].values, data["换手率"].values)
plt.show()

1-4-4 成交量 总市值

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("成交量和总市值相关性图")
plt.xlabel('成交量', fontsize=8)
plt.ylabel('总市值', fontsize=8)
plt.scatter(data["成交量"].values, data["总市值"].values)
plt.show()

1-5 热力图数据分析 

# 热力图
ax = plt.subplots(figsize=(20, 16))
ax = sns.heatmap(data.corr(), vmax=.8, square=True, annot=True)
plt.show()

1-6 直方图数据分析 

1-6-1 成交量直方图

# 直方图
sz_close = data["成交量"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('成交量', fontsize=8)
plt.title("成交量直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

1-6-2 收盘价直方图

sz_close = data["收盘价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('收盘价', fontsize=8)
plt.title("收盘价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

1-6-3 最高价直方图 

sz_close = data["最高价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('最高价', fontsize=8)
plt.title("最高价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

1-6-4 开盘价直方图

sz_close = data["开盘价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('开盘价', fontsize=8)
plt.title("开盘价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

1-6-5 成交金额直方图

sz_close = data["成交金额"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('成交金额', fontsize=8)
plt.title("成交金额直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

股票预测数据分析,完整源码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

data = pd.read_csv("stock.csv", encoding='gbk')
print(data.head())

# Index(['收盘价', '最高价', '最低价', '开盘价', '前收盘', '涨跌额', '涨跌幅', '换手率', '成交量', '成交金额','成交量', '流通市值'],
# 删除不需要的列
data.drop(['股票代码', '名称', '日期', ], axis=1, inplace=True)  # 删除操作  # '涨跌额','涨跌幅','成交金额','总市值','流通市值','成交量','换手率'
# 空值所在行删除
data = data.dropna(axis=0, how='any')
print(data.head())
print(data.columns)  # 打印表头

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("收盘价和前收盘相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('前收盘', fontsize=8)
plt.scatter(data["收盘价"].values, data["前收盘"].values)
plt.show()

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("收盘价和开盘价相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('开盘价', fontsize=8)
plt.scatter(data["收盘价"].values, data["开盘价"].values)
plt.show()

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("涨跌幅和换手率相关性图")
plt.xlabel('收盘价', fontsize=8)
plt.ylabel('换手率', fontsize=8)
plt.scatter(data["收盘价"].values, data["换手率"].values)
plt.show()

# 两类相关性分析
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.figure(figsize=(16, 8))
plt.title("成交量和总市值相关性图")
plt.xlabel('成交量', fontsize=8)
plt.ylabel('总市值', fontsize=8)
plt.scatter(data["成交量"].values, data["总市值"].values)
plt.show()

# 热力图
ax = plt.subplots(figsize=(20, 16))
ax = sns.heatmap(data.corr(), vmax=.8, square=True, annot=True)
plt.show()

# 直方图
sz_close = data["成交量"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('成交量', fontsize=8)
plt.title("成交量直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

sz_close = data["收盘价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('收盘价', fontsize=8)
plt.title("收盘价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

plt.show()
sz_close = data["最高价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('最高价', fontsize=8)
plt.title("最高价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

plt.show()
sz_close = data["开盘价"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('开盘价', fontsize=8)
plt.title("开盘价直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

plt.show()
sz_close = data["成交金额"].values
x_close = [i for i in range(len(sz_close))]
plt.xlabel('时间', fontsize=8)
plt.ylabel('成交金额', fontsize=8)
plt.title("成交金额直方图")
plt.hist(sz_close, bins=40, facecolor="blue", edgecolor="black", alpha=0.6)
# 显示图标题
plt.show()

二:K线图数据分析

2-1 导入需要使用到的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import mpl_finance as mpf

from matplotlib.pylab import date2num
import datetime

2-2 读取表头数据

data = pd.read_csv("stock.csv", encoding='gbk')
data.drop(['股票代码', '名称'], axis=1, inplace=True)
# Index(['收盘价', '最高价', '最低价', '开盘价', '前收盘', '涨跌额', '涨跌幅', '换手率', '成交量', '成交金额','成交量', '流通市值'],
print(data.head())
          日期      收盘价      最高价  ...         成交金额           总市值          流通值
     0  2021/3/15  1975.45  2069.80  ...  12459955712  2.480000e+12  2.480000e+12
     1  2021/3/12  2026.00  2077.00  ...   8181594631  2.550000e+12  2.550000e+12
     2  2021/3/11  2048.00  2079.99  ...  11521736384  2.570000e+12  2.570000e+12
     3  2021/3/10  1970.01  1999.87  ...  10136910284  2.470000e+12  2.470000e+12
     4   2021/3/9  1936.99  2000.00  ...  16100769579  2.430000e+12  2.430000e+12

     [5 rows x 13 columns]

2-3 峰值数据分析

print(max(data["开盘价"].values), max(data["前收盘"].values), max(data["最高价"].values), max(data["最低价"].values))
2587.98 2601.0 2627.88 2485.0

2-4 数据转换为可读格式

# 将Tushare库中获取到的日期数据转换成candlestick_ochl()函数可读取的格式
def date_to_num(dates):
    num_time = []
    for date in dates:
        date_time = datetime.datetime.strptime(date, '%Y/%m/%d')
        num_date = date2num(date_time)
        num_time.append(num_date)
    return num_time

2-5 日期格式转换数字格式

# 将DataFrame转换为二维数组,并利用date_to_num()函数转换日期格式
df_arr = data.values  # 将DataFrame格式的数据转换为二维数组
# df_arr
df_arr[:, 0] = date_to_num(df_arr[:, 0])  # 将二维数组中的日期转换成数字格式
print(df_arr)
[[18701.0 1975.45 2069.8 ... 12459955712 2480000000000.0 2480000000000.0]
 [18698.0 2026.0 2077.0 ... 8181594631 2550000000000.0 2550000000000.0]
 [18697.0 2048.0 2079.99 ... 11521736384 2570000000000.0 2570000000000.0]
 ...
 [11563.0 36.38 37.0 ... 194689620 9095000000.0 2601170000.0]
 [11562.0 36.86 37.0 ... 463463143 9215000000.0 2635490000.0]
 [11561.0 35.55 37.78 ... 1410347179 8887500000.0 2541825000.0]]

2-6 绘制K线图

fig, ax = plt.subplots(figsize=(15, 6))
mpf.candlestick_ochl(ax, df_arr, width=0.6, colorup='r', colordown='g', alpha=1.0)
plt.grid()  # 显示网格
ax.xaxis_date()  # 设置x轴的刻度格式为常规日期格式
plt.show()

K线图数据分析,完整源码

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import mpl_finance as mpf

data = pd.read_csv("stock.csv", encoding='gbk')
data.drop(['股票代码', '名称'], axis=1, inplace=True)
# Index(['收盘价', '最高价', '最低价', '开盘价', '前收盘', '涨跌额', '涨跌幅', '换手率', '成交量', '成交金额','成交量', '流通市值'],
# print(data.head())
# print(max(data["开盘价"].values), max(data["前收盘"].values), max(data["最高价"].values), max(data["最低价"].values))

# 导入调整日期格式涉及的两个库
from matplotlib.pylab import date2num
import datetime


# 将Tushare库中获取到的日期数据转换成candlestick_ochl()函数可读取的格式
def date_to_num(dates):
    num_time = []
    for date in dates:
        date_time = datetime.datetime.strptime(date, '%Y/%m/%d')
        num_date = date2num(date_time)
        num_time.append(num_date)
    return num_time


# 将DataFrame转换为二维数组,并利用date_to_num()函数转换日期格式
df_arr = data.values  # 将DataFrame格式的数据转换为二维数组
# df_arr
df_arr[:, 0] = date_to_num(df_arr[:, 0])  # 将二维数组中的日期转换成数字格式
print(df_arr)
fig, ax = plt.subplots(figsize=(15, 6))
mpf.candlestick_ochl(ax, df_arr, width=0.6, colorup='r', colordown='g', alpha=1.0)
plt.grid()  # 显示网格
ax.xaxis_date()  # 设置x轴的刻度格式为常规日期格式
plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/114021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Xray正向及反向漏洞检测

文章目录软件介绍下载地址安装教程使用教程主动扫描被动扫描软件介绍 xray 是从长亭洞鉴核心引擎中提取出的社区版漏洞扫描神器,支持主动、被动多种扫描方式,自备盲打平台、可以灵活定义 POC,功能丰富,调用简单,支持 …

Vue3安装scss教程

在开发新项目的时候打算使用scss,新项目使用的是vue3框架,所以发一下scss安装的教程 scss是sass的超集,其实可以说是安装sass Vue3安装scss教程安装依赖vite.config.js配置使用安装依赖 npm install node-sass -S npm install sass-loader …

excel函数应用技巧:那些名不副实的函数列举

对于在职场中徜徉于数据海的Exceler们来说,一提到效率,都会对Excel函数赞不绝口,璀璨耀眼者如VLOOKUP、SUMIF、SUMPRODUCT等,皆是查询统计数据的大杀器!但是Excel函数家族成员众多,而且各函数问世时间各不相…

Linux中Docker安装RabbitMQ

1. RabbitMQ介绍 RabbitMQ是一套开源(MPL)的消息队列服务软件,是由 LShift 提供的一个 Advanced Message Queuing Protocol (AMQP) 的开源实现,由以高性能、健壮以及可伸缩性出名的 Erlang 写成。 2. MQ介绍 MQ是一个互联网架构…

一文带你梳理HTTP的发展历程

HTTP是什么? 首先,HTTP是什么? HTTP 是一种 超文本传输协议(Hypertext Transfer Protocol) 是基于_TCP/IP_的应用层通信协议,它是客户端和服务器之间相互通信的标准。它规定了如何在互联网上请求和传输内容。 你在这里已经可以…

RabbitMQ 第二天 高级 9 RabbitMQ 集群搭建 9.1 集群方案的原理 9.2 单机多实例部署 9.4 RabbitMQ镜像集群配置

RabbitMQ 【黑马程序员RabbitMQ全套教程,rabbitmq消息中间件到实战】 文章目录RabbitMQ第二天 高级9 RabbitMQ 集群搭建9.1 集群方案的原理9.2 单机多实例部署9.4 RabbitMQ镜像集群配置第二天 高级 9 RabbitMQ 集群搭建 实际生产应用中都会采用消息队列的集群方案…

基于Java+Swing+mysql餐厅点餐管理系统

基于JavaSwingmysql餐厅点餐管理系统一、系统介绍二、功能展示1.用户登陆2.用户注册(顾客)3.顾客可以点餐4.顾客可以查看订单信息5.顾客可以修改个人信息6.新增套餐(管理员)7.管理套餐(管理员)8.处理定单&a…

Spring整合Activemq

目录 一、Pom.xml 二、Spring配置文件 三、队列 四、主题 一、Pom.xml <dependencies><!-- activemq核心依赖包 --><dependency><groupId>org.apache.activemq</groupId><artifactId>activemq-all</artifactId><version>…

安全分析开发环境一键部署

安全分析开发环境一键部署 Gartner 报告中指出 [7]&#xff0c;Platfor m Ops for AI 是一种编排和扩展运营人工智能的方法&#xff0c;利用跨数据、机器学习、人工智能和应用程序 开发管道的多种最佳实践&#xff0c;为基于人工智能的系统创建一个高效的交付模型。Platform O…

Android 8~12蓝牙架构组件介绍

一. Android 蓝牙架构图 可以看到Android蓝牙一共分为几层&#xff1a; APPLICATION FRAMEWORKBLUETOOTH PROCESSJNIBLUETOOTH STACKHIDL INTERFACESVENDOR IMPLEMENTATAION 生成内容路径以rk3399举例,在更新的过程中会遇到这个问题&#xff0c;解决方式是&#xff1a; root a…

node.js+uni计算机毕设项目基于微信小程序的图书管理系统(程序+小程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流 项目运行 环境配置&#xff1a; Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。 项目技术&#xff1a; Express框架 Node.js Vue 等等组成&#xff0c;B/S模式 Vscode管理前后端分离等…

【前端设计】寄存器复位对综合面积的影响

我们的目标是┏ (゜ω゜)=☞芯片前端全栈工程师~喵! 前言 之前在写代码的时候呢,就一直被要求尽量使用不带复位的寄存器,理由是节约面积和降低功耗。因此我一直有两个疑问:能省多少面积?能降低多少功耗? 鉴于我一直没能掌握功耗测试的技能,因此这次先来看看面积的影响…

k8s本地联调工具kt-connect

1、Kt Connect简介 KT Connect &#xff08; Kubernetes Developer Tool &#xff09; 是轻量级的面向 Kubernetes 用户的开发测试环境治理辅助工具。其核心是通过建立本地到集群以及集群到本地的双向通道&#xff0c;从而提升在持续交付生命周期中开发环节的效率问题以及开发测…

[Linux]多线程的同步和互斥(线程池 | 单例模式 | 其他常见的锁 | 读者写者问题)

文章目录线程池线程安全的单例模式单例模式的特点饿汉方式和懒汉方式单例模式实现线程池其他常见的锁读者写者问题线程池 线程池是一种线程使用模式。线程过多会带来调度开销&#xff0c;进而影响缓存局部性和整体性能。而线程池维护着多个线程&#xff0c;等待着监督管理者分…

K26 SOM从emmc启动linux——2

问题 在K26 SOM从emmc启动linux文章中&#xff0c;使用EMMC启动后&#xff0c;出现下图打印&#xff1a; 这里本身是存在问题的&#xff0c;没有显示系统名称&#xff0c;打印中有错误提示。 解决办法 在Image Packaging Configuration中将petalinux-initramfs-image修改成p…

教你快速实现“基于Docker快速构建基于Prometheus的MySQL监控系统”

&#x1f341; 个人网站&#xff1a;知识浅谈 &#x1f4cc; 资料分享群&#xff1a;资源分享 &#x1f356;400多套PPT模板&#xff1a;商务模板&学生答辩 &#x1f91e;这次都给他拿下&#x1f91e; 基于Docker快速构建基于Prometheus的MySQL监控系统 先来捋一下数据流的…

Java Lambda表达式原理解析

前言 java中有lambda,在使用java的过程中我们没少用(啥?用的kotlin?你别说话)但是你知道lambda的实现原理吗? 接下来就来解析lambda实现,不过在lambda之前我们与一个熟悉的老伙计谈谈心————匿名类,为什么因为他们有点类似. 匿名类的实现方式 从字节码的层面上来说ne…

长光卫星冲刺科创板上市,预计2025年底前实现300颗卫星在轨

近日&#xff0c;长光卫星技术股份有限公司&#xff08;下称“长光卫星”&#xff09;在上海证券交易所递交招股书&#xff0c;准备在科创板上市。 本次冲刺科创板上市&#xff0c;长光卫星计划募资26.83亿元&#xff0c;将用于“吉林一号”卫星星座建设项目&#xff08;二期&a…

第五章:数据完整性

一、实体、参照、用户自定义完整性 1、【单选题】CREATE TABLE时定义属性上的约束条件&#xff0c;检查列值是否满足一个条件表达式的定义关键词为&#xff1a; 正确答案&#xff1a; A 2、【多选题】创建患者住院主记录表pat_visit&#xff0c;并定义主码{patient_id,visit_…

《图解TCP/IP》阅读笔记(第七章 7.1、7.2、7.3)—— 路由控制概念与路由控制算法

第七章 路由协议 本章旨在将详细介绍路由控制以及实现路由控制功能的相关协议 7.1 路由控制的定义 在互联网这片汪洋大海中&#xff0c;数据就好似一叶扁舟&#xff0c;没有灯塔的指引&#xff0c;是难以寻得目的地的。这种进行正确方向引导的转发数据的处理&#xff0c;就叫…