《如何制作类mnist的金融数据集》——1.数据集制作思路

news2025/1/11 22:37:15

1.数据集制作思路(生成用于拟合金融趋势图像的分段线性函数)

       那么如何去制作这样的一个类minist的金融趋势曲线数据集呢?

       还是如上图所示,为了使类别平均分布,因此可以选取三种“buy”的曲线、三种“sell”的曲线以及三种“no”的曲线来作为新数据集的基本数据类别。那么buy类别的曲线可以选取上图中的第14、12、19个图像,并将其主标签类别设为0、1、2;那么sell类别的曲线可以选取上图中的第2、5、7个图像,并将其主标签类别设为3、4、5;那么no类别的曲线可以选取上图中的第4、15、18个图像,并将其主标签类别设为6、7、8。

       选好标签后,就是考虑如何去拟合它们。我们发现选取的这些图片都各有千秋。比如第2个表示“sell”的图,其实可以直接用y=-kx进行拟合,只是调整它的斜率(k>0)即可。第12、25张图也同理。而像第4张图,它其实可以用两段分段线性函数去拟合(当然你也可以去使用多段线性函数去拟合它,我这里为了偷懒就说两段吧。而且还有一个原因就是无论你是两段还是更多段,在你把它转为28*28的像素图片后其实里面的细节不太容易看出来,所以我觉得两段就行。)如下图所示,前一段可以用y=±kx表示,而后一段可以使用y=kx(k>0)表示,分别随机调整它们的斜率就能生成无数种类似图片。第1、3、4、5、6、7、9、11、14、15、16、19、20、23、24张图也同理。而剩下没有提到的图片我认为可以使用三段线性函数去进行拟合,因为以17举例,它包括了一段降、一段升和一段降的趋势,也主要是这三种趋势会提示网络不进行买卖的操作。

       有了上面的思路后就好说了,以生成第14张图为例,直接上代码,下面这段代码不光把第14张图的曲线拟合出来了,还对生成的图像进行了黑底白线的处理。且生成的图像的两段的斜率是随机的,从而保证能够生成若干张图片来形成数据集。

import matplotlib.pyplot as plt
import numpy as np
import random

t1 = np.arange(-4, 0, 0.01)#分段函数的定义域与精度
t2 = np.arange(0, 2, 0.01)

# print(random.randint(pre_data0,99))
y1_list = []  # 记录函数值
y2_list = []  # 记录函数值
number = 50
def y(t1,t2):
    t1 = t1 * random.uniform(1,5) # t1 * 随机的斜率k
    t2 = t2 * random.uniform(1,5)
    for i in t1:
        y1_list.append(i)
    for j in t2:
        y2_list.append(-j)

num=6000 #需要制造的数据量
for j in range(num):
    y1_list = []
    y2_list = []
    y(t1, t2)
    #调整画布背景颜色为黑色
    ax = plt.axes().set_facecolor('black')
    #根据函数画出来的曲线是白色,并且稍粗一些
    plt.plot(t1, y1_list, linewidth = 3.0, color='white')
    plt.plot(t2, y2_list, linewidth = 3.0, color='white')
    #去横纵坐标
    ax = plt.subplot()
    ax.set_xticks([])
    ax.set_yticks([])
    #去图片边框
    plt.subplots_adjust(top=1, bottom=0, right=1, left=0, hspace=0, wspace=0)
    plt.margins(0, 0)
    #用于放大缩小图像
    plt.xlim(-5, 3)  # 坐标轴范围
    plt.ylim(-8, 1)
    plt.savefig('./pre_data0/{}_0.jpg'.format(j+1))
    plt.show()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1386122.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

云渲染农场渲染和自己搭建农场渲染怎么选?哪个更划算?

当我们面临繁重或紧急的渲染任务时,通常会选择云渲染的解决方案。可能很多人会问,我们是否能够自行建立一个小型的个人农场进行渲染呢?与云渲染农场相比,哪个更划算?更方便?接下来就带大家看看…

创意设计探索:8个推荐的高水平设计灵感网站

对于任何设计爱好者来说,浏览优质的设计网站无疑是激发创意、汲取灵感的重要途径之一。今天,小编精心为大家推荐了8个设计网站,无论你的设计方向是平面设计、包装设计、插画设计还是网页设计,这里都能帮你找到创作的灵感! 1.即时设计资源广场 即时设计是一款功能强大的云端设…

奈奎斯特-香农采样定理的理解(结合cos(8.5t)和傅里叶变换)

采样定理,通常被称为奈奎斯特-香农采样定理,是信号处理中的一个基本原则。它解释了如何从连续信号中采样以便在后续能完全重构原始信号。以下是该定理的核心要点: 采样定理的陈述:为了从其样本中无失真地重构一个连续时间信号&am…

Django框架完成读者浏览书籍,图书详情页,借阅管理

前情回顾: 使用Django框架实现简单的图书借阅系统——完成图书信息管理 文章目录 1.完成展示图书信息功能1.1django 静态资源管理问题1.2编写图书展示模板HTML 2.完成图书详情页功能2.1从后端获取图书详情信息2.2详情页面展示图书数据 3.完成借阅管理功能3.1管理员…

MIinW-W64交叉编译找不到‘mutex‘问题解决

问题 在linux下安装mingw-w64来交叉编译Windows的程序和库. 就像我之前的一篇博客提到的来进行mingw的交叉编译 这样默认安装的线程模型是win32模型.这个线程模型不支持mutex. 一般查找问题的过程: 线程模型通常包含互斥锁(mutex)作为线程同步的基本工…

开源对象存储服务器MinIO本地部署并结合内网穿透实现远程访问管理界面

文章目录 前言1. Docker 部署MinIO2. 本地访问MinIO3. Linux安装Cpolar4. 配置MinIO公网地址5. 远程访问MinIO管理界面6. 固定MinIO公网地址 前言 MinIO是一个开源的对象存储服务器,可以在各种环境中运行,例如本地、Docker容器、Kubernetes集群等。它兼…

网页测试遇到自动弹窗,Alert类无法处理?或许你该来学学这招了!

相信大家在使用selenium做网页自动化时,会遇到如下这样的一个场景: 在你使用get访问某一个网址时,会在页面中弹出如上图所示的弹出框。 首先想到是利用Alert类来处理它。 然而,很不幸,Alert类处理的结果就是没有结果…

C语言——小细节和小知识9

一、大小端字节序 1、介绍 在计算机系统中,大小端(Endianness)是指多字节数据的存储和读取顺序。它是数据在内存中如何排列的问题,特别是与字节顺序相关。C语言中的数据存储大小端字节序指的是在内存中存储的多字节数据类型&…

MyBatis-Plus 入门指南:安装与配置、代码生成、综合案例、主键生成策略、自动填充

目录 1.MyBatis-Plus介绍 1.1.简介 1.2.特性 1.3.结构 1.4.支持数据库 2.快速开始 3.安装与配置 4.代码生成 5.综合案例 5.1.主键生成策略 5.2.自动填充 1.MyBatis-Plus介绍 1.1.简介 MyBatis-Plus(简称 MP)是一个 MyBatis 的增强工具&…

fastadmin答题考试系统开源二次开发带拍照搜题版本

应用介绍 应用介绍 一款基于FastAdminThinkPHPUniapp开发的小程序答题考试系统,提供全部前后台无加密源代码,支持私有化部署 前端截图: 后台截图: 功能介绍:

多个搜索引擎跳转

<div align"center"> <select id"search_engine"> <option value"https://www.baidu.com/s?wd%s">百度</option> <option value"https://cn.bing.com/search?q%s">必应</option> <option va…

CentOS离线安装MongoDB

目录 1、下载 2、上传并解压 3、创建目录 4、新建配置文件 5、启动 6、验证 7、停止服务 7.1 快速停止 7.2 标准的关闭方法 1、下载 下载MongoDB对应的压缩包&#xff0c;本次使用的是4.0.10版本&#xff0c;点击下载 2、上传并解压 把压缩包上传到服务器&#xff0c…

大模型日报-20240115

即插即用&#xff0c;完美兼容&#xff1a;SD社区的图生视频插件I2V-Adapter来了 https://mp.weixin.qq.com/s/tlOWaMi0e6By__MUT414xA 图像到视频生成&#xff08;I2V&#xff09;任务旨在将静态图像转化为动态视频&#xff0c;这是计算机视觉领域的一大挑战。其难点在于从单…

Docker-Dockerfile构建镜像

Dockerfile 是一个文本格式的配置文件&#xff0c; 用户可以使用 Dockerfile 来快速创建自定义的镜像&#xff0c;另外&#xff0c;使用 Dockerfile 去构建镜像好比使用 pom 去构建 maven 项目一样&#xff0c;有异曲同工之妙 构建基础镜像 centos alpine 1. 空间大小差异…

Everything-一切尽在掌握之中

软件推荐&#xff0c;电脑文件繁多的时候&#xff0c;想要快速找到文件&#xff0c;少不了它 反应速度简直了&#xff0c;一秒响应 官网下载连接&#xff1a;下载 - voidtools

uni-forms表单校验有很多坑,uniapp项目,我的表单是写在tab切换页中的,

我的表单是写在tab切换页中的&#xff0c;这和一般写在最外层的表单不一样&#xff0c;当你点提交按钮时&#xff0c;返回的是一个数组&#xff0c;你有3个tab,就有3个数组&#xff0c;你需要通过下标拿到你表单所在的tab对应的数组 <view class"form-box"><…

geopandas 笔记:plot 的scheme

transbigdata 笔记&#xff1a;官方文档案例1&#xff08;出租车GPS数据处理&#xff09;-CSDN博客 3.3.1 节的内容的拓展&#xff0c;这里主要是比较各个scheme的效果 主代码为&#xff1a;修改的就是第二行scheme的内容 plt.figure(1,(16, 6), dpi300) schemebox_plot #图…

免费通配符SSL证书

通配符SSL证书&#xff0c;又名泛域名证书或Wildcard Certificates&#xff0c;是一种专门设计用于同时保护一个主域名以及该域名下所有同级子域名的加密证书。它采用先进的加密技术确保网络传输数据的私密性和完整性&#xff0c;防止中间人攻击和信息窃取。 通配符SSL证书的优…

【LeetCode】202. 快乐数(简单)——代码随想录算法训练营Day06

题目链接&#xff1a;202. 快乐数 题目描述 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为&#xff1a; 对于一个正整数&#xff0c;每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1&#xff0c;也可能是 无限循环 但始终…

MATLAB R2023b for Mac 中文

MATLAB R2023b 是 MathWorks 发布的最新版本的 MATLAB&#xff0c;适用于进行算法开发、数据可视化、数据分析以及数值计算等任务的工程师和科学家。它包含了一系列新增功能和改进&#xff0c;如改进了数据导入工具&#xff0c;增加了对数据帧和表格对象的支持&#xff0c;增强…