[计算机毕业设计]机器学习的数据驱动股票价格预测

news2025/1/16 20:56:28

前言

    📅大四是整个大学期间最忙碌的时光,一边要忙着准备考研,考公,考教资或者实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

🚀对毕设有任何疑问都可以问学长哦!

本次分享的课题是

🎯XXX

课题背景与意义

机器学习给人的感觉是能做很好的预测,于是人们开始滥用它。随着机器学习算法不断应用到各行各业,越来越多声称能够预测股市的机器学习算法模型也层出不穷,有的还给出了准确率近乎完美的结果,这些模型和结果看上去确实令人兴奋,然而在现实中如果真的使用这些模型去预测市场,就会被市场教育。

课题实现技术思路

通常对于监督性学习来说,模型的训练都需要基于标注的数据,而对于股票趋势分类来说的话,这个工作不免有些巨大和繁琐。所以这篇文中首先通过启发式非监督算法来划分价格的模式。具体分为了四种:

  • Up:表示上涨模式,同时这个模式又根据上涨范围的大小被划分了两个子模式,如上涨区间在[10%, 30%]内和大于30%。

  • Down:表示下降模式,同上涨模式一样,它也根据下降范围的大小被划分为了子模式。

  • Flat:表示近似平缓的模式。

  • Unknown:表示以大振幅波动的模式。

其中识别算法在下面的03模型训练部分中进行了展示。

这个系统的目的是根据一段时间(如过去一段时间到现在)的模式,来预测它是否可以构成前面划分的几种模式,并预测其生成这个模式的概率。由于这里不是传统的01分类,而是一种模式预测的概率,所以这里的实际用处还是相对比较高的。

预测模式的持续时间文中称作PD(Pattern Duration),用于训练的持续时间文中称作MD(Model Duration)。具体如下面的图所示:

对于不同持续时间的组合在其系统中也有进行预先设计,以便于这个系统可以开箱即用。

在实际的应用中,整个过程其实就可以看做是通过一个滑动窗口的形式,不断的对股票价格序列进行切片,训练以及模式识别的过程,具体如下面论文中的过程图:

模型的预测部分用到的是随机森林模型,毕竟对于要求高可解释性的量化交易领域中,像决策树或者逻辑回归这类较为透明的算法还是较为合理的。预测的训练过程部分也在03模型训练部分中。

最后,整个交易系统的模型框架,包括整个系统的软件设计架构在下面进行了展示:

对于面前定义的非监督算法进行模式识别的具体步骤如下面的Algorithm1所示,由于上涨模式的识别其他模式识别的算法类似,所以Algorithm1只展示了上涨模式的识别步骤:

而预测部分的Random Forest的训练步骤如下面的算法Algorithm2过程所示,这里的算法流程与传统的Random Forest的训练过程还有些不同,因为考虑到了模式类中的不平衡性,所以这里还加入了undersampling的方法。

🚀海浪学长的作品示例:

大数据算法项目

机器视觉算法项目

 

实验的验证部分用到了真实的股票数据,来自深市科创板的495支股票,时间是从2010年1月25到2016年1月26日,并与常见的机器学习模型,如SVM、ANN以及KNN算法进行了预测准确率和收益率的比较。比较的效果如下面的表所示:

在不考虑各种滑点、手续费等因素的前提下,可以看出,论文中提出的方法的效果还是很客观的。

微信小程序项目

Unity3D游戏项目

最后💯

🏆为帮助大家节省时间,如果对开题选题,或者相关的技术有不理解,不知道毕设如何下手,都可以随时来问学长,我将根据你的具体情况,提供帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/23967.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

财政政策与货币政策(下)

财政政策与货币政策(下) – 潘登同学的宏观经济学笔记 文章目录财政政策与货币政策(下) -- 潘登同学的宏观经济学笔记粘性价格下的货币经济总供给曲线总供给曲线斜率与价格粘性菲利普斯曲线的消失货币政策的“动态不一致”财政政策与货币政策的配合财政主导 vs. 货币主导恶性通…

【学习记录】实例分割的发展与区别

【学习记录】实例分割的发展与区别 参考于《The Evolution Of Instantce Segmentation》 文章目录【学习记录】实例分割的发展与区别发展历程RCNNFast RCNNMultipath NetworkFaster RCNNMask RCNN发展历程 RCNN 开发集成了RCNN技术产生了AlexNet,以及使用选择性搜索…

浅谈App的启动优化

1. 应用启动的方式 在Android中,应用启动一般可分为三种:冷启动、温启动、热启动。 那么什么是冷启动、温启动和热启动呢?下面我们来简单看一下它们的定义: 冷启动:当启动应用时,后台没有该应用的进程。这…

Allegro导入导出设计数据操作指导

Allegro导入导出设计数据操作指导 Allegro有个非常好用的功能,就是支持设计数据的导入和导出,让协同设计变得更加方便,具体操作如下 以下面的设计数据为例,需要把这些数据导入到另外一个版本中 点击file-export-subdrawing Options所有的项目都勾选起来 Find选择需要导…

linux笔记(7):东山哪吒D1H使用framebuffer控制HDMI直线

文章目录1.测试流程和结果1.1 使能HDMI1.2 framebuffer操作流程1.3 测试结果2.测试过程详述2.1 编译源码2.2上传可执行文件2.3修改文件的权限,执行文件3.源码解释3.1 HDMI使用的颜色格式是ARGB4.源码工程链接这部分linux笔记是记录我入门的过程,内容基本…

【Flutter】【widget】Table 表格widget

文章目录前言一、Table 是什么?二、使用步骤1.Table 基础使用2.宽度3.设置边框4.TableCell设置单元格式widget等其他设置总结前言 Table 表格widget,其实很少使用到的,等有需要的时候在查看该widget 一、Table 是什么? 表格widg…

Trino源码Gitlab CICD单测环境建设

在中大型公司,由于对Presto源码的定制魔改量越来越大,会随着时间推移而增大出现冷门bug的概率,所以建立一套自动测试机制,在魔改源码合入主分支时可以自动触发test case,通过特定单测的执行失败,来更清晰的…

多云管理产品组合VMware Aria,开启多云管理新篇章

今年8月份,VMware Explore美国大会上宣布了多云管理产品组合VMware Aria,宣布之后,市场上关注度非常高,而且受到了热捧。Aria这个名字动听且贴切,中文意思是 “咏叹调”,也就是说要用统一的、一致的曲调来歌…

big.LITTLEDynamIQ

最近看到了DynamIQ,于是来了解一下什么是DynamIQ? 前言 首先要知道DynamIQ,那么你肯定得知道big.LITTLE。因为DynamIQ可以说是big.LITTLE新一代或者是升级版。 那么在这之前你肯定得知道什么是big.LITTLE? 然后知道了后你就会…

旋转框目标检测mmrotate v0.3.1 训练DOTA数据集(三)——配置文件优化技巧

1、 目标检测比赛中的tricks DOTAv2遥感图像旋转目标检测竞赛经验分享(Swin Transformer Anchor free/based方案) 目标检测比赛中的tricks(已更新更多代码解析) 水下目标检测算法赛解决方案分享 | 2020年全国水下机器人&#xf…

基于布谷鸟搜索混合灰狼优化算法求解单目标优化问题(AGWOCS)

👨‍🎓个人主页:研学社的博客 💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜…

【工具】typora的一些配置

文章目录1. 自动编号1.1 大纲编号1.2 目录编号3. 正文部分2. 自定义快捷键1. 自动编号 我们在查看文档时候,希望编译器能够自动根据标题样式按顺序编号,不需要用户自行添加相应标题。这样也方便用户随时更新文档时候不会因为修改了某个编号而要去修改其…

分享3个文字配音软件,帮助你们轻松制作短视频

有没有刚踏入自媒体行业的小伙伴呀?那你们是不是为视频的后期工作所困惑着呢? 大家平时刷到的视频虽然看起来简短又有趣,但其实后期制作并没那么简单,是由许多道工序环环相扣而成的,其中比较重要的,就是为视…

JavaEE进阶:Spring 更简单的读取和存储对象

文章目录前言一、存储 Bean 对象1、前置⼯作:配置扫描路径(重要)2、添加注解存储 Bean 对象① Controller(控制器存储)② Service(服务存储)③ Repository(仓库存储)④ C…

栈的实现.

文章目录1.栈的概念及结构2.栈的实现(数组实现)2.1栈头文件2.2函数实现3.栈的习题3.1有效的括号3.1.1思路分析3.1.2代码实现1.栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删…

Qt第二十一章:Qt Designer 之 布局

简单场景:页面上放一个QTextEdit控件 预览后发现,拖拽放大窗口,QTextEdit控件不会进行缩放,就像下边自适应缩放 我们看到了QTextEdit控件撑满了整个界面:在控件sizePolicy属性的允许范围中尽可能的撑满界面。 如果换成…

基于h5的风云网球网站的设计

目 录 1绪 论 1 1.1 选题背景及意义 1 1.2 国内外研究现状 2 1.3本章小结 2 2 前端开发及相关技术 4 2.1 HTML5前端开发环境 4 2.2 HTML5前端开发工具 4 2.3 HTML5前端开发相关技术 5 2.3.1 javascript简介 5 2.3.2 javascript基本特点 5 2.3.3 css简介 6 2.3.4 jQuery 7 2.4 本…

Python精髓之括号家族:方括号、花括号和圆括号,你真的会用吗?

Python独一无二的特色除了缩进还有哪些特色呢?大多数的回答一定是 语法简洁、简单易学、代码高效、功能强大四项。那究竟是Python的哪些语言特性使得人们普遍认为Python具有这些特点呢?其实很大程度上,这要归功于列表(list&#x…

公众号免费题库使用方法

公众号免费题库使用方法 本平台优点: 多题库查题、独立后台、响应速度快、全网平台可查、功能最全! 1.想要给自己的公众号获得查题接口,只需要两步! 2.题库: 题库:题库后台(点击跳转&#xf…

haoop启动正常,但上不去网页hadoop102:9870

haoop启动正常,但上不去网页hadoop102:9870 症状如下: hadoop启动正常,jps正常 网页上不去 查下cmd,ping不通 解决方法 一、 先查hdfs 命令:vim /opt/module/hadoop-3.1.3/etc/hadoop/hdfs.site.xml 二、查hosts,我就是…