零基础想系统地学习金融学、量化投资、数据分析、python,需要哪些课程、书籍?有哪些证书可以考?

news2024/11/19 3:31:46

曾经我也是零基础小白,题主想走的路,我已经走过啦~作为一名CFA持证人和管理因子投资的量化策略的投资组合经理,我把这些年积累的干货跟大家分享。

量化投资是金融学的一部分,量化投资(跟量化交易的概念有部分重合)需要进行数据分析,而常见的工具是R或者Python。R正在逐渐被Python代替,如果是零基础的同学,建议直接学Python就可以了。

下面我就再用量化投资中最受欢迎的因子投资为例,搭建一个量化投资的框架,哪里需要数据分析、哪里需要金融学、哪里需要Python的知识,希望大家能在框架中找到它们各自的位置。其中,金融学和数据分析的知识是血肉,Python技能是骨架,没有骨架,再好的血肉也是立不起来。因此,Python的学习贯穿量化投资的过程。

因子投资(Factor Investing),也叫做聪明的贝塔(Smart Beta),是量化投资领域非常受欢迎的重要分支。目前,市场上共有1.8万亿美元的资金投资于因子投资的模型中。因子投资用简单的白话说,就是通过找到决定股票收益高低的“因子(因素)”来进行投资。搭建一个因子投资的模型,需要完成以下流程:收集数据——数据分析——模型训练——检验回测业绩——调整模型。

一、收集数据

目前股票市场上提供财务数据的数据库有很多,但最常用的,是针对A股市场的Wind数据库和针对美股市场的Bloomberg数据库。如果我们分析某只股票,可以通过登陆Wind或者Bloomberg终端进行信息检索和数据收集,但量化投资需要海量的财务数据,通过终端查询不可能实现,通过Excel表格的插件,也费事费力。最有效率的获取数据方法,是通过数据库的Python插件。

以Wind为例,在Python中输入以下代码:

import pandas as pd
from WindPy import w
w.start()

使用Python获取数据库的数据比Excel省事很多,不仅速度快,数据分析时也不用再读取Excel文件了。这里的免费课程覆盖了Python的重要语法,在通过案例学习语法的过程中,自然而然的会学习金融、数据分析的知识。大家先领取,再往下看文章。

Python 量化技能入门必备👉语法入门+四大实战案例

¥0.00立即领取

二、数据分析

拿到财务数据后,我们要做的第一步就是进行数据清理,其中包括了缺失值处理、极值处理、数据转换、数据可视化。这些步骤需要处理大量的数据,Python会让我们事半功倍。

1,缺失值处理。 缺失的数据会影响模型的准确度,如果一个指标的缺失数据达到了20%以上,我们就要考虑是否应该将该指标排除在外。比如,我们想要通过学生的模拟考试成绩预测高考成绩,但一半的学生都没有参加模拟考,那还怎么预测呢?一般情况下,缺失值不是太多,我们会替换成平均数或者中位数。

2,极值处理。 极值顾名思义,就是指特别大或者特别小的数,这个数混在数据里,会影响我们对数据情况的判断。比如,一个小公司的员工都只领几千块钱的薪水,而CEO领几千万元的薪水,公司的平均薪资都达到十几万了,显然,平均数不能正确反映员工的工资水平,这时,CEO的薪水就应该作为极值被排除在外。量化投资中,最常用的极值处理方法是Winsorization,这在Python中也很容易实现。

3,数据转换。 我们分析数据的目的,是要获取数据中隐藏的信息,这个过程就像破案一样,要抽丝剥茧。很多时候,数据要符合一定的样子才能吐露信息,比如在线性回归模型中,自变量应该服从正态分布。这时候,我们需要将原始数据变成期望中的样子,这个过程就叫做数据转换。量化投资中,我们会将数据标准化、正态化、取Log等等。

4,数据可视化。 “A picture is like a thousand words",一图顶万言。画图能帮助我们更好的了解手中的数据。Python在数据可视化这方面比R更加灵活、领先,比如Clustering的可视化,关于分布的Histogram图片。

从使用者的角度,Python的语言更直白,图片更好看。如果大家向领导汇报,相信Python会比R更能让领导“赏心悦目”。

三、模型训练

量化投资的模型可以分成两大类:回归类(regression)和分类类(classification) 。这两类都是监督学习的模型,最常见的回归模型就是线性回归,也就是多元一次方程式;最常见的分类模型就是二叉树模型。

因子投资的基础模型是线性回归,我们将收集到的时间序列数据或者横截面数据代入线性回归模型中。

ExpectedReturn=Alpha+Beta1∗Factor1Value+Beta2∗Factor2Value+…Betan∗FactornValue+errorterm

当因子太多,也就是线性回归模型中的自变量太多时,自变量之间可能存在相关关系,互相影响从而降低模型的准确度。这时,我们可以用脊回归模型或者LASSO来进行自变量的权重调整或挑选。这些模型都可以用Python相应的Package完成。

线性回归模型简单且强大。但实际上,市场中很多因素对股价的影响并不是线性的,我们如何能找到非线性的模型呢?答案就是决策树。随着技术的发展,更聪明的模型被引入到量化投资中,除了简单的回归,我们还可以将模型设计成决策树或者神经网络。决策树算法采用树形结构,使用层层推理来实现最终的分类。决策树又叫二叉树,是因为每个推理节点,都会分成“是”和“否”两个分支。比如,银行决定是否向个人发放贷款,简单的决策树模型如下图。

简单的决策树模型虽然没有线性的强制假设,但也不能代表股票市场真实发生的情况,,我们可以将模型变为Random Forest(Bagging)或者Boosting。

但有的时候,市场不是只有“是”和“否”两个答案。如果再引入更加聪明的模型,我们可以用神经网络模型(nerual network)。神经网络是模拟人类大脑处理信息方式的简化模型,它通过模拟大脑的多层感知,对输入信息的反馈过程决进行隐藏层,每个信息对最终预测结果的影响都是多元化的。

这些模型的搭建工具是Python,各个模型对应的Package都可以在网上搜索到。

四、检测回测业绩和调整模型

当我们训练出一个模型后,需要用真实的历史数据检测该模型在历史上是否有效。回测结果非常重要,如果回测结果不好,那这个模型基本要被推翻重建;如果回测结果好,我们也不能掉以轻心,因为回测的结果好,不代表现在用着也好。有很多模型放到真实世界里就失效了。要搭建一个有效的量化投资模型,需要我们不停的检测、调整。

检测模型是否有效,还需要分析一些统计学指标,比如R Square,T-Statistic。我们还可以用一些统计学方法来检测每个自变量(我们向模型输入的能影响股票价格的指标)的重要性,从而决定是否要放弃某些指标,或者寻找其他类似指标。如果是回归模型,可以使用Stepwise Selection,如果是决策树模型,可以使用Feature Selection方法。

工欲善其事,必先利其器。Python等编程语言是量化投资的工具,如果不会使用工具,再好的策略也只是纸上谈兵,落不到实处。因此,掌握Python是量化投资的基础,下面的课程会系统的帮助我们了解Python在量化投资中的应用,最重要的是,它免费,感兴趣的朋友赶紧薅羊毛薅起来吧!

结语

当然,好的模型不仅在于“型”,更在于输入的数据是什么。如果我们对股票市场缺乏了解,不知道什么因素能影响股票的价格,那么再好的模型也无法预测未来的股票收益,因为你让模型吃进去的全是噪音数据,模型无法提取到信息,正所谓“Garbage In,Garbage Out”。金融知识在这里就展示出了它的重要性。量化投资的重点仍然在“投资”,量化只是实现投资的方式,领域知识非常重要。毕竟,我们的目标是成为会写程序的投资者,而不是只会写程序的门外汉。

如果你对Python感兴趣的话,可以试试我整理的这份Python全套学习资料,微信扫描下方二维码免费领取

包括:Python永久使用安装包、Python web开发,Python,Python数据分析,人工智能、机器学习等学习教程。带你从零基础系统性的学好Python!
在这里插入图片描述

零基础Python学习资源介绍

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python学习软件

工欲善其事,必先利其器。学习Python常用的开发软件都在这里了!
在这里插入图片描述

三、Python入门学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~在这里插入图片描述

四、Python练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述

五、Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。这份资料也包含在内的哈~在这里插入图片描述

六、Python面试资料

我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

七、资料领取

上述完整版Python全套学习资料已经上传CSDN官方,需要的小伙伴可自行微信扫描下方CSDN官方认证二维码输入“领取资料”免费领取!!
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1233390.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

从入门到精通,mac电脑录屏软件使用教程!

“mac电脑怎么录屏呀,刚买了一台mac电脑,用了几个月感觉挺流畅的,最近因为工作原因,需要用到录屏功能,但是我不会操作,想问问大家有没有简单易懂的录屏教程,谢谢啦。” 在日常生活中&#xff0…

使用遗传算法优化的BP神经网络实现自变量降维

大家好,我是带我去滑雪! 在现实生活中,实际问题很难用线性模型进行描述。神经网络的出现大大降低了模型建立的难度和工作量。只需要将神经网络当作一个黑箱子,根据输入和输出数据,神经网络依据相关的学习规则&#xff…

腾讯云轻量应用服务器三年租用价格表_免去续费困扰

腾讯云服务器续费贵所以一次性买3年或5年,腾讯云轻量应用服务器3年价格有优惠,CVM云服务器5年有特价,腾讯云3年轻量和5年云服务器CVM优惠活动入口,3年轻量应用服务器配置可选2核2G4M和2核4G5M带宽,5年CVM云服务器可以选…

米诺地尔行业分析:预计2029年将达到14亿美元

米诺地尔市场规模庞大,不仅包括消费品市场和服务行业,还涵盖了创新科技领域。随着经济的发展和市场需求的不断增长,米诺地尔市场的规模将继续扩大,各行各业都将面临更多机遇和挑战。 随着社会经济发展和城市化进程的推进&#xff…

无服务器开发实例|微服务向无服务器架构演进的探索

在当今的技术环境中,许多组织已经从构建单一的应用程序转变为采用微服务架构。微服务架构是将服务分解成多个较小的应用程序,这些应用程序可以独立开发、设计和运行。这些被拆分的小的应用程序相互协作和通信,为用户提供全面的服务。在设计和…

Ant Design Vue 树形表格计算盈收金额

树形表格计算 一、盈收金额计算1、根据需要输入的子级位置,修改数据2、获取兄弟节点数据,并计算兄弟节点的金额合计3、金额合计,遍历给所有的父级 一、盈收金额计算 1、根据需要输入的子级位置,修改数据 2、获取兄弟节点数据&am…

全面解析IEC 60364三种接地系统的概念、特点及应用

根据IEC 60364规定的各种保护方式、术语概念,低压配电系统按接地方式的不同分为三类,即 TT 、 TN 和 IT 系统。 1.TT系统TT grounding system TT供电系统:是指将电气设备的金属外壳直接接地的保护系统,称为保护接地系统&#xff…

运动装备经营小程序商城效果如何

运动装备可包含服装、帐篷、渔具、箱包鞋帽等,对喜欢外出的人来说,靠谱的装备是关键,往往更容易选择品牌和信得过的商家。 而对商家来说,如何打造品牌提升卖货经营效率和提升营收是重中之重;互联网时代需要商家拓展线…

sklearn模型中预测值的R2_score为负数

目录 正文评论区参考链接 正文 Sklearn.metrics下面的r2_score函数用于计算R(确定系数:coefficient of determination)。它用来度量未来的样本是否可能通过模型被很好地预测。 分值为 1 表示最好,但我们在使用过程中&#xff0c…

大结局!OpenAI创始人奥特曼和 Greg Brockman 将加入微软!!!

持续48小时的OpenAI政变大戏终于迎来了大结局! 微软堪称最大赢家💥💥💥 微软CEO刚刚宣布: 我们仍然致力于与 OpenAI 的合作伙伴关系,并对我们的产品路线图、我们在 Microsoft Ignite 上宣布的一切继续创…

单片机和FreeRTOS上跑机器人ROS的应用

机器人的应用越来越广泛了,大家熟知的稚晖君直接创业搞机器人,可想而至,接下来的十年,机器人绝对是热门的行业。 目前市面上很多机器人都是基于一套叫做ROS的系统开发的,今天就给大家分享一个跑在MCU上,基…

Notpad-- ubuntu下载安装

Notpad-- ubuntu下载安装 下载 Gitee链接: https://gitee.com/cxasm/notepad– 安装 sudo apt install *.deb运行 /opt/apps/com.hmja.notepad/files/Notepad--出错 需要安装qt5 sudo apt-get install qt5-default

数据结构~~~~ [队列] ~~~~

文章目录 队列队列的概念与结构队列的接口实现***队列的初始化******队列的销毁******队列的插入与创建节点******队列的删除******队列的队头数据******队列的队尾数据******队列的判空*** 队列 队列的概念与结构 队列的插入数据在队尾出数据在队头(尾入头出&…

51单片机/STM32F103/STM32F407学习1_点亮LED灯

目录: 基础知识单片机从0实现单片机GPIO介绍 参考连接: 野火霸天虎教程 https://doc.embedfire.com/products/link/zh/latest/mcu/stm32/ebf_stm32f407_batianhu_v1_v2/download/stm32f407_batianhu_v1_v2.html x.1 基础知识 x.1.1 指针中的取地址&a…

房间够亮还有必要台灯吗?考研必备护眼台灯推荐

我认为不管台灯是否够亮还是需要使用台灯的! 一般房间的吸顶灯距离桌面都有很长的一段距离,虽说我们正常观察时是觉得亮度很足了,不过实际上照射到桌面的光线是所剩无几的,远远达不到我们学习、办公时所需要的亮度。而且单开一盏室…

多协议数据库管理软件 Navicat Premium 16 mac中文版功能

Navicat Premium 16 mac是一款跨平台数据库管理工具,支持多种数据库类型,如MySQL、MariaDB、Oracle、SQLite、PostgreSQL等等。它提供了丰富的数据库管理功能和工具,可以帮助开发人员和数据库管理员快速地创建、管理和维护数据库。 Navicat P…

效率提升利器:Automa插件的实用指南

Automa是一个chrome扩展,通过拖拽0代码实现工作流,模拟网页的各种点击、表单填写等操作,使用时点击插件脚本一键执行,或者设置定时执行,从而简化我们的工作。 功能介绍 官方文档地址:Getting started | Au…

长期使用老旧、劣质、不合格电源线的危害有多大?

电源线作为电力、信息传输的重要工具,如今已经成为人类生活生产必不可少的产品之一,电气装备、电器照明、通信、家装、工业生产等多个行业,电源线都发挥着重要的载体作用。由于市场上电源线产品品类繁多,价格、品质参差不齐&#…

深度态势感知的含义

深度态势感知的含义 当年德国对苏联发动的侵略战争,本来是两个大国内讧的结果。这次入侵完全是希特勒和最高统帅部几个人就决定了的。他们是怎样对待关于苏联的情报呢?英国人写的《苏德战争》中有这样描述:"很多真实的情报对元首来说则毫…

六要素超声波微气象仪一款气象监测设备

WX-WQX6 随着科技的发展,人们对天气的预测和掌控能力越来越强。在这个领域,六要素超声波微气象仪以其精准、实时的气象监测能力,赢得了众多关注。这款仪器不仅可以实时监测温度、湿度、风速、风向、气压和雨量六个气象要素,还可以…