R语言数据分析案例-股票可视化分析

news2024/10/6 22:27:00

一、数据整合的对象

# Loading necessary libraries
library(readxl)
library(dplyr)

# Reading the data from Excel files
data_1 <- read_excel("云南白药.xlsx")
data_2 <- read_excel("冰山.xlsx")

二、数据整合的代码

# Reading the data from Excel files
data_1 <- read_excel("云南白药.xlsx")
data_2 <- read_excel("冰山.xlsx")

# Assuming both data sets have the same structure
# Combine the two datasets vertically
combined_data <- bind_rows(data_1, data_2)

由于数据特征名称不同,要处理:

# View the combined data
head(combined_data)


# 检查原始数据集中是否有NA值
sum(is.na(data_1))
sum(is.na(data_2))

# 检查列名以确保它们在两个数据集中是一致的
colnames(data_1)
colnames(data_2)

# 调整data_2的列名以匹配data_1
colnames(data_2) <- colnames(data_1)

# 重新合并数据
combined_data <- bind_rows(data_1, data_2)

# 再次检查列名
colnames(combined_data)

任务二:统计分析

一、统计分析的代码

# 重新进行描述性统计分析
print("描述性统计分析 - 云南白药")
summary(combined_data[combined_data$"证券简称" == "云南白药", ])

print("描述性统计分析 - 冰山冷热")
summary(combined_data[combined_data$"证券简称" == "冰山冷热", ])

二、代码运行的结果及统计结论的分析

日期:数据涵盖的时间范围是从2023-02-07到2023-07-07。

证券代码:证券代码始终为538,这表明分析的数据集仅针对一支股票。

前收、开盘、最高、最低、今收:

这些股价相关的变量都有类似的统计范围,价格从50元左右到近60元。

中位数和均值非常接近,这表明数据的分布相对对称,没有严重的偏斜。

最高价和最低价的范围表明该股票在观察期间的波动范围。

涨跌幅(%):

涨跌幅变化范围从-5.28%到7.52%,这显示了股票在观察期间的波动性。

中位数接近0(0.04%),意味着相对于前一交易日的收盘价,该股票的收盘价在中位数日期是几乎没有变化的。

均值接近0,这暗示在所考察的时间段内,股票价格的上涨和下跌大致抵消。

成交量(万股):

成交量的最小值为203.1万股,最大值为2963.8万股,显示出交易量的显著波动。

交易量的中位数572.3万股和均值637.3万股相比较高的最大值,表明有一些交易日的成交量非常高。

成交金额(万元):

成交金额的范围从10547万元到169013万元,与成交量的波动类似,表明有些交易日成交金额非常大。

市盈率:市盈率从30.32到37.03变动,这反映了该股票价格相对于每股收益的比率在观察期内的变化。

日期:数据覆盖的时间范围与之前的“云南白药”相同,从2023-02-07到2023-07-07。

证券代码:证券代码始终为530,这表明分析的数据集仅针对一支股票。

前收、开盘、最高、最低、今收:股价变量的范围大致在4.35元到5.78元之间,这与“云南白药”的股价范围相比较低,显示了它是一个较低价位的股票。

中位数和均值非常接近,表明数据分布相对均衡,没有显著偏斜。

股价的最大值和最小值之间的差异不大,这可能表明股票在该时间段内的价格波动较小。

涨跌幅(%):涨跌幅的范围从-3.36%到4.78%,与“云南白药”相比,这个股票的价格波动性稍低。中位数为0%,均值为0.1147%,这表明在所考察的时间段内,股票价格的上涨和下跌大致平衡。

成交量:成交量从482.4万股到9138.9万股不等,显示了交易量的显著波动。成交量的中位数和均值较低,可能表明在某些交易日,股票的交易活跃度不高。

成交金额:成交金额的范围从995.2万元到50741.5万元,与成交量的波动相似,表明有些交易日的活跃度特别高。

市盈率:市盈率从0到261.6变动,这是一个非常宽的范围,可能反映了投资者对于公司盈利能力预期的显著变化,或者是由于特定时期盈利数据的变化导致的市盈率计算出现极端值。

任务三:数据可视化

一、时间序列图

(1)作时间序列图的代码

# 加载所需的库
# 设置图形布局为1行2列
par(mfrow = c(2, 1))
# 云南白药的时间序列图
plot(data_1$'日期', data_1$'今收', type = "l", col = "blue", xlab = "日期", ylab = "今收价格", main = "云南白药的时间序列图")
# 冰山冷热的时间序列图
plot(data_2$'日期', data_2$'今收', type = "l", col = "red", xlab = "日期", ylab = "今收价格", main = "冰山的时间序列图")

(2)生成的时间序列图

(3)基于时间序列图进行的分析

云南白药的时间序列图分析:

价格波动:云南白药的股票价格在2月到4月期间相对稳定,在此之后价格出现了下降趋势。5月份之后,股价波动加大,显示出更多的上下波动。

下降趋势:从图中可以看出,尽管有波动,但整体趋势是向下的,特别是在5月到7月期间,股价有明显的下降。

冰山冷热的时间序列图分析:

价格波动:与云南白药相比,冰山冷热的股价波动较小,整体趋势是上升的。

上升趋势:2月到7月期间,冰山冷热的股价显示出一种持续上升的趋势,特别是在4月到7月期间,股价持续攀升。

对比分析:

股价水平:云南白药的股价明显高于冰山冷热,这可能反映了两家公司市值和投资者对其业绩预期的不同。股价趋势:在给定期间内,云南白药和冰山冷热的股价趋势完全不同,云南白药呈现下跌趋势,而冰山冷热则呈现上升趋势。投资者情绪:云南白药的下降趋势可能反映了投资者对该公司前景的悲观情绪,而冰山冷热的上升趋势可能表明投资者对该公司的乐

观看法。

二、直方图

(1)作直方图的代码

# 设置图形布局为1行2列
par(mfrow = c(1, 2))
# 云南白药的直方图
hist(data_1$'今收', col = "blue", xlab = "今收价格", ylab = "频率", main = "云南白药的直方图", breaks = 30)
# 冰山冷热的直方图
hist(data_2$'今收', col = "red", xlab = "今收价格", ylab = "频率", main = "冰山的直方图", breaks = 30)

(2)生成的直方图

(3)基于直方图进行的分析

云南白药直方图分析:

价格分布集中在54到56元之间,这表明大部分交易日的收盘价落在这个区间。

价格分布较为紧凑,显示出相对较小的波动范围。

存在一个明显的峰值区间,表明某一价格区间的频率特别高。

冰山冷热直方图分析:

价格分布集中在4.9到5.1元之间,这表明大部分交易日的收盘价落在这个较狭窄的区间。

相比于云南白药,冰山冷热的价格分布看起来更为分散,这可能意味着其价格波动性较大。

直方图显示了几个较高的峰值,这可能表明某些价格区间的频率特别高,而其他区间较低,显示出价格分布的不均匀性。

对比分析:

两支股票的价格分布范围不同,云南白药的价格区间更高,这与公司的市值和股票的定价有关。云南白药的价格分布相对集中,显示出价格较为稳定;而冰山冷热的价格分布则更为分散,显示出价格波动性较大。

三、饼图

(1)作饼图的代码

par(mfrow = c(1, 2))
# 为深圳华强的“今收”价格创建分类
breaks_huaqiang <- seq(min(data_huaqiang$'今收'), max(data_huaqiang$'今收'), length.out = 5)  
data_huaqiang$price_category <- cut(data_huaqiang$'今收', breaks_huaqiang, include.lowest = TRUE)
# 计算每个分类的频率
price_counts_huaqiang <- table(data_huaqiang$price_category)
# 绘制饼图
pie(price_counts_huaqiang, col = rainbow(length(price_counts_huaqiang)), main = "深圳华强价格区间的饼图")
# 添加图例
legend("topright", legend = names(price_counts_huaqiang), fill = rainbow(length(price_counts_huaqiang)))

# 为平安银行的“今收”价格创建分类
breaks_pingan <- seq(min(data_pingan$'今收'), max(data_pingan$'今收'), length.out = 5)  
data_pingan$price_category <- cut(data_pingan$'今收', breaks_pingan, include.lowest = TRUE)
# 计算每个分类的频率
price_counts_pingan <- table(data_pingan$price_category)
# 绘制饼图
pie(price_counts_pingan, col = rainbow(length(price_counts_pingan)), main = "平安银行价格区间的饼图")
# 添加图例
legend("topright", legend = names(price_counts_pingan), fill = rainbow(length(price_counts_pingan)))

(3)基于饼图进行的分析

从云南白药的饼图可以观察到:

价格区间分为四个部分,每个部分代表一个特定的价格范围。最大的部分是价格区间(5.07, 5.36],这意味着大多数的“今收”价格落在这个区间。其他三个区间的占比较小,这表明“今收”价格较少地落在这些范围内。

从冰山冷热的饼图可以观察到:

价格区间同样分为四个部分,每部分对应不同的价格范围。最大的部分似乎是价格区间(4.77, 5.07],表明这个价格区间的频率最高。其他区间的分布较为均匀,但(4.48, 4.77]区间占据了较大的一部分,表明该价格区间内的“今收”价格出现的次数也相对较多。

对比分析:

对于云南白药,高频价格区间集中在(5.07, 5.36],而对于冰山冷热,高频价格区间则集中在(4.77, 5.07]。这两张饼图显示,尽管两家公司的股票价格绝对值不同,但它们都有一个主要的价格区间,其中股票价格出现的频率最高。另外,这些饼图也体现了两个股票价格分布的不同特性,云南白药的价格分布集中在一个较高的区间,而冰山冷热的价格则在一个较低的区间较为分散。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1668975.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker:docker在项目中常用的一些命令

简介   Docker 是一个开源的容器化平台&#xff0c;它允许开发者将应用程序及其依赖项打包到一个可移植的容器中&#xff0c;并发布到任何安装了 Docker 引擎的机器上。这些容器是轻量级的&#xff0c;包含了应用程序运行所需的所有东西&#xff0c;如代码、系统库、系统工具…

“数字化叙事的革命:人工智能驱动的创意工具的崛起”

近年来&#xff0c;人工智能 (AI) 改变了我们生活的许多方面&#xff0c;数字故事讲述的世界也不例外。随着人工智能驱动的创意工具的出现&#xff0c;广告商、内容创作者和专业人士现在配备了创新的解决方案来简化他们的工作流程&#xff0c;增强他们的创意输出&#xff0c;并…

08.4.grafana自定义图形并直接数据库取值

grafana自定义图形并直接数据库取值 自定义添加油表图形 选择gauge图形&#xff0c;并且配置对应设定值&#xff0c;点击应用 如图所示&#xff0c;可以看到仪表盘上的值是zabbix上取得值 配置grafana直接数据库取值 添加mysql数据源 添加后进行配置&#xff0c;我这…

二分判定+选插冒排序+归并快速堆希尔+计数排序

二分力扣题 一&#xff1a;搜索二维矩阵 74. 搜索二维矩阵 按照题意&#xff1a;直接利用二维数组转换成一维数组进行求解 方法一&#xff1a;普通等于的二分查找 class Solution { public:bool searchMatrix(vector<vector<int>>& matrix, int target) {t…

websevere服务器从零搭建到上线(三)|IO多路复用小总结和服务器的基础框架

文章目录 epollselect和poll的优缺点epoll的原理以及优势epoll 好的网络服务器设计Reactor模型图解Reactor muduo库的Multiple Reactors模型 epoll select和poll的优缺点 1、单个进程能够监视的文件描述符的数量存在最大限制&#xff0c;通常是1024&#xff0c;当然可以更改数…

STM32快速入门(定时器之输入捕获)

STM32快速入门&#xff08;定时器之输入捕获&#xff09; 前言 本节主要讲解STM32利用通用定时器&#xff0c;在输入引脚出现指定电平跳变时&#xff0c;将CNT的值锁存到CCR寄存器当中&#xff0c;从而计算PWM波形的频率、占空比、脉冲间隔、电平持续时间等。其功能的应用有&…

免费思维13招之七:空间型思维

免费思维13招之七:空间型思维 本篇给你带来的是空间型思维。 空间型思维,具体分为内部空间型思维和外部空间型思维。 什么叫内部空间型思维呢? 内部空间型就是充分利用现有空间或资源为社会提供免费服务,积累人气,增加流量,从而带动消费。 为什么你生意不好?为什么你…

ubuntu中的docker记录(5)——如何使用阿里云的镜像加速配置docker镜像加速器

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、镜像加速器介绍1. 什么是docker镜像加速器&#xff1f;2. 为什么要配置镜像加速器&#xff1f; 二、配置镜像加速器1. 注册阿里云账号2. 注册镜像容器服务3…

C++ int 学习

在C语言中 & 是取地址符号&#xff1b; 在C中有 int& 这样的&#xff0c;这里的&不是取地址符号&#xff0c;而是引用符号&#xff1b; 引用是C对C的一个补充&#xff1b; 变量的引用就是变量的别名&#xff0c;讲的通俗一点就是另外一个名字&#xff1b; a的值…

代码随想录算法训练营第二十七天| LeetCode39. 组合总和、LeetCode40.组合总和II、LeetCode131.分割回文串

#LeetCode 39. Combination Sum #LeetCode 39. 视频讲解&#xff1a;带你学透回溯算法-组合总和&#xff08;对应「leetcode」力扣题目&#xff1a;39.组合总和&#xff09;| 回溯法精讲&#xff01;_哔哩哔哩_bilibili 当建立树的结构的时候&#xff0c;target 可以限制树的深…

Spring Boot 调用外部接口的几种方式

Spring Boot 调用外部接口的几种方式 在微服务架构中&#xff0c;服务间的调用是不可或缺的环节。Spring Boot 为开发者提供了多种方式来实现这一任务&#xff0c;这个文章将为你详细介绍这些方式。 一、使用RestTemplate RestTemplate是 Spring Boot 早期版本中常用的 REST 客…

基于 Spring Boot 博客系统开发(八)

基于 Spring Boot 博客系统开发&#xff08;八&#xff09; 本系统是简易的个人博客系统开发&#xff0c;为了更加熟练地掌握 SprIng Boot 框架及相关技术的使用。&#x1f33f;&#x1f33f;&#x1f33f; 基于 Spring Boot 博客系统开发&#xff08;七&#xff09;&#x1f…

HCIP-Datacom-ARST自选题库_06_排障【28道题】

一、单选题 1.如果面对复杂的网络故障&#xff0c;并经过评估认为短时间内无法完成排障&#xff0c;而此时用户又急需恢复网络的可用性&#xff0c;那么正确的做法是? 告诉用户这是不可能实现的 不通知客户的情况下&#xff0c;直接搭建替代的网络环境 始终尝试排除故障&a…

【Spring】验证 @ServerEndpoint 的类成员变量线程安全

文章目录 前言猜想来源验证方法Controller 的情况ServerEndpoint 的情况 后记 前言 最近有 websocket 的需求。探索 ServerEndpoint 的类成员变量特点。 这里类比 Controller 讨论 ServerEndpoint 类成员变量是否线程安全。 猜想来源 网上的教程大多数都这么展示程序&#…

5.10.6 用于乳腺癌超声图像分类的Vision Transformer

医学超声&#xff08;US&#xff09;成像由于其易用性、低成本和安全性已成为乳腺癌成像的主要方式。卷积神经网络&#xff08;CNN&#xff09;有限的局部感受野限制了他们学习全局上下文信息的能力。利用 ViT 对使用不同增强策略的乳房 US 图像进行分类。 卷积神经网络&#…

LeetCode题练习与总结:二叉树的中序遍历--94

一、题目描述 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 示例 1&#xff1a; 输入&#xff1a;root [1,null,2,3] 输出&#xff1a;[1,3,2]示例 2&#xff1a; 输入&#xff1a;root [] 输出&#xff1a;[]示例 3&#xff1a; 输入&#xff1a;roo…

C++八股(面试题、手撕题)自用版

目录 面试题&#xff1a; 1. define inline 在编译的哪个阶段 2. const static 3. 子函数返回结构体有什么问题&#xff0c;返回对象调用了哪些函数 4. volatile关键字 5. 编译器基本原理 6. 预处理、编译、汇编、链接以及他们在操作系统上如何运作的 7. 数组和指针&a…

【HCIP学习】BGP对等体组、聚合、路由反射器、联盟、团体属性

一、大规模BGP网络所遇到的问题 BGP对等体众多&#xff0c;配置繁琐&#xff0c;维护管理难度大 BGP路由表庞大&#xff0c;对设备性能提出挑战 IBGP全连接&#xff0c;应用和管理BGP难度增加&#xff0c;邻居数量过多 路由变化频繁&#xff0c;导致路由更新频繁 二、解决大…

【python量化交易】qteasy使用教程07——创建更加复杂的自定义交易策略

创建更加复杂的自定义交易策略 使用交易策略类&#xff0c;创建更复杂的自定义策略开始前的准备工作本节的目标继承Strategy类&#xff0c;创建一个复杂的多因子选股策略策略和回测参数配置&#xff0c;并开始回测 本节回顾 使用交易策略类&#xff0c;创建更复杂的自定义策略 …

mapreduce | 自定义Partition分区(案例2)

1.需求 统计每个手机号消费总金额&#xff0c;按照消费金额降序排序&#xff0c;最终联通、电信、移动分别写入不同的文件。 130、131、132&#xff08;联通&#xff09; 133&#xff08;电信&#xff09; 135、136、137、138、139 &#xff08;移动&#xff09; 手机号,消费记…