csv可视化
- 一、实验内容
- 二、实验总结
一、实验内容
1、datal.csv中的B、C、D和E列数据分别是日期、权重、A企业的销售额、B企业的销售额。读取C、D、E列数据,并统计E列数据的算术平均数、加权平均值(权值为C列数据)、方差、中位数、最小值、最大值。并绘制E列数据的直方图。
(1)源代码:
(2)运行结果截图 :
2、读取datal.csv文件中的A企业销售额与B企业销售额数据,并计算这些企业数据的协方差矩阵和相关系数矩阵。
(1)源代码:
(2)运行结果:
3、读取datal.csv文件中A、B、C、D、E,绘制由A列和D列数据关联,以及由A列和E列数据(请将该列值除以120后绘图)关联的两条折线图,并分别赋以不同的颜色和线型,添加图例。
(1)源代码:
(2)运行结果截图 :
4、针对datal.csv中A企业的销售额,使用简单移动平均方法估计各月的销售额。移动平均间隔为3,即用1、2、3三周的数据预测第4周的数据。
(1)源代码:
(2)运行结果截图 :
5、使用指数移动平均方法估计上题的A企业的销售额。移动平均间隔为3。并请添加图、坐标轴标题和图例。
(1)源代码:
(2)运行结果截图 :
二、实验总结
-
我们要的不是数据,而是数据告诉我们的事实。大多数人面临这样一个挑战:我们认识到数据可视化的必要性,但缺乏数据可视化方面的专业技能。部分原因可以归结于,数据可视化只是数据分析过程中的一个环节,数据分析师可能将精力花在获取数据、清洗整理数据、分析数据、建立模型,但在最终的展示沟通上力不从心。
-
可视化工具包括但不限于,Tableau,Excel,PowerBI,Python,R
可视化之前:探索性分析与解释性分析
二者之间有很重要的区别:探索性分析指理解数据并找出值得分析或分享给他人的精华。这就好比,在牡蛎中寻找珍珠,可能打开一百个牡蛎(尝试很多种方法)才最终找到两颗珍珠。而解释性分析,我们迫切希望能够言之有物,讲好某个故事–专注于两颗珍珠。 -
可视化过程:一个完整的数据可视化过程,主要包括以下4个步骤:
确定数据可视化的主题、提炼可视化主题的数据、根据数据关系确定图表、进行可视化布局及设计
可视化元素由3部分组成: 可视化空间+标记+视觉通道
可视化空间: 数据可视化的显示空间,通常是二维。三维物体的可视化,通过图形绘制技术,解决了在二维平面显示的问题,如3D环形图、3D地图等。 -
标记: 标记,是数据属性到可视化几何图形元素的映射,用来代表数据属性的归类。根据空间自由度的差别,标记可以分为点、线、面、体,分别具有零自由度、一维、二维、三维自由度。如我们常见的散点图、折线图、矩形树图、三维柱状图,分别采用了点、线、面、体这四种不同类型的标记。
-
视觉通道: 数据属性的值到标记的视觉呈现参数的映射,叫做视觉通道,通常用于展示数据属性的定量信息。常用的视觉通道包括:标记的位置、大小(长度、面积、体积。。。)、形状(三角形、圆、立方体。。。)、方向、颜色
确定图表: 数据之间的相互关系,决定了可采用的图表类型。