3.2 分析特征间的关系

news2024/11/30 12:33:56

3.2 分析特征间的关系

  • 3.2.1 绘制散点图 scatter()
    • 例子1:绘制2000-2017年各季度国民生产总值散点图
    • 例子2:使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值散点图
  • 3.2.2 绘制折线图 plot()
    • 例子1:绘制2000-2017年各季度国民生产总值折线图
    • 例子2:使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值折线图
  • 3.2.3 任务实现
    • 1、绘制2000-2017年各产业与各行业的国民生产总值散点图
    • 2、绘制2000-2017年各产业与各行业的国民生产总值折线图

3.2.1 绘制散点图 scatter()

    散点图(scatter diagram)又称为散点分布图,是以一个特征为横坐标,另一个特征为纵坐标,利用坐标点(散点)的分布形态反映特征间的统计关系的一种图形。
        值是由点在图表中的位置表示,类别是由图表中的不同标记表示,通常用于比较跨类别的数据。
        散点图可以提供两类关键信息。
        (1)特征之间是否存在数值或者数量的关联趋势,关联趋势是线性的还是非线性的。
        (2)如果某一个点或者某几个点偏离大多数点,那这些点就是离群值。通过散点图可以一目了然,从而可以进一步分析这些离群值是否在建模分析中产生很大的影响。
        散点图通过散点的疏密程度和变化趋势表示两个特征的数量关系。如果有3个特征,若其中一个特征为类别型,散点图改变不同特征的点的形状或者颜色,即可了解两个数值型特征和这个类别型之间的关系。
        pyplot中绘制散点图的函数为scatter,其使用语法如下:
scatter函数

matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, alpha=None, **kwargs)

常用参数及说明如下表所示:
在这里插入图片描述

例子1:绘制2000-2017年各季度国民生产总值散点图

# 1、绘制2000-2017年各季度国民生产总值散点图
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False
data = np.load('F:/书籍/Python数据分析与应用/37304_Python数据分析与应用_源代码和实验数据/
第3章/data/国民经济核算季度数据.npz',allow_pickle=True)
name = data['columns']  # 提取其中的columns,作为数据的标签
print("name:\n",name)
values = data['values']   # 提取其中的values数组,视为数据的存在位置
print("values:\n", values)
plt.figure(figsize = (8,7))  # 设置画布
plt.scatter(values[:,0],values[:,2],marker='o')  # 绘制散点图
plt.xlabel('年份')
plt.ylabel('生产总值(亿元)')
plt.ylim((0,225000))  # 设置y轴范围
# 添加x轴刻度 --->1.添加刻度2.添加刻度的值,3.将值旋转45度
plt.xticks(range(0,70,4), values[range(0,70,4), 1], rotation=45)
plt.title('2000-2017各季度国民生产总值散点图')
plt.savefig('F:/书籍/Python数据分析与应用/自己实现/3.22000-2017各季度国民生产总值散点图.png')
plt.show()

在这里插入图片描述
在这里插入图片描述

例子2:使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值散点图

# 2、使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值散点图
plt.figure(figsize=(8,7))  #设置画布
# 绘制散点图1
plt.scatter(values[:,0], values[:,3], marker='o',c='red')
# 绘制散点图2
plt.scatter(values[:,0], values[:,4], marker='D',c='blue')
# 绘制散点图3
plt.scatter(values[:,0], values[:,5], marker='v',c='yellow')
plt.xlabel('年份')  # 添加横轴标签
plt.ylabel('生产总值(亿元)') # 添加纵轴标签
plt.xticks(range(0,70,4),values[range(0,70,4),1], rotation=45)
plt.title("2000-2017年各产业各季度国民生产总值散点图")
plt.legend(['第一产业','第二产业', '第三产业'])  # 添加图例
plt.savefig('F:/书籍/Python数据分析与应用/自己实现/2000-2017年各产业各季度国民生产总值散点图.png')  # 保存
plt.show()

在这里插入图片描述
       通过上图的颜色和形状的区别可以看出,第一产业增长平缓,第三产业呈现指数型增长,第二产业每年会根据季度呈现周期性波动。总体来看,各个产业都在持续增长中。

3.2.2 绘制折线图 plot()

       折线图(line chart)是一种将数据点按照顺序连接起来的图形。可以看作是将散点图,按照x轴坐标顺序连接起来的图形。 折线图的主要功能是查看因变量y随着自变量x改变的趋势,最适合用于显示随时间(根据常用比例设置)而变化的连续数据。同时还可以看出数量的差异,增长趋势的变化。
       pyplot中绘制折线图的函数为plot,其基本使用语法如下。

matplotlib.pyplot.plot(*args, **kwargs)

   plot函数在官方文档的语法中只要求填入不定长参数,实际可以填入的主要参数主要如下:
在这里插入图片描述
其中,color参数的8种常用颜色的缩写如下表:
在这里插入图片描述

例子1:绘制2000-2017年各季度国民生产总值折线图

# 1、绘制2000-2017年各季度国民生产总值折线图
plt.figure(figsize = (8,7))  # 设置画布
plt.plot(values[:,0],values[:,2],color='m',linestyle='--',marker='o')  # 绘制散点图
plt.xlabel('年份')
plt.ylabel('生产总值(亿元)')
plt.ylim((0,225000))  # 设置y轴范围
# 添加x轴刻度 --->1.添加刻度2.添加刻度的值,3.将值旋转45度
plt.xticks(range(0,70,4), values[range(0,70,4), 1], rotation=45)
plt.title('2000-2017各季度国民生产总值散点图')
plt.savefig('F:/书籍/Python数据分析与应用/自己实现/3.2.2000-2017各季度国民生产总值折线图.png')
plt.show()

在这里插入图片描述

   plot函数一次可以接收多组数据,添加多条折线图,同时分别定义每条折线图的颜色、点的形状和类型,还可以将这三个参数连接在一起,用一个字符串表示。

例子2:使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值折线图

# 2、使用不同颜色不同形状的点,绘制2000-2017年各产业各季度国民生产总值折线图
plt.figure(figsize=(8,7))  #设置画布
# # 绘制折线图1
# plt.plot(values[:,0], values[:,3], 'bs-')
# # 绘制折线图2
# plt.plot(values[:,0], values[:,4], 'ro-')
# # 绘制折线图3
# plt.plot(values[:,0], values[:,5], 'gH-')
# plot函数一次可以接收多组数据,添加多条折线图
plt.plot(values[:,0], values[:,3], 'bs-',
         values[:,0], values[:,4], 'ro-',
         values[:,0], values[:,5], 'gH-' )
plt.xlabel('年份')  # 添加横轴标签
plt.ylabel('生产总值(亿元)') # 添加纵轴标签
plt.xticks(range(0,70,4),values[range(0,70,4),1], rotation=45)
plt.title("2000-2017年各产业各季度国民生产总值散点图")
plt.legend(['第一产业','第二产业', '第三产业'])  # 添加图例
plt.savefig('F:/书籍/Python数据分析与应用/自己实现/2000-2017年各产业各季度国民生产总值折线图.png')  # 保存
plt.show()

在这里插入图片描述

3.2.3 任务实现

1、绘制2000-2017年各产业与各行业的国民生产总值散点图

  国民生产总值数据包括三大产业的国民生产总值,以及农业、工业、建筑、批发、交通、餐饮、金融、房地产和其他行业各个季度的增加值。通过散点图分析三大行业的国民生产总值可以发现我国产业结构。通过比较各行业间季度的增加值则可以发现国民经济的主要贡献行业。此处分别使用两个子图绘制三大产业和细分行业各个季度的生产总值。

# 绘制2000-2017年各产业与行业的国民生产总值散点图
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei'  # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False
data = np.load('F:/书籍/Python数据分析与应用/37304_Python数据分析与应用_源代码和实验数据/第3章/data/国民经济核算季度数据.npz',
               allow_pickle=True)
name = data['columns']  # 提取其中的columns,作为数据的标签
# print("name:\n",name)
values = data['values']   # 提取其中的values数组,视为数据的存在位置
# print("values:\n", values)
p = plt.figure(figsize=(12,12))  # 设置画布

# 子图1 三大产业
ax1 = p.add_subplot(2,1,1)
plt.scatter(values[:,0], values[:,3], marker='o',c='red')  # 绘制散点图
plt.scatter(values[:,0], values[:,4], marker='D',c='blue')
plt.scatter(values[:,0], values[:,5], marker='v',c='yellow')
plt.ylabel('生产总值(亿元)')
plt.title('2000-2017年各产业与行业的国民生产总值散点图')
plt.legend(['第一产业','第二产业', '第三产业'])  # 添加图例

# 子图2 各行业
ax2 = p.add_subplot(2,1,2)
plt.scatter(values[:,0], values[:,6], marker='o',c='r')  # 绘制散点图
plt.scatter(values[:,0], values[:,7], marker='D',c='b')
plt.scatter(values[:,0], values[:,8], marker='v',c='y')
plt.scatter(values[:,0], values[:,9], marker='8',c='g')  
plt.scatter(values[:,0], values[:,10], marker='p',c='c')
plt.scatter(values[:,0], values[:,11], marker='+',c='m')
plt.scatter(values[:,0], values[:,12], marker='s',c='k')  
plt.scatter(values[:,0], values[:,13], marker='*',c='purple')
plt.scatter(values[:,0], values[:,14], marker='d',c='brown')  
plt.legend(['农业','工业', '建筑业', '批发', '交通', '餐饮', '金融', '房地产', '其他'])  # 添加图例
plt.xlabel('年份')
plt.ylabel('生产总值(亿元)')
# 添加x轴刻度 --->1.添加刻度2.添加刻度的值,3.将值旋转45度
plt.xticks(range(0,70,4), values[range(0,70,4), 1], rotation=45)

plt.savefig('F:/书籍/Python数据分析与应用/自己实现/3、2000-2017年各产业与行业的国民生产总值散点图.png')
plt.show()

在这里插入图片描述
  可以看出,我国现阶段国民经济增长的主要动力是第三产业,其次是第二产业。从行业来看,工业、其他行业和农业对整体国民经济贡献度最大。

2、绘制2000-2017年各产业与各行业的国民生产总值折线图

  通过绘制2000~2017年各产业与行业的国民生产总值折线图,分别能够发现我国经济各产业与各行业增长趋势。
绘制2000~2017年各产业与行业的国民生产总值折线图

# 2、绘制2000-2017年各产业与行业的国民生产总值折线图
p = plt.figure(figsize=(12,12))  # 设置画布

# 子图1 三大产业
ax1 = p.add_subplot(2,1,1)
plt.plot(values[:,0],values[:,3], 'r-',
         values[:,0], values[:,4], 'b-.',
         values[:,0], values[:,5], 'y--')
plt.ylabel('生产总值(亿元)')
plt.title('2000-2017年各产业与行业的国民生产总值散点图')
plt.legend(['第一产业','第二产业', '第三产业'])  # 添加图例

# 子图2 各行业
ax2 = p.add_subplot(2,1,2)
plt.plot(values[:,0], values[:,6], 'r-',
            values[:,0], values[:,7], 'b-.',
            values[:,0], values[:,8], 'y--',
            values[:,0], values[:,9], 'g:',
            values[:,0], values[:,10], 'c-',
            values[:,0], values[:,11], 'm-.',
            values[:,0], values[:,12], 'k--',
            values[:,0], values[:,13], 'r:',
            values[:,0], values[:,14], 'b-')
plt.legend(['农业','工业', '建筑业', '批发', '交通', '餐饮', '金融', '房地产', '其他'])  # 添加图例

plt.xlabel('年份')
plt.ylabel('生产总值(亿元)')
# 添加x轴刻度 --->1.添加刻度2.添加刻度的值,3.将值旋转45度
plt.xticks(range(0,70,4), values[range(0,70,4), 1], rotation=45)

plt.savefig('F:/书籍/Python数据分析与应用/自己实现/3、2000-2017年各产业与行业的国民生产总值散点图.png')
plt.show()

在这里插入图片描述
  可以看出, 我国整体经济呈现增长趋势,其中第一产业增长相对较慢但是周期性最明显,农业的周期性和第一产业的周期性基本吻合。工业和第二产业的增长趋势基本一致。同时, 除了餐饮行业外,其他行业均呈现较为明显的增长趋势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/619716.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

接口自动化测试框架开发(pytest+allure+aiohttp+ 用例自动生成)

近期准备优先做接口测试的覆盖,为此需要开发一个测试框架,经过思考,这次依然想做点儿不一样的东西。 接口测试是比较讲究效率的,测试人员会希望很快能得到结果反馈,然而接口的数量一般都很多,而且会越来越…

Matlab论文插图绘制模板第100期—紧凑排列多子图(Tiledlayout)

不知不觉,《Matlab论文插图绘制模板》系列来到了第100期。 在此之前,其实我也没想到会有这么多种数据可视化表达方式,论文里不是折线图就是柱状图,单调的很。 假如研究生那会要是能遇到现在的自己(分享的内容&#x…

因果一致性

上一篇写到了一致性模型,而因果一致性模型比较复杂,故单独写一篇文章来记录 强一致性模型会在网络分区时变的不可用,而最终一致性模型放弃了safety,但同时也对系统可用性和性能产生明显的损害。上层要做些操作。于是有了一个折中…

高考作文AI大比拼「GPT-4 vs 文心一言 vs 通义千问」

2023 年 6 月 7 日上午,全国高考语文科目已经考试结束,第一时间拿到了全国甲卷的高考作文题目: 阅读下面的资料,根据需要写作 人们因技术发展得更好地掌控时间,但也有人因此成为了时间的仆人。 这句话引出了你怎样的联…

备战金九银十:1200道Java面试真题合集,助你搞定面试官

不论是校招还是社招都避免不了各种面试。笔试,如何去准备这些东西就显得格外重要。不论是笔试还是面试都是有章可循的,我这个有章可循‘说的意思只是说应对技术面试是可以提前准备。 运筹帷幄之后,决胜千里之外!不打毫无准备的仗,我觉得大家…

爬虫数据采集需要什么样的代理ip以及遇到的反爬措施

随着互联网的快速发展,数据已经成为许多行业中的重要资源。网络爬虫作为一种数据采集工具,在许多领域中得到了广泛应用。但是现在很多网站都有非常多的限制,所以在爬取数据的时候,还需要借助代理ip来助力,才能更好的完…

OKHttp_官方文档[译文]

OKHttp功能类介绍 OKHttp网络请求流程分析 OKHttp连接池 OKHttp分发器 OKHttp拦截器 RetryAndFollowUpInterceptorBridgeInterceptorCacheInterceptorConnectInterceptorCallServerInterceptor 总览 OkHttp HTTP是现代应用程序网络的方式。这就是我们交换数据和媒体的方…

Tcp黏包和半包形象讲解以及结合Netty应用层的解决方案

黏包:顾名思义就是好几次的请求消息粘在了一起 半包:顾名思义就是一个消息分成了好几半发送出去 首先讲解这两种现象出现的原因: 1.大家都知道tcp是一个可靠的网络协议,每发送一段消息,就要进行一次,确认应答(ack处…

5.41 综合案例2.0-modbus协议控制变送器和六路继电器

modbus协议控制变送器和六路继电器 案例说明1.器件光照温湿度变送器六路继电器 2.测试前操作3.连线 代码测试 案例说明 基于modbus协议,本案例实现了下述功能:  (1)采集和上报温度、湿度、光照数据  (2)…

安全防御 --- IPSec理论(02)

附: 协议与模式分类 esp 和 ah 的分类: 数据的安全性:ESP有机密性;AH无机密性场景:ESP适合公网场景;AH适合内网 / 私网场景 (数据的安全性主要依赖于传输端之间需要做认证) 传输…

MyBatisPlus4-DML编程控制(增删改)、id生成策略、逻辑删除、乐观锁和悲观锁

1. id生成策略控制(增) 名称: TableId 类型: 属性注解 位置: 模型类中用于表示主键的属性定义上方 作用: 设置当前类中主键属性的生成策略 public class User {TableId(type IdType.AUTO)private Long id; }value: 设置数据库主键名称 type: 设置主键属…

vue完美模拟pc版快手实现短视频,含短视频详情播放

目录 一、预览 二、效果图 项目实现的demo效果图: 三、项目细节说明 1.项目结构、设计说明 2.项目可拓展能力题外话(看不懂可以忽略) 3.项目路由配置 4.框架布局页面源码 5.首页实现 四、总结 一、预览 本作品demo预览地址&#xff1…

测试工程师该何去何从?写给30+岁的测试工程师!

前言: 软件测试是为了发现程序中的错误而执行程序的过程。 通俗的说,软件测试需要在发布软件之前,尽可能的找软件的错误,尽量避免在发布之后给用户带来不好的体验,并要满足用户使用的需求。 首先今年行情肯定比去年好…

【Java|多线程与高并发】线程的中断的两种方法

文章目录 1.前言2. 方法1: 自定义标志位3. 方法2:使用标准库自带的标志位4.总结 1.前言 线程中断是指在一个线程执行的过程中,强制终止该线程的执行。虽说是中断,但本质上是让run方法快点执行完,而不是run方法执行到一半,强制结束. 本文主要介绍线程中断的两种方法…

电力通信机房如何管理?你绝对想不到!

在信息化建设中,机房运行是信息交换管理的核心。机房内的所有设备必须始终正常工作,否则一旦某个设备出现故障,就会对数据传输、存储和系统运行造成威胁,进而影响全局系统的运行。 机房内的3大安全隐患 01.典型的事故包括电气、消…

HighCharts图表的呈现

HighCharts用法说明地址:Highcharts API 文档 | Highcharts 通过地址打开会出现新版,也可以切换到旧版,以上图是旧版,旧版有详细的备注更方便使用 大致的界面呈现上方提供的地址可以实现,在这个地方主要说明几个注意点…

耗时108天,终于有人把金九银十面试必问的1309道Java面试题全部整理出来了

就目前大环境来看,跳槽成功的难度比往年高很多。一个明显的感受:互联网行业竞争越来越严峻,面试也是越来越难,不少大厂,如阿里、腾讯、华为的招聘名额明显减少,面试门槛却一再拔高,其实&#xf…

AI安防视频融合平台EasyCVR服务启动异常的原因排查与解决

EasyCVR视频融合平台基于云边端一体化架构,具有强大的数据接入、处理及分发能力,平台支持多协议、多类型的设备接入,包括主流标准协议国标GB28181、RTSP/Onvif、RTMP等,以及厂家私有协议与SDK接入,包括海康Ehome、海大…

求子网掩码的有效地址

第一步&#xff1a;通过题目可以得知&#xff0c;这个子网掩码属于C类&#xff0c;故ABCD四个选项&#xff0c;我们只需要看最后一位 第二步&#xff1a;题干给的是224&#xff08;我们只需要知道哪8位二进制数加起来等于224即可&#xff09; 很明显这个192<224&#xff1b…