python数据分析-连云港石化基地2023年用电量分析

news2024/11/27 1:25:05

接下来对连云港石化基地2023年用电量进行分析,首先导入数据分析基本的包:

import pandas as pd
import matplotlib.pyplot as plt


# Load the data from the provided Excel files
file_path1 = 'data1.xlsx'
file_path2 = 'data2.xlsx'

data1 = pd.read_excel(file_path1)
data1

从上面结果可以发现,数据集一个有246条数据

# 接下来可以进行数据分析和可视化

# 将日期格式更改为仅包含年和月
data1['时间'] = data1['时间'].dt.to_period('M')

# 接下来可以进行数据分析和可视化

接下来进行描述性统计结果分析:

  1. 数据概况

    • 数据包含了 246 个观测值,分别对应不同的月份和用电量。
    • 用电量的平均值为 3257539 千瓦时,中位数为 284677.5 千瓦时,说明数据存在一定的右偏态。
    • 标准差为 8436332 千瓦时,说明数据的离散程度较大,可能存在一些极端值。
  2. 用电量分布

    • 用电量的最小值为 11700 千瓦时,最大值为 37745478 千瓦时,说明数据的范围非常广泛。
    • 大部分用电量集中在较低的水平,可能存在一些大型用电设备或工业用户导致了极端值的出现。
  3. 异常值检测

    • 可以通过绘制箱线图来检测异常值。从箱线图中可以看出,存在一些用电量明显高于其他观测值的异常值。
    • 这些异常值可能需要进一步调查,以确定是否存在数据录入错误或其他异常情况。
import matplotlib.pyplot as plt 
%matplotlib inline
plt.rcParams['font.sans-serif'] = ['KaiTi']  #中文
plt.rcParams['axes.unicode_minus'] = False   #负号
import pandas as pd
import seaborn as sns
# 企业用电量排名
import matplotlib.pyplot as plt
import numpy as np

# 定义企业名称和用电量数据
companies = ['盛虹炼化(连云港)有限公司', '连云港石化有限公司', '江苏瑞恒新材料科技有限公司', '江苏嘉宏新材料有限公司', '江苏方洋能源科技有限公司',
             '中化连云港石化仓储有限公司', '连云港徐圩港口控股集团有限公司', '连云港圣奥化学科技有限公司', '江苏洋井石化集团有限公司', '连云港徐圩港口码头有限公司']
electricity = [4191025003, 2192691053, 1186132719, 283658970, 87738582, 21805327, 9319212, 7785657, 7636359, 7440616]

# 为每个企业选择一个不同的颜色
colors = plt.cm.tab10(np.arange(len(companies)))

# 绘制柱状图
plt.figure(figsize=(10, 8),dpi=200)
plt.bar(companies, electricity, color=colors)
plt.xlabel('企业名称')
plt.ylabel('用电量')
plt.title('不同企业的用电量情况')
plt.xticks(rotation=45)  # 如果企业名称较长,可以旋转以免重叠
# plt.grid(True)  # 显示网格线

# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='y', style='plain')
plt.show()

首先,我们对数据进行了彻底的清洗和验证,确保所有用电数据均准确无误。然后,我们从企业规模和行业类型这两个维度对数据进行了对比分析。具体来说,我们将企业按照用电量进行了排名,以此识别出用电量最高的企业。分析结果表明,盛虹炼化(连云港)有限公司和连云港石化有限公司的用电量显著高于其他企业,这反映了它们作为该地区主要炼油或化工企业的能源密集特性。它们对电力的巨大需求可能是支持高强度生产过程所必需的。紧随其后的江苏瑞恒新材料科技有限公司,其用电量也相对较高,这可能指示该公司是一家从事新材料生产的高能耗企业。与这些企业相比,其他企业的用电量相对较低,这可能反映了它们较小的规模或参与的行业对能源的需求相对较低。尽管如此,这些企业仍在当地经济中扮演着重要角色。

# 绘制条形图
plt.figure(figsize=(12, 6),dpi=200)
sns.barplot(x=monthly_electricity.index, y=monthly_electricity.values)
plt.title('每月用电量分布')
plt.xlabel('月份')
plt.ylabel('用电量(千瓦时)')
# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='y', style='plain')
plt.show()

 

# 为饼图准备数据
values = [specific_company_electricity, total_electricity - specific_company_electricity]
labels = ['江苏瑞恒新材料科技有限公司', '其他公司']

# 绘制饼图
plt.figure(figsize=(8, 6),dpi=200)
plt.pie(values, labels=labels, autopct='%1.1f%%', startangle=140)
plt.title('江苏瑞恒新材料科技有限公司用电量占比')
plt.show()

 

我们的分析结果显示,江苏瑞恒新材料科技有限公司的用电量占比高达14.8%,这一显著的比例不仅展示了该公司在当地能源消耗方面的重要性,而且暗示了其较大的企业规模和市场影响力。在典型经济体中,企业的用电量往往与其规模、产能和产品产出水平紧密相关。较高的用电量可能表明该公司拥有大型生产设施和高产出的生产线。此外,这一较高的用电量占比还可能反映出该公司在其行业中的领先地位,如在新材料科技领域的技术优势或市场占有率。 

读取另一个文件

import pandas as pd
import matplotlib.pyplot as plt


# Load the data from the provided Excel files
file_path2 = 'data2.xlsx'

data2 = pd.read_excel(file_path2)
data2

通过这个数据集,可以了解不同用电单位在特定时间内的用电情况,包括用电量的多少。这对于电力管理、计费、规划等方面都具有重要的参考价值。同时,结合其他相关信息,还可以进一步分析用电趋势、优化电力供应等。

这里设置显示选项,避免科学计数法

pd.set_option('display.float_format', lambda x: '%.2f' % x)

# 只显示数值型数据的描述统计信息
numeric_data_description = data2.describe(include=np.number)
print(numeric_data_description)

# 按项目分组并计算每个项目的总用电量
project_electricity = data2.groupby('项目')['电量'].sum().sort_values(ascending=False).head(20)
# 重置索引,便于作图
project_electricity_df = project_electricity.reset_index()

# 绘制条形图
plt.figure(figsize=(8, 10),dpi=300)
sns.barplot(x='电量', y='项目', data=project_electricity_df)
plt.title('前20个项目的用电量对比')
plt.xlabel('总用电量(千瓦时)')
plt.ylabel('项目')
plt.xticks(rotation=90)
# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='x', style='plain')
plt.show()

从图表中明显看出,如220kV炼化变高压供用电和连云港石化高压供用电这样的主要项目用电量显著高于其他项目,这些项目代表了该地区主要的工业生产基地,其高用电量体现了对电力的强烈需求。同时,我们也注意到了一些与新材料产业相关的项目,比如瑞恒新材料110kV瑞恒碳三变电站高压供用电,这些项目的用电数据提供了对新兴行业在当地经济中的发展情况和影响力的重要见解。除了工业生产,我们还发现了诸如能源科技第三方治理工程高压供用电这样的能源治理和环保项目,这些项目的用电情况反映了当地对环保和可持续发展的重视。

通过这项分析,我们得以全面了解该地区的产业结构、经济活动和基础设施建设状况。排名前20的项目不仅涵盖了石化、新材料、能源治理和环保等多个领域,还包括了基础设施建设项目,如变电站和输煤管道,这些用电数据反映出对基础设施建设的投入,突显了该地区对建设和发展的承诺。这样的综合分析不仅帮助我们把握当地的经济结构和发展趋势,而且为未来的经济发展和能源规划提供了宝贵的参考。这些信息对于政府规划部门、企业决策者以及投资者都极为重要,帮助他们在制定策略和计划时做出更加明智的选择。

数据加完整代码

创作不易,希望大家多点赞关注评论!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1805388.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络学了点socket,写个聊天室,还得改进

目录 第一版: common 服务端: 客户端 第一版问题总结: 第二版 服务端: 客户端: 改进: Windows客户端 一些小问题 还可以进行的改进 这篇文章我就先不讲网络基础的东西了,我讲讲在我进行制作我这个拉跨聊天室中遇到的问题,并写了三版代码. 第一版: common #pragm…

使用 Keras 的 Stable Diffusion 实现高性能文生图

前言 在本文中,我们将使用基于 KerasCV 实现的 [Stable Diffusion] 模型进行图像生成,这是由 stable.ai 开发的文本生成图像的多模态模型。 Stable Diffusion 是一种功能强大的开源的文本到图像生成模型。虽然市场上存在多种开源实现可以让用户根据文本…

Linux磁盘分区使用情况查询

一、磁盘分区使用情况查询 1. 查询磁盘整体使用情况使用 df -h进行查询 如图我们可以了解到磁盘的一些大致的使用情况,注意当已用部分有超过80%使用的分区就意味着你需要进行磁盘的清理了。 2.查询指定的磁盘使用情况 使用指令 du -h 当不指定目录时,默…

Vivado时序报告之Datasheet详解

目录 一、前言 二、Datasheet配置选项说明 2.1 Options 2.2 Groups 2.3 Timer Settings 2.4 Common Options 三、Datasheet报告 3.1 General Information 3.2 Input Ports Setup/Hold 3.3 Output Ports Clock-to-out 3.4 Setup between Clocks 3.5 Combinational…

物联网实战--平台篇之(十四)物模型(用户端)

目录 一、底层数据解析 二、物模型后端 三、物模型前端 四、数据下行 本项目的交流QQ群:701889554 物联网实战--入门篇https://blog.csdn.net/ypp240124016/category_12609773.html 物联网实战--驱动篇https://blog.csdn.net/ypp240124016/category_12631333.html 物联网…

基于Python的AI动物识别技术研究

基于Python的AI动物识别技术研究 开发语言:Python 数据库:MySQL所用到的知识:Django框架工具:pycharm、Navicat、Maven 系统功能实现 系统的登录模块设计 本次设计的AI动物识别系统为了保证用户的数据安全,设计了登录的模块&…

明天15点!如何打好重保预防针:迎战HVV经验分享

在当今数字化时代,网络攻击日益猖獗,各行各业面临的网络安全威胁不断升级。从钓鱼邮件到复杂的APT攻击,网络犯罪分子的手法层出不穷,给各行各业的信息安全带来了前所未有的挑战。 在这样的背景下,"HVV行动"应…

免费,C++蓝桥杯等级考试真题--第7级(含答案解析和代码)

C蓝桥杯等级考试真题--第7级 答案:D 解析:步骤如下: 首先,--a 操作会使 a 的值减1,因此 a 变为 3。判断 a > b 即 3 > 3,此时表达式为假,因为 --a 后 a 并不大于 b。因此,程…

如何远程连接Linux服务器?

远程连接Linux服务器是通过网络连接到位于远程位置的Linux服务器,以进行服务器管理和操作。远程连接使得系统管理员可以方便地远程访问服务器,进行配置、维护和故障排除等操作,而不必亲自在服务器前工作。以下是一些常用的远程连接方法&#…

使用小黄鸟(HttpCanary)、VMOS Pro虚拟机对手机APP进行抓包(附带软件)

老规矩先看,效果图: 文章很详细,希望可以耐心看完,保证可以学会抓包,不再走冤枉路,小编在之前看过太多类似文章,折腾了太久才搞懂的,写这篇文章就是不想希望你们像小编一样再花时间…

qmt量化交易策略小白学习笔记第15期【qmt编程之获取龙虎榜数据】

qmt编程之获取龙虎榜数据 qmt更加详细的教程方法,会持续慢慢梳理。 也可找寻博主的历史文章,搜索关键词查看解决方案 ! 获取龙虎榜数据 获取指定日期区间内的龙虎榜数据 内置python C.get_longhubang(stock_list, startTime, endTime)参…

十八、【源码】二级缓存

源码地址:https://github.com/mybatis/mybatis-3/ 仓库地址:https://gitcode.net/qq_42665745/mybatis/-/tree/18-second-levelcache 二级缓存 二级缓存,namespace级别,默认关闭,需要手动开启,在xml加入…

论文阅读《SELECTIVE DOMAIN-INVARIANT FEATURE FOR GENERALIZABLE DEEPFAKEDETECTION》

作者:Yingxin Lai、 Guoqing Yang1、Yifan He2、Zhiming Luo、Shaozi Li 期刊:ICASSP-2024 目的:解决泛化性的问题,提出了3个模块 论文整体的架构图:(挑选域特征不变,减少对图像内容或者风格…

我的编程语言学习记录:一段不断探索的旅程

目录 我的编程语言学习记录:一段不断探索的旅程 1.引言 2.我的编程之旅开始 第一站:Python — 简洁之美 第二站:JavaScript — 网页的魔法 第三站:Java — 企业级的力量 3.学习过程中的挑战与克服 1.理解概念 3.记忆语法…

德克萨斯大学奥斯汀分校自然语言处理硕士课程汉化版(第七周) - 结构化预测

结构化预测 0. 写在大模型前面的话1. 词法分析 1.1. 分词1.2. 词性标注 2.2. 句法分析 2.3. 成分句法分析2.3. 依存句法分析 3. 序列标注 3.1. 使用分类器进行标注 4. 语义分析 0. 写在大模型前面的话 在介绍大语言模型之前,先把自然语言处理中遗漏的结构化预测补…

Word Split Line

Word Split Line 分割线 https://download.csdn.net/download/spencer_tseng/89413772

Verilog实战学习到RiscV - 4 : ICEStick 评估板计数器

这篇是关于always 时序逻辑的。直接上代码。 引脚配置文件 set_io leds[0] 99 set_io leds[1] 98 set_io leds[2] 97 set_io leds[3] 96set_io -pullup yes pmod[0] 78 set_io -pullup yes pmod[1] 79参看icestick的原理图 这里在pmod上使用了内部的上拉电阻。…

两轮自平衡小车资料(L298N 模块原理图及使用说明+c源码)

本文详细介绍了基于STM32微控制器的两轮自平衡小车的设计与实现过程。内容包括小车的硬件选型、电路设计、软件编程以及PID控制算法的应用。通过陀螺仪和加速度计获取小车的姿态信息,利用PID控制算法调整电机输出,实现小车的自主平衡。此外,还…

mac Network: use --host to expose

本地启动无法访问,这个不是权限问题是mac 主机端口安全策略,现在我们只需要开启端口自动检测就可以 npm run dev --host 网络:未暴露 方案一 1、执行 npm run dev -- --host 方案二 1、请在 vite.config.js server: {host: true } 1…

c++之旅第十弹——IO流

大家好啊,这里是c之旅第十弹,跟随我的步伐来开始这一篇的学习吧! 如果有知识性错误,欢迎各位指正!!一起加油!! 创作不易,希望大家多多支持哦! 一.流的概念&…