从北京到南京:偶数在能源行业的数据迁移实践

news2024/11/8 18:09:10

能源行业的数字化转型

当前,大数据技术在以电力为代表的能源行业不断推进,同时,分布式能源、储能、电网技术不断改进,电力行业的数字化转型充满了机遇和挑战。

一方面,电力行业本身自动化程度高、信息化基础好、系统完备,电力企业在数字化转型上,更加关注通过物联网、大数据、人工智能等新技术的应用挖掘数据的价值。另一方面,在信息化建设和数字化转型的过程中,智能传感器生态链尚不完善,海量数据闲置无法发挥价值,错综复杂的系统形成信息孤岛无法有效融合。

因此,为了充分挖掘,实现数据价值,电力企业首先要考虑如何实现数据的高效整合,以及如何形成数据资产。

在这个背景下,偶数科技为国内某大型能源集团进行了数据迁移并成功实现了大数据底座的优化升级。


平台升级改造迫在眉睫

2023年,该能源集团数据中心在经过多年的使用后即将进行升级改造。由于业务调整,数据中心的地理位置也随之变更,需要将原北京数据中心迁移至南京的新数据中心。同时,当前数据平台系统已经遇到瓶颈,无法有效满足业务需求,亟需对管理架构进行升级改造。


平台技术瓶颈定位

1. 平台拓展能力受限,当前集群规模已达到上限,形成性能瓶颈,如果拓展节点就需要增加新的集群,不仅系统变得复杂,管理维护也变得异常困难。2. 平台数据更新能力受制约,需要原生支持 HDFS 存储上的 Update/Delete 操作。3. 原平台达到性能瓶颈,需要新平台能大幅改善数据库系统插入和查询的性能。


核心组件选型

在对现有分析型国产数据库进行横向调研和测评后,该能源集团对 OushuDB 新产品特性产生了极大的兴趣和期待。一方面是 OushuDB 产品本身对 HDFS 操作的灵活支持,另一方面客户非常认可偶数自研存储的性能及其可插拔存储架构。经过多轮的沟通和测试,确定了以 OushuDB 为核心的数据平台解决方案,并正式进入了数据迁移改造阶段。


整体迁移方案

由于北京数据中心原来的服务器机型老旧,不兼容南京数据中心即将搭建的新集群,因此本次迁移通过搭建临时集群的方式,在北京数据中心将原有数据文件同步至临时集群,再将临时集群搬迁至南京数据中心,临时集群和南京集群组建新的OushuDB 集群,导入备份数据。最后补录迁移期间数据,完成整体迁移。

平台迁移时间线

迁移实施过程

本次大数据平台搬迁实施总体目标是完成大数据平台由北京机房搬迁至南京机房,本次迁移分为两个主要步骤,第一是北京机房的数据备份,迁移至南京机房,第二是新集群的部署和系统及数据验证,再进行业务切换。

北京机房搭建临时集群

为了保证搬迁效率和控制成本,在搭建临时大数据集群时采用规模最小原则,根据数据实际情况,本次项目使用了5台服务器以支撑数据迁移。

在临时集群搭建完毕后,通过数据快照的方式,将北京机房通过万兆局域网进行跨集群数据迁移,数据由原大数据平台迁移至新集群环境。

临时集群搬迁

待北京机房新大数据新集群数据迁移完成后,将新集群下电搬迁至南京机房。将5个节点新集群下架,通过物流运输的方式,将5个节点组成的临时集群搬迁至南京机房。

南京机房集群部署及运行

同步进行部署在虚拟化集群的大数据平台应用功能迁移,新集群重新加电启动,进行系统和数据验证后,依托广域网络完成增量数据迁移,完成系统功能和数据验证。

1. 在南京机房上架新服务器

将10台服务器进行上架。设备网络互联、设备电源连接、打印标签。服务器安装操作系统,网络设备配置、调试;

2. 大数据平台虚拟化应用部署

在南京机房虚拟化集群部署大数据平台的各应用及服务;

3. 新大数据集群搬迁及扩容

待5节点集群迁移至南京机房,进行设备网络互联、设备电源连接、打印标签、启动设备,对集群平台进行功能验证,并将南京机房现有的服务器10台纳入新大数据集群,形成15节点集群;

4. 增量数据同步,新、旧集群并列运行

通过大数据平台数据补招和离线文件导入功能,将大数据搬迁期间增量运行数据迁移至新集群,并进行新集群业务功能验证;核实数据无问题后,将剩余相关业务整体切换至南京机房大数据集群。


平台能力提升
布局实时分析和人工智能

通过本次数据迁移,该客户不仅实现了从北京机房到南京机房无损、平稳的数据搬迁,同时还通过这次契机实现了大数据平台的升级,并在以下几个方面得到了显著提升。

1. 平台性能大幅提升,更换采用新一代向量化执行引擎,让硬件资源得以充分释放,减少了业务分析的延迟。2. 平台可靠性得到有力保障,通过多活主节点保证更高的系统可用性,规避单主节点的故障风险。3. 平台动态水平扩展,通过存算分离、可拓展技术架构解决了集群规模受限的长期困扰。4. 共享一份数据,解决数据孤岛,减少冗余。通过开放的存储格式让所有数据形成统一的一份数据,减少了不同集群之间底层数据存储不兼容的问题。

除了以上平台能力建设的大幅提升,该客户基于平台开放格式的统一数据存储,还可以选用和优化不同大数据组件(如处理结构化数据、非结构化数据和流式数据的不同计算引擎),可落地的多引擎融合能力,让该客户在能源领域提早布局实时分析和人工智能,抓住数字化转型先机。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1114491.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

去水印app有哪些?这三款良心推荐

如今图片的使用越来越普遍,因此我们经常需要对图片进行编辑和修改。但有些图片可能带有水印,这会影响图片的美观和应用效果。你知道有哪些推荐的图片去水印app吗?以下是介绍的三款可以去水印app,让你的素材更加专业和美观&#xf…

Python高频面试题——如何在字符串中删除指定字符,掌握strip()、replace()和re.sub ()正确使用方法!

关于python删除字符串是面试python测试开发工程师的一个经典问题。问题很简单,但是一下子就能测试出来被面试者是否能够熟练的进行python相关编码工作! 对于有些临时抱佛脚的同学来讲,一看删除,很自然就说用remove 、del相关方法…

优化销售策略,突破企业全面预算管理难题

传统的企业年度销售计划往往会消耗企业内部人员很多精力和时间,比如需要收集数据、处理电子表格、确定项目优先级、预测未来发展以及为次年的费用制定预算等。然而随着这些繁琐的工作不断进行,其中的准确性和价值也受到了一定的怀疑。虽然销售计划仍按着…

经纬恒润推出全新一代智能电动座椅模块

随着智能驾驶、智能座舱的广泛应用,人们对于汽车的定位不再局限于代步工具,对于汽车座舱这个私密空间也有了不一样的期待。更安全、更舒适、更智能化的体验将成为未来智能座椅的发展方向,而传统的座椅控制系统已无法满足人们新的需求。 为了…

python3 win环境部署

python3 win环境部署 1.安装包 https://www.python.org/ftp/python/3.12.0/python-3.12.0-amd64.exe安装成功后 ctrlr 输入 cmd 执行 python 检验是否安装成功 pip 镜像源更新 查看pip.ini 文件路径,一般在 python 安装目录下添加 pip.ini 文件即可 pip -v config list​ 创建…

JAVA---RMI详解1

一、RMI简介 The Java Remote Method Invocation (RMI)允许运行在一台虚拟机上的对象调用运行在另一台虚拟机上的对象中的方法。RMI使用stubs and skeletons (存根和骨架)架构来和远程对象(Remote Object)沟通 二、相关术语介绍 1…

人脸写真FaceChain风格写真的试玩(二)

接着上一篇【人脸写真FaceChain的简单部署记录(一)】来试玩一下。 1 无限风格写真 参考:让你拥有专属且万能的AI摄影师AI修图师——FaceChain迎来最大版本更新 1.1 人物形象训练 这里的步骤比较简单,就是选择照片,然…

CentOS7.9离线安装Docker环境

1. 下载合适的Docker安装包 Docker安装包下载地址:Index of linux/static/stable/x86_64/https://download.docker.com/linux/static/stable/x86_64/ 进入地址页面,如下图: 我下载的是:docker-23.0.1.tgz 版本 2. 将下载好的Do…

linux-守护进程daemon

linux-守护进程daemon 代码实现 main.c运行结果 代码实现 main.c //pName&#xff1a;程序名 //facility&#xff1a; 守护进程&#xff0c;输出日志类型 302页 #include<signal.h> #include<syslog.h> #include<fcntl.h> static int daemon_proc 0; #defin…

AQS理解

AQS是JAVA中的一组抽象类&#xff0c;就是为了解决多线程并发竞争共享资源而引发的线程安全问题&#xff0c;细致点说AQS就是具备一套线程阻塞等待以及被唤醒的时候锁分配的机制&#xff0c;这个机制是由队列来实现的&#xff0c;暂时获取不到所的线程加入到队列里面&#xff0…

爬虫/scrapy基础

如果文章对你有帮助&#xff0c;欢迎关注、点赞、收藏一键三连支持以下哦&#xff01; 想要一起交流学习的小伙伴可以加zkaq222&#xff08;备注CSDN&#xff0c;不备注通不过哦&#xff09;进入学习&#xff0c;共同学习进步 目录 0x01 安装和简介 0x02 文件作用 0x04 保存…

【软考-中级】系统集成项目管理工程师-合同管理历年案例

持续更新。。。。。。。。。。。。。。。 目录 2018 下 试题一(17分)系列文章 2018 下 试题一(17分) 阅读下列说明&#xff0c;回答问题 1至问题 3&#xff0c;将解答填入答题纸的对应栏内     某大型央企 A 公司计划开展云数据中心建设项目&#xff0c;并将公司主要业务应…

OpenGL —— 2.8、漫游之摄像机飞行移动(附源码,glfw+glad)

源码效果 C源码 纹理图片 需下载stb_image.h这个解码图片的库&#xff0c;该库只有一个头文件。 具体代码&#xff1a; vertexShader.glsl #version 330 corelayout(location 0) in vec3 aPos; layout(location 1) in vec2 aUV;out vec2 outUV;uniform mat4 _modelMatrix; …

智慧公厕蜕变多功能城市智慧驿站公厕的创新

随着城市发展的不断推进&#xff0c;对公共设施的便利性和智能化要求也日益提高。为满足市民对高品质、便捷、舒适的公共厕所的需求&#xff0c;智慧公厕行业的领航厂家广州中期科技有限公司&#xff0c;全新推出了一体化智慧公厕驿站。凭借着“高科技碳中和物联网创意设计新经…

widnows安装audiocraft

audiocraft介绍 AudioCraft是一个PyTorch库&#xff0c;用于音频生成的深度学习研究。我们可以上传一段音乐&#xff0c;AI会根据音乐以及提示词&#xff0c;生成一段新的音乐。下面来看看具体安装。 首先查看cuda版本 如何安装cuda&#xff0c;可以自行搜索 获取程序 可…

泛微OA E-Office V10 OfficeServer 任意文件上传漏洞复现

声明 本文仅用于技术交流&#xff0c;请勿用于非法用途 由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;文章作者不为此承担任何责任。 漏洞简介 泛微e-ofice是一款标准化的协同0A办公软件&#xff0c;泛微 …

书单|1024程序员狂欢节充能书单!

作者简介&#xff1a; 辭七七&#xff0c;目前大二&#xff0c;正在学习C/C&#xff0c;Java&#xff0c;Python等 作者主页&#xff1a; 七七的个人主页 文章收录专栏&#xff1a; 七七的闲谈 欢迎大家点赞 &#x1f44d; 收藏 ⭐ 加关注哦&#xff01;&#x1f496;&#x1f…

双指针——快乐数

一, 题目要求 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为&#xff1a; 对于一个正整数&#xff0c;每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1&#xff0c;也可能是 无限循环 但始终变不到 1。 如果这个过程 结果为 …

工程中的SOVD——从ECU到车辆

SOVD标准正在改变诊断方式&#xff0c;特别是在互联网上当多个合作方进行交互时&#xff0c;其提供了很大的优势。在开发的早期阶段&#xff0c;需要使用附加的方法来利用这个标准&#xff0c;因为该标准并不是专为ECU诊断而开发的&#xff0c;而且还需格外注意数据的处理&…

金融统计学方法:神经网络

目录 1.神经网络 2.深度神经网络 3.案例分析 1.神经网络 神经网络是模仿人脑神经元工作原理而设计的一种算法模型。在一个基本的神经网络中&#xff0c;存在多个“神经元”或称为“节点”&#xff0c;这些节点被组织成多个层次。每个节点都接收前一层的输入&#xff0c;进行…