近乎实时的物联网数据管道架构

news2024/12/26 8:08:50

这篇论文的标题是《Near Real-Time IoT Data Pipeline Architectures》,作者是 Markus Multamäki,完成于 2024 年,属于计算机科学与工程硕士学位论文。论文主要研究了物联网(IoT)数据分析的可扩展数据管道架构,特别应用于车辆中铅酸电池状态的估计。以下是论文的详细内容概述:

摘要

  • 研究介绍了一种用于 IoT 数据分析的可扩展数据管道架构,特别用于车辆中铅酸电池状态的估计。
  • 论文提出了一种新方法,利用云计算远程处理数据,使用电池的历史和使用信息来评估其状态。
  • 系统能够持续分析数万个铅酸电池,开发过程包括探索适合实时 IoT 数据的可扩展管道架构和云服务,以及开发分析铅酸电池状态的算法和方法。
  • 研究结果被整合到一个演示应用程序中,并通过文献回顾和模拟真实使用情况的测试进行了验证。

关键词

  • 铅酸电池
  • 电池健康状态
  • 分类
  • 云计算
  • Google Cloud
  • Microsoft Azure

目录

  • 摘要
  • 引言
  • 背景
  • 云基础的 IoT 架构
  • 实施
  • 测试和评估
  • 讨论
  • 总结
  • 参考文献
  • 附录

引言

  • 论文介绍了物联网(IoT)的定义、应用和与机器学习(ML)及人工智能(AI)方法的结合。
  • 讨论了云计算在克服单个 IoT 设备限制方面的作用,以及云平台如何提供灵活、可扩展的平台。

背景

  • 详细介绍了 IoT 的组件和概念,包括设备和传感器、通信、存储、分析和用户界面。
  • 讨论了云计算的定义、服务模型(IaaS、PaaS、SaaS)和云类型(公有云、私有云、混合云)。
  • 探讨了云计算与 IoT 的结合,以及边缘计算和雾计算的概念。
  • 描述了数据管道的概念,包括 ETL 和 ELT 过程,以及数据存储、数据库、数据湖和数据仓库。

云基础的 IoT 架构

  • 分析了 Google Cloud Platform 和 Microsoft Azure 提供的服务,包括连接性、数据传输、数据存储和分析。
  • 对比了 Google Cloud 和 Azure 在 IoT 数据管道架构中的应用。

实施

  • 描述了系统需求、数据收集、探索性数据分析(EDA)、决策制定过程,包括基于规则的决策和基于机器学习的决策。
  • 讨论了管道开发,包括实验和开发的管道。

4. 实施

4.1. 需求

  • 确定了系统的主要需求,包括处理大量数据的能力、成本效益、以及能够及时准确地估计电池状态。
  • 指出了系统需要能够处理每秒约700行日志数据,并在几秒钟内提供分析结果。

4.2. 数据

  • 描述了用于分析的数据来源,包括从物联网设备收集的电池电压、温度和输入/输出控制数据。
  • 讨论了数据的存储格式,包括在 Google Datastore 中以压缩形式存储的数据批次。

4.3. 探索性数据分析 (EDA)

  • 使用统计和可视化方法对数据进行了探索,以更好地理解数据特性。
  • 分析了电压、温度和 I/O 状态数据的分布和模式。

4.4. 决策制定

  • 结合文献综述和 EDA 的发现,开发了基于规则的决策系统,用于估计电池状态。
  • 介绍了用于检测电池状态的不同阶段(放电、充电和空闲)的算法,包括使用时间加权移动平均(TWMA)算法来检测电压变化。

4.4.1. 基于规则的决策制定

  • 定义了一组规则,用于检查每个空闲期间的电池状态,并根据这些规则发出警告或错误。

4.4.2. 基于机器学习的决策制定

  • 探讨了使用机器学习方法来预测电池未来可能出现的问题。
  • 测试了不同的机器学习模型,并评估了它们在预测电池状态方面的准确性。

4.5. 管道开发

  • 描述了数据管道的开发过程,包括使用 Google Cloud Platform (GCP) 和 Microsoft Azure 的服务。
  • 讨论了数据管道的各个组成部分,包括数据摄取、数据传输、数据存储和分析。

4.5.1. 实验

  • 对 GCP 和 Azure 上的不同服务进行了实际测试,以评估它们的性能和成本效益。
  • 测试了数据管道在处理大量数据时的性能,包括使用 Dataflow 和 Dataproc 进行数据转换和分析。

4.5.2. 开发的管道

  • 详细介绍了最终开发的管道架构,包括使用的关键服务,如 Cloud Pub/Sub、Cloud Dataflow、BigQuery 和 Dataproc。
  • 讨论了管道的可扩展性、成本和处理能力,以及如何满足项目需求。

实施部分的核心是开发了一个能够处理和分析大量 IoT 数据的管道,以便实时估计车辆中铅酸电池的状态。这个管道不仅能够处理数据,还能够提供有关电池健康的有用信息,从而支持可持续的电池使用。

测试和评估

  • 评估了基于规则的方法、机器学习方法和数据管道的性能。
  • 讨论了数据管道的负载测试和成本评估。

讨论

  • 评估了管道架构和应用程序的有效性,提出了未来工作的方向。

总结

  • 总结了研究的主要发现,强调了所开发的管道架构和电池状态估计系统在实际应用中的潜力。

参考文献

  • 列出了论文引用的相关研究文献。

附录

  • 提供了测试结果的图表和数据。

整体而言,这篇论文提出了一个针对 IoT 数据的实时数据处理和分析的可扩展管道架构,特别关注于车辆铅酸电池状态的监测和分析。通过云计算平台,该系统能够处理和分析大量数据,以支持可持续的电池使用。论文还探讨了未来研究的方向,包括进一步优化管道架构和提高电池状态估计的准确性。

复制再试一次分享

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2141230.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

FloodFill算法【下】

417. 太平洋大西洋水流问题 题目链接:417. 太平洋大西洋水流问题 题目解析 题目给我们一个矩阵,这个矩阵相当于陆地,被两个洋包围,左和上代表太平洋,右和下代表大西洋。 矩阵里面的数字代表海拔,水可以…

STM32之FMC—扩展外部 SDRAM

文章目录 一、FMC外设介绍二、SDRAM 控制原理1、SDRAM关键参数a、容量、分区b、引脚SDRAM 使用 2、SDRAM芯片IS42S16400J3、SDRAM 控制引脚说明控制逻辑地址控制SDRAM 的存储阵列SDRAM 的命令预充电刷新 W9825G6KH:W9825G6KH引脚 三、STM32F429 FMC四、其他文章打开…

医学数据分析实训 项目四回归分析--预测帕金森病病情的严重程度

文章目录 项目四:回归分析实践目的实践平台实践内容 预测帕金森病病情的严重程度作业(一)数据读入及理解(二)数据准备(三)模型建立(四)模型预测(五&#xff0…

神经网络通俗理解学习笔记(4) 深度生成模型VAE、GAN

深度生成模型 什么是生成式模型蒙特卡洛方法变分推断Variational Inference变分自编码器VAE生成对抗网络Generative Adversarial NetworkDiffusion 扩散模型VAE和GAN 代码实现 什么是生成式模型 判别式和生成式模型 判别式:CNN/RNN/transformer;生成式:AE/VAE/GAN 判别式模型学…

Linux:RPM软件包管理以及Yum软件包仓库

挂载光驱设备 RPM软件包管理 RPM软件包简介 区分软件名和软件包名 软件名:firefox 软件包名:firefox-52.7.0-1.el7.centos.x86_64.rpm 查询软件信息 查询软件(参数为软件名) ]# rpm -qa #当前系统中所有已安装的软件包 ]# r…

Unity实战案例全解析 :PVZ 植物脚本分析

植物都继承了Pants脚本,但是我因为没注意听讲,把Pants也挂在植物上了,所以子类的PlantEnableUpdate和PlantDisableUpdate抢不过父类,无法正确触发动画,我还找不到哪里出了问题,所以就使用了携程加while强行…

Navicat使用 笔记04

Navicat调用数据库 1.创建一个自己的链接(文件-->新建连接-->MySQL) 进入到这个界面中: 【注意:密码是下载登录软件时设定过的】 创建一个连接完成(通过双击激活)。 2.在创建好的连接中创建数据库…

神经网络通俗理解学习笔记(5) 自然语言处理

自然语言处理 词嵌入和word2vec词义搜索和句意表示预训练模型Hugging Face库介绍经典NLP数据集代码案例-电影评论情感分析 词嵌入和word2vec 词嵌入是一种 将高维的数据表示映射到低维空间的方法 word embedding 是将语言中的词编码成向量便于后续的分析和处理 词嵌入和词向量…

感知器神经网络

1、原理 感知器是一种前馈人工神经网络,是人工神经网络中的一种典型结构。感知器具有分层结构,信息从输入层进入网络,逐层向前传递至输出层。根据感知器神经元变换函数、隐层数以及权值调整规则的不同,可以形成具有各种功能特点的…

宿舍管理系统的设计与实现 (含源码+sql+视频导入教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 宿舍管理系统拥有三个角色,分别为系统管理员、宿舍管理员以及学生。其功能如下: 管理员:宿舍管理员管理、学生管理、宿舍楼管理、缺勤记录管理、个人密…

django学习入门系列之第十点《A 案例: 员工管理系统8》

文章目录 10.6 重写样式10.7 判断数据是否合法10.8 保存内容至数据库10.9 修改入职时间10.10 错误提示10.11 重写错误信息往期回顾 10.6 重写样式 注意:因为他框架都已经给你写好了,所以如果要使用样式的话可能要自己重新定义框架来进行修改 他有两种方…

衣食住行的投资与消费

机器人工程课程与科研采取敏捷开发的弊端和反思_工业机器人适合敏捷开发吗-CSDN博客 →学历消费者←自我救赎↑2024↓(*Φ皿Φ*)-CSDN博客 大部分衣食住行相关的产品都是消费品,只有极少部分是能保值的资产。 物以稀为贵,量产供应的一般而言都是消费品…

第二百三十五节 JPA教程 - JPA Lob列示例

JPA教程 - JPA Lob列示例 以下代码显示了如何使用Lob注释将字节数组保存到数据库。 LOB在数据库中有两种类型:字符大对象(称为CLOB)和二进制大对象(或BLOB)。 CLOB列保存大字符序列,BLOB列可存储大字节序…

JDK的选择安装和下载

搭建Java开发环境 要使用Java首先必须搭建Java的开发环境;Java的产品叫JDK(Java Development Kit:Java开发工具包),必须安装JDK才能使用Java。 JDK发展史 那么这么多JDK,应该使用哪个版本,此处…

C# 比较对象新思路,利用反射技术打造更灵活的比较工具

前言 嘿,大家好!如果你之前看过我分享的文章《C# 7个方法比较两个对象是否相等》,你可能会意识到对象比较在实际业务中经常出现的场景。今天,我想继续与大家分享一个在实际项目中遇到的问题。 有一次,我接手了一个别…

LLVM PASS-PWN-前置

文章目录 参考环境搭建基础知识![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/dced705dcbb045ceb8df2237c9b0fd71.png)LLVM IR实例1. **.ll 格式(人类可读的文本格式)**2. **.bc 格式(二进制格式)**3. **内存表示** …

无心剑英译张九龄《望月怀远》

望月怀远 Watching the Moon and Missing You Far Away 张九龄 By Zhang Jiuling 海上生明月,天涯共此时 情人怨遥夜,竟夕起相思 灭烛怜光满,披衣觉露滋 不堪盈手赠,还寝梦佳期 The bright moon rises from the sea, So far apart…

【宠物小精灵之收服(待更新)】

题目 代码 #include <bits/stdc.h> using namespace std; int f[1010][510]; int main() {int n, m, k;cin >> n >> m >> k;int c 0;for(int i 1; i < k; i){int cost, hp;cin >> cost >> hp;for(int j n; j > cost; j--){for(i…

java技术栈介绍

Java技术栈是一个庞大而丰富的生态系统&#xff0c;它包含了从基础语言特性到高级框架、库和工具的整个集合。这个技术栈为开发者提供了构建各种类型应用&#xff08;包括企业级应用、Web应用、移动应用、大数据应用等&#xff09;所需的全部组件。以下是对Java技术栈的一个更详…

【webpack4系列】编写可维护的webpack构建配置(四)

文章目录 构建配置包设计功能模块设计和目录结构设计功能模块设计目录结构设计 使用ESLint规范构建脚本冒烟测试介绍和实际运用冒烟测试 (smoke testing)冒烟测试执行判断构建是否成功判断基本功能是否正常 单元测试和测试覆盖率测试框架编写单元测试用例单元测试接入测试覆盖率…