论文学习——数据挖掘技术在水文数据分析中的应用

news2024/9/23 21:23:40

文章目录

  • 0 引言
  • 1 数据挖掘技术及工具
    • 1.1 什么是数据挖掘?
    • 1.2 数据挖掘的过程?
    • 1.3 常用的数据挖掘技术
    • 1.4 ODM
  • 2 水文数据分析系统功能设计
  • 3 系统实现与应用
    • 3.1 数据获取与清理
    • 3.2 模型建立
  • 4 结语

2012年12月
计算机工程与设计

在这里插入图片描述

0 引言

  1. 洪水是现实生活中频发的一种自然灾害,水文数据是研究水问题的重要基础数据。随着水利行业信息化建设发展,目前积累了大量水文数据资料。如何充分利用这些长期积累的历史水文数据进行水文分析和预报显得非常重要。
  2. 当前,应用各种计数挖掘蕴藏与历史水文数据中的模型、知识,为水资源管理与调度决策提供科学依据,已成文水文科学发展的新热点。

1 数据挖掘技术及工具

1.1 什么是数据挖掘?

数据挖掘也称为知识发现,是指从大量数据中抽取出那些隐含的、令人感兴趣的、有价值的知识的过程。数据挖掘是数据库技术的深层次应用,可以进一步提高信息资源的使用价值和使用效益,能更好的解决日益复杂多变的决策问题,进一步提高了决策的准确性和可靠性,为科学决策提供依据。

1.2 数据挖掘的过程?

  1. 问题定义
  2. 数据收集及预处理
  3. 模型建立
  4. 结果解释及模型评估
  5. 模型应用

1.3 常用的数据挖掘技术

  1. 分类与预测
  2. 关联分析
  3. 聚类分析
  4. 序列分析及时间序列

1.4 ODM

ODM 是Oracle Database 集成的数据挖掘功能。

在这里插入图片描述
在这里插入图片描述

2 水文数据分析系统功能设计

在这里插入图片描述

  1. 数据获取与清洗:主要是有水文数据获取和数据预处理两部分。采用水文历史数据作为系统的源数据。由于源数据的不完整性,其中存在大量的空值、噪声数据和不规范数据,因此在进行数据挖掘前必须对其进行空值处理、极端数据处理等预处理,为下一阶段的数据挖掘提供高质量的、清洁的数据。
    在这里插入图片描述
    在这里插入图片描述

3 系统实现与应用

3.1 数据获取与清理

原始数据采用江西省鄱阳湖地区4个重要的水文站点:星子、都昌、棠荫、龙口从1960年到2009年的历史水位数据。这4个测站的历史水位数据丰富并且在事实上各站点的水位之间存在一.定的相互关系,这为水文数据挖掘提供了很好的挖掘对象。

数据的预处理。经过检查,原始数据中存在大量的空值、噪声数据和重复值,因此采用如下方法进行预处理:

对于重复值,直接删除这些重复的记录;对于不是大规模连续出现的空值,采用求15日均值填充该空值的方法来消除;
对于连续的超过5天但不超过一月的空值,采用求临近5年同期平均值填充来消除;
对于连续一个月以上的空值,则删除所有测站同期记录,剔除该月份或年份的所有记录;
对于那些噪声的极端值,则在下一阶段的ODM中进行筛选和替换。

数据预处理之后,根据挖掘问题的定义,重建表结构,将同一时期的龙口、棠荫、都昌、星子T日水位、星子T+1日水位存放于同一记录中。

3.2 模型建立

根据数据源中数据的相互关系,以及数据挖掘的流程,定义问题为发现星子T+1日水位与龙口、棠荫、都昌、星子T日水位之间的关系模型,进而利用龙口、棠荫、都昌和星子T日水位来预测星子站的T+1日水位。

在这里插入图片描述
在这里插入图片描述

4 结语

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/431160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构_第十三关(3):归并排序

目录 归并排序 1.基本思想: 2.原理图: 1)分解合并 2)数组比较和归并方法: 3.代码实现(递归方式): 归并排序的非递归方式 原理: 情况1: 情况2&#…

《剑指大前端全栈工程师》--大前端时代全站式开发,直指大厂P7技术专家

【内容提要】 实力打造大前端时代,走在时代的钱端!   实战驱动教学,探索前端黑科技。紧跟企业实际技术选型,追求技术的实用性与前瞻性完美结合!   本书对大前端技术栈进行了全面的讲解,内容涉及HTML5CS…

AI产品铺天盖地,企业却用不上?

近年来,随着人工智能技术的飞速发展,越来越多的企业开始关注并尝试使用人工智能技术来提高业务效率和降低成本。然而,国内企业使用人工智能技术仍然存在一些困难和问题,主要原因如下: 国外产品不稳定或不安全 目前国内市场上存在许多国外的AI产品,例如ChatGPT、GPT-4等,但这些…

QT CTK控件 CTK开发(二)

CTK 为支持生物医学图像计算的公共开发包,其全称为 Common Toolkit。为医学成像提供一组统一的基本功能;促进代码和数据的交互及结合;避免重复开发;在工具包(医学成像)范围内不断扩展到新任务,而不会增加现有任务的负担;整合并适应成功的解决方案。 本专栏文章较为全面…

教你如何搭建物业-后勤管理系统,demo可分享

1、简介 1.1、案例简介 本文将介绍,如何搭建物业-后勤管理。 1.2、应用场景 该应用包含疫情上报、绿化、安保等管理功能。 2、设置方法 2.1、表单搭建 1)新建表单【返区登记】,字段设置如下: 名称类型名称类型姓名单行文本…

【历史上的今天】3 月 17 日:苹果起诉微软;CN 域名开放注册;赛博朋克之父出生

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 3 月 17 日,在 1958 年的今天,我国第一台黑白电视机诞生。当时,我国电视机研制技术与日本基本处在同一起跑线,是…

四十六、docker-compose部署

一个项目肯定包含多个容器,每个容器都手动单独部署肯定费时费力。docker-compose可以通过脚本来批量构建镜像和启动容器,快速的部署项目。 使用docker-compose部署主要是编写docker-compose.yml脚本。 一、项目结构 不论是Dockerfile还是docker-compo…

如果你想从事人工智能职业,学习Python吧

人工智能并不会抢走你的工作,至少目前还不会。人工智能和机器学习(AI/ML)最好的应用是补充人类的创造力,而不是取代它。具有讽刺意味的是,最好的大型语言模型(LLMs)可能是通过使用受版权保护的人…

本地环境配置自签名HTTPS证书

在本地使用的线上的https证书的话,每三个月需要更新一次比较繁琐,用本地证书也可以满足调试需求也会方便许多 下载签名工具: https://github.com/FiloSottile/mkcert/releases/tag/v1.4.4 根据需求下载对应系统的版本,以64位的win…

有奖征文|小鱼再进化!OceanBase 4.1免费体验

OceanBase 4.0(小鱼)的首次亮相是在 2022 年 8 月,作为业内首个单机分布式一体化架构的数据库,4.0 版本兼顾了分布式架构的扩展性和集中式架构的性能优势,在同等硬件条件下实现单机性能赶超集中式数据库的同时&#xf…

【分享】群报数入驻集简云平台,实现无代码集成数百款应用

群报数介绍 群报数是一款人人可用的轻量化统计小程序,支持填表、报名、接龙、预约、打卡、问卷、通知等多种场景。 群报数集简云使用场景 企业的用户信息,人才信息往往在很多不同的系统里,比如CRM系统,客服系统,人力…

打造智慧医疗新生态:互联网医院系统源码分析

在数字化时代,医疗行业也在不断地探索新的模式和方法,以更好地服务于人民群众。互联网医院系统作为一种新型医疗服务模式,受到了广泛的关注和热议。下文,小编将为大家介绍互联网医院系统的概念、特点以及如何利用互联网医院系统源…

Rhodamine-PEG-NH2,罗丹明-聚乙二醇-氨基的结构式,一文了解RB-PEG-NH2的使用

RB-PEG-NH2,罗丹明-聚乙二醇-氨基 中文名称:罗丹明-聚乙二醇-氨基 英文名称:RB-PEG-NH2 性状:粉红色/红色固体或者粘稠液体,取决于分子量大小。 溶剂:溶于水和常规性有机溶剂 激发/发射波长:570nm/590…

开源周报第 89 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 Databend v1.1 …

【Mybatis源码分析】Mybatis中的反射(MetaObject)详细讲解

Mybatis中的反射 一、引入MetaObject二、MetaObject 源码分析1. 使用MetaObject 三、BeanWrapper源码分析1. MetaClass2. ReflectorFactory3. Reflector 四、总结 一、引入MetaObject 在使用Mybatis,编写DQL语句时,查询结果可能会是多个,多变…

Java实现图片验证码功能

文章目录一、背景二、实现步骤1、maven中加入依赖2、CaptchaController.java3、生成验证码配置4、CaptchaService.java接口5、CaptchaServiceImpl.java实现类6、增加验证码校验涉及文件一、背景 在实现登录功能时,为了防止特定的程序暴力破解,一般为了安…

使用DevExpress22.X(Patch)控件库在VisualStudio2022使用C#进行Winform、WPF应用的开发,看这一篇就够了!

写在开头,Dev Express是个十分强大的控件库(下文简称Dev),但碍于其高昂的使用费用,“出于学习目的”,我们一般使用的都是Patch版本(在版权意识日趋加强的当下,不要提那两个字&#x…

面试题React

1.React Fiber是什么? 在 React V16 将调度算法进行了重构, 将之前的 stack reconciler 重构成新版的 fiber reconciler,变成了具有链表和指针的 单链表树遍历算法。通过指针映射,每个单元都记录着遍历当下的上一步与下一步&…

接口测试用例编写和接口测试模板

一、简介 接口测试区别于传统意义上的系统测试,下面介绍接口测试用例和接口测试报告。 二、接口测试用例模板 功能测试用例最重要的两个因素是测试步骤和预期结果,接口测试属于功能测试,所以同理。接口测试的步骤中,最重要的是将…

149.网络安全渗透测试—[Cobalt Strike系列]—[HTTP Beacon重定器/代理服务器/流量走向分析]

我认为,无论是学习安全还是从事安全的人多多少少都会有些许的情怀和使命感!!! 文章目录一、Cobalt Strike 重定器1、Cobalt Strike 重定器简介2、重定器用到的端口转发工具二、cobalt strike重定器实验1、实验背景2、实验过程3、流…