VB 数据质量诊断软件(分析数据的完整性,合理性,准确性)-139-(代码+程序说明)

news2024/11/27 8:26:20


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

前言:

为何口出狂言,作任何VB和ASP的系统, 这个就是很好的一个证明 :) 又有些狂了...

 数据库操作谁都会,接触的多了也没什么难的,VB编程难在哪?算法上,这个是一个算法题的毕业设计

哈哈忙活了足足有一○小时,  大多数毕业设计都是 数据库编程... 你这个是个算法很累脑子哈哈,不过也摆平了.

样子有些像外挂, 跟句您的设定检查每个字段的 数据类型,或是EXCEL的每个列 下面有截图 请查看 条件设置写在程序里了,当然若写程序动态的 ,这个就真正成为了一个数据质量分析的工具了,没去研究他, 因为不知道写出来是否 会有人去用他, 这里只是一个毕业设计 下面有源码的截图

本系统不单单是个毕业设计,而且是一个产品,当然您若有兴趣将他继续新增功能, 可以跟我联系,我可以按您的要求去修改,或是专门给您定做,  您获得代码后也可以自己改, 没有什么版权 :) 
既然放上来了, 就当他是毕业设计出售了 :) 

联系方式在网页的最下方  

  

要求

数据质量诊断软件设计要求

目标:该软件主要是为了帮助企业对其拥有的数据库中的数据质量做一个诊断。可以很直观地告诉诊断出数据质量状态。

软件功能设定:

1.  数据读取: 读取不同的数据库中的数据:

数据格式:DELIMITED(包括TABLE,COMMA,SPACE。。。)

         EXCEL/ACCESS,DBF,MS SQL/SYBASE/ORACLE/IBM DB2

操作系统:Windows为主,如果能够兼容别的操作系统更好Unix,LINUX

2.  数据转换:读取的数据会存在数据的字段名称不统一的问题。如zip code,不同的公司有不同命名方法,可以是ZIP,zip_code,yzbm,yb,postal_code。需要把这些字段匹配到软件中的标准字段中

3.  数据字段:软件只关注比较重要的字段的诊断。这些关键的字段包括:

a)    直邮相关联的字段:

Zip:- 邮政编码(6位数字以文本存储)

State::省份(至少2个中文)

City: 城市(至少2个中文)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

b)    电子邮件相关联字段:

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式)

c)    手机相关联的字段:

Mobile: 手机号码或者小灵通

d)    电话相关联的字段:

Area_code: 电话区号 (3位数字以文本形式存在)

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

e)    传真相关联的字段:

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

f)     其他字段:
反映其他重要意义的字段,比如:
性别,年龄,职业,收入,

行业,所有制,开业年限,员工人数,销售额,

4.  完整性诊断:软件主要要实现对以上字段的完整性检验,然后反馈回一个结果。

5.  完整性诊断规则:如何检验数据的完整性,规则如下

1. 如果字段的值为空,那结果是Missing,输出结果有个空和非空的比例

2. 如果字段的值为非空,那么检查完整性,结果可以是非空并且完整和非空不完整2个结果:

Zip:- 邮政编码(6位数字以文本形式存在)

State::省份(至少2个中文 – 可以有31个省的名称列表来判断,它们是:北京 上海 江苏 浙江 安徽 湖北

江西 黑龙江 吉林 辽宁 天津 内蒙古

河北 山东 山西 河南 广东 广西

海南 福建 湖南 新疆 西藏 青海

四川 重庆 云南 贵州 陕西 甘肃

宁夏)

City: 城市(至少2个中文 – 或者把中国的城市和省以及电话区号的对照表,这样可以做相关性检查)

Address_1: 地址1(至少6个中文或10个单字节)

Address_2: 地址2(没有限制)

Address_3: 地址3 (没有限制)

Email: 电子邮件(主要做格式的有效性检查,可以用正则表达式:

'/\w[-.\w]*\@[-\w]+(\.[-\w]+)*\.(com|edu|gov|int|mil|net|org|biz|info|name|museum|coop|aero|[a-z][a-z])/ '),如果正则表达式算法不容易实现,可以是:

必须有@, @的位置不能在前3个字节,前三个字节是字母或者下划线

Mobile: 手机号码或者小灵通(手机号码是11位,小灵通是7位或8位)

Area_code: 电话区号 (3位或4位数字以文本形式存在,但是有的公司的数据对电话的格式并没要求,并不一定是区号+电话号码+分机,这个在数据倒入需要考虑解决,或者在对这个字段的判定上需要有所改变,比如: 最少7位,最多17位(包括区号,电话和分机))

Phone:电话号码 (7位数字或8位数字以文本形式存在)

Phone_Extention: 分机号码 (没有限定)

FAX:传真号码(7位数字或8位数字以文本形式存在)

FAX_Extention: 分机号码 (没有限定)

******************************

 报告生成日期:2006-5-28 22:12:34


数据表名称为: Sheet$
数据表总记录数为:6062
统计信息如下************************

******************************
字段名: [ZIPCODE]
邮件检查
合法邮件记录数为:0
占总数:0%

电话小灵通传真号检查
合法记录数为:6057
占总数:99.92%

区号检查
合法记录数为:0
占总数:0%

性别检查
合法记录数为:591
占总数:9.75%

空字符检查
合法记录数为:591
占总数:9.75%

字符长度检查
合法记录数为:0
占总数:0%

******************************

**************************..


转载地址http://www.3q2008.com/soft/search.asp?keyword=139

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1511345.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024年最新阿里云和腾讯云云服务器价格租用对比

2024年阿里云服务器和腾讯云服务器价格战已经打响,阿里云服务器优惠61元一年起,腾讯云服务器61元一年,2核2G3M、2核4G、4核8G、4核16G、8核16G、16核32G、16核64G等配置价格对比,阿腾云atengyun.com整理阿里云和腾讯云服务器详细配…

C语言 ——关键字

关键字:在C语言中被赋予了特定含义的英文单词,一共有32个关键字 * 关键字全部小写 * 在特定的编译器中,关键字是高亮显示的 vs:蓝色或者紫色 vs:蓝色 下图圈起来的都是关键字 c auto break case char const con…

Kafka消费者重平衡

「(重平衡)Rebalance本质上是一种协议,规定了一个Consumer Group下的所有Consumer如何达成一致,来分配订阅Topic的每个分区」。 比如某个Group下有20个Consumer实例,它订阅了一个具有100个分区的Topic。 正常情况下&…

【C语言】如何规避野指针

✨✨ 欢迎大家来到莉莉的博文✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 目录 一、概念: 二、野指针成因: 2.1. 指针未初始化 2.2 指针越界访问 3. 指针指向的空间释放 三、如何规避野指针 3.…

MT6771 android13 自定义背光曲线

一. Android系统源码中的参数配置 MTK6771平台MTK重写了背光曲线的参数,路径在s0_vnd/vendor/mediatek/proprietary/packages/overlay/vendor/FrameworkResOverlayExt/brightness_adaptive_support/res/values/config.xml 不过MTK的其他平台可能不是在这个路径 来看…

C/C++语言学习基础版(一)

目录 一and二、C语言说明 注释: 1、声明语句 2、输出函数 3、return 语句 三、C语言的数据结构 1、常量与变量 2、基本数据结构 3、关键字 练习:进制转换 四、基本输入输出 1、字符输出函数putchar 2、字符输入函数getchar 3、格式化输出函…

JavaParser的快速介绍

开发的工作主要是写代码, 有考虑过使用代码写代码, 使用代码分析和改进代码吗? JavaParser 就可以帮你用来处理Java 代码的这些功能。 Java Parser 的介绍 Java Parser是一个用于解析和分析Java源代码的开源工具。它提供了一个API接口&…

VMware ESXi 6.7.0 开启SNMP服务

VMware ESXi 6.7.0 开启SNMP服务,操作步骤如下: 1、用root账户,登录VMware ESXi 6.7.0 2、开启SSH服务 Host->Actions->Services->Enable Secure Shell(SSH) 主机->操作->服务->启用安全Shell(SSH) 3、登录SSH&#xff…

抽象工厂模式——创建型模式

抽象工厂模式——创建型模式 抽象工厂模式是一种软件设计模式,它解决了在创建一组相关或相互依赖的对象时的一些核心问题。其核心问题包括: 对象的创建与使用分离: 抽象工厂模式通过引入抽象工厂接口以及具体工厂类,将对象的创建与…

如何在Linux使用docker安装Plik并实现无公网ip上传下载内网存储的文件资源

文章目录 1. Docker部署Plik2. 本地访问Plik3. Linux安装Cpolar4. 配置Plik公网地址5. 远程访问Plik6. 固定Plik公网地址7. 固定地址访问Plik 正文开始前给大家推荐个网站,前些天发现了一个巨牛的 人工智能学习网站, 通俗易懂,风趣幽默&…

python学习1:csv模块、time模块、random、jieba、worldcloud、pycharm的虚拟环境认识、black格式化文件

标准库与第三方库 模块(modules):是包含python函数和变量的文件,名称符合Python标识符要求,并使用.py后缀 包(package):是包含其他模块、包的文件夹。名称符合Python标识符要求&am…

第三百九十八回

文章目录 1. 概念介绍2. 使用方法3. 示例代码 我们在上一章回中介绍了通道相关的内容,本章回中将介绍StreamProvider组件.闲话休提,让我们一起Talk Flutter吧。 1. 概念介绍 在Flutter中Stream是经常使用的组件,对该组件的监听可void main()…

【C++】STL(五) Stack Queue容器

5、 stack容器 5.1 简介 ① stack是一种先进后出的容器,它只有一个出口。 ② 栈中只有顶端的元素才可以被外界使用,因此栈不允许有遍历行为。 ③ 栈中进入数据称为:入栈 push ④ 栈中弹出数据称为:出栈 pop 5.2 常用接口 …

ansible-playbook的角色(role)

1前言 角色目录如下(分别为httpd角色和nginx角色) handlers/ :至少应该包含一个名为 main.yml 的文件; 其它的文件需要在此文件中通过include 进行包含 vars/ :定义变量,至少应该包含一个名为 main.yml 的…

如何使用US Domain Center和WordPress搭建非营利组织网站的详细指南

在今天的数字化时代,拥有一个专业、易于管理和更新的网站对于非营利组织(例如慈善机构、NGO等)至关重要。WordPress是一个功能强大且易于使用的网站构建平台,而美国域名中心 US Domain Center:US Domain Center 则是一…

Ansys Zemax | 如何获取公差报告中的任何优化操作数值

附件下载 联系工作人员获取附件 此文为上一篇文章“如何执行非序列公差分析”’的文末提到的详细介绍。 本文介绍如何使用 OpticStudio 的公差脚本功能在公差报告中包含任何优化操作数值,以及如何编写简单的公差脚本。 简介 在对系统进行公差处理时,…

C语言数据结构之堆排序

青衿之志 履践致远 堆排序(Heapsort) 是指利用 堆 这种数据结构所设计的一种排序算法,它是 选择排序 的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。 🎥二叉堆 🎥二叉树 🔥期待小伙伴们…

GIS瓦片3-WMTS瓦片

介绍 WMTS( Web Map Tile Service)切片地图Web服务(OpenGIS Web Map Tile Service)当前最新版本是1.0.0。WMTS标准定义了一些操作,这些操作允许用户访问切片地图。WMTS可能是OGC首个支持RESTful访问的服务标准。 WMTS提供了一种采用预定义图…

​LeetCode解法汇总1261. 在受污染的二叉树中查找元素

目录链接: 力扣编程题-解法汇总_分享记录-CSDN博客 GitHub同步刷题项目: https://github.com/September26/java-algorithms 原题链接:. - 力扣(LeetCode) 描述: 给出一个满足下述规则的二叉树&#xff1…

【脚本玩漆黑】全自动赚金珠

文章目录 脚本思路 项目结构: 由橙华市全自动战斗改写的。大部分代码都不用修改。 金珠脚本money.py 土狼犬图片,区域选择土狼犬。 战斗废话的像素值,选择右下角一片深绿色。 战斗画面的像素值,和之前一样,取背景中的…