基于神经网络的手写汉字提取与书写评分系统研究

news2024/9/30 5:30:43

相关源码和文档获取请私聊QQ:3106089953

论文目录结构

目 录
摘 要 I
Abstract II
目 录 IV
第1章 绪论 1
1.1. 研究背景与意义 1
1.2. 国内外研究现状 2
1.2.1. 文本定位技术研究现状 2
1.2.2. 手写汉字识别研究现状 3
1.2.3. 汉字书写质量评价方法研究现状 4
1.3. 本文所做工作 4
1.4. 论文结构安排 5
第2章 系统需求分析及概要设计 6
2.1. 可行性分析 6
2.2. 系统用例分析 7
2.2.1. 用例表设计 7
2.3. 功能需求分析 9
2.4. 性能需求分析 10
2.5. 系统总体设计 10
2.5.1. 系统总体架构设计 10
2.5.2. 系统功能模块设计 12
2.6. 相关技术介绍 13
2.6.1. Android系统 13
2.6.2. OpenCV视觉库 14
2.6.3. TensorFlow开源库 14
2.7. 本章小结 14
第3章 系统详细设计及实现 16
3.1. 系统模块详细设计 16
3.2. 笔画提取模块 16
3.2.1. 单帧图像的疑似笔画像素点检测 17
3.2.2. 基于帧差法的笔画增长点检测 19
3.2.3. 笔画切换点检测与单笔画的提取 20
3.3. 基本笔画识别模块 22
3.3.1. 汉字的基本笔画 22
3.3.2. LeNet-5网络 23
3.4. 书写评分模块 25
3.4.1. 重心特征 27
3.4.2. 网格特征 27
3.4.3. 整字综合评分 27
3.5. 系统UI界面 28
3.6. 本章小结 30
第4章 系统性能测试 31
4.1. 测试的意义与方法 31
4.2. 运行性能测试 32
4.2.1. 测试设备 32
4.2.2. 测试环境 32
4.3. 本章小结 33
总结 34

论文工作总结 34
工作展望 34
参考文献 35
致谢 37

相关目录的具体内容

2.3.功能需求分析
系统的用例分析是从用户操作的角度对系统进行设计,对于系统的功能需求分析,是以开发者的角度进行设计,即对系统的用例图及用例描述进行详细定义与描述,给开发人员作为参考。所有功能均与系统用例一一对应。
1)录制书写过程
该功能通过用户点击按钮触发,软件获取系统摄像头使用权限,开启摄像头,进行视频录制,直至用户点击按钮结束录制。输出mp4多媒体格式文件并传递给下一模块。
2)报告书写正确性
该功能触发前,需要用户输入书写的汉字,以供系统使用相应的模板特征数据与输入数据进行对比分析。系统对录制好的书写过程视频进行计算,提取出单一笔画,通过笔画识别、特征比对等方式得到书写正确性结果。书写正确性包括笔画类型、笔画位置、笔画顺序等方面的正确性。报告结果在文本框中以文本方式显示。后台给出笔画状态编码列表,前端对其映射得到对应文本。
3)显示书写改正建议
该功能依赖于报告书写正确性功能的分析结果。改正建议类型与正确性类型相对应,因此同样使用映射得到对应的建议文本,在前端的文本框中显示。
4)显示书写评分
该功能与报告书写正确性、显示书写改正建议一同显示。后台对单一笔画、整字分别通过特征比对法计算评分,最后将其权值相加以百分制形式给出用户的综合书写评分。
2.4.性能需求分析
系统的功能需求仅仅可以确定系统的任务,但是为了让系统的能够更长久且无误的运行,还需要进行系统的性能需求分析。系统的性能需求是按照系统的功能需求以及系统本身的特性所设定的。将从系统的开发、系统的运行以及部署等多个方面,进行性能的提取。当系统的性能满足需求后,系统的生命周期才会满足预估,且也会使得系统的功能更加完备。
1.可靠性
系统需要具备一定的可靠性,即用户完成视频输入后,在设备运行内存充足的情况下,系统应该在5秒内完成计算,给出反馈结果。
2.容错性
用户在进行功能操作时,若输入了错误的数据,如用户在汉字书写过程中,出现连笔、错字的情况等,用户在输入信息时输入了错误的形式信息后,系统不会自动闪退或崩溃,而是将这些错误情况进行捕捉,并显示哪里出错,让用户进行及时更改。
3.可维护性
系统需要具备一定的可维护性,随着后续的算法优化与替换,书写评价功能的增加等,所有的模块均应该是可维护的,且可增加、替换或者删除的,系统在设计过程中需要达到高内聚低耦合的状态。
2.5.系统总体设计
2.5.1.系统总体架构设计
系统总体架构设计是指按照多种角度进行分层,本系统的总体架构如图2-2所示。系统可分为访问层、前端UI、业务层、数据层及基础设施层[15]。
对于访问层,有Android移动端及安卓用户作为终端。系统的所有功能均是通过这一硬件进行数据计算与显示的。
前端UI对应系统的页面展示与用户交互,该系统部署在App端,使用Android操作系统,以PyQt5作为GUI开发框架,本文转载自http://www.biyezuopin.vip/onews.asp?id=14866需要完成对Activity的编写以及Video的读写。
系统的业务层是将系统的功能以业务逻辑的形式展示在系统的总体架构图中。对于用户,主要包含录取视频、选择汉字等业务逻辑功能。对于后台的业务逻辑主要包含视频录制模块、书写评价模块,其中视频录制模块包括录取视频,书写评价模块包括笔画提取、笔顺判别、文本定位与切割、书写评分等功能。
数据层主要包含了数据的存储过程、数据缓存、文件读写等数据操作。
基础设施层对应了系统的物理架构所需要的硬件设备,包括操作系统、摄像头、CPU等。

部分代码展示

import cv2
import sys
import numpy as np
from matplotlib import pyplot as plt
import pickle
from text_location import *

char_feat_path = './utils/character_feature_dict'
stroke_feat_path = './utils/stroke_feature_dict'

def gravity_core(img):  # 计算汉字的重心特征向量
    '''
    计算汉字的重心特征向量
    ----------
    :param img [ndarray]: 笔画二值图像,笔画为白色
    :return [list]: 归一化的重心坐标
    :return [list]: 绝对重心坐标
    '''
    h, w = img.shape
    x_axis = 0
    y_axis = 0
    total = np.sum(img[:, :])
    for row in range(h):
        y_axis += row * np.sum(img[row, :])
    Gy = y_axis / total
    for col in range(w):
        x_axis += col * np.sum(img[:, col])
    Gx = x_axis / total
   #除是进行了归一化处理,消除了输入图像分辨率的差异对评分的影响
    return [Gx/w, Gy/h], [Gx, Gy]


def grid_vector(img, n_divide = 3):   # 计算图像的网格特征向量
    '''
    计算汉字的网格特征向量
    ----------
    :param img [ndarray]: 笔画二值图像,笔画为白色
    :param n_divide [int]: 
    :return [list]: 
    '''
    w, h = img.shape
    spanX = int(w/n_divide)
    spanY = int(h/n_divide)
    grid_area = spanX * spanY
    left_border = 0
    up_border = 0

    grid_vector = []
    #求出每一个矩阵的特征值
    for row in range(n_divide):
        left_border = 0
        for col in range(n_divide):
            white_num = np.sum(img[up_border:up_border+spanY, left_border:left_border+spanX])
            #在这个矩形之中 一共有多少个方格是有白色像素的,然后除以这个矩形的面积
            grid_vector.append(white_num / grid_area)
            left_border += spanX
        up_border += spanY

    return grid_vector

def cosine_similarity(vec1, vec2):
    '''
    计算向量余弦相似度
    ----------
    :param vec1 [list]: 向量1,元素应为可计算数值
    :param vec2 [list]: 向量2,元素应为可计算数值
    :return [float]: 相似性数值,取值范围为[-1,1]
    '''
    #求余弦相似度的公式
    sim = np.dot(vec1, vec2) / (np.linalg.norm(vec1)*np.linalg.norm(vec2))
    return sim

def stroke_score(stroke_list, char_id, dict_path, gravity_ratio=0.2):
    '''
    根据单笔画分别评分
    ----------
    :param img [ndarray]: 笔画二值图像列表,笔画为白色
    :param char_id [str]: 汉字编号
    :param dict_path [str]: 模板特征字典文件路径
    :param gravity_ratio [float]: 重心特征评分所占比例,为0到1之间的值
    :return [float]: 笔画评分
    '''
    if gravity_ratio>1.0 or gravity_ratio<0:
        print("单笔画重心评分比例错误,应为0到1之间的值")
        gravity_ratio = 0.2
    grid_ratio = 1.0 - gravity_ratio
    pattern_feat = []
    score = []

    with open(dict_path, 'rb') as f:
        dict = pickle.load(f)
        pattern_feat = dict[char_id]
        if len(pattern_feat):
            if len(pattern_feat)==len(stroke_list):
                for i in range(len(pattern_feat)):  # 对每个笔画分别计算特征向量,计算评分
                    gravity, _ = gravity_core(stroke_list[i])   #重心特征
                    grid = grid_vector(stroke_list[i])              #网络特征
                    gravity_similarity = cosine_similarity(gravity, pattern_feat[i][0])
                    grid_similarity = cosine_similarity(grid, pattern_feat[i][1])

                    # test
                    print("单笔画重心评分", gravity_similarity)
                    print("单笔画网格评分", grid_similarity)
                    print()
                    # 这是笔画的评分
                    score.append(gravity_similarity * gravity_ratio + grid_similarity * grid_ratio)
                return np.mean(score)
            else:
                print("【ERROR】 笔画图片数量与模板不一致!")
                sys.exit(0)
                return -1
        else:
            print("模板数据丢失!")
            return -1
#上面是检测单个笔画的,这个是整个字的,用的方法是一模一样
def char_score(char_img, char_id, dict_path, gravity_ratio=0.2):
    '''
    对整字进行评分
    ----------
    :param img [ndarray]: 汉字二值图像,文字部分为白色
    :param char_id [str]: 汉字编号
    :param dict_path [str]: 模板特征字典文件路径
    :param gravity_ratio [float]: 重心特征评分所占比例,为0到1之间的值
    :return [float]: 整字评分
    '''
    if gravity_ratio>1.0 or gravity_ratio<0:
        print("单笔画重心评分比例错误,应为0到1之间的值")
        gravity_ratio = 0.2
    grid_ratio = 1.0 - gravity_ratio
    
    with open(dict_path, 'rb') as f:
        dict = pickle.load(f)
        pattern_feat = dict[char_id]
        if len(pattern_feat):
            gravity, _ = gravity_core(char_img)
            grid = grid_vector(char_img)
            gravity_similarity = cosine_similarity(gravity, pattern_feat[0])
            grid_similarity = cosine_similarity(grid, pattern_feat[1])
            
            # test
            print("整字重心评分", gravity_similarity)
            print("整字网格评分", grid_similarity)
            print()

            return (gravity_similarity * gravity_ratio + grid_similarity * grid_ratio)
        else:
            print("模板数据丢失!")
            return -1

def aesthetic_score(stroke_list, char_id):
    '''
    计算汉字的书写质量综合评分
    ----------
    :param stroke_list [list]: 笔画二值图像列表,笔画为白色
    :return [float]: 书写评分
    '''
    # 计算单笔画评分
    strokes_score = stroke_score(stroke_list, char_id, stroke_feat_path)
    # 计算整字评分
    char_img = img_merge(stroke_list)
    character_score = char_score(char_img, char_id, char_feat_path)

    # 权值相加得到综合评分
    stroke_ratio = 0.5
    char_ratio = 1.0 - stroke_ratio
    final_score = strokes_score * stroke_ratio + character_score * char_ratio

    return final_score

if __name__ == '__main__':
    stroke_list = []
    for i in range(4):
        img = cv2.imread("./test_video/strokes/" + str(i) + ".jpg")
        img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        stroke_list.append(img)
    stroke_list = text_location(stroke_list)    # 文本定位与切割

    score = aesthetic_score(stroke_list, '0750')
    print(score)

项目运行图片展示

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1363222.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

OS_lab——bochs源码的编译与安装

1. 实验环境VMware station 15 Ubuntu 14.04.6 32位。2. 实验步骤2.1 安装虚拟机&#xff0c;并在虚拟机根目录下编译并安装bochs环境。 2.2 使用bochs自带工具bximage创建虚拟软驱。 2.3 编写引导程序boot.asm并用nasm编译得到引导文件boot.bin和boot.com。 2.4 修改bochs…

Hadoop分布式文件系统(二)

目录 一、Hadoop 1、文件系统 1.1、文件系统定义 1.2、传统常见的文件系统 1.3、文件系统中的重要概念 1.4、海量数据存储遇到的问题 1.5、分布式存储系统的核心属性及功能含义 2、HDFS 2.1、HDFS简介 2.2、HDFS设计目标 2.3、HDFS应用场景 2.4、HDFS重要特性 2.4…

性能分析与调优: Linux 安装基于BPF的bcc-tools系统性能工具库

目录 一、实验 1.环境 2.agent服务器安装使用ELRepo安装依赖包 3.agent服务器安装基于BPF的bcc-tools系统性能工具库 二、问题 1.安装bcc-tools后执行命令报错 一、实验 1.环境 &#xff08;1&#xff09;主机 表1-1 主机 主机架构组件IP备注prometheus 监测 系统 pro…

【C++】- 类和对象(!!C++类基本概念!this指针详解)

类和对象 引入类类的定义类的访问限定操作符类的作用域类的实例化类对象模型this指针 引入类 在 C中&#xff0c;引入了一个新的定义----------类。类是一种用户自定义的数据类型&#xff0c;用于封装数据和行为。类可以看作是一个模板或蓝图&#xff0c;描述了一组相关的数据和…

JVM虚拟机的垃圾回收器(面试题)

1.什么是垃圾回收 垃圾回收主要说的是java会自动把程序在运行过程中产生的一些没有用的对象给回收掉&#xff0c;这样可以避免内存的浪费。 java主要是通过一个叫“根可达”的算法来识别这个对象是否可以被回收的&#xff0c;然后回收的算法也主要有三种&#xff1a;标记清除&a…

QT c++和qml交互实例

文章目录 一、demo效果图二、c和qml交互的基本方式1、qml访问C类对象 三、关键代码1、工程结构图2、c代码MainWindow.cppMainQuickView.cppStudentInfoView.cppStudentInfoModel.cpp 3、qml代码main.qmlMainQuickTopRect.qmlMainQuickMiddleRect.qmlMainQuickMiddleTableRect.q…

服务器cpu占用很高如何排查问题

前段时间&#xff0c;运维监控发现有个项目cpu占用很高&#xff0c;并且还在持续不断增长&#xff0c;服务不能正常响应&#xff0c;如下图&#xff1a; 在服务器上面安装了arthas&#xff0c;下载地址&#xff1a; https://alibaba.github.io/arthas/arthas-boot.jar 我使用了…

Linux stm32串口下载程序

一、工具 使用stm32flash进行串口下载 二、stm32flash安装 sudo apt-get install stm32flash 三、查看串口设备名称 先拔掉串口运行下面指令&#xff0c;获得所有设备名称,插上串口再运行一次&#xff0c;新增的就是串口设备名称&#xff0c;记住串口设备名称&#xff0c;以…

【信息论与编码】习题-判断题-第一部分

目录 判断题1. 对于N个对立并联信道&#xff0c;其信道容量CN2. 汉明码是一种线性分组码。3. 某一信源&#xff0c;不管它是否输出符号&#xff0c;只要这些符号具有某些概率特性&#xff0c;就有信息量。4. 若检错码的最小距离为dmin&#xff0c;则可以检测出任意小于等于dmin…

集团企业OA办公协同平台建设方案

一、企业对协同应用的需求分析 实现OA最核心、最基础的应用 业务流转&#xff1a;收/发文、汇报、合同等各种审批事项的业务协作与办理 信息共享&#xff1a;规章制度、业务资料、共享信息资源集中存储、统一管理 沟通管理&#xff1a;电子邮件、手机短信、通讯录、会议协作等…

期货日数据维护与使用_日数据维护_日数据更新

目录 写在前面&#xff1a; 下载日数据 下载“新增合约”日数据 下载“待更新合约”日数据 日数据文件 “选择日数据所在目录”按钮点击 “执行”按钮点击 sqlite3代码 按钮点击后执行的代码 子线程代码 写在前面&#xff1a; 本文默认已经创建了项目&#xff0c;如…

Archlinux下自启动rclone mount

路径&#xff1a; /etc/systemd/system/rclonemount.service [Unit] Descriptionrclonemount Requiresnetwork-online.target.wants Afteralist.service[Service] Typesimple ExecStartPre/bin/mkdir -p /media ExecStart/usr/bin/rclone mount \aliyun: /media \--config /ro…

Docker学习与应用(五)-DockerFile

1、DockerFile 1&#xff09;DockerFile介绍 dockerfile是用来构建docker镜像的文件&#xff01;命令参数脚本&#xff01; 构建步骤&#xff1a; 1. 编写一个dockerfile文件 2. docker build 构建称为一个镜像 3. docker run运行镜像 4. docker push发布镜像&#xff08;D…

2024最新前端源码分享(附效果图及在线演示)

分享10款非常有趣的前端特效源码 其中包含css动画特效、js原生特效、svg特效以及小游戏等 下面我会给出特效样式图或演示效果图 但你也可以点击在线预览查看源码的最终展示效果及下载源码资源 粒子文字动画特效 基于canvas实现的粒子文字动画特效 会来回切换设定的文字特效 图…

Docker学习与应用(四)-容器数据卷

1、容器数据卷 1&#xff09;什么是容器数据卷 docker的理念回顾 将应用和环境打包成一个镜像&#xff01; 数据&#xff1f;如果数据都在容器中&#xff0c;那么我们容器删除&#xff0c;数据就会丢失&#xff01;需求&#xff1a;数据可以持久化 MySQL&#xff0c;容器删…

java推荐系统:好友推荐思路

1.表的设计 表里面就两个字段&#xff0c;一个字段是用户id&#xff0c;另外一个字段是好友id&#xff0c;假如A跟B互为好友&#xff0c;那在数据库里面就会有两条数据 2.推荐好友思路 上面的图的意思是&#xff1a;h跟a的互为好友&#xff0c;a跟b&#xff0c;c&am…

webgl调试之排查内存泄漏

内存泄漏自然而然是要看内存是不是涨了 然后我们如何确认泄露了呢&#xff0c;我们需要把代码梳理清楚&#xff0c;知道哪个时机&#xff0c;在delete&#xff0c;在create&#xff0c;那么这个时候&#xff0c;按道理&#xff0c;delete了n个对象&#xff0c;create了N个对象&…

[Excel]如何找到非固定空白格數列的條件數據? 以月份報價表單為例

在群組中看到上述問題&#xff0c;研判應是一份隨月份變動的產品報價表單&#xff0c;空白欄可能表示該月份價格與上個月份一致。這個問題是需要取得最近一次單價和倒數第二次單價&#xff0c;常用且實務的excel案例值得紀錄。 最近一次單價: INDEX($B2:$G2,1,LARGE(IF(ISBLAN…

贯穿设计模式-享元模式思考

写享元模式的时候&#xff0c;会想使用ConcurrentHashMap来保证并发&#xff0c;没有使用双重锁会不会有问题&#xff1f;但是在synchronize代码块里面需要尽量避免throw异常&#xff0c;希望有经验的同学能够给出解答&#xff1f; 1月6号补充&#xff1a;没有使用双重锁会有问…

【Qt- C++ Qml 交互】

Qt编程指南 VX&#xff1a;hao541022348 ■ 将C对象注册到 QML中&#xff0c;在QML使用C对象&#xff08;Q_INVOKABLE宏&#xff09;■ C对象注册到元对象系统■ Q_INVOKABLE 宏■ 演示步骤 ■ 将C对象注册到 QML中&#xff0c;在QML使用C对象&#xff08;Q_PROPERTY宏 属性绑定…