2024妈妈杯数学建模B题思路-甲骨文智能识别中原始拓片单字自动分割与识别研究

news2025/1/13 17:33:02

# 1 赛题
B 题 甲骨文智能识别中原始拓片单字自动分割与识别研究
甲骨文是我国目前已知的最早成熟的文字系统,它是一种刻在龟甲或 兽骨上的古老文字。甲骨文具有极其重要的研究价值,不仅对中国文明的 起源具有重要意义,也对世界文明的研究有着深远影响。 在我国政府的大 力推动下,甲骨文研究已经进入一个全新的发展阶段。 人工智能和大数据 技术被应用于甲骨文全息性研究及数字化工程建设,成为甲骨文信息处理领域的研究热点[1]。

甲骨文拓片图像分割是甲骨文数字化工程的基础问题,其目的是利用 数字图像处理和计算机视觉技术, 在甲骨文原始拓片图像的复杂背景中提 取出特征分明且互不交叠的独立文字区域。它是甲骨文字修复、 字形复原 与建模、文字识别、拓片缀合等处理的技术基础[2]。然而,甲骨拓片图像 分割往往受到点状噪声、人工纹理和固有纹理三类干扰元素的严重影响[3]。 且甲骨文图像来源广泛,包括拓片、拍照、扫描、临摹等,不同的图像来 源,其干扰元素的影响是不同的。由于缺乏对甲骨文字及其干扰元素的形 态先验特征的特殊考量,通用的代表性图像分割方法目前尚不能对甲骨文 原始拓片图像中的文字目标和点状噪声、人工纹理、固有纹理进行有效判 别,其误分割率较高,在处理甲骨拓片图像时均有一定局限性。如何从干 扰众多的复杂背景中准确地分割出独立文字区域,仍然是一个重待解决的具有挑战性的问题。

图 1 为一张甲骨文原始拓片的图像分割示例,左图为一整张甲骨文原始拓片, 右图即为利用图像分割算法[4]实现的拓片图像上甲骨文的单字分 割。甲骨文的同一个字会有很多异体字,这无疑增加了甲骨文识别的难度,图 2 展示了甲骨文中“人 ”字的不同异体字。
在这里插入图片描述
在这里插入图片描述
现希望通过对已标记的甲骨文图像进行分析、特征提取和建模,从而 实现对一张新的甲骨文图像进行单个文字的自动分割和识别。具体任务如下:

问题 1:对于附件 1(Pre_test 文件夹) 给定的三张甲骨文原始拓片图 片进行图像预处理,提取图像特征,建立甲骨文图像预处理模型,实现对甲骨文图像干扰元素的初步判别和处理。
问题 2:对甲骨文原始拓片图像进行分析,建立一个快速准确的甲骨 文图像分割模型,实现对不同的甲骨文原始拓片图像进行自动单字分割, 并从不同维度进行模型评估。其中附件 2(Train 文件夹) 为已标注分割的数据集。
问题 3:利用建立的甲骨文图像分割模型对附件 3(Test 文件夹) 中的 200 张甲骨文原始拓片图像进行自动单字分割, 并将分割结果放在“Test_results.xlsx ”中,此文件单独上传至竞赛平台。
问题 4:基于前三问对甲骨文原始拓片图像的单字分割研究, 请采用 合适的方法进行甲骨文原始拓片的文字识别, 附件 4(Recognize 文件夹) 中给出了部分已标注的甲骨文字形(不限于此训练集,可自行查找其他资 料,如使用外部资料需在论文中注明来源),请对测试集中的50 张甲骨文原始拓片图像进行文字自动识别, 并以适当结果呈现。

2 解题思路

B题实际上非常简单,熟悉CV的同学看到这道题肯定眼熟的不行,其实这个题目跟我们CV做烂的车牌识别的套路是一样的,还要不少大大聪明在不断的找甲骨文识别资料,太搞笑了。

预处理部分做滤波和形态学操作就行。

第二问,常用的字符分割方法包括基于阈值的方法、基于连通域的方法、投影法、边缘检测等。

第四问简直和车牌识别中的字符识别一模一样,而且数据集题目还给整理好了,直接VGG16训练就完了。

思路已出

在这里插入图片描述

🥇 最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog

3 选题分析

A题属于目标优化问题,还结合了动态规划问题,别看题目描述的复杂,只要构建好目标函数就能轻松解决

B题这种类型的题目这几年出的还不少呀,就是机器学习或深度学习的图像目标检测

C题是一个典型的运筹学问题,涉及到预测模型的建立和优化排班策略的制定。解决这个问题需要综合运用统计学、机器学习、优化算法等多学科知识。

D题该问题是一个典型的优化问题,需要综合考虑多个因素,如设备性能、矿山条件、成本和风险等

本次建模题目难度(由高到低) B>A>D>C

!!!A君会先出C题思路!!!

4 最新思路更新

🥇 最新思路更新(看最新发布的文章即可):
https://blog.csdn.net/dc_sinor?type=blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1588810.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Arduino 项目笔记 |TH1621 LCD液晶显示屏驱动(SSOP-24封装)

LCD液晶屏资料 LCD液晶屏资料 重要参数: 工作电压: 3V可视角度:1201/4 ,1/3 TH1621 驱动 HT1621 LCD控制驱动芯片介绍 VLCD 和 VCC 电压符合规格书,最好都取3.3V 。电压太高或太低都会出现段码液晶屏乱码的情况&am…

算法学习 | day40/60 单词拆分/多重背包/背包问题总结

一、题目打卡 1.1 单词拆分 题目链接&#xff1a;. - 力扣&#xff08;LeetCode&#xff09; class Solution { public:bool findInVector(vector<string> &w, string& s){for(auto & it : w){if(it s) return true;}return false;}bool wordBreak(string …

第三十八节 Java 多线程编程

Java 给多线程编程提供了内置的支持。一个多线程程序包含两个或多个能并发运行的部分。程序的每一部分都称作一个线程&#xff0c;并且每个线程定义了一个独立的执行路径。 多线程是多任务的一种特别的形式。多线程比多任务需要更小的开销。 这里定义和线程相关的另一个术语&…

第三十七节 Java 发送邮件

Java 发送邮件 使用Java应用程序发送E-mail十分简单&#xff0c;但是首先你应该在你的机器上安装JavaMail API 和Java Activation Framework (JAF) 。 你可以在 JavaMail (Version 1.2) 下载最新的版本。 你可以再 在JAF (Version 1.1.1)下载最新的版本。 下载并解压这些文…

云HIS系统操作指南

医疗(医院&#xff09;机构正式使用云HIS系统之前&#xff0c;要先进行院内基础数据的配置&#xff0c; 主要在数据管理模块中进行&#xff0c;由系统管理员来操作。 机构信息&#xff1a;主要是记录医院的基本信息和机构信息。 科室管理&#xff1a;是用来管理医疗&#xff08…

基于SSM的校园生活管理系统设计与实现(内附设计LW + PPT+ 源码下载)

摘 要 随着现代化发展进程不断的加快&#xff0c;人们对于网络的接受程度越来越强&#xff0c;现在人们的生活与工作已经离不开网络的帮助。而网络在当下的学校中也已经非常的普及&#xff0c;现在各类学校的网络覆盖率已经接近于100%。基于互联网来实现对学校校内的教育、教…

c# wpf datagrid 简单试验

1.概要 datagrid 一个列表类的控件 2.代码 <Window x:Class"WpfApp2.Window3"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d"http://schemas.mic…

Mac电脑安装蚁剑

1&#xff1a; github 下载源码和加载器&#xff1a;https://github.com/AntSwordProjectAntSwordProject GitHubAntSwordProject has 12 repositories available. Follow their code on GitHub.https://github.com/AntSwordProject 以该图为主页面&#xff1a;antSword为源码…

go语言学习--3.常用语句

目录 1.条件语句 1.1 if语句 1.2 if-else语句 1.3 switch语句 1.4 select语句 2.循环语句 2.1循环处理语句 2.2循环控制语句 3.go语言关键字 1.条件语句 和c语言类似&#xff0c;相关的条件语句如下表所示&#xff1a; 1.1 if语句 if 布尔表达式 {/* 在布尔表达式为 t…

软考 — 系统架构设计师 - 嵌入式真题

问题1&#xff1a; 可靠度表示系统在规定条件下&#xff0c;规定的时间内不发生失效的概率。 失效率表示系统运行到此时从未出现失效的情况下&#xff0c;单位时间内系统出现失效的概率 问题 2&#xff1a; 动态冗余又称为主动冗余&#xff0c;通过故障检测&#xff0c;故障定…

[大模型]Qwen1.5-4B-Chat WebDemo 部署

Qwen1.5-4B-Chat WebDemo 部署 Qwen1.5 介绍 Qwen1.5 是 Qwen2 的测试版&#xff0c;Qwen1.5 是基于 transformer 的 decoder-only 语言模型&#xff0c;已在大量数据上进行了预训练。与之前发布的 Qwen 相比&#xff0c;Qwen1.5 的改进包括 6 种模型大小&#xff0c;包括 0.…

【服务器部署篇】Linux下JDK的安装和配置

作者介绍&#xff1a;本人笔名姑苏老陈&#xff0c;从事JAVA开发工作十多年了&#xff0c;带过刚毕业的实习生&#xff0c;也带过技术团队。最近有个朋友的表弟&#xff0c;马上要大学毕业了&#xff0c;想从事JAVA开发工作&#xff0c;但不知道从何处入手。于是&#xff0c;产…

TR4 - Transformer中的多头注意力机制

目录 前言自注意力机制Self-Attention层的具体机制Self-Attention 矩阵计算 多头注意力机制例子解析 代码实现总结与心得体会 前言 多头注意力机制可以说是Transformer中最主要的模块&#xff0c;没有之一。这次我们来仔细分析一下注意力机制与多头注意力机制。 自注意力机制…

KubeSphere 社区双周报|2024.03.29-04.11

KubeSphere 社区双周报主要整理展示新增的贡献者名单和证书、新增的讲师证书以及两周内提交过 commit 的贡献者&#xff0c;并对近期重要的 PR 进行解析&#xff0c;同时还包含了线上/线下活动和布道推广等一系列社区动态。 本次双周报涵盖时间为&#xff1a;2024.03.29-04.11…

如何在Pycharm中快捷放大和缩小代码界面?

如何在Pycharm中快捷放大和缩小代码界面&#xff1f; 【File】->【Setting】->【keymap】 在Keymap中找到Increase Font Size&#xff0c;双击&#xff0c;选择Add Mouse Shortcut 在弹出的Mouse Shortcut界面&#xff0c;按住 Ctrl 并同时向上滚动鼠标滚轮&#xff0c;…

基于LNMP部署wordpress

目录 一.环境准备 二.配置源并安装 三.配置Nginx 四.配置数据库 五.上传源码并替换 六.打开浏览器&#xff0c;输入虚拟机ip访问安装部署 七.扩展增加主题 一.环境准备 centos7虚拟机 关闭防火墙和seliunx stop firewalld #关闭防火墙 setenforce 0 …

golang 冒泡、选择、插入、快速排序法

个人学习笔记&#xff5e; 1. 冒泡排序 // Author sunwenbo // 2024/4/6 22:37 /* 1. 一共会经过arr.length -1 次的轮数比较&#xff0c;每一轮将会确认一个数的位置 2. 每一轮的比较次数逐渐的减少 [4,3,2,1] 3. 当发现前面的一个数比后面的一个数大的时候&#xff0c;就进行…

kubectl_入门_Pod配置以及生命周期

Pod配置以及生命周期 1. Pod结构定义 每个pod中都可以包含一个或多个容器&#xff0c;这些容器可以分为两类 用户程序所在的容器&#xff0c;数量可多可少Pause容器&#xff0c;这是每个Pod都会有的一个根容器&#xff0c;它的作用有两个 可以以它为根据&#xff0c;评估整个…

参与 PenPad Season 2 获得勋章,还有海量 Scroll 生态稀缺权益

PenPad是Scroll生态中的首个LaunchPad平台&#xff0c;该平台继承了Scroll生态的技术优势&#xff0c;具备包括隐私在内的系列特点&#xff0c;同时且也被认为是Scroll生态最重要的价值入口之一。Penpad与Scroll官方始终保持着合作&#xff0c;同时该项目自启动以来长期得到Scr…

宁盾radius认证服务器软件如何实现802.1X认证/Portal认证上网(portal web入网认证)

一、什么是802.1X认证和Portal认证以及有什么区别 随着企业网络规模的不断扩大和网络安全威胁的日益加剧&#xff0c;有效的网络认证机制成为保障网络安全的关键。其中&#xff0c;802.1X认证和Portal认证是两种常见的网络认证方式&#xff0c;它们各有特点&#xff0c;适用于…