第十四届中国大学生服务外包大赛细品,上百支队伍与合合信息用AI共克“记账”难题

news2024/11/15 10:36:10

前言

熟悉我的小伙伴应该知道我在大学时期参与了很多竞赛,我向来对比赛是比较热枕的,以我个人观点,我认为可以通过竞赛激发学习激情和检验自己的技能水平掌握情况,大学生很少有机会能够了解到课堂之外市场的需求,外包服务竞赛就是一个很好的机会能够帮助大学生接触到市场需要何种服务以及人才需求,而且大学的很多比赛都可以积累自己的操行分,拿到一个好的名次收获颇多,可以说学业事业一箭双雕。正好这次第十四届中国大学生服务外包大赛圆满落幕,在我的大学竞赛生涯中曾也参见过此类比赛且获得过金奖,正好借此次机与大家一起细品中国大学生服务外包大赛。

比赛背景

中国大学生服务外包创新创业大赛(以下简称“大赛”),是响应国家关于鼓励服务外包产业发展、加强服务外包人才培养的相关战略举措与号召,举办的每年一届的全国性竞赛。服务外包是指将某些业务或工作过程外包给其他机构或公司来完成,在一定程度上降低企业的成本和提高效率。获得服务外包的比赛奖项,可以证明获奖者在团队合作、项目管理、沟通协调等方面具备较强的能力和经验,这对于未来就业和个人职业发展都是有帮助的。而且此类比赛一般来说在各大高校都是有保研加分的,自然关注的人比较多。

大赛自2010年创立以来,累计吸引了1600余所院校、50余万名大学生参加,成为服务外包产业领域的国家级赛事。本届大赛共有803所全国院校的8006支团队报名参赛,报名团队数再创新高。而且随着技术的不断迭代,市场需求也再不断更迭,大赛的竞赛主题也响应着时代的发展而诞生了很多贴切前沿技术主题的问题。比如就最近比较火热的AI大模型运用,这次大赛就很好的结合了当今热点技术话题,启发了更多参与比赛的大学生思考。

本次竞赛内容设计充分聚焦企业发展中所面临的技术、管理等现实问题,与产业的结合度更紧密,智能文字识别技术是大赛重点关注的技术之一。智能文字识别技术融合了智能图像处理、光学字符识别、深度学习、自然语言处理等技术,可在多语言、多版式、曲面、褶皱、背景干扰等复杂场景下进行文字信息的识别分析与理解,在生产、教育、生活等多个领域中有着广泛的应用。

合合信息在智能文字识别领域有着十余年深耕经验,基于自身在行业领域的认知,从“基于智能文字场景个人财务管理创新应用”等议题出发,向广大学生群体发出了“产品征集令”,得到了积极的反馈,相关赛题吸引了包括重庆大学、北京邮电大学、哈尔滨工业大学、华东理工大学、四川大学、西北大学等全国70多所高校的近300支队伍积极参与,也涌现出许多优秀的作品。

参赛作品评析

本次大赛中,诸多高校参赛队伍很好地洞悉了不同用户群体的痛点,例如从“中老年人使用记账本应用需要经历繁琐的操作”现象背后发现“图片识别记账方式更受欢迎”的趋势,并针对性地进行产品开发优化。

以中南大学的作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统项目为例。

 项目设计方向

针对此需求,中南大学很好的理解了项目开发的疑难点。首先此类应用面对的是中老年人,那么开发左眼皮应该是适应中老年人的安卓手机APK比较合适。此外不需要设计更多繁杂的功能,只适合记账使用,应用应该操作简单明了,要容易快速上手,不要设计太多复杂的过程最好。传统记账一般都是手动输入或者是其他应用辅助进账,比较麻烦。而本次比赛借助合合信息智能图像识别模块可以快速进行小票识别,直接按照模版读取到对应框架内容中。因此如何结合智能图像识别模块以及设计对应简洁、高效的数据输入财务管理工具是项目的主要难题。

中南大学的作品采取的是SpringCloud微服务架构,Spring Cloud可以帮助开发者实现微服务架构的快速搭建和部署,提高系统的可扩展性和弹性。对于比赛快速开发服务来说,选择此架构没有一点问题,而如何进行图像识别以及识别准确率技术要求是比较大的难点。能够支持识别外卖账单、超市小票、手账、证券、支付宝微信消费截图等,且准确率较高的技术栈来说,OCR识别是一种不错的技术,此外还应训练出符合记账文本对应的分类模型以及信息抽取标注模型。以上技术难点中南大学都有考虑到且做出了比较规范的处理,比如Python的jieba分词库以及文本转换技术Word2Vec,信息抽取与关系抽取则是考虑到了序列标注模型(BiLSTM-CRF)。以上技术都较为成熟,使用起来不会有太大问题,适合快速开发。且作品还考虑到了企业端,另做能够获取消费者的消费习惯,投放广告,提高账单识别的技术框架,比较全面。

此外如有根据已存有历史数据能够自动生成历史账单画像,或者是能够结合AI大模型自动对账号数据进行评估或许能够完成的更加全面。尽管如此此作品完成程度已经足够高,简单高效最贴切竞赛主题。

 开发方向

中南大学的作品代码开发方向十分清晰。前端使用Flutter框架,Flutter采用自绘引擎,具有出色的性能和渲染效果。通过使用丰富的小部件库,开发者可以轻松创建精美的用户界面,并实现高度的自定义。这使得Flutter在设计感强烈的应用程序、品牌应用以及注重用户体验的项目中具备竞争力。开发模式采取前后端分离的模式,在这种模式下,前端和后端可以独立开发,互不干扰,相互配合,最终组合成一个完整的应用程序,提高了开发效率,提高了系统的可维护性和可扩展性,前后端交互简单明了,易于调试和测试。

中南大学作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统不仅解决了市场上存在财务小票记账的痛点,也灵活地将合合信息智能图像识别模块与小票识别的API落地财务管理场景,将复杂的小票信息秒速转换成了简洁、高效的数据输入,构建了一个多场景下的财务管理工具,让用户在不同场景中都能轻松地进行记账和财务管理。

可以毫不夸张地说,BERT已经对自然语言处理进行了显著的变革。比如使用一个在大型无标号数据集上训练的模型,在11个独立的自然语言处理任务中取得佳绩。只需稍加微调就能实现。BERT引发了许多新的自然语言处理体系结构、训练方法以及语言模型,如Google TransformerXL、OpenAI的GPT-2、XLNeT、ERNIE2.0、RoBERTa等。自然语言处理的最大挑战之一是缺乏训练数据。因为自然语言处理是一个具有许多不同任务的多样化领域,大多数任务专用的数据集只包含几千或几十万个人工标记的培训示例。因此能够支撑起庞大的数据集是大模型结合其他领域的关键,运行BERT是一项GPU密集型任务,需要大量的算力资源支持。

 

谈到图像处理技术就不得不谈一下OCR技术了。随着技术的不断发展,OCR技术在工业界中的应用也从最开始的简单的光学字符识别拓展到涵盖图像预处理、文字识别、版面分析、文档理解等多项技术的智能文档处理领域。文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。合合信息依托自研的智能文字识别服务平台,在解决工业界中面临的各类问题中所做一些相关工作进展和研究成果,并探讨当前工业界中面临的一些关键技术难题和挑战。相信合合信息在模式识别、深度学习、图像处理、自然语言处理等领域的深耕厚积薄发,用技术方案惠及更多的人。

 

合合信息智能文档处理技术采用精准的图像裁剪、形变矫正以及去除阴影和摩尔纹等技术,利用人工智能技术对文档图像进行增强和清晰度提升,从而提高文档图像的质量和阅读体验。通过这种方法,可以有效提升文档处理下游任务的质量和效率,例如识别转换和图像分析等。目前,该技术已经被应用于智能文字识别产品,为来自全球上百个国家和地区的数亿用户提供了服务。

 

文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。 此外,未来的图文智能处理技术也将会更加可定制化,根据不同的行业和应用场景,为客户提供量身定制的解决方案。这将有助于满足客户的不同需求,提升客户的体验和满意度。

比赛发展

 

从技术创新的视角来看,参赛队伍展现出了深刻的思考。他们将先进的大模型技术与智能文档处理领域的实际需求相融合。通过将文本识别和文本理解技术应用于大量的消费票据,他们成功地实现了有效的分类。这项创新使得财务结算过程从过去的繁琐手动操作变为高度自动化的流程。这一实践充分展示了他们运用新技术来解决传统难题的能力。

 

据大数据统计,现在有百分之七十以上的大学生毕业后所从事的职业与本科专业无关。这就表示,大学生走出大学校门时,迎接他们的可能是一个完全陌生的领域,如果不想被淘汰,就必须不断充实提高自己的知识储备。由此可见,建立多元化的人才培养机制非常重要。当前,科技的创新、突破与发展越来越依赖于多学科的交叉、融合,这就对复合型人才的培养提出了更高的要求。大赛对参赛作品的评分标准也十分“仿真”,涉及技术资源及经济成本控制,对项目创意前景的判断、对市场需求的分析等方面,覆盖商业价值、社会应用价值等多方面的评估。

在这个人工智能时代,科技企业在应用场景中扮演着关键角色,并在人才培养方面发挥着重要作用。未来,各行各业都渴望拥有那些对专业学术领域有深刻理解、具备解决问题潜力的人才,特别是在不断发展的人工智能领域。在这一背景下,大赛为学生提供了一个卓越的科技领域展示平台。

科技企业通过参与这样的活动,不仅能够挖掘潜在的人才,还能够与学术界建立更紧密的联系,共同推动技术的发展和创新。总之,这种校企合作在人才培养和行业发展方面取得了显著成就,为未来的科技进步奠定了坚实基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/890930.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

repmgr出现双主,并且时间线分叉,删除了最新的时间线节点

遇到的问题如下: 2023-08-17 20:24:21.566 CST [1556001] LOG: database system was interrupted; last known up at 2023-08-17 20:21:41 CST 2023-08-17 20:24:21.770 CST [1556001] LOG: restored log file "00000009.history" from archive cp: 无法…

【从零开始学爬虫】采集中国国际招标网招标数据

l 采集网站 【场景描述】采集中国国际招标网招标数据。 【源网站介绍】中国国际招标网致力于为企业提供招标、采购、拟在建项目信息及网上招标采购等一系列商务服务。 【使用工具】前嗅ForeSpider数据采集系统 http://www.forenose.com/view/forespider/view/download.html 【…

LVS-DR模式下(RS检测)ldirectord工具实现部分节点掉点后将请求发往正常设备进行处理

基于前文的LVS-DR集群构建环境 一.下载ldirectord软件 二.将模板文件中的LVS-DR模式相关文件拷贝到/etc/ha.d主配置目录并按实际设备修改 三.配置两台RS匹配规则 四.停止RS1的http服务进行测试 RS1失去工作能力,RS2接替RS1 基于前文的LVS-DR集群构建环境 一.下…

ARM--day5(C语言点灯实验、总线、串口通信信息、串口通讯协议)

函数分装实现点灯 gpio.c: #include "gpio.h" //函数功能:GPIO引脚初始化操作 //参数1:GPIO组号 //参数2:引脚编号 //参数3:初始化内容 void hal_gpio_init(volatile gpio_t*gpiox,unsigned int pin,gpio_init_t* ini…

浏览器控制台调试代码和JavaScript控制台方法介绍

浏览器控制台调试代码和JavaScript控制台方法介绍 浏览器控制台调试代码 浏览器控制台(Console)是浏览器提供的一个开发工具,用于在浏览器中执行和调试 JavaScript 代码。它提供了一个交互式环境,可以输入 JavaScript 代码&#…

计算机竞赛 wifi指纹室内定位系统

简介 今天来介绍一下室内定位相关的原理以及实现方法; WIFI全称WirelessFidelity,在中文里又称作“行动热点”,是Wi-Fi联盟制造商的商标做为产品的品牌认证,是一个创建于IEEE 802.11标准的无线局域网技术。基于两套系统的密切相关&#xff…

UGUI组件Rect Transform

一. Rect Transform概述 画布上UI对象都附加一个Rect Transform组件,和一般对象附加的Transform对象相比,Rect Transform多了Width,Height,Anchor,Pivot属性。 二.位置属性 UI对象的坐标是其轴心到锚点之间的像素值,如下图所示。 三.Pivot(…

同时负责多个项目,团队成员还参与多个项目开发,如何有效管理?分享9个策略

如果你正在管理一个团队或项目,可能会需要同时在进行多个项目的管理。在这种情况下,追踪所有进行中的项目部分可能会迅速变得非常复杂。没有合适的管理过程,就难以确定哪些工作应该优先处理,也不容易确保团队有效管理工作量&#…

WPF显示初始界面--SplashScreen

WPF显示初始界面–SplashScreen 前言 WPF应用程序的运行速度快,但并不能在瞬间启动。当第一次启动应用程序时,会有一些延迟,因为公共语言运行时(CLR)首先需要初始化.NET环境,然后启动应用程序。 对于WPF中…

Spring基础梳理(一):一定要先全局掌握Spring

越活越完蛋了,看着看着现在又想梳理梳理Spring基础,搞点原始真解吧,不过技术人每个阶段看相同东西的理解都是不同的,只是现在浮躁的技术中又有多少人能够一本书啃两遍以上呢,我也一样,徜徉于业务之中&#…

【国护攻防场景下的沙箱技术对比】

目录 前言 沙箱技术分析 总结 前言 真高兴呀,又是受到红队大佬青睐的一天,今天下午很荣幸的收到了来自红队大佬的恶意投喂,把我们各位在座100年工作经验的蓝队师傅们吓得赶忙拔掉自己的电脑电源,断掉自己的网线,…

基于Helm管理Kubernetes应用

目录 基于kubeadm部署K8S集群 一、环境准备 1.1、主机初始化配置 1.2、部署docker环境 二、部署kubernetes集群 2.1、组件介绍 2.2、配置阿里云yum源 2.3、安装kubelet kubeadm kubectl 2.4、配置init-config.yaml 2.5、安装master节点 2.6、安装node节点 2.7、安装…

Linux驱动开发(Day4)

字符设备驱动分步注册:

OpenCV实战(OCR识别和高级基础)

目录 图像特征harris角点检测基本原理实现 Scale Invariant Feature Transform(SIFT)图像尺度空间多分辨率金字塔高斯差分金字塔(DOG)DoG空间极值检测关键点的精确定位消除边界响应特征点的主方向生成特征描述 特征匹配Brute-Forc…

Linux命令200例:crontab详解及应用场景(常用)

🏆作者简介,黑夜开发者,全栈领域新星创作者✌。CSDN专家博主,阿里云社区专家博主,2023年6月csdn上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师,项目技术负责人。 &…

视频智能分析/视频云存储/集中存储EasyCVR平台AI分析告警列表定制

安防监控视频集中存储/云存储EasyCVR视频汇聚平台基于云边端一体化架构,可支持多协议、多类型设备接入,视频监控综合管理平台具有强大的数据接入、处理及分发能力,能在复杂的网络环境中,将分散的各类视频资源进行统一汇聚、整合、…

Effective C++学习笔记(7)

目录 条款41:了解隐式接口和编译多态条款42:了解typename的双重意义条款43:学习处理模板化基类内的名称条款44:将与参数无关的代码抽离templates条款45:运用成员函数模板接受所有兼容类型条款46:需要类型转…

100. 相同的树

100. 相同的树 题目-简单难度示例1. dfs2. bfs 题目-简单难度 给你两棵二叉树的根节点 p 和 q ,编写一个函数来检验这两棵树是否相同。 如果两个树在结构上相同,并且节点具有相同的值,则认为它们是相同的。 示例 示例 1: 输入…

Stable Diffusion XL(SDXL)原理详解

技术报告:SDXL: Improving Latent Diffusion Models for High-Resolution Image Synthesis 官方代码:Stability-AI-generative-models 模型权重:HuggingFace-Stability AI 非官方代码:Linaqruf/kohya-trainer diffuser库&#xf…

Redis实战:Redis的安装及简单使用

本片将介绍 Redis 的安装及简单使用 文章目录 1、Redis安装1.1、Windows下Redis的安装1.2、Linux下Redis的安装1.3、Mac下Redis的安装(使用Homebrew) 2、Redis使用2.1、启动服务端客户端2.2、Redis简单命令 3、Redis命令大全 1、Redis安装 1.1、Windows…