四川省税务局CDH国产化替代实践

news2024/11/15 6:53:08

“传统数据仓库对于数据处理时效较低,且无法处理实时增量数据及数据变更,同时,在面对海量税务数据大规模进行查询分析等方面存在一些挑战。我们希望尽快寻找到一款能够替代CDH,并且具备灵活扩展能力的大数据解决方案,以应对复杂多元的税务数据处理场景。”

——四川省税务局大数据风险管理局技术专家 肖斌

从线下窗口办理到“非接触式”办税、从领取纸质发票到扫码开具电子发票……税务系统作为数字经济发展的重要支撑,正不断向智慧税务转型。在四川省,相关税务部门也一直在开展税务数字化的积极探索和有益实践。

为了应对日益增长的纳税主体数量和多元化的涉税经营活动,四川省税务局于2022年3月正式启动税务大数据平台建设项目,以优刻得私有化大数据产品USDP作为技术支撑,构建了符合信创要求的智能大数据平台,加速“以数治税”,实现税费全业务、全流程、全数据的“云化”打通。

一、以数治税,数据处理时效提升100%

优刻得携手四川省税务局,为当地建设了税务大数据中心,通过部署大数据平台和分析工具集,形成安全可靠、运行高效、数据完备、运行稳定的大数据支撑平台,满足了四川省各地市税务风险管理人员的数据分析和治理诉求,更为其湖仓一体平台的全面建设奠定了坚实基础。

USDP是优刻得自主研发的智能化、轻量级的大数据基础服务平台,提供一站式大数据集群管理和运维能力,能够帮四川省税务局快速构建起大数据的分析处理能力,并大大简化其对大数据基础平台原生且复杂的维护控制工作,使得税务部门能够聚焦于数据分析及价值挖掘中,为业务赋能。

图片

自四川省税务局USDP大数据平台项目上线以来,完善了对多源异构数据采集与统一存储能力,实现了税务数据全生命周期的统一管理,数据处理时效提升100%;而USDP的自动化运维管理功能,则帮助四川税务局平台维护性工作减少了70%

二、CDH国产化替代的理想选择

税务工作开展的每一步都离不开数据。2020年,四川省税务局大数据风险管理局成立,成为国家税务总局主管组织指导全国税收大数据和风险管理相关工作的机构。其成立之后,便是基于Hadoop架构下的CDH构建大数据平台,实现数据的统一汇聚,并对税务数据进行高效管理。但跟随税务业务数据爆发式增长,单一发票业务表就已累计120亿条数据,对大数据平台的稳定性和扩展性提出了更高要求。

优刻得USDP智能大数据平台,全面兼容基于CDH构建传统大数据处理业务架构,且满足国产化要求,并将大数据集群部署时间从数天缩短至数分钟,真正实现现有生产环境的平滑迁移;同时,USDP支持Hadoop、Hive、HBase、Spark、Flink、Hudi、Iceberg、Atlas等关键大数据组件,可一站式服务多端数据采集、入湖及治理工作,为税务系统数据的综合分析和智能化应用提供有力支撑。

值得一提的是,USDP还具备丰富的大数据生态技术,使得平台具备良好的存算扩展能力,可靠支撑四川省税务局从数据仓库架构向湖仓一体架构演进。当下,通过对四川省税务局现有数据进行精细化分析,优刻得助力税局完善了各类数据模型和数据关系设计文档,实现了数据模型、数据关系对业务的完整准确建模与描述,并基于USDP构建了全新的数据资产管理与数据治理平台,以此充分应用到后续的税务业务中。

图片

由于税务系统掌握着纳税主体的大量敏感数据,对数据风险管控和合规也有着特殊的要求。而USDP完全自主可控,全面适配信创生态,经国家权威机构检测,代码自主率高达95%以上;结合Kerberos、LDAP等系列安全组件,以及通过 Ranger细粒度权限控制,基于USDP在客户本地构建私有化数据湖仓,持续提升大数据服务的安全性保障能力。平台全面支持集群级监控,运维人员可实时获取事件告警和异常定位等,做到对整个平台的可视化、自动化监控,在减轻运维负担的同时,保障平台的健康稳定运行。

四川省税务局对优刻得的产品和服务给予了高度评价:“优刻得的专业技术和快速响应服务确保了大数据平台的稳定运行。特别是在税务人员智税大赛期间,USDP平台展现的强大数据处理和分析能力,为大赛的顺利进行提供了有力保障。”

目前,在智能大数据平台合作的基础上,四川省税务局正与优刻得积极探索AI和大模型技术在税务领域的应用,以期实现更深层次的数字化转型,通过充分运用税收大数据,实现税费优惠政策与适用对象的精准智能匹配,并进行个性化办税引导,加速智慧税务发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1702443.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Kubernetes 容器资源管理Resources和探针Probe

资源配额 Resources 在 Kubernetes 中,resources 配置用于设置容器的资源请求和限制,以确保集群中的资源(如 CPU 和内存)得到合理分配和使用。 在之前的pod中,不写 resources 字段。就意味着 Pod 对运行的资源要求“…

集智书童 | YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9

本文来源公众号“集智书童”,仅用于学术分享,侵权删,干货满满。 原文链接:YOLOv10开源|清华用端到端YOLOv10在速度精度上都生吃YOLOv8和YOLOv9 在过去几年中,YOLO系列模型已成为实时目标检测领域的主导范式…

图像处理之基于标记的分水岭算法(C++)

图像处理之基于标记的分水岭算法(C) 文章目录 图像处理之基于标记的分水岭算法(C)前言一、基于标记点的分水岭算法应用1.实现步骤:2.代码实现 总结 前言 传统分水岭算法存在过分割的不足,OpenCV提供了一种…

图片提取表格要怎么做?7个软件教你快速进行图片识别

图片提取表格要怎么做?7个软件教你快速进行图片识别 要从图片中提取表格,您可以使用以下七款软件来快速进行图片识别和表格提取: 1.一键识别王:这是一款专业的OCR(光学字符识别)软件,可以帮助…

在通过跨网文件交换时,如何保障科研结构核心研究数据?

当今科研领域,数据如同生命线,支撑着每一个突破性发现的诞生。随着国际合作的加深,跨网文件交换成了常态,但这也为科研机构的核心研究数据安全带来了一系列挑战。想象一下,那些精心搜集和分析的宝贵数据,在…

【Typescript】通过变量的值即可获取变量的类型【typeof 变量】

注意:只要变量的类型准确,则typeof获取变量的类型就不会错 enum Test {a "a0",b "b0" }// 这里的a是一个变量的值 let a: Test.a "a0" as Test.a// 这里的typeof a是一个类型【Test.a】 let x: typeof a Test.a

【C++】开源:RabbitMQ安装与配置使用(SimpleAmqpClient)

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍。 无专精则不能成,无涉猎则不能通。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下,下次更新不迷路&#x1…

Jlink卡死 JFlash keil 盗版JLINK

现象:用Keil打开Jlink配置页,会卡死。 解决方法:用旧版本的Jlink软件,因为淘宝买的很多JLINK下载器是盗版的,不支持新版本的JLINK软件。到https://www.segger.com/downloads/jlink下载旧版本的软件。 如果必须要用新版…

重量and体积,不要在傻傻的花冤枉钱寄快递了!

寄快递时有没有遇到过明明不重却被按体积收费的情况?别急,今天就来给大家揭秘快递收费的奥秘! 实际重量和体积重量! 首先,我们要明白两个概念:实际重量和体积重量。实际重量就是你看到的物品重量&#xf…

安装vllm的时候卡主:Collecting vllm-nccl-cu12<2.19,>=2.18 (from vllm)

按照vllm的时候卡主: ... Requirement already satisfied: typing-extensions in /home/wangguisen/miniconda3/lib/python3.10/site-packages (from vllm) (4.9.0) Requirement already satisfied: filelock>3.10.4 in /home/wangguisen/miniconda3/lib/python…

推荐二轮电动车仪表盘蓝牙主芯片方案-HS6621CGC

随着国内二轮电动车的火热开启,电动车的智能化程度越来越高;电动车的智能操控需求也越来越高,现在介绍蓝牙控制面板的一些功能;例如:定位(GNSS),设防,实时上报数据&#…

ctfshow web入门 web306--web310源码审计

web306 这和之前的完全不一样了 <?php #error_reporting(0); session_start(); require service.php;$username$_POST[userid]; $userpwd$_POST[userpwd]; $servicenew service();$user$service->login($username,$userpwd); if($user){setcookie(user,base64_encode(…

JAVA中的代理:代理的作用+静态代理的实现+动态代理的实现

JAVA中的代理&#xff1a;代理的作用静态代理的实现动态代理的实现 一、代理的作用二、静态代理实现方式2.1 实现原理2.2 示例 三、动态代理 一、代理的作用 代理是一种设计模式 主要目的&#xff1a;提供了对目标对象另外的访问方式 代理的好处&#xff1a; 目标对象可以间…

告别低效率||智能BI财务分析软件

在当今信息爆炸的时代&#xff0c;财务数据作为企业运营的核心&#xff0c;其处理和分析的效率直接关系到企业的决策速度和市场竞争力。奥威BI软件凭借其卓越的性能和智能化的分析功能&#xff0c;为企业提供了一套高效、准确的财务分析解决方案。 奥威BI软件在财务分析中的优…

从0开始回顾ElasticSearch

1 elasticsearch概述 1.1 elasticsearch简介 官网: https://www.elastic.co/ ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎&#xff0c;基于RESTful web接口。Elasticsearch是用Java开发的&#xff0c;并作为Apache许可条款下的…

angr使用学习(持续更新)

首先我是直接在kali中安装的&#xff0c;也是边练边学的。 嗯&#xff0c;要在纯净python环境&#xff0c;所以是在 virtualenv 虚拟环境里&#xff0c;也不是特别会用这个&#xff0c;按照教程一步步做的 source venv/bin/activate 进入了对应环境 退出是 deactivate en,ipy…

重生之 SpringBoot3 入门保姆级学习(06、属性绑定)

重生之 SpringBoot3 入门保姆级学习&#xff08;06、属性绑定&#xff09; 2.3.1 使用 ConfigurationProperties2.3.2 使用 EnableConfigurationProperties 2.3.1 使用 ConfigurationProperties application.properties 文件书写相关配置 pig.id1 pig.name王萍 pig.age21方法一…

Sping源码(九)—— Bean的初始化(非懒加载)— ConversionService

序言 经过前面一系列的加载、解析等准备工作&#xff0c;此刻refresh方法的执行已经来到了尾声&#xff0c;接下来我们用几篇文章着重的介绍一下Bean的初始化 代码 着重看refresh()主流程中的finishBeanFactoryInitialization()方法。 finishBeanFactoryInitialization 方法…

python深入探索斐波那契数列:代码示例与不满足的外围条件

新书上架~&#x1f447;全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我&#x1f446;&#xff0c;收藏下次不迷路┗|&#xff40;O′|┛ 嗷~~ 目录 一、斐波那契数列的初步实现 二、外围条件的不满足情况 总结 一、斐波那契数列的初步实现 …

二叉树——堆的实现

一.前言 前面我们讲解了二叉树的概念以及二叉树的存储结构&#xff1a;https://blog.csdn.net/yiqingaa/article/details/139224974?spm1001.2014.3001.5502 今天我们主要讲讲二叉树的存储结构&#xff0c;以及堆的实现。 二.正文 1.二叉树的顺序结构及实现 1.1二叉树的顺序…