[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之五

news2025/1/13 2:29:50

 通过示范引领,激励多方主体积极参与,释放数据要素价值。

本文为“数据要素×”典型案例深度解析系列的第五篇,前四篇请见

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之一

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之二

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之三

[案例]国家数据局:首批“数据要素×”典型案例深度解析系列之四

在第七届数字中国建设峰会的第一天,即5月24日,国家数据局会同各领域主管部门,包括生态环境部、交通运输部、金融监管总局、中国科学院、中国气象局、国家文物局、国家中医药局等部门一起,发布首批20个“数据要素×”典型案例。

01   案例之九|中科院系-多元数据融合 支撑空间与天文科技创新发现

——————————————————

话说鼹鼠哥本人自从在2010年开始投身云计算和大数据以后,和中科院系还是打过不少交道的。

在刚开始做大数据的时候,还没有那么多的分布式存储,什么HDFS,Ceph,Gluster当时都还没出现,或者还都在1.0版本之前没法商用,而当时Lustre是一个不错的选择,当时在国内应用Lustre最多的,就是中科院的高能物理所。

众所周知,随着人类探索宇宙起源以及基本物质组成的脚步不断前行,高能物理实验的规模也在不 断扩大,欧洲大型强子对撞机 LHC、北京正负电子对撞机 BEPCII、大亚湾以及江门中微子实验、羊八井国际宇宙线实验、高海拔宇宙线观测实验 LHAASO 等大型高能物理实验已经建成运行或者陆续建成,这将累积越来越多的数据。比如,LHC 每年会产生 25PB 的数据, 采用网格计算模型进行全球分布式的处理与分析。BEPCII 累积超过 5PB 的数据,主要采 用大规模计算集群进行分析。 

这样的庞大的数据对高能物理计算环境提出许多新的挑战,包括海量的数据存储能力、 超强的计算能力、高速数据传输、大规模分布式的协同处理机制等。总体来说,高能物理计 算主要有如下需求: 

首先,高能物理的数据量巨大。随着新一代高能物理实验装置的建设完成,实验规模不 断扩大,实验复杂性也不断增加,数据产生量越来越大。目前,全世界高能物理的实验数据 已经达到 200PB,并将很快超过 1000PB。 

其次,数据需求全球共享。比如,全世界 8000 多位物理学家对 LHC 每年产生的 25PB 的实验数据进行分析。BEPCII 上的 BESIII 实验、大亚湾中微子实验等都是大型国际合作项 目,有着同样的需求。 

最后,高能物理中很多数据需要长期保存。比如,LHC 和 BESIII 实验的原始数据必须 保证在实验结束后至少 15 年以上的生命期内还可被利用。 

这里科普一下,PB就是1000个TB,每个TB又是1000个GB,咱们现在普通笔记本一般也就是1TB的大小,这些科学数据大概相当于20万个笔记本硬盘的空间,而且这还是在大概十年前的数据,现在估计早就又要加上3到4个0,也就是几千万到几亿个笔记本硬盘了。

你也许会说,银行存的数据也不少啊。但是这个地方有一个区别,银行的数据很多会归档,比如你可能没法直接查到10年前的交易流水,但是到柜台可以申请调取,这就是去后台调取归档数据。但是科学数据需要时时访问到全部数据,这是很大的差异。

不知不觉就说多了,后来我们还和中科院声学所一起开展音频大数据的研发,包括声纹识别,关键词识别等等,虽然现在看起来不难,可是那是在差不多十年前,没有什么大模型也没有GPU的时候。

后来我们的一位同事就是去了贡献这个案例的其中一个机构,转行做了科学研究,现在也小有成果了,这个系列案例的详情我还是从她的朋友圈里最先看到的。

这里我们注意到一点,就是空间数据的数据量,也达到了50PB,而高能物理应该是高出一到两个数量级了,我们简单算一下,一台存储专用服务器大约裸容量是100TB,50PB就需要500台服务器,乘以3倍冗余,就是1500台,再加上其他的机器,大概2000台,需要大约150个机柜。所以,单单建设一套支撑这么大数据量的分布式存储系统,支撑高速的读写,并且确保数据的高度一致性和可用性,已经是一件很不容易的事情了。何况还要进行标准规划,以及全生命周期的治理,所以这个案例的含金量还是很高的。

下边是案例正文:

空天科技是一种跨学科、跨领域、跨行业的综合性科技。中国天眼FAST、子午工程等重大科技基础设施建成应用和空间科学系列卫星的发射启用,产生海量数据。该类数据标准不一、来源分散、类别多样,深度应用较难,为高效应用空间天文数据,丰富研究方法,提升处理应用方式,更好地支撑复杂科学问题研究,国家空间科学数据中心、国家高能物理科学数据中心、国家天文科学数据中心等联合通过强治理、研工具,探索形成基于数据的天文领域科学创新模式。一是促进空间-高能物理-天文科学数据汇聚与全生命周期治理。编制分级分类、管理存储、开放共享等空间高能天文领域系列数据标准10余项,以标准为引领,规范实施全生命周期数据治理,促进跨学科数据汇聚融合。

二是建立空间高能天文领域融合数据库。聚焦跨领域前沿科学问题,面向科学真实需求,打造空天典型事件等数据库,发布空间科学、高能物理、天文学联合主题数据资源。自2021年以来,治理形成高质量空间天文科学数据资源约50PB。

三是以数据驱动科学新发现。依托融合数据库、借助人工智能等,联合研发了20余项专用数据分析挖掘工具与模型,推出以超高能宇宙线起源、多波段时域天文、日地空间天气传播链等不同科学场景的高质量在线数据分析应用,服务空间天文领域科技系列创新活动,服务科技计划千余项,助力取得“全球首次打开了10TeV波段的伽马射线暴观测窗口”“获得纳赫兹引力波存在的关键证据”等数十项国际领先的原创性、标志性、突破性科学发现,相关成果发表于《自然》《科学》等国际顶尖学术期刊,多项成果入选当年“中国科学十大进展”。

图片

三中心联合发布高能瞬变源多波段监测数据专题,提供面向科学问题的跨领域数据发现服务

图片

AI for Data空间与天文领域系列专用软件工具

图片

02   案例之十|湖南省博物院-数据资源融合应用 助力文物传承保护和价值增值

——————————————————

看到博物院,想跟大家谈谈体验消费。

疫情后,体验消费在各个行业中迅速崛起,成为一种新的消费趋势。去年,甘肃省天水市的“天水麻辣烫”引发了广泛的讨论和关注,成为体验消费的一个典型案例。天水麻辣烫不仅使当地餐饮市场持续火热,还带动了周边的零售、服务和文旅等消费市场的同步升温。相关数据显示,近两周天水辣椒面、定西土豆等土特产品的成交额环比增长均超100%,3月以来天水景区门票相关订单量显著增加。

除了天水麻辣烫,还有许多其他案例展示了体验消费的魅力。例如,宜家的移动小睡车、耐克体验中心和箱根牧场等,都是通过深度互动的营销策略,让消费者与产品和企业之间进行互动,从而提升消费者的体验感。这些案例表明,体验消费不仅仅是简单的购物行为,更是一种文化和情感的交流。

那么,为什么体验消费突然火起来了呢?笔者认为主要有以下几个原因:

消费者需求变化:现代消费者更加注重个性化和情感化的消费体验。他们不仅仅满足于商品本身的质量,更在乎购买过程中的感受和体验。体验消费能够满足这种需求,提供更多的附加值。

社交媒体的影响:社交媒体平台的兴起使得体验消费更容易被传播和推广。通过短视频、图片等形式,消费者可以分享自己的体验,吸引更多人参与。例如,天水麻辣烫通过短视频传播,迅速走红全国。

技术进步:随着虚拟现实(VR)和增强现实(AR)技术的发展,博物馆、餐厅和其他场所能够提供更加沉浸式的体验。例如,AR导览在博物馆的应用,打破了传统二维静态展示的边界,实现了三维动态立体展示,让文物“活”了起来。这种技术的应用不仅提升了游客的满意度和忠诚度,还促进了文化遗产的民主化。

博物馆作为文化传承的重要场所,也在积极采用新技术来提升游客的体验。

增强现实(AR)技术的应用:博物馆通过AR技术,将虚拟信息叠加到现实世界中,为游客提供更加丰富的互动体验。例如,河南博物院利用AR技术,让游客能够与展品进行互动,增加了观展的乐趣。此外,荷兰梵高博物馆通过AR技术,创造了沉浸式的展览《遇见梵高之旅》,吸引了大量年轻观众。

虚拟现实(VR)技术的应用:VR技术可以让游客在虚拟环境中亲身体验历史事件或文化场景。例如,某项目采用66台OptiTrack动捕摄像机和定制化文物道具,通过VR交互体验,打造了现实版“博物馆奇妙夜”。这种技术的应用不仅提升了游客的满意度,还满足了人民群众多层次的文化消费需求。

数字化创新:博物馆通过虚拟现实、应用程序APP、人工智能等方式开启文化体验之旅,旨在增强技术精湛的访客体验。这些技术的应用使得博物馆不再是单一的展示空间,而是变成了一个充满互动和探索的乐园。

总之,体验消费正在成为现代消费市场的重要趋势。通过技术创新和消费者需求的变化,各行各业都在不断改进和升级,以提供更好的消费体验。博物馆行业也不例外,通过引入AR、VR等技术,极大地丰富了游客的体验,推动了文化的传承和发展。

下边是案例的正文。

推动数字技术与文物保护利用融合发展是建设文化强国的关键举措。目前,文物数据资源应用率较低,数据要素在文物的保护、管理、传播、利用中发挥的作用不足,难以对文物关联行业的数字化发展起到足够的支撑作用。湖南省博物院积极推进文物数据资源的挖掘、汇聚和利用,通过创新合作开发模式,推动文物数据资源协同优化、复用增效、融合创新。

一是多手段采集汇聚文物数据资源。通过高清影像拍摄和激光扫描等手段,采集文物数据103万条、图片11万张、三维模型2000余个,编制文物数据采集加工地方标准,推动构建马王堆汉墓文物、音乐文物等文物知识图谱,并将文物中涉及的传统医药、农牧渔猎、服饰服装、餐饮美食、礼仪文化、人物事件等元素进行数字化映射、匹配、提取和转化,形成多种文物数据资源集。

二是构建文物数据授权和合作开发模式。积极与高校、优质企业、文化创意团体等签署整体授权或单项合作开发协议,免费开放品牌资源和文化数据库授权,联合打造“数字汉生活”文化IP系列产品,实现文物数据资源在不同领域中的复用增效。先后签约近50家企业和团队,带动近10亿元规模的文化创意及周边产业发展。

三是推动文物数据跨领域融合创新。面向不同行业、不同人群等差异化需求,设计、制作、推出马王堆复原京剧展演、多年龄段“辛追”数字人、文物实景解谜游戏及数字藏品等系列产品。自2022年以来,以汇聚形成的文物数据资源为基础,先后推出云展览、云教育、动画视频、沉浸式体验等200余项数字化项目,浏览量超过1200万次;同时举办2个大型线下数字展览,吸引60余万观众,实现2300万元票房收入,推动了文化传承和文物价值增值协同发展。

沉浸式体验、数字人、元宇宙及数字藏品等数字产品

图片

数据资产化,鼹鼠哥与你一起。

图片

任何问题,欢迎大家公众号后台留言沟通。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1854175.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信小程序入门2

微信开发者工具的安装方法 1.打开微信开发者工具下载页面 在微信小程序管理后台的左侧边栏中选择“开发工具”,然后选择“开发者工具”,即可找到微信开发者工具的下载页面。 2.打开微信开发者工具的下载链接页面 单击“下载” 按钮下载,即…

【网络安全的神秘世界】已解决burpsuite报错Failed to start proxy service on 127.0.0.1:8080

🌝博客主页:泥菩萨 💖专栏:Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 解决burpsuite无法在 127.0.0.1:8080 上启动代理服务端口被占用以及抓不到本地包的问题 Burpsuite无法启动proxy…

深度学习 --- stanford cs231学习笔记五(训练神经网络的几个重要组成部分之二,数据的预处理)

数据的预处理(Data Preprocessing) 2 Data Preprocessing数据的预处理 数据预处理的几种方法 2,1 数据的零点中心化 数据的零点中心化的目的就是为了把数据的整体分布拉回到原点附近,也就是让数据的整体均值变为0。 ​ 2,2 数据的标准化 数据…

VS Code Arduino编程

①Arduino Arduino是一款便捷灵活、方便上手的开源电子原型平台。包含硬件(各种型号的Arduino板)和软件(Arduino IDE)。 ②VS Code(全称 Visual Studio Code) 是由微软开发的一款开源、轻量级的跨平台现代代码编辑器…

PADS学习笔记

1.PADS设计PCB流程 封装库(layout),原理图库(logic)的准备原件封装的匹配(logic)原理图的绘制(logic)导网表操作(logic)导入结构(lay…

一文掌握提升 Python 代码质量的最佳伴侣工具:black、isort、flake8 和 mypy

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 在 Python 项目开发中,为了保持代码质量和提高开发效率,我们常需借助一些工具。今天,我将为大家介绍四个 Python 代码工程的得力助手:black、isort、flak…

风险评估概念

渗透服务只是风险评估的一种内容 风险评估的概念 是识别,控制,降低,或者消除可能影响到信息系统的安全风险过程。 风险评估的定义: 就是量化测评一种事情带来的影响,整个量化的过程是偏主观化(客户觉得) 风险的特…

AI 开发平台(Coze)搭建小游戏《挑战花光10亿》

前言 本文讲解如何从零开始,使用扣子平台去搭建一个小游戏 这是成品链接:挑战花光10亿 - 扣子 AI Bot (coze.cn) 欢迎大家去体验一下 效果 正文 什么是coze平台? 扣子(Coze)是字节跳动推出的一站式 AI 开发平台&am…

(4) cmake编译静态库和动态库

文章目录 静态库整体代码动态库编译整体代码执行结果(静态) 静态库整体代码 static.h #pragma onecevoid static_demo();static.cpp #include "static.h" #include <iostream>void static_demo(){std::cout<<"static demo"<<std::end…

动手学深度学习(Pytorch版)代码实践 -卷积神经网络-26网络中的网络NiN

26网络中的网络NiN import torch from torch import nn import liliPytorch as lp import matplotlib.pyplot as plt# 定义一个NiN块 def nin_block(in_channels, out_channels, kernel_size, strides, padding):return nn.Sequential(# 传统的卷积层nn.Conv2d(in_channels, ou…

个人成长的利器:复盘教你如何避免重蹈覆辙

前言 &#x1f4eb; 大家好&#xff0c;我是南木元元&#xff0c;热爱技术和分享&#xff0c;欢迎大家交流&#xff0c;一起学习进步&#xff01; &#x1f345; 个人主页&#xff1a;南木元元 最近忙着学习和工作&#xff0c;更新比较少&#xff0c;期间一直在思考如何才能快速…

BLDC无感控制策略

本文根据 BLDC 的电路模型推导了一个简 化磁链方程来估计转子位置,转速适用范围较 广;重点分析了反电动势和换相电流对转矩脉动 的影响;设计了一种BLDC的无速度传感器高速 驱动控制方案。通过试验验证了新型控制策略 的性能。 1 低速时的转子位置检测 图1 为高速无刷直流电…

高职人工智能专业实训课之“图像识别基础”

一、前言 随着人工智能技术的迅猛发展&#xff0c;高职院校对人工智能专业实训课程的需求日益迫切。唯众人工智能教学实训平台作为一所前沿的教育技术平台&#xff0c;致力于为学生提供高效、便捷的人工智能实训环境&#xff0c;特别在“图像识别基础”这一关键课程中&#xf…

四川汇聚荣科技有限公司怎么样?

在探讨一家科技公司的综合实力时&#xff0c;我们往往从多个维度进行考量&#xff0c;包括但不限于公司的发展历程、产品与服务的质量、市场表现、技术创新能力以及企业文化。四川汇聚荣科技有限公司作为一家位于中国西部的科技企业&#xff0c;其表现和影响力自然也受到业界和…

从零开始使用Surya-OCR——检测后的精细化处理框1:降噪二值图下的空白检测框删除

目录 一、动机 二、降噪二值化处理 1.一般二值化处理 2.降噪二值化处理 三、图片区域空白框判断 1.计算区域黑色像素比重 2.设置阈值筛选空白区域 3.可视化检查结果 一、动机 在使用 Surya 检测文本框时,对于一些特殊的文本,尤其是中文的古籍等,存在检测不准确的问题。常常…

国产AI算力训练大模型技术实践

ChatGPT引领AI大模型热潮&#xff0c;国内外模型如雨后春笋&#xff0c;掀起新一轮科技浪潮。然而&#xff0c;国内大模型研发推广亦面临不小挑战。面对机遇与挑战&#xff0c;我们需保持清醒&#xff0c;持续推进技术创新与应用落地。 为应对挑战&#xff0c;我们需从战略高度…

Program-of-Thoughts(PoT):结合Python工具和CoT提升大语言模型数学推理能力

Program of Thoughts Prompting:Disentangling Computation from Reasoning for Numerical Reasoning Tasks github&#xff1a;https://github.com/wenhuchen/Program-of-Thoughts 一、动机 数学运算和金融方面都涉及算术推理。先前方法采用监督训练的形式&#xff0c;但这…

【git1】指令,commit,免密

文章目录 1.常用指令&#xff1a;git branch查看本地分支&#xff0c; -r查看远程分支&#xff0c; -a查看本地和远程&#xff0c;-v查看各分支最后一次提交, -D删除分支2.commit规范&#xff1a;git commit进入vi界面&#xff08;进入前要git config core.editor vim设一下vi模…

《王者荣耀》国际服全球上线《Honor of Kings》海外下载榜首

原标题&#xff1a;《Honor of Kings》全球上线&#xff0c;国际玩家见证中国游戏魅力 易采游戏网6月23日独家消息&#xff1a;《王者荣耀》国际服《Honor of Kings》正式在全球160多个国家和地区上线&#xff0c;标志着这款源自中国的热门手机游戏迈向了国际舞台。尤其在加拿大…

Java面试八股之JVM永久代会发生垃圾回收吗

JVM永久代会发生垃圾回收吗 JVM的永久代&#xff08;PermGen&#xff09;在Java 8之前是存在的一部分&#xff0c;主要用于存储类的元数据、常量池、静态变量等。在这些版本中&#xff0c;永久代确实会发生垃圾回收&#xff0c;尤其是在永久代空间不足或超过某个阈值时&#x…