【金猿人物展】东方金信董事长兼总经理王伟哲:价值化、智能化驱动下的大数据,治理仍需深化...

news2024/11/18 10:52:39


78deb6782e16f823d25344b609a0f783.png

王伟哲

本文由东方金信董事长兼总经理王伟哲撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度趋势人物榜单及奖项”评选。

9a30a6196368d45319108e0bab0deda0.png




大数据产业创新服务媒体

——聚焦数据 · 改变商业


2023年,数据要素、公共数据授权运营成为热点话题,也是激活数据资产的必经之路。我个人认为,进一步提升数据治理成效、确立一体化的政务数据权责体系是目前的当务之急。12月15日,国家数据局发布了《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》,向社会公开征求意见。“数据要素×”涉及12大应用场景,主要通过数据要素的融合,提升各行业的数字化水平,促进数据要素的流通和应用,实现数据要素的价值最大化。

结合行业趋势和国家政策,2023年度大数据行业呈现出以下两大特点:

1、数据治理成为关键:随着数据量的增长,确保数据质量、安全和合规性的需求日益迫切。政府部门和企业需要建立更完善的数据治理体系,以应对这一挑战。

2、人工智能与大数据的深度融合:人工智能技术在大数据领域的广泛应用。如机器学习和深度学习,为企业提供了更强大的数据分析和决策支持工具,如大模型在自然语言处理、金融风控、医疗诊断、智能交通等领域都有比较成熟的应用。

在这样的大背景下,企业需要密切关注这些趋势,积极应对挑战,抓住机遇,实现可持续发展。

我个人认为,国家及各省市关于数据要素、数据交易一系列政策的出台将对2024年度大数据行业的趋势产生以下影响:

1、数据确权更加明确:数据产品的所有权将得到更加明确的确认,这将有效保护数据生产者的权益,提高数据交易的透明度和可信度。

目前,由于缺乏明确的数据产权法律法规,数据生产者往往面临着权益无法得到有效保护的困境。然而,随着对数据价值的认识逐渐提高,相关政策和法规也将不断完善,为数据生产者确立合法的所有权,使其能够更好地掌控和管理自己生产的数据产品。例如,假设某家公司在研发过程中积累了大量的医疗数据,并开发了一款基于这些数据的创新医疗诊断工具。在数据确权更加明确的情况下,该公司可以通过合法的方式确立对这些数据产品的所有权,从而有效保护自身的创新成果。这不仅可以鼓励企业进行更多的创新探索,还可以为数据交易提供更加可靠的基础。

其次,明确的数据确权将增加数据交易的透明度和可信度。数据市场的发展离不开数据交易的进行,而数据交易的核心问题之一就是信息不对称和信任缺失。当数据生产者能够明确拥有自己数据产品的所有权,并能够通过合法的方式授权他人使用这些数据时,数据交易的过程将变得更加透明和可信。

根据我们在数据三权分置方面的实践经验,我们主要专注于服务政府公共数据定价领域,重点在于基于不同的数据权属设计定价模型和策略。数据三权分置对企业参与数据流通起到了鼓励作用,因为这种制度分离了数据所有权与数据使用权,推动了企业对数据使用权的流通和利用,减轻了企业对数据所有权的纠结。然而,由于目前企业数据所有权和三权尚未有正式的法规约束以及权威确权机构,企业对数据流通的权利保护存在较大顾虑。基本原因在于企业期望数据流通价值能够得到法规的保护,因此,国家加快数据权属的立法是当务之急,也是三权分置落地的首要实际操作。

在我们的实际操作中,我们观察到以下情况:一方面,在各地交易所的数据资源或数据产品上架交易环节,交易所普遍采取“上架确权”的模式,即由第三方机构对上架产品的权属进行合规检查,从一定程度上保障了在交易所范畴内的权属保护。另一方面,今年8月财政部发布的《企业数据资源相关会计处理暂行规定》,要求企业主动披露入表数据资源的合法性和控制权,这也在表内空间保障了权属。换言之,“场内”和“表内”在技术层面对权属的保护提供了基础,但“场外”和“表外”还处于空白态。

由于数据的非实体性和可共享性,与实物不同,数据实际上很容易在“场内”、“场外”、“表内”、“表外”之间流动。因此,仅有“场内”和“表内”的技术确权,而缺乏“场外”和“表外”的确权,难以保护数据权属。因此,有必要在制度和法律上提出一个统一的、覆盖“场内”、“场外”、“表内”、“表外”的数据确权,以实质性推动数据流通。

2、大数据交易市场更加规范:随着数据确权的明确,大数据交易市场也将变得更加规范。这将有助于建立一个公平、透明、高效的数据交易环境,促进大数据产业的健康发展。例如,国家发改委、清华大学、中国人民大学联合某省大数据交易中心建立适配多级市场数据要素规律的定价机制与支撑平台,正在探索建立适配数据要素规律的定价机制;未来数据定价体系构建中,应充分适应数据交易“双向不确定性”和“非标准化”这两个特征,从数据要素的资源化、资产化、资本化价值变现三个层面构建新型博弈定价模型,并分别探讨成本法、收益法、市场法等定价方法的应用路径,逐步完成数据资源化、资产化、资本化的过程。

从当前趋势看,各地方、各行业正积极开展公共数据授权运营,引入社会化力量充分挖掘和释放公共数据价值,以公共数据开发利用为数据要素市场培育的突破点,培育产业生态。杭州、济南、青岛、武汉、烟台、郑州等地方相继发布针对公共数据授权运营的专门管理办法,推进建立授权运营工作机制。河南、福建、湖北、湖南、苏州等地相继成立地方数据集团公司,作为本地域开展公共数据授权运营的市场主体,以社会化力量推动公共数据与社会数据的融合开发利用。如在北京建设了金融数据专区、海南省数据产品超市,成都建设了数据运营服务平台,贵州建设了云上贵州集团等等。

3、对高质量的数据的需求将更加迫切。数据已成为未来人工智能竞争的关键要素,人工智能正从“以模型为中心”加速向“以数据为中心”转变。人工智能的蓬勃发展驱动数据要素市场需求爆发,高质量数据集缺乏的问题尤为突出。各类主体通过数据要素市场积极应对上述问题,部分地方和行业推出一系列举措加强高质量数据供给,为大模型成长提供充足“养料”。合成数据也成为模型训练中的重要类型,为数据要素市场带来了新需求。未来,合成数据将成为模型训练的关键数据。近两年,各地政府部门和行业主管部门积极推进公共数据开放,通过建立公共数据开放平台,逐步完善公共数据开发利用体系。这些平台提供了大量的公共数据集,涵盖市监、工商、交通、生态、公共设施等多个领域。

展望未来,我预期各省市会相继出台更多与数据交易相关的政策文件。这些政策文件将进一步促进大数据产业的健康发展,推动各行业的数字化转型。同时,进一步深化数据治理成效,形成高质量的数据也是当前的重点任务。

·关于王伟哲:

王伟哲,北京东方金信科技股份有限公司董事长兼总经理。武汉理工大学本硕,清华大学博士,18年大数据领域从业经验。曾任职中国软件、IBM和Teradata等公司;现任北京东方金信科技股份有限公司董事长兼总经理。

荣获 “中国大数据产业十大领军人物”、“未来100人物”、“数据英雄”、“2019数据智能领袖奖”等称号。被国家信息技术标准化委会,中国数据委员会等多个国内权威机构聘为专家委员,并担任国家信息中心数字中国研究院专家委员,国家信息中心数据资产研究中心主任。

266dd708804a9da15388b4d98437af99.jpeg

39b8198496e46f344294b12c6ca3c8de.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1359084.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flume基础知识(二):Flume安装部署

1. Flume 安装部署 1.1 安装地址 (1)Flume 官网地址:Welcome to Apache Flume — Apache Flume (2)文档查看地址:Flume 1.11.0 User Guide — Apache Flume (3)下载地址&#xf…

Halcon计算封闭区域(孔洞)的面积area_holes

Halcon计算封闭区域(孔洞)的面积 除了可以用area_center 算子计算区域的面积以外,在Halcon中还可以使用area_holes算子计算图像中封闭区域(孔洞)的面积。该面积指的是区域中孔洞部分包含的像素数。一个区域中可能不只…

深入了解Swagger注解:@ApiModel和@ApiModelProperty实用指南

在现代软件开发中,提供清晰全面的 API 文档 至关重要。ApiModel 和 ApiModelProperty 这样的代码注解在此方面表现出色,通过增强模型及其属性的元数据来丰富文档内容。它们的主要功能是为这些元素命名和描述,使生成的 API 文档更加明确。 Api…

解读 $mash 通证 “Fair Launch” 规则(Staking 玩法解读篇)

Solmash 是 Solana 生态中由社区主导的铭文资产 LaunchPad 平台,该平台旨在为 Solana 原生铭文项目,以及通过其合作伙伴 SoBit 跨链桥桥接到 Solana 的 Bitcoin 生态铭文项目提供更广泛的启动机会。有了 Solmash,将会有更多的 Solana 生态的铭…

静态网页设计——电影推荐网(HTML+CSS+JavaScript)

前言 声明:该文章只是做技术分享,若侵权请联系我删除。!! 感谢大佬的视频: https://www.bilibili.com/video/BV1NK411x7oK/?vd_source5f425e0074a7f92921f53ab87712357b 使用技术:HTMLCSSJS(…

C语言编译器(C语言编程软件)完全攻略(第十二部分:VS2010下载地址和安装教程(图解))

介绍常用C语言编译器的安装、配置和使用。 十二、VS2010下载地址和安装教程(图解) 为了更好地支持 Win7 程序的开发,微软于2010年4月12日发布了 VS2010,它的界面被重新设计,变得更加简洁。需要注意的是,V…

crontab 创建定时任务

1、创建crontab任务 crontab -ecrontab内容 */59 * * * * sh /home/restartAllSlave.sh >> /home/my-restartAllSlave.log 2>&12、创建执行脚本(restartAllSlave.sh) docker重启如下: docker restart slave_zllrp_gb_1 slav…

开源分布式任务调度系统DolphinScheduler本地部署与远程访问

文章目录 前言1. 安装部署DolphinScheduler1.1 启动服务 2. 登录DolphinScheduler界面3. 安装内网穿透工具4. 配置Dolphin Scheduler公网地址5. 固定DolphinScheduler公网地址 前言 本篇教程和大家分享一下DolphinScheduler的安装部署及如何实现公网远程访问,结合内…

web服务器nginx和Apache有什么区别?

随着互联网的快速发展,Web服务器在互联网应用中扮演着越来越重要的角色。其中,Nginx和Apache是两种广泛使用的Web服务器软件。尽管它们都可以实现Web服务器的功能,但Nginx和Apache在许多方面存在一些重要的区别。本文将探讨Nginx和Apache之间…

STC进阶开发(四)SPI协议、矩阵键盘、EEPROM

前言 这一期我们简单介绍一下SPI协议,然后我们学习一下矩阵键盘,了解EEPROM是干什么用的,话不多说,开整! SPI协议 SPI(Serial Peripheral Interface)是一种同步串行通信协议,用于在…

【MLOps】使用Ray缩放AI

Ray正在人工智能工程领域崭露头角,对扩展LLM和RL至关重要 Spark在数据工程中几乎是必不可少的。Ray正在人工智能工程领域崭露头角。 雷是伦敦大学学院Spark的继任者。Spark和Ray有很多相似之处,例如用于计算的统一引擎。但Spark主要专注于大规模数据分析…

智能革命:揭秘AI如何重塑创新与效率的未来

1.AI技术的发展与应用 1.1 AI技术的发展 人工智能(AI)的概念最早可以追溯到20世纪40年代和50年代,当时的计算机科学家开始探索如何创建能模仿人类智能的机器。最初的AI研究集中在问题解决和符号逻辑上,但随着时间的推移&#xf…

mmdetection训练自己的数据集

mmdetection训练自己的数据集 这里写目录标题 mmdetection训练自己的数据集一: 环境搭建二:数据集格式转换(yolo转coco格式)yolo数据集格式coco数据集格式yolo转coco数据集格式yolo转coco数据集格式的代码 三: 训练dataset数据文件配置config…

解决问题:PPT中插入视频编辑模式可以播放,幻灯片放映后播放不了

目录 一、原因分析二、解决办法三、其它问题 一、原因分析 这可能是由于PowerPoint的硬件图形加速功能导致的。 二、解决办法 禁用硬件图形加速。 (1)点击《文件》选项卡 (2)点击《选项》 (3)在《高级》…

如何使用ArcGIS Pro转换单个点坐标

坐标转换作为基础的功能,一般的GIS软件都支持,大多数情况下,我们是转换整个图层,如果想要转换单个坐标点,在ArcGIS Pro内也是支持的,这里为大家介绍一下转换方法,希望能对你有所帮助。 拾取坐标…

IPv6路由协议---IPv6静态路由

IPv6路由协议 路由是数据通信网络中最基本的要素。路由信息就是知道报文发送的路径信息,路由的过程就是报文转发的过程。 根据路由目的地的不同,路由可划分: 1.网段路由:目的地为网段,IPv4地址子网掩码长度小于32位或IPv6地址前缀长度小于128位。 2.主机路由:目的地为主…

某大型电商APP sign头部签名逆向分析

APP版本 唯品会 7.45Java层抓包分析 打开抓包工具 charles进行分析,可以发现对于API采集需要突破当前这个参数,否则不返回信息 jadx静态分析 jadx静态分析,打开app搜索关键词api_sign,可以发现有参数位置 跟进去上边str赋值方…

HttpRunner辅助函数debugtalk.py

辅助函数debugtalk.py Httprunner框架中,使用yaml或json文件进行用例描述,无法做一些复杂操作,如保存一些数据跨文件调用,或者实现一些复杂逻辑判断等,为了解决这个问题,引入了debugtalk.py辅助函数来进行一…

nccl 源码安装与应用示例 附源码

1, 官方下载网址 注意,本文并不使用nv预编译的包来安装,仅供参考: NVIDIA Collective Communications Library (NCCL) | NVIDIA Developer 2,github网址 这里是nv开源的nccl源代码,功能完整,不…

使用ffmpeg+flv.js + websokect播放rtsp格式视频流

对于rtsp的视频流网上有很多种的解决方案,但是大的趋势还是利用ffmpeg的工具进行rtsp的视频解析进行一个推流,我最终选择bilibili开源的flv.js,代码十分的简单全部都在底层封装好了。实现的方式也比较容易理解,ffmpeg进行rtsp的视…