王伟哲
本文由东方金信董事长兼总经理王伟哲撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度趋势人物榜单及奖项”评选。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
2023年,数据要素、公共数据授权运营成为热点话题,也是激活数据资产的必经之路。我个人认为,进一步提升数据治理成效、确立一体化的政务数据权责体系是目前的当务之急。12月15日,国家数据局发布了《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》,向社会公开征求意见。“数据要素×”涉及12大应用场景,主要通过数据要素的融合,提升各行业的数字化水平,促进数据要素的流通和应用,实现数据要素的价值最大化。
结合行业趋势和国家政策,2023年度大数据行业呈现出以下两大特点:
1、数据治理成为关键:随着数据量的增长,确保数据质量、安全和合规性的需求日益迫切。政府部门和企业需要建立更完善的数据治理体系,以应对这一挑战。
2、人工智能与大数据的深度融合:人工智能技术在大数据领域的广泛应用。如机器学习和深度学习,为企业提供了更强大的数据分析和决策支持工具,如大模型在自然语言处理、金融风控、医疗诊断、智能交通等领域都有比较成熟的应用。
在这样的大背景下,企业需要密切关注这些趋势,积极应对挑战,抓住机遇,实现可持续发展。
我个人认为,国家及各省市关于数据要素、数据交易一系列政策的出台将对2024年度大数据行业的趋势产生以下影响:
1、数据确权更加明确:数据产品的所有权将得到更加明确的确认,这将有效保护数据生产者的权益,提高数据交易的透明度和可信度。
目前,由于缺乏明确的数据产权法律法规,数据生产者往往面临着权益无法得到有效保护的困境。然而,随着对数据价值的认识逐渐提高,相关政策和法规也将不断完善,为数据生产者确立合法的所有权,使其能够更好地掌控和管理自己生产的数据产品。例如,假设某家公司在研发过程中积累了大量的医疗数据,并开发了一款基于这些数据的创新医疗诊断工具。在数据确权更加明确的情况下,该公司可以通过合法的方式确立对这些数据产品的所有权,从而有效保护自身的创新成果。这不仅可以鼓励企业进行更多的创新探索,还可以为数据交易提供更加可靠的基础。
其次,明确的数据确权将增加数据交易的透明度和可信度。数据市场的发展离不开数据交易的进行,而数据交易的核心问题之一就是信息不对称和信任缺失。当数据生产者能够明确拥有自己数据产品的所有权,并能够通过合法的方式授权他人使用这些数据时,数据交易的过程将变得更加透明和可信。
根据我们在数据三权分置方面的实践经验,我们主要专注于服务政府公共数据定价领域,重点在于基于不同的数据权属设计定价模型和策略。数据三权分置对企业参与数据流通起到了鼓励作用,因为这种制度分离了数据所有权与数据使用权,推动了企业对数据使用权的流通和利用,减轻了企业对数据所有权的纠结。然而,由于目前企业数据所有权和三权尚未有正式的法规约束以及权威确权机构,企业对数据流通的权利保护存在较大顾虑。基本原因在于企业期望数据流通价值能够得到法规的保护,因此,国家加快数据权属的立法是当务之急,也是三权分置落地的首要实际操作。
在我们的实际操作中,我们观察到以下情况:一方面,在各地交易所的数据资源或数据产品上架交易环节,交易所普遍采取“上架确权”的模式,即由第三方机构对上架产品的权属进行合规检查,从一定程度上保障了在交易所范畴内的权属保护。另一方面,今年8月财政部发布的《企业数据资源相关会计处理暂行规定》,要求企业主动披露入表数据资源的合法性和控制权,这也在表内空间保障了权属。换言之,“场内”和“表内”在技术层面对权属的保护提供了基础,但“场外”和“表外”还处于空白态。
由于数据的非实体性和可共享性,与实物不同,数据实际上很容易在“场内”、“场外”、“表内”、“表外”之间流动。因此,仅有“场内”和“表内”的技术确权,而缺乏“场外”和“表外”的确权,难以保护数据权属。因此,有必要在制度和法律上提出一个统一的、覆盖“场内”、“场外”、“表内”、“表外”的数据确权,以实质性推动数据流通。
2、大数据交易市场更加规范:随着数据确权的明确,大数据交易市场也将变得更加规范。这将有助于建立一个公平、透明、高效的数据交易环境,促进大数据产业的健康发展。例如,国家发改委、清华大学、中国人民大学联合某省大数据交易中心建立适配多级市场数据要素规律的定价机制与支撑平台,正在探索建立适配数据要素规律的定价机制;未来数据定价体系构建中,应充分适应数据交易“双向不确定性”和“非标准化”这两个特征,从数据要素的资源化、资产化、资本化价值变现三个层面构建新型博弈定价模型,并分别探讨成本法、收益法、市场法等定价方法的应用路径,逐步完成数据资源化、资产化、资本化的过程。
从当前趋势看,各地方、各行业正积极开展公共数据授权运营,引入社会化力量充分挖掘和释放公共数据价值,以公共数据开发利用为数据要素市场培育的突破点,培育产业生态。杭州、济南、青岛、武汉、烟台、郑州等地方相继发布针对公共数据授权运营的专门管理办法,推进建立授权运营工作机制。河南、福建、湖北、湖南、苏州等地相继成立地方数据集团公司,作为本地域开展公共数据授权运营的市场主体,以社会化力量推动公共数据与社会数据的融合开发利用。如在北京建设了金融数据专区、海南省数据产品超市,成都建设了数据运营服务平台,贵州建设了云上贵州集团等等。
3、对高质量的数据的需求将更加迫切。数据已成为未来人工智能竞争的关键要素,人工智能正从“以模型为中心”加速向“以数据为中心”转变。人工智能的蓬勃发展驱动数据要素市场需求爆发,高质量数据集缺乏的问题尤为突出。各类主体通过数据要素市场积极应对上述问题,部分地方和行业推出一系列举措加强高质量数据供给,为大模型成长提供充足“养料”。合成数据也成为模型训练中的重要类型,为数据要素市场带来了新需求。未来,合成数据将成为模型训练的关键数据。近两年,各地政府部门和行业主管部门积极推进公共数据开放,通过建立公共数据开放平台,逐步完善公共数据开发利用体系。这些平台提供了大量的公共数据集,涵盖市监、工商、交通、生态、公共设施等多个领域。
展望未来,我预期各省市会相继出台更多与数据交易相关的政策文件。这些政策文件将进一步促进大数据产业的健康发展,推动各行业的数字化转型。同时,进一步深化数据治理成效,形成高质量的数据也是当前的重点任务。
·关于王伟哲:
王伟哲,北京东方金信科技股份有限公司董事长兼总经理。武汉理工大学本硕,清华大学博士,18年大数据领域从业经验。曾任职中国软件、IBM和Teradata等公司;现任北京东方金信科技股份有限公司董事长兼总经理。
荣获 “中国大数据产业十大领军人物”、“未来100人物”、“数据英雄”、“2019数据智能领袖奖”等称号。被国家信息技术标准化委会,中国数据委员会等多个国内权威机构聘为专家委员,并担任国家信息中心数字中国研究院专家委员,国家信息中心数据资产研究中心主任。