纯纯的,共享出来了
目录
摘要
2 数据价格动态评估模型
2.1 数据产品定价策略
摘要
传统数据交易平台中,定价完全由平台把控,数据所有者不明确数据潜在价值,网络买卖双方信用缺失,导致数据交易中的数据价格难以评估。本文提出了一种基于信用博弈的数据价格动态评估模型。模型包括:数据产品定价策略和信用博弈模型。买卖双方通过问价和报价机制进行信用博弈,通过信用博弈模型得出信用函数结合数据产品定价策略得出数据价格。本文分别对信用博弈模型基本博弈过程和重复博弈过程中混合策略贝叶斯均衡和混合策略完美贝叶斯均衡的存在性进行了证明。最后通过仿真实验模拟买卖双方交易得出:信用函数在数据交易中发挥重要作用,本模型可以完成数据价格评估,价格差异百分比控制在10%左右,交易成功率达到96%以上。
现实生活中商品是有价的,但是当商品的生产成本难以衡量便导致难以对其进行估价,人们运用深度学习方法通过特征学习进行估价,比如神经网络在二手车价格评估的应用[1],一种基于情感分析的金融市场趋势预测方法[2]。但是这些价格评估仅针对单一商品相关数据集进行特征学习完成估价。
数据不同于现实物品,数据的形式多种多样,数据的内容各式各样,导致特征难以学习。因此我们应该充分发挥市场的功能,回归到价格原始的形成机制,充分发挥买卖双方的主动性。
本文的主要贡献包括2个方面:
- 建立数据价格动态评估模型,包括数据产品定价策略和信用博弈模型[3]。对动态博弈过程进行分析并证明了纳什均衡的存在性。信用博弈模型解决买卖双方不诚信问题;数据产品定价策略防止数据价值偏离;
- 11
1 引言
大数据时代已经来临,根据《2021中国大数据产业发展白皮书》,2020中国大数据产业规模达6388亿元,同比增长18.6%。到2025年,中国大数据产业规模将达到3万亿元[4]。
随着机器学习,深度学习,神经网络和数据挖掘技术的逐渐成熟。数据在这些技术中发挥的作用日益明显。数据交易的发展一方面能够为数据的提供者带来收益,另一方面,数据的购买者也能够因此满足自己的实际需求。达到双方互惠互利,合作共赢的效果。
数据价格和其成本严重失衡。数据具有生长速度快,价值难以估计[5-6]。在传统的中心服务器数据交易平台中,用户将数据上传就会失去对数据的控制权,数据定价单纯由卖方(object,O)定价或者由平台方定价。数据的价值评估,数据的交易授权,完全依靠第三方中心平台,导致数据价格和其成本严重不匹配。没有涉及买方(subject,S)与卖方O之间的动态的讨价还价。在数据的司法定位与保护[7]提出对数据文件设定绝对权,数据文件所有权的原始取得人为交易观念视角下的数据文件制造者,当数据权被他人侵害使用法律的武器保护自己的权益。但是当面临数据价值低于诉讼成本时,这种方式不在适用。
信任关系是人类复杂的社会关系之一,良好的信任模型能够抵抗攻击[8-9]实现信用评估。文献[8]定义了两个不同资产之间的双向可信交易协议,将交易过程划分为三种状态来识别交易的阶段,在不增加计算机资源的情况下实现不同资产的交换。本文以博弈的方式让买卖双方选择性的进行问价或出价进行信用博弈。因此,开放式交易平台中数据价格动态评估就是买方S和卖方O间的非完全信息动态博弈[10-11]问题。在移动云计算中基于动态博弈[12]中提出动态博弈的推荐激励策略可以提高移动云服务的数据安全和隐私保护。我们将这种激励策略应用到信用评估中。
在开放式交易平台中,买方S对卖方O的初次请求行为发生后,在一定的时间间隔后,也许请求行为再次发生,即前者为基本博弈,后者为重复博弈。重复博弈[13-14]是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”。重复博弈是多阶段博弈的一种,它是基本博弈的简单反复,博弈双方在各阶段的策略变量及支付结构都是完全相同的,因此认为重复博弈过程是由基本静态博弈[15]构成的。但是,在买卖双方交互过程中,博弈实体双方在每个“阶段博弈”后,行动都被双方观测到,观测的结果直接会导致再次博弈行为发生时各自采取行为策略的选择和均衡结果,所以重复博弈又是一个动态过程,属于动态博弈范畴,不能简单把重复博弈作为基本博弈的线性叠加。显然,买卖双方的重复博弈具有开放结构和封闭结构的双重特征:(1)重复博弈每一阶段的信息结构不受对方以前行为的影响,因而弈者的策略具有开放策略的性质;(2)由于买卖双方都观测到双方博弈过去的历史行为,因此,买方S(卖方O)可以针对卖方O(买方S)的行为采取相应的行动以引导买方S(卖方O)将来的行动。
由于重复博弈的效用与单次静态博弈和动态博弈不同,它不是整个重复博弈结束后的一个总的效用,而是包含博弈过程的每个“阶段博弈”中产生的效用。因此,本文面向开放式交易平台,基于信任构建了在数据交易中数据价格动态评估模型,给出了基于信任的请求控制博弈的扩展式和支付矩阵[16-18]。通过对网络实体双方交互过程的分析,分别对基于信任的动态请求控制博弈基本博弈过程和重复博弈过程中混合策略贝叶斯均衡和混合策略完美贝叶斯均衡[19-21]的存在性进行了证明。
2 数据价格动态评估模型
本模型由两部分构成:数据产品定价策略和信用博弈模型。数据产品定价策略防止数据价值偏离;信用博弈模型得到买卖双方的信用函数值,动态评估买卖双方信用。通过信用博弈模型得出信用函数值结合数据产品定价策略完成数据价格动态评估。
2.1 数据产品定价策略
数据产品定价策略:平台方会根据数据性质如稀缺程度、数据量大小、数据条目数属性得到售价,计算的出建议售价SP。再根据售价范围表得到售价范围[p1,p2]。
其中稀缺程度划分了三个等级,分别为低中高。稀缺程度的划分是通过卖方提交数据的关键词和以往的数据交易记录进行搜索比对。根据检索的条目数确定相应的等级。通过关键词进行搜索到的条数在三至十条范围内认定数据集稀缺程度中等;当小于三则认定稀缺程度较高;大于十认定稀缺程度较低。稀缺程度为中设定稀缺等级数值为一。具体等级划分如等级划分表所示。