2011年,麦肯锡发布报告,认为“大数据Big Data已成为当今竞争、创新、生产效率提升的关键基础”。一时间,大数据,成为业内热点。数据,大家都懂;大,有什么区别?
而不管大的是什么,至少一个确定的趋势是,数据资产,越来越值钱。
这股科技新风也来到中国。本着“懂不懂先不说,有新趋势就先干”的大A,也渐渐热闹起来。比如拥有消费者购买记录的百货公司,虽然还处于电商取代线下的衰退趋势中,但投资者还是兴奋地给了“估值重构”的机会,2013年7月份,也曾有过股价快速涨一倍的战绩。
2015年4月,我国首家大数据交易所——贵阳大数据交易所成立,对数据资产的探索,又迈出了关键一步。成立当天就完成了第一笔数据交易,交易所管理层也雄心勃勃,提出在3~5年内将日交易额推到100亿元的规模。
百货行业没有避开电商的冲击,业绩也没有被数据资产改善;而短信等数据,也让投资人清醒,有的数据是资产,有的只是01代码,或者只是投资人情绪的载体。而在大数据领域创业的公司,也有一些融了FGH轮之后,不得不卖服务器来改善现金流。而贵阳大数据中心也在2022年8月,才实现了数据交易规模突破1亿元。
然而,也正如Gartner公司经典的科技发展曲线一样,技术发展不是一帆风顺,数据的资产重塑,也必经历曲折。基于庞大数据的算法,正成为许多公司业务提升的诀窍,例如在短视频、在自动驾驶。而数据交易所的数量扩展到了30多家。
数据资产,似乎是“玄学的显学”,显而易见的是,数据很重要、数据很好用、数据很值钱;而玄之又玄的是,数据如何成为资产?如何成为可交易的资产?如何成为产生更大收益的资产?要回答这些问题,并不容易。
用户的数据所有权、平台的数据所有权,如何界定?
不当访问:该用数据做什么
一个不成文的行业惯例,是用户的数据属于用户;但提供服务的平台,可以通过用户的授权(不点击同意授权,就没办法使用应用),对数据具有一定的使用权。通过对数据的分析、使用,提升整体效率、拿到双赢自然是最好不过了。
一个经典的案例,是沃尔玛通过样本数据得到结论,在尿不湿旁边摆放啤酒,既提升了销量,又节省了用户选购时间。而在地图软件上,通过分析终端用户的数量、用户的移动速度,也可以对路况得到大致的分析,有助于用户提前规划路线、节省时间。
数据分析提升生活的案例,不胜枚举。但不可否认的是,算法的世界,也有信息茧房、大数据杀熟等等让人担忧的事情。数据的使用,也有边界。
最近,某互联网公司的国际业务犯了个错误,员工未经用户允许、且在非法律要求的情况下,查看了几位用户的数据。尽管几位员工的目的和探寻公司机密信息泄露相关,但很不幸,这个行为依然引起了舆论的轩然大波,同时也会面临监管机构的调查、甚至处罚。
我们目前的数据,大部分都是和个人相关,要变成资产,就必须先守好边界。用户期待的是,用我的数据,让我更好;而不是利用我的数据,找到我的弱点,猛攻、谋利。
隐私计算:安全分析数据
汽车领域有过一场争论,关于整车厂是否要丢掉自己的灵魂。
这个冲突在现实中很常见,拥有数据的公司,许多并不具备分析数据的能力,而如果把数据完全公开给合作方,不仅涉及隐私、甚至还会丢掉灵魂。而另一方面,一家机构的数据维度有限,要达到更好的效果,也难免会涉及多方数据共享。
如何让数据合规、安全得到处理?所谓,原始数据不出域、数据可用不可见。这就需要用到“隐私计算”。
隐私计算,也是前几年的创业热潮。刚需性毋庸置疑,但在从概念验证走向商业落地过程中,存在的瓶颈也是显而易见:技术路线差异大、派系众多、理论复杂晦涩。比如在技术体系方面,就有:
姚期智教授在1982年提出的“多方安全计算”;可追溯到1996年的、谷歌也在大力使用的“联邦学习”;Intel等芯片公司推动的由软硬件方法构建安全区域的“可信执行环境”;以及包括差分隐私、图联邦等在内的其他技术等。
而所有的技术路线,也都有一些共性瓶颈。专注于隐私计算领域的上海富数科技,在和远川科技的产业交流中强调,本身用来解决安全合规问题的隐私计算,却也存在多个“安全黑盒”:
算法协议存在“安全黑盒”。虽然隐私计算的理论基础是公开、被广泛认可的学术研究成果,但在实际应用中,为了满足商业环境需求,也会自行改造算法协议,而这部分修改对客户是不透明的,也缺少严谨性,但却存在安全基础坍塌的风险。
这就有点类似于祖传秘方,也许好用,但也不知道为什么,总还是有点担忧。
算法代码存在“安全黑盒”。算法代码容易被恶意修改,无法与算法协议保持一致性,从而也破坏了算法原本的安全性和正确性。
数据交互存在“安全黑盒”。原始数据一般会先经过本地计算和加密处理,产生中间数据,然后再用中间数据和合作方进行交互。但,中间数据的准确性无法验证。这不禁令人想到一幕幕鬼才的翻译桥段,中间人如果不靠谱,做啥都是干瞪眼。
应用流程存在“安全黑盒”。单个算法可能满足安全要求,但是多个算法流程的组合,是否安全,就存在不确定性。这也好理解,概率论告诉过我们,多个非100%的准确率叠加后,同时都正确的概率就会大幅降低;而且,组合也会提高复杂度。
隐私计算的审计监管存在“安全黑盒”。隐私计算产品中的算法、数据安全性和一致性难以验证评估,因此审计监管只能依赖人工审查和理论证明。而如果采用“自证清白”的方式,不仅流程繁复、效率低下,而且静态的验证也难以检测真实应用情况。
困难重重。但解决方案也在推进,比如通过数据洞察、通信透析、日志开箱、代码审计、全链路可视化等方式,可以有效缓解黑盒瓶颈。
隐私计算的应用,会逐步打破数据孤岛,将数据资产连接起来,实现真正的数字社会;但隐私计算的发展,也并不是安全公司一家的事儿,对算力、通信网络传输性能都提出了巨大需求和挑战。
每个时代,都有其对应的核心资产要素。
农业经济时代,农业技术是第一生产力,土地、劳动力、农耕工具是核心生产要素;工业经济时代,蒸汽、电力技术是第一生产力,能源、设备、资本,也成为核心要素。
而在当下数字经济时代,数字技术成为第一生产力,数据资产,也已经和土地、劳动力、资本、技术等并列成为生产要素。
数据不仅只有个人数据,企业数据、公共数据,都是可以挖掘的资产。数据资产的时代趋势是清晰,但路径却充满挑战:搜集、确权、加工、分析、定价、使用、监管,多个环节、多种困难。正视困难,是成功的开始。而时代机遇,也恰恰存在于解决时代难题的过程中。
免责声明:本公众号所发布的文章为本公众号原创,或者是在网络搜索到的优秀文章进行的编辑整理,文章版权归原作者所有,仅供读者朋友们学习、参考。对于分享的非原创文章,有些因为无法找到真正来源,如果标错来源或者对于文章中所使用的图片、链接等所包含但不限于软件、资料等,如有侵权,请直接联系后台,说明具体的文章,后台会尽快删除。给您带来的不便,深表歉意。