2023隐私计算与人工智能峰会成功举办!数据宝演讲实录(上篇)分享

news2024/11/24 10:43:45

2023年4月8日,2023隐私计算与人工智能峰会在深圳举办,大会由华东江苏大数据交易中心和热点资讯联合主办,会上,数据宝董事詹臻女士做开幕式致辞。

数据宝与开放群岛(Open Islands)进行战略签约,数据宝轮值CEO肖斌上台与开放群岛共同点亮启动球。

本次峰会以 “聚焦隐私计算,赋能人工智能未来” 为主题,汇聚互联网生态发展,以互联网技术为核心,用户体验为导向,实现公平、开放、安全的网络系统和生态体系。打造隐私计算技术应用与生态互动交流平台,启动新全球数字经济系统。数据宝轮值CEO肖斌受邀以《隐私计算应用场景与数据宝实践探索》为题发表演讲。以下是数据宝轮值CEO肖斌演讲实录(上篇)。

在这里插入图片描述

各位嘉宾,各位同仁,大家上午好!我今天代表数据宝跟大家做一个简单的分享和汇报。

汇报大概分为几个方向,第一个是数据宝在隐私计算主要落地场景,第二是数据宝的落地实践探索,第三个是数据宝看隐私计算现状,第四个是数据宝的解决方案探索,最后是介绍一下数据宝。

首先是数据宝在隐私计算主要落地场景。不管是政策红利,还是客观市场上的需要,隐私计算迎来了比较重大的发展机遇。从2019年开始,隐私计算方面的趋势还是逐年递增,在2021年已经迎来了比较高速的发展状态,它在各个方面都有比较多的明显的应用可能性。数据宝在这个方向来说,也有自己的探索和实践,包括金融、保险、政务,当然也包括上一位嘉宾讲到的医疗方面,也有很多这样的应用。
在这里插入图片描述

从这个大的饼图里看,在金融侧来说对于隐私计算的需求和市场上落地的角度来说,它的需求量是比较旺盛的。

重点讲几个场景,第一个先说说金融、保险。金融和保险主要解决的问题是什么?数据在应用的时候,不管是数据风控还是保险反欺诈,甚至更多纬度信息的评估,去降低风险。在这个角度来说,它有风控方向的,当然也有包括金融方面,不管是新增方面还是主动营销方面,它需要大量外部的数据,与企业内部进行共融,这时候就需要引入合规的、合法的、安全的、可控的制度去保障数据外部引用之后能够实现在合规场景下的应用。还有一块是监管方向,不管是统计类型还是查询类型,都会解决面向金融,不管是银监会还是证监会,各个监管机构有大量关于信息用户各个纬度的,需要对它的内容进行监管,不管是它的客户还是它的实际交易场景要做各种各样的监管。在这个方向来说,它也需要依赖于融合各方的数据。在融合数据的时候,需要有一个安全合规的解决方案。隐私计算在这里,是能够发挥巨大的作用。这是数据宝通过实践得出的判断。

还有一个方向,是政务方向。在这个方向有很多政策的红利,政策是随着市场化的推进有一个明显变化的趋势,从最早的时候,认知数据是有效的资产,简单理解它是一个金矿。第一阶段首先要解决的是数据能够融通、能够解决孤岛、能够实现未来更多场景应用、实现聚合的方向。在聚合的过程中,其实涉及到大量的包括随着互联网企业高速发展以及一些不良数据应用的场景,在数据应用方面会出现很多问题。国家连续出台几个法律,在我们行业里经常讲的“三法”,不管是数据安全、网络安全还是个人隐私,这几个法律出台之后好像给我们行业增加了一个“紧箍咒”。数据要素市场化流通首先要解决“三法”如何合规的问题,市场变成了什么样的导向呢?先解决合规安全,在合规安全条件下再往前走一步。在现阶段,不管是数据二十条,还是近期出的国家发展规划,大数据经济发展规划里,它的导向又发生了些许变化,期望数据要素能够发挥最大价值,能够创造更多市场上的应用。在创造价值的前提下,要保障它的合规。也就是说,它的顺序发生了一定变化。原本是期望我们能够在安全的状态下做一定的市场价值挖掘,现在变成叫“能够更多地放大它市场价值的前提下保障它的数据安全”,这两个变化,后面我会稍微展开一下。

在政务方向来说,不仅是政务基本数据的共享,还是更多公共数据能够开放出来,尤其是政务相关的数据能够在市场化流通起来,如何做运营方面,都需要给它解决数据安全和合规的问题,包括政府在这里面如何解决监管和信息可控的问题。

数据宝也在这个方面做了一些落地的实践探索。我们先举一个例子,数据宝在国有资源的做代运营,代运营的逻辑是什么?帮助国家各个部委、国央企的数据实现市场化变现,寻找更多市场化增量空间。数据宝代运营了很多部委的数据,做了一些自己的探索,比如在保险场景里,我们是依赖自己的车辆动态相关的大数据,解决了原有简单依靠静态数据去做风险定价的模型,做了一个主动性的探索,增加了动态地很多车辆的风险与自身的车型、自身属性是有很大关系的。与车辆行驶的里程、疲劳的情况、驾驶的情况以及他在运输过程中他的频度、长度有巨大的关联。我们通过这个方向,去做一定的探索。这个案例也是讲我们在小货车方向,小货车具备量级规模比较大,我们数据在引入时候起到了巨大的效果,在企业实践里也得到的验证,我们引入了车辆动态因子,创造了动态化和动静结合的模型,实践上也有比较好的效果。
在这里插入图片描述

我们从小货车模型出发,逐渐推广到大货车模型,包括面对车队风险评估的模型,现在也在尝试探索私家车车险定价和反欺诈相关的模型上的应用,结合我们的数据,后面会讲到我们如何引入一些数据安全合规,包括隐私计算相关技术,去解决我们在联合建模、在市场化应用场景里的一些探索。

这是刚才讲到的,我们在车险建模的时候其实就引入了较多的数据源,首先需要有理赔车险数据,也需要车辆的静态数据及交通相关的动态数据。动态数据多元的情况下,每个数据供给方都会对自己的数据保护有强烈的需求,这时候如何解决保护各方数据源、所有方数据利益前提下实现我们数据挖掘呢?数据宝探索了基于联邦学习的方法,应用这个方法去解决。数据宝一侧引入了交通静态和动态的数据,技术解决方案具体的不展开,因为前面几位介绍得比较多。通过这种方式,我们解决了引入多方数据,去提升模型的场景。

我们也探索了另外一种场景,在全同态加密的方式,我们对所有数据在密文状态下进行建模,取得了阶段性成果。在利润状态下,我们建模效果和全明文效果,偏差度最高不超过7%。这是技术相对比较高的,但是从技术方案来说是比较高的。在这个地方我想多讲一句,为我后面做的事情做铺垫。我们公司有比较多的精算人员、算法专家,在精算和算法专家互相PK的时候发生一些比较有趣的现象,算法人员认为依靠全同态加密这种方法,甚至半同态加密,我们也做过尝试,这种状态下做出的效果,偏差度是比较低的。但是从精算和市场角度来说,他们认为是不可接受的。为什么呢?因为在一些场景,比如车险场景里,其实对你最终的盈利能力包括首单投保盈利能力是有阈值的。当偏差超过3到5%的时候,这个处于负利润状态。也就是说这个模型在7%左右,看似在理论上不错,实际商用上是存在一定欠缺的。我们就会尝试联邦学习的方式,包括半同态,这是我们尝试的方向,我们最终解决最终商业价值变现的问题。

这是数据核验类的场景,不管是验证个人、企业各种社会化场景,比如车辆基本信息的情况,包括企业内部车辆一些基本情况,包括企业运力各种情况,有大量验证类的场景。我们采用的是数据宝认为的安全域的产品,有点类似于TEE,实际不是纯的硬件解决方案,是基于商业化策略及我们配套的密码机制去解决安全域的应用场景。

这里稍微展开一点。在核验方会引入比较多的入参,在入参进行加密操作,通过在密文状态下进行传输,中间经过包括数据宝在内的数据方都是密文状态的,不存在数据存储和再应用的场景。进入到数据源方进行验证的时候,他也会在密文状态进行匹配,获得入参信息,数据宝在中间过程包括中间实际应用的企业,不管是金融公司还是互联网公司,甚至包括政府,都能够实现无感知的透传。最终应用终端体验或者终端客户的时候能够完成验证的过程,我们依靠的是产品安全域的解决思路。

这是关于公安的,也类似刚才的场景,我们实际上是把查询方包括能够实现信息匹配的入参唯一性的ID做了公钥、私钥的加密操作。在密文状态下,实现分发。这里引入了一些分片的机制,因为数据存取,包括我可能一对多或者多对一的场景。在多对一场景的时候,我们会把数据进行分片,进行密文的加密,也解决了前三位讲到的说我们通过隐私计算里面具体的技术,能够实现在规模化应用场景下,能够不出现数据的泄露,以及无法感知我具体求取的是哪一个,保证最终得到的结论是保持一致的。

(上篇完)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/472524.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LoRA: 大语言模型个性化的最佳实践

出品人: Towhee 技术团队 大型语言模型(LLM)在今年获得了极大的关注。在以往,预训练微调(finetuning)成为了让模型适配于特定数据的最佳范式。然而随着大型模型的出现,这种完全微调(…

【运动规划算法项目实战】如何实现机器人多目标点导航

文章目录 前言一、 什么是actionlib?二、实现流程三、总结前言 在ROS机器人应用中,实现机器人多目标点导航是非常常见的需求。本文将介绍如何使用ROS和actionlib来实现机器人的多目标点导航,目标点信息将被记录在YAML文件中。 我们可以通过使用MoveBaseAction来实现机器人…

高并发场景下JVM调优实践

一、背景 2021年2月,收到反馈,视频APP某核心接口高峰期响应慢,影响用户体验。 通过监控发现,接口响应慢主要是P99耗时高引起的,怀疑与该服务的GC有关,该服务典型的一个实例GC表现如下图: 可以…

【WinForm】定时器的使用方法除了定时还有延迟执行可用

在使用VS开发工具创建的WinForm项目中,有一个定时器组件,拖出来放上,它只是一个定时处理的作用,不会显示在窗体中。 开发中如果需要定时处理,就使用Timer组件即可, 在它的属性事件一栏里,有一…

offer选择:创业公司 VS 大厂外包

面试拿到两个offer,一个是规模只有几十人的初创小公司,另一个是大厂外包岗位。都是功能测试,两者薪水待遇也差不多,该如何选择?更有利于之后的职业发展...... 这是一个比较典型的问题,对于要转行的同学或者是刚入行没…

【Call for papers】2023年CCF人工智能会议信息汇总(持续更新)

本博文是根据2022年CCF会议推荐的人工智能领域相关会议目录撰写。 注: 由于一些会议的投稿时间还没公开,因此根据往年投稿时间在表格中使用 ~ 符号表示大概的投稿时间(一旦会议日期更新,我们也将同步更新博文。若更新不及时请小伙…

C++常用23种设计模式总结(一)------单例模式

什么是单例模式 单例模式是一种设计模式,它保证一个类只有一个实例,并提供一个全局访问点来访问该实例。这个模式通常用于控制资源的访问,例如数据库连接、线程池等。单例模式通过限制实例化操作并提供访问方法,确保在整个应用程序…

【Unity3D小功能】Unity3D中实现模型的旋转、缩放效果(控制摄像机)

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客 大家好,我是佛系工程师☆恬静的小魔龙☆,不定时更新Unity开发技巧,觉得有用记得一键三连哦。 一、前言 其实之前已经写了关于如何控制模型的旋转、移动、缩放效果&…

Android开发:使用sqlite数据库实现记单词APP

一、功能与要求 实现功能:设计与开发记单词系统的四个界面,分别是用户登录、用户注册、单词操作以及忘记密码。 指标要求:通过用户登录、用户注册、单词操作、忘记密码掌握界面设计的基础,其中包括界面布局、常用控件、事件处理等…

NPN三极管放大原理

NPN三极管放大 这是华为的芯片,还有其他人的芯片 无论这些芯片再复杂,它们都是由这种材料制成的 ​ 硅晶体 我们把他放大,单个硅原子最外层带有四个电子, 在纯硅当中,这些电子会两两形成共价键,此时周围形成非常稳定的八电子结构 我们接上电池, 电池无法吸引其中的电子离开,也…

不止大模型,亚马逊云科技布局AIGC底座能力

“大模型只是客户需求的其中一个部分,但远远不是所有,客户还需要更广泛的基础能力。亚马逊云科技推出自研芯片、生成式AI服务Bedrock以及大模型Titan,都在致力于推动AIGC技术的普惠化,够降AIGC的技术门槛和资金门槛,让…

万应低代码4月重点更新内容速递

低代码开发能力提升 分布式缓存支持 万应提供了一套分布式的缓存系统,可在多个节点之间共享缓存数据,从而加速数据获取速度,提高应用的性能和效率。包含: 缓存设置节点:把需要高频访问的数据写入到缓存中,并…

vue3 vue.config.js配置Element-plus组件和Icon图标实现按需自动引入

打包时,报警告,提示包太大会影响性能 1.配置前包体积: 2.安装插件: npm i unplugin-auto-import unplugin-vue-components unplugin-icons -D 3.vue.config.js中加入以下配置: const { defineConfig } require(vu…

Vue3 Antd 父子嵌套子表格

Vue3 Antd 父子嵌套子表格 父子嵌套子表格 目标1:可以点击多个父节点表格,正确显示子表格数据 目标2:父表格数据刷新重载,解决子表格数据不刷新问题 官方示例代码,以及效果 https://www.antdv.com/components/tabl…

linux0.12-8-2-asm.s

[290页] 8-2 asm.s程序 8-2-1 功能描述 1、 我们先考虑c)、 d) 2、无出错码 2.1、 将要执行的处理函数压栈; 2.2、 eax被交换入栈。现在eax护理函数 2.3、 其他寄存压栈 2.4、 立即数0压栈 2.5、 取edxEIP后,将edx压栈 2.6、 段寄存器都设置0x10段选…

通过身份个性化网络(IPM)实现真实世界的自动化妆

来源:投稿 作者:小灰灰 编辑:学姐 论文标题: Real-World Automatic Makeup via Identity Preservation Makeup Net 论文链接:https://www.ijcai.org/proceedings/2020/0091.pdf论文代码:https://github.co…

XRSPACE 总经理刘冠廷:元宇宙行业如何通过 2D、3D 联动,实现高速用户增长?

序言: 元宇宙领域创业并非坦途,似乎已经成为了行业共识。 即使到今天,VR/AR 领域的装备开支和上手学习成本居高不下,全球整体用户体量相比移动互联网也仍属早期阶段。 在这样的背景下,元宇宙公司如何持续且快速地获…

python毕业设计之django+vue流浪宠物动物救助领养网站

开发语言:Python 框架:django Python版本:python3.7.7 数据库:mysql 数据库工具:Navicat 开发软件:PyCharm 网站前台: 站内新闻:针对网站的新闻信息进行展示,能够展示…

简单聊聊Echarts伪3D地图实现的相关配置

知识和技能真的是用进废退,还是得多实践,才不至于遗忘。 目录 前言 二、实现原理 三、从0开始实现 1.目录结构 2.地图JSON数据获取 3.具体实现,重头戏 3.一些常见问题的解决方法 总结 前言 本文简单来聊一聊Echarts伪3D地图的实现&a…

Java面试被问Spring哑口无言?100道Spring面试考点解析

对于开发同学来说,Spring 框架熟悉又陌生。 熟悉:开发过程中无时无刻不在使用 Spring 的知识点;陌生:对于基本理论知识疏于整理与记忆。导致很多同学面试时对于 Spring 相关的题目知其答案,但表达不够完整准确。今天展…