2022年12月28日,由中国信息通信研究院(以下简称中国信通院)、中国通信标准化协会指导,隐私计算联盟、中国通信标准化协会大数据技术标准推进委员会联合主办的2022可信隐私计算峰会在北京召开,本次峰会的主题为“推进隐私计算互联互通,助力可信数据要素流通”,当日网络直播过万人次观看。冲量在线联合创始人&CTO陈浩栋于大会中发表了题为《基于可信执行环境构建更安全的数据流通方案》的演讲。
PART 01
可信执行环境TEE技术展望
隐私计算作为公认解决数据流通的安全问题而生的技术,其包含三种技术路径多方安全计算、联邦学习、可信执行环境(TEE),其中可信执行环境可以兼并隐私安全和性能。
可信执行环境TEE在国际上作为隐私计算的主流技术路线之一,国外大型公有云AWS、Google Cloud、Azure都有成熟可直接购买的TEE产品,产品大多基于Intel SGX生态打造。依托于国内信创和自主可控的需求,国产化芯片厂商纷纷在TEE方向开始发力,目前支持TEE芯片的厂商海光、鲲鹏、飞腾都已经在量产的芯片里提供了自主可控的TEE实现。
冲量在线作为国内早期推出基于国产化TEE技术的全国产化数据流通与隐私计算解决方案的公司,支持全部国产化芯片厂商适配,设计并发布国内领先的国产化数据流通隐私计算一体机,已在金融、政务、运营商等多行业落地应用。
PART 02
TEE安全特性与实现
目前来看,TEE具备三个最基本、最通用的安全特性,第一是数据机密性,也就是在TEE当中运算的数据无法被查看,不会泄露;第二是数据的完整性,可以保证数据在计算过程当中不会被篡改;第三是保证代码的完整性,即在TEE当中执行的代码和预期的一致,第一个特性主要是通过TEE的隔离机制来保证的,第二和第三种特性是通过度量和背书证明对外保证。
PART 03
TEE安全增强数据流通方案
在数据流通系统中,一共有三类流通要素需要撮合,包括数据、算法和计算算力。因为各个要素之间彼此并不一定在同一个机构域内,所以跨域的可信和隐私性保护是要素能够流通起来的前提。在目前的方案中,一是通过数据水印、结合区块链的数据确权、合约定价以及数据NFT技术来保证数据的可溯源可验证能力。二是通过隐私计算基于密码学协议的算法以及基于TEE的计算程序可验证度量保证算法的安全性和可验证性。而计算算力上,冲量在线基于可信执行环境可以在智算、超算、私有云和混合云上提供可验证的可信执行环境。这些可信技术与区块链去中心化技术进一步结合就可以派生出像可信分布式身份DID、数据确权、可验证计算、数据血缘等等数据流通当中必备的可信溯源能力。整套系统裁剪后则可以满足联合统计、联合建模、数据交易、AI SaaS以及数据密态沙箱这些数据流通中常见的应用需求。
冲量在线在此方案基础之上,逐步探索和沉淀出了一套产品矩阵。产品以一站式平台的形式来提供的,包括数据互联平台,即隐私计算平台,解决数据使用的问题;数据交易平台,提供关于数据确权,血缘跟踪,交易管理等相关能力;AI开放平台,提供AI深度学习的SaaS化一站式解决方案能力。
TEE作为软硬件结合的技术,为保证交付形态友好,除了支持软件私有化的部署外,同时冲量也推出了一体机产品,把软硬件打包一同交付,将软硬件资源性能调配到最优,同时可以把TEE的安全能力扩展到更多的异构加速设备上面。
目前,冲量在线已经与国内全部主流芯片厂商达成合作,包括X86、ARM、自主架构,既满足信任根和信任链完全国产化、自主可控的要求,同时也可以保证产品开箱即用,迅速投入到生产环境当中。
融合异构加速硬件的可信执行环境将是下一阶段的技术热点方向。当前把CPU端TEE特性扩展到GPU端的实现思路主要有直通模式和代理模式两类。直通模式要求GPU内核态调用可以在TEE中实现,代理模式是通过调用转发的形式在用户态完成数据密态的设备通信。两种方式都可以实现GPU度量和认证、PCIe总线加密、显存加密控制。冲量在线和国产GPU厂商在不同路径上都进行了原型验证,并已经针对生产环境的模型进行过安全性和性能验证,实现上涉及到对TEE-OS内核、GPU驱动、GPU runtime的修改。目前的方案能够对应用层模型保持兼容友好性,且性能加速比与明文计算环境中GPU的加速比接近。当GPU厂商进一步将密码计算逻辑硬件化后,性能优势有望进一步释放。
演讲的最后,陈浩栋分享了一个关于机密计算在金融场景中的应用。在开放银行的背景下,AI SaaS服务如何通过应用TEE技术手段解决业务痛点,即在AI场景中,模型提供方与服务使用方不互信的前提下同时保证推理特征与模型的机密性。机密计算可作为基础框架,隐私计算平台纳管多个机密计算节点为工作节点;将诸如OCR算法、待推理数据(如合同、发票等)运行在机密计算节点上,客户的合同和发票等敏感数据不会被落盘和泄漏,实现数据方和模型方的互信。
冲量在线认为,硬件安全和密码学安全同样重要,都是保证数据流通安全的基石,两类方法缺一不可的。接下来,TEE为主的硬件安全手段将逐步覆盖到数据流通完整的计算链路的所有节点、所有过程当中,所有参与到计算机密数据的芯片都会有TEE的环境。未来,冲量在线也会持续和业界各位伙伴一起努力,共建更多的技术创新力量,推动隐私计算和数据流通相关技术的发展。