在2024年的中关村论坛年会关于数据安全治理与发展的讨论中,新加坡资讯通信媒体发展局局长柳俊泓指出,根据预测,今年全球将产生约147泽字节的数据量,这意味着每个地球上的人都拥有相当于150部iPhone的数据量。
柳俊泓强调,数据的价值随着其被共享和使用的频率增加而提升,更重要的是,数据的跨境流动正以前所未有的速度发生。
随着海量产业数据的涌现,对数据安全治理的要求越来越高。
4月28日,中国汽车工业协会与国家计算机网络应急技术处理协调中心联合发布了《关于汽车数据处理4项安全要求检测情况的通报(第一批)》。
该报告涵盖了比亚迪、理想、蔚来、合众(哪吒)、特斯拉和路特斯六家新能源车企的76款车型,这些车型均已通过合规性测试。
测试主要关注四个关键方面:车外人脸信息的匿名化处理、默认不收集座舱数据、座舱数据车内处理以及显著告知个人信息处理方式。
这些方面直接关联到用户隐私和数据安全的中心问题。
随着车路云一体化的深入发展,海量产业数据呈现出敏感性高、交叉存储和流动性大等特点,从而对数据安全治理提出了更高的要求。
据中关村论坛透露,北京市以北京经济技术开发区为中心,建立了全球首个车路云一体化高级别自动驾驶示范区。
该区域累计接入超过360个智能路口,超过800辆车入网,涵盖六大类超200种数据项,累计接入数据超过5.1PB。
结合国内外先进的数据治理经验,该示范区已经构建了包括六大类41个子类的数据体系,实现了对超过600TB结构化数据和4.5PB非结构化数据的全面掌控与分析。
面对如此庞大的数据安全治理需求,尤其在人工智能快速发展的背景下,其重要性不言而喻。
然而,汽车产业的数据只是海量数据冰山一角。
如何在保护数据安全的同时促进创新发展成为一个重要议题。
柳俊泓提到,大多数国家和地区在数据安全治理的顶层设计上采用了相似的方法:首先,确保用户授权同意是使用个人数据的前提;其次,建立数据机制,明确禁止使用的领域;再次,确保可用领域的设计占多数;最后,通过标准合同条款建立协调机制,助力实现一定程度的全球一致性。
为了支持《数据安全法》和《个人信息保护法》的实施,2022年国家市场监管总局与国家互联网办公室联合发布公告,决定开展数据安全管理认证和个人信息保护认证工作,鼓励网络运营者、个人信息处理者通过认证方式规范数据处理活动,加强数据安全和个人信息保护。
陈建良,中国网络安全审查认证和市场监管大数据中心党委书记兼主任表示,自2022年以来,该中心已收到近200家网络运营者的数据安全管理认证申请意向和近100家网络运营者的个人信息保护认证申请意向,目前已发放数据安全管理认证书19张和个人信息保护认证书5张。
沈昌祥院士提出,实现有效的数据安全治理需要达到“六个不”的效果:攻击者无法进入系统、即便进入也拿不到数据、即使拿到数据也无法解读(因数据加密)、无法篡改数据(系统具有自动免疫功能)、确保设备不会瘫痪(能及时采取措施保持稳定运行)以及确保行为可追溯(无法抵赖)。
郭毅可院士认为,区块链技术作为一种有前景的解决方案,可以增强数据安全。
他表示,区块链的透明和不可更改特性保障了数据的完整性,降低了数据被未经授权修改和篡改的风险,基于区块链的解决方案在金融、医疗和供应链管理等行业具有重要价值。
在生成式人工智能时代,探索AI治理的新范式变得尤为重要。
“数据是人工智能服务的核心,我们看到的一些新服务和新解决方案都是源于传统人工智能和生成式人工智能的创新。
”柳俊泓说。
孙茂松院士表示,人工智能特别是生成式人工智能成为了新质生产力发展的关键引擎,但同时也带来了安全挑战,比如幻觉现象等。
因此,进行适当的治理是必要的。
3月29日启用的北京人工智能数据训练基地为大模型企业提供了强大的算力、海量数据以及监管合规的完整训练要素,设立了全国首个人工智能领域监管沙盒。
4月19日启动的人工智能大模型训练营吸引了多家数据及模型企业参与,引入了大量高质量的数据集,为多领域的应用场景提供了支持。
孙茂松还指出,生成式人工智能不仅带来治理挑战,其实它的出现也为安全治理提供了一种更有效的手段,例如通过生成符合实际情况的数据来规避隐私问题,展现了其潜力。