今年6月,浙江某科技有限公司因违反《中华人民共和国数据安全法》第四十五条及相关规定,公司及项目主管人员、直接责任人员分别罚款100万元、8万元、6万元。这也是《数据安全法》开始运行以来的首例“高额罚单”案件。实际上,这也给我国众多行业用户在运营自身&客户数据时的一个警钟。随着数字经济深入发展,这类案件将会更多,需要充分了解数据安全的重要性以及相关治理的方式才能做到数据安全。
一、数据为什么重要
数据被定义为新时代重要的生产要素,是国家基础性战略资源,同时数据价值的有效发挥是推动国家社会经济转型发展的新动力。2021年以来,在《“十四五”国家信息化发展规划》、《“十四五”数字经济发展规划》等重要国家数据战略中强调建设数字中国,加快数据要素市场化流通,创新数据要素开发利用机制。随着数据价值的显现,数据开发的另一面,如数据被泄露、篡改、滥用等风险也令人担忧。
二、数据安全治理第一步
面对数据安全威胁日益严峻的态势,着力解决数据安全领域的突出问题,提升数据安全治理能力的第一步在于做好数据发现与梳理。
数据发现与梳理
数据发现与梳理是对多个非结构化和结构化数据源进行搜索、分析、索引、跟踪和报告的过程,使单位/企业机构能够看到数据所在的位置,以及数据在企业机构内部和企业机构之间的流动路径,通过洞察会转化为数据风险和合规评估流程的重要参数,也是开展数据安全治理的基础性工作。
图1
三、数据资产繁多如何梳理
在不同系统每天产生的成百上千数据里,并非所有的数据都同等重要。基于行业属性、监管要求、数据特征、业务发展需求等,有针对性地对数据展开分级分类,并贯穿数据全流程是保障数据安全的前提,也是实施数据风险评估、数据安全策略制定、数据权限控制等数据安全治理过程中重要的一环。
图2
数据分类分级的困境
在实际进行数据分类分级的过程中,需要结合业务流程进行考虑,不同的部门或单位采用不同的数据分类标准,不同类型的数据可能存在交叉或重叠,并且数据分类分级是一个持续的过程,基于数据伴随业务处理活动的持续新增与变化,分类分级也需随之动态变更。然而目前市场上缺乏有效的分类分级的标准化工具,几乎所有情况下都需要人工对数据进行手动分类分级,导致效率及准确度低下。实现数据分类分级的自动化、精准化需要借助分类分级标准的统一及在此基础上研制自动化的工具来逐步解决。
四、安全狗推出数据资产梳理系统
为了协助行业用户更好地梳理数据,有效深挖数据要素的价值,安全狗打造并推出了数据资产梳理系统·数海。
图3
数据资产梳理系统
安全狗数据资产梳理系统是一款通过扫描嗅探分析技术,对敏感数据进行自动发现标识加手工标识核验的方式,协助用户清晰掌握敏感数据分布情况,同时通过不同的数据资产标签管理能帮助单位/企业对数据资产进行有效的类别和级别的测绘与划分,以便用户基于数据资产情况对敏感数据进行针对性防护。
图4
梳理引擎
梳理引擎作为数海平台的核心功能,集成多类型数据源接口适配(自动识别数据库类型、版本信息进行匹配)、资产发现、敏感数据标识、与平台梳理任务的对接等引擎能力。
管理平台
以web控制台的形式和用户交互,清晰展示各项数据资产梳理和分析的结果,可设定相关的分类分级标准、资产梳理任务,帮助用户更好更快地处理数据资产。
五、数海赋能数据分类分级
安全狗数海系统主要包含了分类分级设置、规则库管理、组织机构管理、资产发现、资产梳理、资产统计、系统后台等功能,能多方面赋能用户数据安全治理。
价值1:全域数据资产运营
单位/企业系统繁多,数据资产管理部门往往不统一。
数海可梳理并明确机构下的组织关系,以及每个组织下建设的系统,对资产系统关联的设备进行划分,标识资产的差异性,建立“组织机构+系统分布”的数据资产管理模式,对全量资产能进行全量扫描以及有差别重点排查,能针对不同资产类型、不同数据存储方式、数据冷热程度采取与之相符的数据资产识别策略,进而能更好的跟踪管理部门机构内的数据资产分布情况。
价值2:跨机构下分类分级标准区分管理
在一些跨多行业大型集团公司,在同一套数据资产梳理管理下,无法根据部门特点及数据属性等进行个性化的分类配置。
数海集成多套行业数据分类分级标准,能针对机构或系统进行个性化的配置相关的分类分级的标准,细粒度地以信息系统级别的任务区分不同的数据分类分级的标准与使用;
数海允许用户自定义编辑实际分类分级模版,同时支持对细化到不同资产进行不同的模版设定。
价值3:自动识别+人工核验进行数据分类分级
面对庞大的数据,自动化标识工作存在一定的技术瓶颈,并且数据样本收集不全则会导致识别的准确率不高,因此需要投入更多的人工参与到表字段的分类分级操作,效率低且错误率高。
数海在产品设计阶段就充分考虑数据库内表与字段的数量,能协助管理员更加简便地进行字段的分类分级操作,在易用的前提下,准确率高,让分类分级的结果“依规而行”、“有据可循”,同时满足企业合规要求;
数海可支持100+敏感数据的识别规则,支持AI敏感数据识别的方式,性能水平高,识别率突出。
价值4:实现数据动态&静态管理
数据在某个时间点上是静态的,在一段时间内又是动态变化,包含数据量变化,表结构化的变化,众多数据特点也让数据分类分级更难操作。
数海在对数据资产的识别的持续性,并且能自动检测出数据表结构的变化,立即进行重新分析变化的特点,让用户可对数据动态&静态实现全面管理。
六、总结
在数据发现和数据分类分级工作中,通过对数据进行识别、分类和分级划分,是有效且高效的数据安全管理的基础,但也要充分地调研了解实施对象组织机构、网络环境、系统部署的实际情况,制定相关的数据梳理方案,进行有针对性的开展项目实施工作,才能更好的服务企业/单位进行数据资产的梳理工作。平台一旦建成后将有助于单位/企业机构了解其处理的数据的敏感程度及相关业务场景,响应对于安全、隐私和数据治理和合规的需要,满足监管要求。