数据分类是一个过程,用于发现敏感内容,并对关键数据进行分组,以便进一步配置 DLP。数据分类过程分析组织的数据存储库,以便根据文件的内容和上下文有效地将文件分类为不同的类别,并协助配置适当的安全控制级别以符合数据法律。这是保护敏感业务关键型数据的第一步。数据分类与数据发现一起运行,以将上下文信息添加到数据安全策略中。
为什么数据分类很重要
一个组织,无论是中型还是大型,每天都有无数的数据被创建、查看、修改和频繁传输。为所有此类数据配置数据丢失防护策略是多余的,因为并非每个数据都很重要。通过数据分类,您可以从海量数据中找到敏感数据,并继续为重要数据配置数据丢失防护。
数据分类有什么好处
- 有效的风险管理:识别数据的性质和敏感性有助于确保适当的安全措施到位。
- 资源的最佳利用:通过整合和保护所有敏感信息,可以进一步审查非敏感内容,以确定它是否仍然有用,然后,可以轻松消除任何被视为无目的的数据,以降低维护和存储的间接成本。
- 全面的数据丢失防护:所有敏感数据都会被考虑和标记,因此任何滥用都会立即被发现。
- 提高用户工作效率:根据数据的类型和用途以及使用方式和时间,授权用户可以更轻松地访问数据,并限制其他用户访问数据。
数据分类过程
- 广泛的风险评估:确定与组织(包括员工和客户)相关的特定类型的敏感数据相关的风险级别,以便确定数据保护工作的优先级。
- 创建官方策略:安全措施的严格程度应与特定类型的数据暴露或被盗时随之而来的风险大小成正比,在用户如何与敏感信息类型交互方面正式创建限制非常重要,即他们可以在哪里存储或上传敏感信息。
- 数据采集:端点在网络中很普遍,可以存储大量数据。进行端点数据搜索的有效方法是按功能或部门对端点进行分组,因为特定类型的数据可能会在其各自的部门中找到(例如,HR 端点中的 PII)。数据积累后,就可以进行排序了。
数据分类的最佳实践
- 定义明确的目标:清楚地说明数据分类的预期结果。通常,分类过程在数据发现过程之后进行,因此,最好从数据发现的最终目标开始,数据分类的主要目标是识别和标记所有数据存储库中的敏感数据,以成功应用安全控制。
- 确定文件标记标签:数据分类工具有助于确定数据的敏感性,并为您提供评估数据重要性以及数据泄露时的后果所需的上下文感知见解。通常,数据使用“公共”、“私有”、“内部”和“受限”标签进行分类,优先级从高到高。这些标记使应用的数据安全策略与每个数据子集相关。
- 与数据发现协调:数据分类策略应与数据发现策略保持一致,以帮助准备数据安全措施。如果数据发现和分类工具是单独部署的,那么无缝集成这些工具至关重要。或者,您可以将这两种工具合并到单个数据风险评估解决方案中,以确保内容感知保护。
- 满足合规性要求:数据分类是 HIPAA、PCI DSS、GDPR 等合规性要求的基本要求之一。全面评估合规性要求,以识别数据风险和数据处理准则。确保处理敏感数据的所有流程都符合法规要求的安全要求。
- 测试和验证:在全面实施数据分类过程之前,请在较小规模上测试排序和文件标记过程。根据业务需求、目标集和要满足的合规性要求比较和调整流程。
- 授权定期审查:有必要定期更新数据分类过程,以确保数据增长增加、严格的合规性要求、新的数据风险和不断变化的业务需求导致的数据安全。在数据分类计划中留出更改和调整的余地,以便更有效地合并更新。
什么是数据分类软件
数据分类软件支持最高程度的可靠数据分类实践,使数据丢失防护成为无缝过程的软件。企业在任何给定时间都包含大量数据,然而,在非正式交流的旋风中,包含敏感信息的文件和消息也可以被转移,在处理大量杂项组织信息时,数据分类软件可帮助管理员识别哪些数据是无害的,哪些数据是敏感的,需要保护。
Endpoint DLP Plus使IT管理员能够自动对跨端点存储的敏感信息进行广泛的梳理和分类。该企业解决方案使用指纹识别、正则表达式、基于文件扩展名的过滤器和关键字搜索等高级机制快速发现和分类各种类型的结构化和非结构化数据。此外,还可以使用许多预定义标准或通过创建自定义标准,根据来源、格式和许多其他属性对敏感数据进行分类。完成此步骤后,创建策略要容易得多,这些策略准确规定应如何处理指定内容以防止泄露。
数据分类的工作原理是什么
数据规则是一种准则,它使用正则表达式、关键字匹配、文件扩展名和文档/指纹匹配等分类标准来帮助发现文件/数据中的敏感内容。在文件扫描过程中,如果数据规则中的模式与文件中的内容匹配,则该文件将被标记为敏感文件。数据分类标准将不断更新,牢记保持合规性和安全的重要性。
数据规则(自定义和预定义)用于对企业数据中的敏感内容进行分类,使用Endpoint DLP Plus创建数据规则后,将根据定义的规则持续扫描您的企业数据以查找敏感数据。
- 精确的数据规则:典型的数据分类过程是识别敏感数据的分类准则,Endpoint DLP Plus中的数据规则就是这样一种标准,可以定义它以在海量数据中准确发现关键企业数据。
- 自定义和预定义标准:数据规则,是双重数据分类标准,自定义和预定义。虽然预定义的条件更一致,以帮助在识别敏感数据时同时对数据进行分类,但自定义条件是根据业务需求创建一组规则。
- 对关键数据进行分类:数据分类也扩展到敏感数据分类。对敏感数据(如 PHI、PII 和 PCI 等)进行分组,在设计迎合相关机密数据的 DLP 策略时是个好兆头。
数据分类软件如何提供帮助
- 使用预定义条件进行数据分类
- 使用自定义条件进行数据分类
使用预定义条件进行数据分类
预定义的标准可以快速检测包含 PII 的文档(如地址或财务信息)中敏感项目的常见指标,由于 PII 在世界各地以不同的格式显示,因此可以在国家范围内应用预定义的标准。
使用自定义条件进行数据分类
有许多利基行业,公司需要处理和处理不属于传统形式的 PII 或金融代币的数据,对于特定于组织的要求,有无数种机制可以创建详细的自定义规则条件。
- 正则表达式:正则表达式,也称为正则表达式或有理表达式,是描述模式的逻辑系统。在数据分类中,它是一个功能强大的实用程序,可用于识别某些敏感文档中表示的表达式。它们可以包括信用卡号或社会保障标识等序列。
- 关键字搜索:对于包含目标关键字或其他特定字母排列的文件,这些字母被认为是敏感数据(如姓名)的符号,关键字搜索功能可用于有效地过滤大量数据并自动查找相关文档。此工具对于调查目的特别有用,因为它有助于缩小范围并检测特定标准。
- 指纹识别/文件匹配:指纹识别是一种 DLP 功能,用于根据用户上传或通常传输的文档创建条件。组织为经常处理的文档类型建立的格式可用于区分各种敏感文档。可以对专利、法律文件、健康记录和其他类型的文件的结构进行上下文分析,以创建相应的文件指纹。从那时起,这些类型的文档在处理或传输时将根据其相应的布局进行相应分类。
- 文件扩展名:文档也可以根据其文件扩展名分类为敏感文档。根据组织或部门的不同,某些文件类型很可能包含敏感项目,例如: 在会计部门,Excel 工作表可能包含机密的财务信息,因此扩展名为 .xlsx 的文件可以标记为敏感文件。
Endpoint DLP Plus 是一款全面的数据分类工具,通过有效的数据分类和分类过程扫描端点的敏感数据,定义对组织敏感的内容。在配置数据丢失防护 (DLP) 策略时,此分类有助于准确标记企业数据中是否包含敏感内容。