数据发现解决方案的三个注意事项

在我20多年的数据(www.xberp.cn)安全行业经验中,我还没有看到有人对敏感数据发现的需求提出异议。这是有效的数据安全计划的基础。

但这并不像听起来那么容易。实际上,什么是正确的解决方案?一种可以使您确信找到所有敏感数据的工具?作为设计发现解决方案的人,我建议您考虑以下三个方面来评估任何数据发现解决方案:

1.数据模型的复杂性

大多数应用程序和数据存储都是经过数十年的设计和重新设计的,从而导致了复杂性和冗余层次。此外,您可能拥有基于不同体系结构的应用程序或数据库。结果,要在所有这些应用程序和数据存储中发现敏感数据,就需要一种可以解决每个问题的工具。与此复杂的是,像ERP系统这样的应用程序和数据存储携带大量数据,其中一些包含键值存储或组合存储中的信息-本质上是难以发现的区域。不仅如此:您可能将数据存储在多个系统中,例如文件,数据库,大型机等。因此,

但是,如果您拥有的发现解决方案不像我们所说的那样“包罗万象”,它将真正发挥作用吗?

2.20%的难题
您可能听说过供应商声称他们可以发现您99%的敏感信息。这是“相当好的隐私”方法。但是,让我告诉您,在这种情况下,99比0更接近于0。您的汽车制动器是否在99%的时间内“表现得很好”?停车是一种全有还是全无的办法,不是吗?但是,如果您仍然认为1%的故障率对数据安全性不构成麻烦,那么请允许我解释一下。

如果只想大规模发现敏感数据,则可能会在大约2%的运行时间中找到90%的敏感数据。但是,将快速运行时间换成部分结果并不是一个好的解决方案。为了安全起见,“还不错”还不够好。即使您的敏感数据中只有1%未被发现,也会使您的组织面临相当大的风险。为了给您一个更好的主意,让我们假设一个小型组织拥有非常保守的1 TB内存。该数据库的仅1%将是10 GB。想象一下,将由10 GB组成多少条记录-联系人详细信息和其他信息。看起来很大吧?现在,将此数字外推到大型企业数据库。处理太多?只是将数据暴露出来而已。

每当安全供应商声称他们可以大规模进行数据发现时,请一筹莫展。答案不是快速的解决方案。这与获得快速结果无关。当涉及到发现数据时,所有要做的都是正确的。不是90%,不是99%,而是100%。

现在,您可能在想:“大规模”发现总是错误的吗?

3.准确性和重复性

让我直接告诉您-如果您可以获得正确的结果,那么大规模发现并不是错误。但是,当急于扩展规模时,解决方案将无法提供准确的结果或可重复,这可能成为一种解决方案。

例如,安全供应商可能很快就完成了工作,但是您不得不进行大量假阳性分析。正如我所说的,这不是要快;这是关于正确做事,这意味着准确性必须是评估的一部分。这就需要部署可靠的发现方法的强大解决方案-这些方法要超越传统的基于字典和基于正则表达式的方法(碰巧需要大量的手动帮助)。即使使用常规方法大规模实现发现,也无法实现实际规模。因为您无法准确发现所有敏感数据。

第二,过程是否可重复?当数据不断发展时,为什么发现应该是一个固定的,一劳永逸的过程?一次发现您的数据,然后在该框上打勾“立即完成”,这意味着发现的数据集在完成时就很重要,然后,这些结果就变得越来越过时了。可行的解决方案需要一种灵活的,可重复的方法,该方法不需要从头开始做全部事情,因为诱惑是改用旧的结果。

在我看来,发现敏感数据的唯一正确方法是找到所有敏感数据。大规模且准确地执行此操作,并确保它是自动化的,并且混合中具有可重复性,以减少所需的人工工作。

有关敏感数据发现过程之后会发生什么的信息,请参阅我的文章,有关被屏蔽数据集的重新识别风险,该文章讨论了在匿名化数据时应将重点放在哪里。请记住,如果没有强大而全面的数据发现工具,则对重新识别风险的担忧几乎没有意义:您可能尚未对其进行识别。归根结底,如果您不知道所有敏感数据在哪里,该如何保护它?

相关文章

联系我们

联系我们

029-88444144      

在线咨询: QQ交谈

邮箱: cnnwn@126.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部