数据分析师

手机号

验证码

30天自动登录

数据分析师

保护您的数据湖需要新的思路

来源:CPDA数据分析师网 / 时间:2021-03-24

这不是一个新发现
实际上这使一些人质疑他们是否真的需要数据湖。尽管答案通常是肯定的,但这并不意味着您就注定了成功的网络攻击的确定性-只要您不依赖希望就可以了,许多企业仍然采用这种方式来考虑数据安全性,集中数据的需求将多个离散的数据库汇集到一个数据湖中,以改善对数据的访问或作为并购过程的一部分,这导致将多种类型的数据(每种都有其自己的访问和安全性类型)存储在服务器上的大量相同大小的数据中,解决方案?在整个系统中抛出一条安全警戒线,然后编写一个API将实际需要的数据提取到数据湖中。

随着时间的流逝
此过程的多次迭代可能会导致一个安全的“体系结构”(尽管在这里使用该术语可能有些费力!),看上去有点像洋葱,也就是说多个系统相互嵌套,每个系统都有自己的“安全层”进行保护,这种方法的问题有两个方面,一个是无论是花在安全解决方案上的钱还是花在使用如此复杂的系统上的时间上,这都只是浪费资源,第二个是它不安全。

数据湖是黑客入侵的捷径
为了弄清原因它有助于回到基础知识,并考虑应该如何处理数据湖,早在它们初作为一个实用概念出现时,他们的想法是将数据拉到临时数据湖中,进行处理,然后消失,问题是,对于许多组织而言,数据湖不再是临时调用,出于所有目的和目的,它们是数据结构,就像它的名字一样,数据湖是单个存储库,其中包含大量处于不受管状态的数据,它趋向于将大量数据放入一个位置,然后根据需要进行提取和分析。数据分析和黑客攻击非常方便,因为所有数据都集中在一个地方。

这意味着它们对于黑客来说是非常“有用的”工具
有史以来规模的数据泄露事件发生在黑客能够在线访问不受保护的数据的大型存储库之后,然后利用其特权移入从中提取的数据库中,由于假定此数据受外围安全“墙”的保护,因此一旦进入黑客内部,便被授予了很大的横向自由度,换句话说数据湖是进入洋葱心脏的捷径,那么解决方案是什么呢?好吧许多人将继续使用我们上面已经看到的相同的有缺陷的逻辑,然后说将您的数据湖包装在另一安全层中,将您的整个系统,数据湖以及所有内容都封装在另一层边界安全中。 

暂时保留
有几个原因使您不应该这样做,一个就是在湖泊周围增加另一层安全性会破坏访问的便利性,这就是您使用数据湖泊的全部原因,第二个问题是您要增加另一层必须管理的复杂性,除非您是从数据湖接收实时分析的极少数人,否则您不太可能会花费时间,技能或精力,管理入侵尝试所需的其他资源,从根本上来说,为数据湖建立外围安全系统应该是一种固有的荒谬建议,因为数据湖应该是临时的,另外正如您可能会指出的那样,当您帮助客户提高网络安全性时,简单的安全性通常是更好的安全性。 

您应该认识到数据湖的价值在于可以快速
有效地访问您管理的异构数据,尽管您还应该认识到它们是一种固有的安全风险,换句话说请小心使用它们。重要的是,这意味着以预期的方式使用它们-快速调用它们,执行必要的分析,然后将它们关闭得同样快,对于许多管理员,尤其是年轻一代的管理员而言,这可能代表着思维方式的改变。数据湖已经构成了很多年的诱惑,这是我们许多人不愿接受的诱惑。结果,我们的湖泊不像夏季阵雨的临时湖泊,而更像古老而永恒的高山峡谷。

本课程的重要性只会在未来几年内增加

尽管它们代表了一些挑战,尤其是在安全性方面,但没有人严重怀疑该概念的未来。无论我们喜欢与否,数据湖都是数据仓库的未来,这就是更多学习正确使用它们的原因。确保您的数据湖是临时的,并在被调用后尽快消失,这将使您的系统保持更大的安全性。 


返回列表