大数据安全概述
数据安全:包括数据本身的安全和数据防护的安全。
- 数据本身的安全,主要是指采用现代密码算法对数据进行主动保护,如数据保密、数据完整性、双向强身份认证等;
- 数据防护的安全,主要是采用现代信息存储手段对数据进行主动防护,如通过磁盘阵列、数据备份、异地容灾等手段保证数据的安全。
随着国内外相关法规的建立,以个人数据保护、授权共享与使用为目的的数据安全越来越重视。
大数据安全内涵
- 保障大数据安全,是指保障大数据计算过程、数据形态、应用价值的处理技术;
- 大数据用于安全,利用大数据技术提升信息系统安全效能和能力的方法,涉及如何解决信息系统安全问题。
大数据安全威胁
- 大数据的价值使其易成为攻击目标:在网络化社会中,信息的价值要超过基础设施的价值;大数据蕴涵着人与人之间的关系和联系,使得黑客成功攻击一次就能获得更多数据。
- 大数据的防护有漏洞: 大数据基础设施具有虚拟化和分布式特点,容易受到非授权访问、信息泄露或丢失、破坏数据完整性、拒绝服务攻击、网络病毒传播; 大数据应用的生命周期中,数据存储是一个关键环节,尤其是非关系数据库带来如下安全挑战:模式成熟度不够、系统成熟度不够、服务器软件没有内置的足够的安全机制、数据冗余和分散性问题。 网络安全是大数据安全防护的重要内容,安全问题随着网络节点数量的增加呈指数级上升;安全数据规模巨大,安全事件难以发现;安全的整体状况无法描述;安全态势难以感知等等。
- 大数据安全风险: 大数据滥用的风险:一方面,大数据本身的安全防护存在漏洞,安全控制力度不够。另一方面攻击者利用大数据技术进行攻击,最大限度地收集更多用户敏感信息。 大数据误用风险:大数据的准确性和数据质量不高,对其进行分析和使用可能产生无效的结果,从而导致错误的决策。
传统数据安全的不足
传统数据安全往往是围绕数据生命周期来部署,即数据的产生、存储、使用和销毁。由于大数据的规模没有上限,且许多数据的生命周期极为短暂,因此,常规安全产品想要继续发挥作用,则需要解决如何根据数据存储和处理的动态化、并行化特征,动态跟踪数据边界,管理对数据的操作行为等。 随着大数据应用越来越多,数据的拥有者和管理者相分离,原来的数据生命周期逐渐转变成数据的产生、传输、存储和使用。数据以外包形式存储在云端。
保障大数据安全
- 围绕大数据全生命周期,即数据的产生、采集、传输、存储、处理、分析、发布、展示和应用、产生新数据等阶段进行安全防护。
- 大数据保障技术可以从物理安全、系统安全、网络安全、存储安全、访问安全、审计安全、运营安全等角度进行考虑。
- 保障大数据安全的目标:最大程度地保护具有流动性和开放性特征的大数据自身安全,防止数据泄露、越权访问、数据篡改、数据丢失、密钥泄露、侵犯用户隐私等问题的发生。
- 对大数据全生命周期阶段合并与精简,大数据应用过程可划分为4个环节:采集、存储、挖掘和发布。
采集环境安全技术
安全威胁:数据损坏、丢失、泄露、窃取。 安全机制: 身份认证 数据加密 完整性保护 抗重放攻击 端到端的数据安全传输:采用SSL VPN(安全套接层,虚拟专用网),有Web浏览器模式、客户端模式、Lan到Lan模式。
存储环节安全技术
安全威胁:数据被窃取、丢失、破坏、机密数据泄露、隐私数据泄露。 安全机制: 隐私保护:数据变换、数据加密、匿名化。 数据加密:静态数据是指文档、报表、资料等不参与计算的数据—先加密再存储;动态数据是指需要检索或参与计算的数据—同态加密。 备份与恢复:异地备份、RAID(独立磁盘冗余阵)、数据镜像、快照(数据副本、复制品)
数据备份与恢复
数据备份
备份的层次 硬件级的备份:实质上就是硬件容错的应用,指用冗余的硬件来保证系统的连续运行,比如磁盘镜像,双机容错等方式,如果主硬件损坏,后备硬件马上能够接替其工作。 软件级备份:是指通过某种备份软件将系统数据保存到其他介质上,当系统出现错误时可以再通过软件将系统恢复到备份时的状态。由于这种备份是由软件来完成的,所以称为软件备份。 人工备份:是指通过手工的方式将要备份的数据拷贝到其他介质上去的方法。人工备份实施起来最为原始和烦琐,在有些时候也最有效。
备份的方式
完全备份:是将所有的文件写入备份介质 增量备份:是指只备份那些上次备份之后已经作过更改的文件,即备份已更新的文件 差别备份:是对上次完全备份之后更新过的所有文件的进行备份 按需备份:是指在正常的备份安排之外额外进行的备份操作 排除:是把不想备份的文件排除在需备份文件之外的一类方法。严格地说不是一种备份的方法
数据恢复
完全恢复 完全恢复通常用在灾难事件发生之后或进行系统升级和系统重组及合并时。使用时的办法较简单,只需将存放在介质上的给定系统的信息全部转储到它们原来的地方。根据所使用的备份办法的不同可以使用几组磁带来完成 个别文件恢复 对于大多数的备份产品来说,这是一种相对简单的操作,只需浏览备份数据库或目录,找到该文件,然后执行一次恢复操作即可达到恢复的目的。也有不少产品允许从介质日志的列表中选择文件进行恢复操作 重定向恢复 重定向恢复指的是将备份文件恢复到另一个不同位置或不问系统上去,而不是进行备份操作时这些信息或数据所在的原来的位置。重定向恢复可以是完全恢复或个别文件恢复