绪论
主要是讲大数据与信息安全之间的关系,具体的关系主要体现在大数据的数据采集、数据传输、数据分析方面。
大数据的处理主要过程如下:数据采集->数据传输->数据存储->数据分析->使用阶段 ,所以围绕大数据的这几个阶段,分析他的安全性,作相应的安全措施。
传统的数据传输过程中,数据基本处于”裸奔“不加密状态,很容易被劫持,机密性不好。此时就需要用到大数据的安全技术如:
-
访问控制:基于角色控制、风险自适应控制(自动评估访问流量给与相应权限)
-
安全检索:对称或非对称可搜索加密。
-
安全计算:同态加密技术(既可以计算加密的数据,又可以维持数据的机密性)、函数加密,外包计算(由于本地算力有限,将任务分配给算力强且可信任的远端处理)
而在数据分析方面就涉及到隐私计算安全,因为传统的数据分析都是直接拿明文进行数据处理,这样会泄露隐私,所以就需要使用隐私计算方法有:
- 关系型隐私保护:对用户的多个属性、位置、以及记录数据进行模糊化处理,让多个用户的数据近似,避免确定出某个用户。
- 社交图谱隐私保护:对用户的社交数据记性k-匿名话处理,避免通过用户社交数据确定出本人。
- 位置轨迹数据保护:
- 差分隐私保护:
以上均是信息安全为大数据做出安全保障,同时大数据也可为信息安全提供服务。例如:基于大数据分析的认证技术,其通过大数据技术对人们的行为数据进行分析,可用来确定用户身份的合法性。
总结:
大数据的重要性不言而喻,大数据的安全离不开信息安全的支持,研究大数据的安全与隐私保护。