数据安全,是指通过采取必要措施确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。数据安全应保证数据生产、存储、传输、访问、使用、销毁、公开等全过程的安全,并保证数据处理过程的保密性、完整性、可用性。此外,还应当异构处理公开数据的关联关系,例如个人姓名、联系方式、车辆登记、社交媒体等。这些虽然都是非实体隐含数据,但往往涉及个人隐私,甚至可能造成实时定位等公共安全问题。
应用大数据我们应该具体哪些技术能力:
第一,数据能力,拥有大数据是有效利用大数据技术的一个基础,而拥有大数据绝不是海量这么简单,重要的在于多维度以及持续性。刚才案例中有三类持续性的多维度数据非常重要。在安全行业,文件样本网络行为、系统漏洞、应用行为等数据都是非常关键的基础数据,如果要解决业务层面的安全同题,则需要更多的数据类型。拥有大数据才能是整个大数据技术的基础,之后提到的存储计算、数据挖掘甚至可视化等都依于数据资源。如何采用多种方式去采集数据,这是安全厂商或是用户必须重新思考的问题,在以前的安全体系中,采集的数据更多是告警,而在大数据技术线路下,对于原始的网络或终端数据,甚至业务数据的完整还原和长期保存就会显得非常重要
第二,不仅需要拥有数据,如何有效处理大数据也是非常重要的。以前的数据处理技术在大数据背景下无能为力,充分利用互联网大数据技术路线,不仅能够带来极强的处理能力,更重要的是有效降低了成本。其中在技术方案论证阶段,考察这项技术方案的成熟性以及供应商的实践经验是非常重要的。
第三,挖掘数据。挖掘数据有很多种方法,有关联分析或是机器学习。在上面的例子中,通过一个失效的样本寻找关联分析进而获得更多的线索,就是一个很好的例子。不仅如此,机器学习在安全分析中的应用越来越成熟,从最初的样本识别,到现在的流量识别,或是同源性分析等,都可以借助机器学习来完成。
第四,可视化分析。刚才的例子其实采用了可视化分析的方式,以前提到可视化时,大家看重的是展示能力,而可视化分析却常常被遗忘,这类技术其实对于安全分析有着非常重要的价值。在很多业务场景中,住往需要通过可视化方法或工具给安全分析人员足够多的空间和便利性,
针对复杂的数据进行分析,并进而了解本质和发现异常。这方面我们应该着力的去做尝试。
最后IP地址信息也是非常重要的,根据IP地址我们可以得出ip地理位置,宿主信息,以及ip用户画像等,可以更好的辅助大数据时代。