期刊:《基于贝叶斯网络的Android恶意行为检测方法》

160 阅读3分钟

「这是我参与11月更文挑战的第25天,活动详情查看:2021最后一次更文挑战

简介

前面主要是介绍了如何利用贝叶斯网络实现Android恶意行为检测的一些前沿基本知识的铺垫,今天主要是给大家讲解一下一些关键的技术和算法。

关键技术和算法

特征选择

本文主要对 Android 应用程序进行静态的分析,在 特征提取方法中,提取的特征数量较多,有些特征对分 类的结果没有影响,有些特征之间存在冗余,为了提高 分类器的效率和检测精度,需要去掉对分类没有影响和 冗余的特征。同时学习分类模型时使用的特征越多,学 习分类模型需要花费的时间就越长。过多的无效的特 征也影响分类器的效果,因此选取选择对检测模型的训 练越来越重要。

卡方统计(CHI)是一种度量特征和类别的关联程 度的方式。某个特征的卡方值越大,代表该特征与类别 的关联程度越高,若特征的卡方值为 0,则代表该特征与 类别相互独立。

卡方值给出了特征 Xi 与 Cj 的直接关联程度,卡方 值的计算只考虑了特征在某一个类别中有没有出现,代 表的是特征与类别的关联程度,但对于低频的特征其检 测效果仍然不好,该特征选取方法的效果和信息增益相 当,选取的特征也能够较好地表达该特征对分类结果的 影响。

image.png

贝叶斯网络分类器原理

贝叶斯网络分类器的网络结构结构比朴素贝叶斯复杂,因为不仅考虑了特征之间的条件独立性,还考虑 了特征之间存在的依赖关系,因此贝叶斯网络分类器的 模型一经训练完成,有比朴素贝叶斯分类器更好的效 果,但贝叶斯网络分类器的结构比朴素贝叶斯的结构更 加复杂,学习贝叶斯网络结构已经被证明是一个 NP 问 题。贝叶斯网络分类器的学习过程主要分为两个部 分:贝叶斯网络结构的学习和贝叶斯网络参数的学习。

贝叶斯网络分类器利用联合概率进行分类,能够充 分地利用特征之间存在的依赖关系,从而在一定程度上 提高了分类器的分类准确度。

基于关联规则的贝叶斯网络分类模型

在本文中使用贝叶斯网络分类器进行 Android病毒 程序的检测,需要进行适合本文提取的 Android 恶意行 为检测的分类器结构的学习,贝叶斯网络中节点之间的 边代表的是特征之间的因果或依赖关系,本文尝试利用 关联规则挖掘特征之间的关系,构建能够检测 Android 恶意程序的网络模型。

寄语

期刊中主要还介绍了有关贝叶斯网络的结构学习以及参数学习,有关这两方面的知识,在前面我发的有关贝叶斯综述里面都有很详细的介绍因此在这里就不一一阐述了。希望这次的期刊能对大家有所帮助。