1. 本科知识点回顾
1.1 朴素贝叶斯分类方法
朴素:假设各个特征之间相互独立,各个特征属性是条件独立的。
独立与条件独立:
独立:独立是指两个事件之间没有因果或关联关系,即知道一个事件发生与否不会影响另一个事件发生的概率。如果事件 A 与事件 B 独立,则有:
P(A and B) = P(A) * P(B)
其中,P(A and B) 表示事件 A 和 B 同时发生的概率,P(A) 和 P(B) 分别表示事件 A 和事件 B 发生的概率。如果 P(A and B) 不等于 P(A) * P(B),则认为事件 A 和 B 不是独立的。
条件独立:条件独立是指在已知某些信息的情况下,**两个事件之间没有因果或关联关系。**具体地说,如果事件 A 和事件 B 在给定事件 C 的条件下是独立的,则称 A 和 B 在条件 C 下是条件独立的。条件独立通常可以表示为:
P(A and B | C) = P(A | C) * P(B | C)
其中,P(A and B | C) 表示在已知事件 C 的条件下,事件 A 和 B 同时发生的概率,P(A | C) 和 P(B | C) 分别表示在已知事件 C 的条件下,事件 A 和 B 发生的概率。
独立和条件独立的判断1
判断2 就是看它是否满足以下的公式
1.2 Bayes定理
贝叶斯定理的表达式如下:
P(A|B) = (P(B|A) * P(A)) / P(B)
其中,A和B是两个事件,P(A)和P(B)分别表示事件A和B的边缘概率(先验概率),P(B|A)表示在事件A发生的条件下事件B的条件概率,P(A|B)表示在事件B发生的条件下事件A的后验概率。
贝叶斯定理的核心思想是通过观测到的证据(事件B)来更新对事件的信念(事件A的后验概率)。根据定理可以看出,后验概率等于先验概率与观测数据的关系的乘积,再除以观测数据的边缘概率。
例题分析:
先分析题目(已知条件:检查结果是 + ;然后还有题目的条件)
例题 2
题目条件和提问条件看清楚
1,3 朴素贝叶斯分类的基本思想
朴素贝叶斯分类(Naive Bayes classification)是一种简单且高效的分类算法,基于贝叶斯定理和特征独立性的假设。
朴素贝叶斯分类的基本思想如下:
-
假设输入数据的特征之间相互独立。这个假设被称为"朴素",因为在实际情况下,很少有所有特征都完全独立的情况。尽管如此,这个假设简化了计算,并且在很多情况下,朴素贝叶斯分类器仍然能够提供良好的分类结果。
-
基于训练数据集计算每个类别的先验概率。先验概率指的是在没有任何观测数据的情况下,某个类别出现的概率。
-
对于给定的待分类样本,计算该样本在每个类别下的后验概率。后验概率表示在观测到样本的情况下,样本属于某个类别的概率。根据贝叶斯定理,后验概率可以通过先验概率和条件概率计算得到。
-
选择具有最高后验概率的类别作为待分类样本的预测类别。
在朴素贝叶斯分类中,条件概率的计算是关键步骤。通常使用频率统计的方法来估计条件概率。对于离散型特征,可以使用计数方法来估计每个特征值在每个类别下出现的频数。对于连续型特征,通常假设特征值服从某种分布(如高斯分布),再基于训练数据集估计概率密度函数。
算法流程图
应用实例:
分析:
计算过程:
每个类别的条件概率已经求出,就可以算目标条件概率
代码实现:
模式二:
代码衔接
课后练习:
总结:
后验概率值(Posterior Probability)是贝叶斯统计学中的一个概念。它表示在已知一些观测数据的情况下,某个假设或事件发生的概率。后验概率值可以通过贝叶斯公式计算得出,将先验概率与似然度相乘,再除以归一化常数。