小知识，大挑战！本文正在参与“程序员必备小知识”创作活动。

谢谢你这么好看还关注我，虽然还没关注，但不会真的不关注吧🥰

👀写在前面

如果你学过概率论，你只需要看看黑体和例题大概就能看懂朴素贝叶斯它到底想干啥😬

条件概率

现在有一盒巧克力，里面装了16块，其中黑色、白色、棕色巧克力各4块，红色、黄色巧克力各2块。如果把这些巧克力分别放在A、B两个盒子里，从A盒中取出黑色巧克力的概率是多少？

🤔我们看着盒子数一数就知道，在A中黑色巧克力有3个，盒内一共有7个巧克力，那么从A盒中取出黑色巧克力的概率是 $\frac{3}{7}$

我们也可以使用条件概率的形式表达出来：

这说明已知一块黑色巧克力是来自A盒的，它的概率等于巧克力是黑色的并且来自A盒的概率除以巧克力来自于A盒的概率

通过数一数，我们看到巧克力总数是16，巧克力是黑色的并且来自于A盒的个数是3，巧克力来自于A盒的个数是7，

P(黑色巧克力∩A盒)=\frac{3}{16}

P(A盒)=\frac{7}{16}

∴P(黑色巧克力|A盒)=\frac{\frac{3}{16}}{\frac{7}{16}}=\frac{3}{7}

💥条件概率公式：

P(X=x|Y=y)=\frac{P(X=x,Y=y)}{P(Y=y)}

贝叶斯定理

1.贝叶斯定理

还是基于上面的问题背景：

已知取出一块黑色的巧克力，它来自A盒的概率是多少？

这里，可以把分子的公式用上题的结果来表达：

最终将②③代入①式计算出：

P(A盒|黑色巧克力)=\frac{\frac{3}{16}}{\frac{4}{16}}=\frac{3}{4}

已知：存在K类 c₁， c₂，...， c_K，给定一个新的实例 x=（x⁽¹⁾，x⁽²⁾，...，x⁽ⁿ⁾）。问：该实例归属第c_i类的可能性有多大？

分子是同时满足两种情况的概率，分母是发生这一条件的全概率公式

贝叶斯定理为：

2.贝叶斯分类

已知：有A和B两盒巧克力，现在拿到一块黑色的巧克力。问：该巧克力最有可能是哪个盒子的？

$\frac{3}{4}>\frac{1}{4}$ ，所以来自A盒的概率最大，那么巧克力最有可能来自于A盒，这就是贝叶斯分类。

存在K类c₁，c₂，...，c_K，给定一个新的实例x=（x⁽¹⁾，x⁽²⁾，...，x⁽ⁿ⁾）问：该实例归属于哪一类？

我们可以分别计算 $P(Y=c_i|X=x)、P(Y=c_2|X=x)、...P(Y=c_k|X=x)$ 的值，然后找到最大的那个。这里面的分母都是相同的，因此只需要计算不同类下的分子👇，找到最大值就可以确定归属的类了。

argmax_{c_{i}}P(X=x|Y=c_i)·P(Y=c_i)

朴素贝叶斯

朴素贝叶斯和贝叶斯相比，有一个前提条件：假设实例点中的每个特征是相互独立的。这就是朴素的含义😁

根据朴素贝叶斯所有的x⁽¹⁾，x⁽²⁾，....，x⁽ⁿ⁾都是相互独立的，那么分子其中一部分的 $P(X=x|Y=c_i)$ 就可以写成：

最终只需要求出👇：

从而找出归属的类别，即可完成朴素贝叶斯算法的分类。

后验概率最大化准则

请问:巧克力是黑色的并且来自于A盒的概率P是多少?

由上文②式得，

P(A盒)叫做先验概率分布，也可以表示成:

P(Y=c_i), i=1,2,...,K

P(黑色巧克力|A盒)叫做条件概率分布，也可以表示成:

当条件变成对调时，由P(X|Y)变成P(Y|X)，得到贝叶斯定理得:

这个就称为后验概率分布(就是贝叶斯定理那个公式)

1. 朴素贝叶斯分类方法

假如存在K类c₁，c₂，...，c_K，现在给定一个新的实例 x=（x⁽¹⁾，x⁽²⁾，...，x⁽ⁿ⁾）。问该实例归属于哪一类？

上面的后验概率公式 $P(Y=c_i|X=x)=\frac{P(X=x|Y=c_i)·P(Y=c_i)}{Σ_{i=1}^KP(X=x|Y=c_i)·P(Y=c_i)}=\frac{P(Y=c_i)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_i)}{Σ_{i=1}^KP(Y=c_i)\prod_{j=1}^nP(X^{(j)}=x^{(j)}|Y=c_i)}$ ，由于分母都相同，因此，只需要计算出分子的最大值就可以找出这个实例所对应的类。