朴素贝叶斯算法

285 阅读3分钟

image.png 解:

(1)对样本数据集做统计:

天气气温湿度打网球
PNPNPNPNPN
1/63/41/62/42/63/45/62/46/104/10
多云2/60/4适中2/61/4正常4/61/41/62/4
3/61/43/61/4

模型:X = x1 ∩ x2 ∩ x3 ∩ x4

E对应决策依据中的取值

决策:判断p(C=P|X)、p(C=N|X)谁大

根据贝叶斯公式 p(C|X)=image.png

P(P|X)=image.png=image.png (2)

①对编号为11的测试集进行计算:

适中正常
天气气温湿度打网球
PNPNPNPNPN
1/63/41/62/42/63/45/62/46/104/10
多云2/60/4适中2/61/4正常4/61/41/62/4
3/61/43/61/4

image.png

同理:

天气气温湿度打网球
PNPNPNPNPN
1/63/41/62/42/63/45/62/46/104/10
多云2/60/4适中2/61/4正常4/61/41/62/4
3/61/43/61/4

image.png

利用公式p(N|X)+p(P|X)=1,解得p(P|X)=28.3% 、p(N|X)=71.7%

决策:p(N|X)>p(P|X) ,故在天气为晴、气温为适中、湿度为正常、有风的情况下不去打网球。

②对编号为12的测试集进行计算:

多云适中

多云情况下,存在p(多云|N)=0,加入普拉平滑分子得行的数据表如下:

天气气温湿度打网球
PNPNPNPNPN
2/94/72/93/73/84/66/83/67/125/12
多云3/91/7适中3/92/7正常5/82/62/83/6
4/92/74/92/7

image.png

接着计算p(N|X):

因为p(多云|N)=0会导致整个概率为0,这是由于训练量不足,令分类器质量大大降低,所以需要加入普拉斯平滑分子+1,更新分母),更新概率如下表:

天气气温湿度打网球
PNPNPNPNPN
2/94/72/93/73/84/66/83/67/125/12
多云3/91/7适中3/92/7正常5/82/62/83/6
4/92/74/92/7

image.png

利用公式p(N|X)+p(P|X)=1,解得p(P|X)=51.8% 、p(N|X)=48.2%

决策:p(N|X)>p(P|X) ,故在天气为多云、气温为适中、湿度为高、无风的情况下会去打网球。

③对编号为13的测试集进行计算:

多云正常
天气气温湿度打网球
PNPNPNPNPN
2/94/72/93/73/84/66/83/67/125/12
多云3/91/7适中3/92/7正常5/82/62/83/6
4/92/74/92/7

与①、②同理可求:

image.png

解得p(P|X)= 82.7%、p(N|X)=17.3%

决策:p(N|X) p(P|X) ,故在天气为多云、气温为热、湿度为正常、无风的情况下会去打网球。

④对编号为14的测试集进行计算:

适中
天气气温湿度打网球
PNPNPNPNPN
1/63/41/62/42/63/45/62/46/104/10
多云2/60/4适中2/61/4正常4/61/41/62/4
3/61/43/61/4

image.png

解得p(P|X)=37.2%、p(N|X)=62.8%

决策:p(N|X) p(P|X) ,故在天气为雨、气温为适中、湿度为高、无风的情况下不会去打网球。