人工智能基石:多层感知机(MLP)

138 阅读5分钟

一句话比喻

MLP就是一个“死板但勤奋的决策委员会”,专门处理“填表格、做判断”的工作。


核心思想拆解

假设你是银行贷款审核员,要根据客户的“申请表”来决定是否放贷。申请表上有3个问题:

  1. 年龄(数值)
  2. 年收入(数值)
  3. 是否有房产(是/否,转换成1或0)

你的大脑在做加权评估:你心里会下意识地给这些条件分配不同的重要性,然后综合判断。

MLP就是把这个“加权评估”的过程,用数学公式明确、自动化地实现出来。


三层结构详解

想象MLP就是这个“贷款审批委员会”,它有三层办公室:

第一层:接待处(输入层)

  • 员工:3个接待员。

  • 工作:每人只负责读取申请表上的一项数据。

    • 接待员A:只问“年龄是多少?”并记下数字。
    • 接待员B:只问“年收入是多少?”并记下数字。
    • 接待员C:只问“有房产吗?”记录1(有)或0(无)。
  • 输出:他们把这三个原始数据,整理好交给下一层的“专员”。

第二层:评估办公室(隐藏层)

这是MLP的核心,也是“多层”的含义所在。假设这个办公室有4个专员(神经元)。

  • 专员们怎么工作?

    每个专员都会从所有接待员那里拿到全部三个数据。但他们不是简单传递,而是会做一次“综合加权思考”

    公式:(年龄 x 权重1) + (收入 x 权重2) + (房产 x 权重3) + 偏见

    • 权重:代表这项数据有多重要。比如,专员1可能认为“收入最重要”,就给收入分配一个很高的正权重(比如+0.9),给年龄分配一个很低的权重(+0.1)。这些权重一开始是随机猜的,后期通过训练来调整。
    • 偏见:代表这个专员的“个人倾向”。比如,专员2可能天生“风险厌恶”,他的偏见就是一个负值,倾向于不通过贷款。
  • 激活函数(关键一步!)

    专员算出加权和后,不会直接把原始数字(比如“3.7”)交上去。他手里有一个标准化的印章(激活函数) ,盖一下,把数字变成更有意义的信号。

    • 常用印章ReLU。规则很简单:如果数字大于0,就原样通过;如果小于等于0,就改成0。
    • 作用:引入非线性。如果没有这一步,无论加多少层,都只是在做线性叠加,无法处理复杂问题。这个“盖章”动作,让模型有了“弯折决策边界”的能力。
  • 输出:4个专员每人盖好章,得出4个新的、经过复杂思考的数字,交给最后的主任。

第三层:决策室(输出层)

这里坐着最后的决策主任(输出神经元)。在二分类(通过/不通过)问题中,只有1个主任。

  • 主任的工作:他同样会收到4个专员传来的所有数据,再做一次他自己的加权综合,然后使用一个特殊的印章。

  • 特殊印章Sigmoid。这个印章很特别,它能把任何数字压缩到 0 和 1 之间

    • 如果输出是 0.85,就意味着模型判断“有 85% ​ 的概率应该批准这笔贷款”。
    • 如果输出是 0.12,就意味着“只有12%的概率该批准,应该拒绝”。

整个流程动画

人工智能基石:多层感知机(MLP).png

“学习/训练”是什么?

一开始,这个委员会是“菜鸟”,权重全是瞎猜的,批的贷款肯定一塌糊涂。

训练过程就是“用历史数据当老师”:

  1. 喂数据:给它1000份历史客户的真实申请表和最终结果(是否违约)。
  2. 对比答案:委员会用当时的权重做预测,然后对比真实结果。比如,它给一个最终违约的客户打了0.9的高分,这就错了
  3. 反向传播:这个错误会从后往前(从主任到专员到接待员) ​ 传回去,像一个严厉的教导主任在问责:“错在哪?是不是某个专员的权重设错了?还是某个接待员看的数据不对?”
  4. 优化调整:根据错误大小,通过优化器(如梯度下降)这个“调薪HR”,来微调每一个权重和偏见。给收入的重要性加点分,给年龄的权重减点分...
  5. 重复亿万次:这个过程重复成千上万次,直到委员会的判断准确率越来越高,权重也被调整到最优状态。这时,它就可以去审核新客户的贷款了。

核心特点总结

特点解释
“全连接”每一层的每个神经元,都和下一层的每一个神经元相连。就像每个专员都知道所有接待员的信息。
“前馈”信息单向流动,从输入层 -> 隐藏层 -> 输出层,没有回路。
“万能近似”理论已证明,只要隐藏层足够宽、神经元足够多,MLP可以拟合任何复杂的输入到输出的映射关系。
优点简单、通用,是理解一切复杂神经网络的基础
缺点1. “死板” :要求输入是固定长度的向量(就像表格栏数固定)。处理图像(像素多)或文本(长短不一)时参数爆炸,效率极低。 2. “黑箱” :很难解释它具体为什么做出某个决策。

一句话最终比喻

MLP就像一个把所有信息摊在桌上、用计算器和一套固定规则(权重+激活函数)来决策的官僚系统。它很强大,但处理图像、语言这类结构化数据时很笨拙,所以成了更专业模型(如CNN、Transformer)里的“基础零件”或“最后拍板人”。