参考文档:www.bilibili.com/video/BV1oj…
bilibili.com/video/BV1uGA3eLEeu/?spm_id_from=333.1387.homepage.video_card.click
神经元
隐藏层
神经网络
前向传播
拟合
过拟合
过拟合:在训练数据上表现完美,但在新数据(现实世界)上一塌糊涂
泛化能力
简单来说,泛化能力就是指模型举一反三的能力
编码
孤热编码
词嵌入
点积 相识度
嵌入矩阵
潜空间
训练集和测试集 核心比喻 :备考 VS 考试
训练集 —— 平时做的“练习题册”
- 定义: 训练集是用于训练模型的数据样本。模型通过“看”这些数据来学习其中的规律和特征。
- 特点:
- 包含答案: 在监督学习中,训练集里的每个样本都有对应的正确答案(标签) 。就像练习册的每一道题后面都附有答案,学生(模型)做完题可以对照答案,看看自己哪里错了,从而调整解题思路。
- 目的是学习: 模型的任务就是尽可能好地拟合(记住或理解)这些数据,以便总结出从“问题”到“答案”的映射规律。
- 相当于: 学生平时用的课本、习题集、模拟试卷。他反复做这些题,从中掌握知识点。
测试集 —— 真正的“期末考卷”
- 定义: 测试集是用于评估模型性能的数据样本。这些数据在训练过程中完全不会让模型看到,用来检验模型对全新数据的处理能力。
- 特点:
- 无答案(对模型来说): 虽然对于开发者来说,测试集也是有正确答案的(用于评分),但在模型“答题”时,它并不知道答案。这就像学生上考场前,是拿不到考卷的标准答案的。
- 目的是评估: 它的唯一作用就是在模型训练完成后,拿来考一考它,看看它到底学得怎么样,能不能举一反三。
- 相当于: 学期末的最终考试。这张卷子上的题目可能和练习题有些类似,但肯定不是原题。它的分数代表了学生真正的学习效果。