又名上班摸鱼系列（笑）总之是用于记录机器学习相关的知识学习的栏目（之一），不知道掘金有没有多级分栏，好像没有……总之暂定是按书来分。因为我其实有点基础所以笔记中只包含我个人觉得需要重复，强化记忆的，可能中英文混杂，不适合其他任何人阅读（但是感觉也根本不会有人看呢，想太多了！)

四类学习

supervised（有监督学习）
unsupervised（无监督学习）
semi-supervised（半监督学习）
reinforcement（强化学习）

Semi-supervised

同时使用有标签数据和无标签数据。通常而言采用半监督学习方式的时候，所使用的无标签数据量要远远大于有标签数据。半监督学习和有监督学习的目的是一样的，而使用半监督学习的原因是有标签的数据量可能不足以用于训练出一个可用的模型，此时便希望能够以大量的无标签数据来填补，从而在标记数据有限的情况下获取性能更好的模型。

强化学习

强化学习是机器学习的一个子领域，关注智能体与环境之间的交互，目的一般是追求最大回报。强化学习的算法的目的一般是学习一个policy（策略）。 A policy is a function (similar to the model in supervised learning) that takes the feature vector of a state as input and outputs an optimal action to execute in that state. The action is optimal if it maximizes the expected average reward. 强化学习能够解决一些特定的，如有着长期目标的问题，例如游戏和资源管理等。

监督学习是如何工作的

监督学习进程始于收集数据。有监督学习的模型输入可以是任何类型的数据，而输出通常为real number/labels/vectors/sequences/etc.

The Hundred-Page Machine Learning-2024.06.04-Introduction

四类学习

Semi-supervised

强化学习

监督学习是如何工作的