开始学习李宏毅老师的《机器学习》课程,稍微记一下笔记,加深一下印象。
人工智慧 机器学习 深度学习的关系
- 人工智慧是目标
- 机器学习是实现人工智慧的手段
- 深度学习是机器学习的一种方法
what is MachineLearning
就像河狸拥有筑水坝把水挡住的生物本能一样,机器所被给予的原始程序就相当于机器的本能。人工设定的规则是比较耗时的,而且是不会超过设定人的智慧的。因此,我们希望机器拥有自主学习的能力。
- step1 找到一个函数f也就是model
- step2 让机器能够判断模型的好坏
- step3 让机器有一个好的方法能够自动找到最好的f
总之,机器学习的三个步骤就是 模型 策略 算法 就像把大象塞进冰箱里一样,打开冰箱,把大象塞进去,关上冰箱
一则四格漫画~~
机器学习分类
scenario 场景, 使用场景并不是随心所欲的, 在没有data时候不能做监督学习,只能做reinforcement learning。
reinforcement learning就是我们没有办法做监督学习的时候,我们才做reinforcement learning。
Structured Learning 监督学习中的结构化学习
output是有结构性的,比如语音识别,翻译,人脸识别
是还有许多问题仍待解决的新大陆。
Transfer Learning 迁移学习
拥有少量的label的数据,但是一堆其他无关的数据,通过这些无关的数据来研究对学习的影响。(?)
监督 半监督 无监督学习的区别
| 分类 | 区别 | |
|---|---|---|
| 监督学习 | supervised Learning | input 数据都有lable |
| 半监督学习 | Semi-supervised Learning | input 数据中部分有lable, 部分没有label |
| 无监督学习 | Unsupervised Learning | input 数据都没有lable |
Reinforcement Learning 强化学习
就是Learning from cirtics ,监督学习是告诉机器正确答案,像是在学习学习一样,强化学习是只给做完某件事得到的分数,而没有标准答案,像是在社会上的学习一样,经受社会的毒打。
强化学习只是知道结果,却不知道为什么对,为什么错
Alpha Go is supervised learning + reinforcement learning 先用棋谱做监督学习,然后自己和自己下做强化学习
参考资料: