本文已参与「新人创作礼」活动,一起开启掘金创作之路。
人工智能:前所未有的主动工具
1.it上最大的成本在于遗留系统改造
2.数字化改革:类似最开始的雅虎,如果把所有东西都安排好,规划好那样是很累的;
3.最开始的iphone解决了两个问题
1.下载手机软件有专门的市场,给开发者一个平台,构造了生态,满足群众的要求
2.触摸屏
4.欧几里得《几何原本》
5.一个功能是否能够通过人工智能实现?
1.是否有x\y之间的对应关系
2.是否能够通过智能实现,而不是人工
3.是否拥有足够的数据?
6.贝叶斯:p(A|B)=P(B|A)P(A)/P(B) 是一个不断验证的过程
7.人工智能:
1.得到现在的数据
2.拟合
3.求拟合出来的东西,与现实数据的差别,得到一个函数(是和拟合中的a,b有关的函数)
4.求损失函数最小的情况之下,a,b是最小的,从而算得最好的拟合
如何计算损失函数最小?使用梯度下降!(但是找到的是局部最优)
1)假设你被随便扔到一个山上,你环顾四周,找一个目前看上去最快下山的方向\
2)下山\
3)到了下一个位置之后再重复1中操作\
8.最简单的分类模型:逻辑回归
9.术语:
1.参数与超参数
2.特征就是x(即输入)
3.目标y(输出)
10.监督和无监督
监督:D{(X,Y)}
无监督:D{(X)}
半监督
11.随机梯度下降:
假设原来特征100个,通过100个的求和得到最佳解
但是如果使用随机梯度下降,就可以使用简单的方法只取5个进行采样。
12.机器学习的流程:
1.准备训练数据
2.选择模型
3.选择损失函数(有些是计算差,有些是方差),其实我需要训练的东西就是要优化的目标,
4.训练:梯度下降优化损失函数,找到最优参数
5.推理:用训练好的模型,输入x,得到y
(难度不在于代码的实现,而是在于了解你代码需要优化的方向,解决你的问题)
13.python:
1.经典机器学习库:sklearn
2.用于深度学习,人工神经网络:tensorflow,pytorch,
14.欠拟合:
画出学习曲线,如果拟合都没拟合上,就是欠拟合
15.是否存在过拟合?
先画出你的学习曲线,如果你的训练数据和测试数据损失相差很大,就有可能是过拟合了
其实,如果有很多很多和过拟合在一起,求平均,大概就不会存在过拟合了
异或通过打破网络的一些固有结构,减轻过拟合
正则化也可以,让一些不重要的参数无限去向于0
正则:拟回归、lasso回归(lasso用的是绝对值,更好,但是差别不会很大;拟回归用的是平方)
16.交叉验证:
寻找一些超参数