神经网络简介
神经网络是什么
神经网络可以算的上是一种比较古老的机器学习算法了,从刚开始提出到后面有一段低谷期,到现在成为很多机器学习问题的首选算法,除了算法模型设计层面的进步外,更主要的是大数据技术的出现使得大训练样本的采集成本下降。
神经网络最初是根据人脑内的生物神经类比得到的
为什么要有神经网络
对于大量数据来说,神经网络相比于传统ai算法,可以显著提升性能。
神经网络概念
对于该问题而言,有四个特征,在神经网络中对应输入层,向量x,经过隐藏层(含有三个神经单元),从而生成含有三个激活值的向量a,然后再输入到输出层,最终形成问题的输出。之所以叫隐藏层,是因为输入训练样本时,并不会出现中间隐藏层中的隐藏特征,训练样本(x,y)只有输入和输出,不包含隐藏层的特征值。并且与传统机器学习算法手动设定特征相比较,深度学习(神经网络)它的优势在于能够通过网络的多层结构和反向传播算法,从大量数据中学习到最适合任务的特征表示。至于每层有多少神经元,有几层是神经网络架构的问题,后面会学。像这种多层神经网络,也叫多层感知机。
这里我们也把输入层称为第0层,第一个隐藏层称为第1层,同时用上标来表示第几层。每一层的输出是下一层的输入。每一个神经单元就类似于我们之前学的逻辑单元。会进行向量a中某一个值的计算,每个神经单元有自己的参数w和b。因为是从前到后不断推进,所以也被叫做前向传播。
更一般化的表示: