1.人工智能发展概述
人工智能总体发展:
人工智能研究方向:
语音合成 声纹识别
语音识别 指纹识别
图像识别 语义理解
字符识别
人工智能技术分类:
NLP方向概述:NLP(自然语言处理):是由语言学、数学、计算机科学融合而成的;所要达到的最终目的是实现人机交互、数据分析/挖掘。
基础要求:
- 需要一定的编程能力
- 一定的算法储备量
- 良好的沟通能力
- 学习能力
- 一定的英文能力
- 使用搜索引擎的能力
常用工具:
- 编程语言:Python(模型训练开发主要语言)/R(用于处理数据)
- 常见框架: Trensorflow Pytorch Keras Gensim Sklearn Numpy(矩阵运算)
2.机器学习基本认识
有监督学习 概述:构建一个模型(公式),是的输入X,可以得到预测值Y;在此之前需要使用到标注好的数据进行模型训练。 要点:
- 需要一定的训练数据
- 输入与输出之间存在明显的联系
- 输入输出可以数值化
- 预测是有价值的
应用:语音识别、语义理解
无监督学习 概述:给予机器的数据不加标注,选用一定的算法去自动化的分析处理数据 应用:聚类、降维、找特征值 常用术语 训练集、验证集、测试集:对于训练模型的数据一般会按照(8:1:1)的比例分别用于训练、验证、测试;但是行业内对于验证集 与测试集的划分比较模糊,并且为了保证模型效果需要对测试集的数据进行定期的更新不能一成不变; K折交叉验证法:为了保证模型效果我们一般不会固定测试集的数据,而是将数据分为k份其中一份用于测试数据,k-1份数据用于 训练集,最终会得到k个结果,再对k个结果去平均值得到的模型效果更好。 过拟合:模型只能预测训练集的数据,超出训练集的数据无法预测 欠拟合:模型连基本的训练集数据都无法预测 回归问题:预测值是数值 分布问题:预测值是离散值
3.深度学习基本认识
深度学习一般步骤:
优化手段: a、调整模型随机初始化策略,尽量不要使用随机初始化避免随机性 b、优化损失函数 c、调整参数优化 d、调整模型结构(选用不同的公式)
深度学习涉及步骤说明:
- 人工神经网络:分布式并行信息处理
- 损失函数逐渐减小说明模型逐渐再收敛,这主要针对分布问题而言,对于回归问题则不适用
- 梯度/学习率:表示每次学习改进的进度
- 梯度下降:主要是为了求函数的最低点
深度学习流程:
总结:深度学习的主要思想就是通过已有的数据找出规律,常用方式就是先猜后调。