从产品经理视角学习AI-人工智能理论基础

57 阅读6分钟

开场白:本人现在在一家新能源车企当产品经理,打算未来转行AI产品经理,这段时间在学AI相关的知识,这里是记录我学习以及产出的地方,以产品经理的视角来学习AI大模型。如发现问题请指出,欢迎大家一起探讨。

一、机器学习和深度学习的区别?

机器学习和深度学习都是AI的子领域;

机器学习是通过数据训练模型,让模型具有预测效果;它需要人为提取特征,然后通过模型训练进行分类回归,最后进行输出

而深度学习可以说是机器学习的子领域,通过深度神经网络训练模型,让模型能够自动提取复杂特征,它是端到端的模型,不需要人为提取特征

image.png

二、机器学习

监督学习:输入数据和对应标签。要求给定新的输入,能够预测出正确的输出标签

无监督学习:输入数据,其中少量数据打了标签

半监督学习:输入数据,没有标签信息

2.1、监督学习

监督学习有明确目的,能够得到量化结果。常用于分类(离散)、回归(连续)场景

监督学习典型算法

  • 线性回归

通过学习输入值与输出值的线性关系,来预测目标的输出,常用于股价预测、分数预测等问题

  • 逻辑回归

通过学习输入特征与类别的关系,来预测目标的类别标签,处理二分类问题,常用于垃圾邮件分类等问题

  • 决策树

以树形结构来展示决策规则和分类结果的模型,常用于客户分类

  • 随机森林

构建多个决策树,常用于文本分类

  • 朴素贝叶斯

根据贝叶斯定理对数据进行预测

  • 支持向量机

构造超平面来最大化数据的边距,来减小分类误差

  • K邻近算法

选取距离测试实例最近的k个训练实例,根据这k个训练实例哪个标签占大头,就将该值作为测试实例的预测值

2.2、无监督学习

无监督学习没有训练目标,没有量化结果。通常用于以下场景:

一、发现异常:如通过对特征对用户分类,能够找到一些异常的用户

二、用户细分与推荐:通过性别、年龄、地理位置等维度对用户进行聚类分类,用于广告投放。通过聚类,发现购买行为相似的用户,然后推送用户“可能喜欢”的商品

无监督学习经典算法

① K-means聚类

算法步骤:

  1. 随机选取k个数据点作为初始聚类中心,
  2. 计算其他每个数据点到每个聚类中心的距离,距离最近的就被分配到这个簇里面,
  3. 重新计算这个簇的中心,
  4. 重复步骤2和3,直到聚类中心不再发生显著变化
image.png

应用场景:

  • 在电商场景中,通过聚类进行用户划分,理解每个簇类的特征,然后打上标签,形成用户画像,然后基于用户画像,投放对应的广告和推荐商品
  • 识别异常数据:如在医疗设备中识别异常生理信号
② PCA降维

通过线性变化将数据转换到新的坐标轴上,使得大部分的方差集中在前面几个主成分

应用场景:常用于图像压缩

2.3、半监督学习

通过用少量带标签的数据和大量未带标签的数据来训练模型,来提高模型的泛化能力,特别适用于标注成本高且标注过程耗时的领域,如语音识别,图像分类

三、深度学习

3.1、神经网络

神经网络是一种模拟生物神经网络的结构和功能的数学模型,神经网络是多层神经元的连接,深度神经网络相比神经网络多了N层隐藏层

image.png

神经网络如何学习

目标:让预测值不断逼近真实值

通过前向传播,层层推进,到输出层产出结果

计算预测值与真实值的误差,通过误差来反向传播迭代,通常用梯度下降等方法,调整权重参数,从而让误差不断变小

3.2、深度神经网络

1、卷积神经网络

①、卷积层

使用卷积核在输入数据上滑动,提取局部特征

image.png
②、池化层

池化层相比卷积层更能大大地降低数据维度,从而减少计算量,同时也避免了过拟合

image.png

  • 最大池化:取区域内的最大值
  • 平均池化:取区域内的平均值
③、CNN架构

经过卷积层和池化层的数据,才能进入全连接层,才能大大降低计算复杂度。

但一个CNN架构,通常要经过多层卷积和多层池化。通常为:

卷积层-池化层-卷积层-池化层-...-全连接层

④、应用

通常用于图像检索、人脸识别等图像领域

2、循环神经网络RNN

CNN很强大,但CNN无法解决序列数据问题,如文字、音频等内容,这时候就出现了RNN

image.png

对于RNN,前面的输入对后面的输出都有影响。但RNN有短期记忆问题,越早的输入影响越小,越晚的输入影响越大,无法处理长期记忆问题。

RNN优化算法
  • LSTM:解决短期记忆问题,只记忆重要信息,忽略不重要的信息

  • GRU:对LSTM的结构进行优化,降低计算量

RNN应用场景

常用于机器翻译,文字语义识别等领域

3、生成对抗网络GAN

GAN有两个结构:

①、生成器G

②、判别器D

训练过程:

  1. 固定判别器D,训练生成器G
  2. 固定生成器G,训练判别器D
  3. 不断循环反复,直到训练出一个好的生成器

应用场景: 用于生成图片,视频等

这里有一篇很通俗易懂的博客,供阅读:一文看懂「生成对抗网络 - GAN」基本原理+10种典型算法+13种应用 (easyai.tech)

4、强化学习

强化学习≠半监督学习

强化学习没有传统标签,只有环境反馈给的奖励信号

强化学习的本质是“与环境试错”,在环境反馈中找到一个奖励最大化的动作序列,现在的gpt、kimi等大模型后训练过程是通过通过强化学习训练出来的。