人工智能学习笔记 - 机器学习算法
机器学习是人工智能的重要分支,本质是通过已有数据选择合适的学习方法(数学函数),找到能使损失最小化的函数模型,然后利用这个模型对未知数据进行预测。它强调数据驱动和模型泛化能力,不依赖手工编程规则。
什么是机器学习(Machine Learning)
-
定义:机器学习通过数据让计算机自动学习规律,从而对新数据进行预测或决策,而无需显式编程。
-
核心思想:
- 从数据中学习规律
- 模型具备泛化能力,不仅拟合已有数据,还能处理未知数据
- 通过最小化损失函数(loss function)优化模型参数
-
应用举例:
- 图像识别
- 自然语言处理
- 推荐系统
- 金融风控
监督学习(Supervised Learning)
-
定义:利用带标签的数据,学习输入特征与输出标签之间的映射关系。
-
数据形式:
- 表示第
i个样本中的特征向量 - 表示第
i个样本中的目标值 - 意思是一共有
n个样本,每个样本包含一个输出 和一个特征向量
- 表示第
-
目标:学习函数 ,使得
-
常用算法:
- 线性回归 / 逻辑回归
- 决策树 / 随机森林
- 支持向量机(SVM)
- 神经网络
-
应用:
- 房价预测(回归)
- 邮件垃圾分类(分类)
无监督学习(Unsupervised Learning)
-
定义:仅使用未标注的数据,发现数据内部结构或规律。
-
数据形式:
-
目标:识别数据模式、聚类或降维表示
-
常用算法:
- K-Means 聚类
- 层次聚类
- 主成分分析(PCA)
- 自编码器(Autoencoder)
-
应用:
- 客户分群
- 异常检测
- 数据降维与可视化