人工智能学习笔记 - 机器学习算法

35 阅读2分钟

人工智能学习笔记 - 机器学习算法

机器学习是人工智能的重要分支,本质是通过已有数据选择合适的学习方法(数学函数),找到能使损失最小化的函数模型,然后利用这个模型对未知数据进行预测。它强调数据驱动和模型泛化能力,不依赖手工编程规则。


什么是机器学习(Machine Learning)

  • 定义:机器学习通过数据让计算机自动学习规律,从而对新数据进行预测或决策,而无需显式编程。

  • 核心思想:

    • 从数据中学习规律
    • 模型具备泛化能力,不仅拟合已有数据,还能处理未知数据
    • 通过最小化损失函数(loss function)优化模型参数
  • 应用举例:

    • 图像识别
    • 自然语言处理
    • 推荐系统
    • 金融风控

监督学习(Supervised Learning)

  • 定义:利用带标签的数据,学习输入特征与输出标签之间的映射关系。

  • 数据形式:{(xi,yi)}i=1n\left\{(\mathbf{x}_i, y_i)\right\}_{i=1}^n

    • XiX_i表示第i个样本中的特征向量
    • yiy_i表示第i个样本中的目标值
    • 意思是一共有n个样本,每个样本包含一个输出 yiyi 和一个特征向量 XiXi
  • 目标:学习函数 ff,使得 f(x)yf(\mathbf{x}) \approx y

  • 常用算法:

    • 线性回归 / 逻辑回归
    • 决策树 / 随机森林
    • 支持向量机(SVM)
    • 神经网络
  • 应用:

    • 房价预测(回归)
    • 邮件垃圾分类(分类)

无监督学习(Unsupervised Learning)

  • 定义:仅使用未标注的数据,发现数据内部结构或规律。

  • 数据形式:xii=1n{\mathbf{x}*i}* {i=1}^n

  • 目标:识别数据模式、聚类或降维表示

  • 常用算法:

    • K-Means 聚类
    • 层次聚类
    • 主成分分析(PCA)
    • 自编码器(Autoencoder)
  • 应用:

    • 客户分群
    • 异常检测
    • 数据降维与可视化