第一章

87 阅读1分钟

数据获取

截屏2022-12-30 下午4.01.24.png

去那里找数据集

数据集比较

截屏2022-12-31 上午9.14.26.png

生成数据

  • 使用GAN网络
  • 数据增强

数据标注

截屏2022-12-31 上午9.27.34.png

半监督学习

截屏2022-12-31 上午9.35.41.png

自学习

截屏2022-12-31 上午9.37.03.png

众包

截屏2022-12-31 上午9.43.46.png

截屏2022-12-31 上午9.46.48.png

主动学习

主动学习的过程是,通过机器学习模型选出一批最难以分类的样本数据,交给标注工进行人工标注,然后将人工标注的数据放入到模型中进行训练,逐步提高模型的效果,使人工经验能够参与融入到机器学习的模型中。

如何选择样本

  • 选择最不确定的样本:选择分类最高概率接近1/n1/n
  • Query-By-Commitee: 训练多个模型,对样本进行投票

主动学习 + 自主学习

截屏2022-12-31 下午4.31.43.png