首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能实践
吃果冻不吐果冻皮
创建于2021-08-12
订阅专栏
人工智能实践
等 23 人订阅
共36篇文章
创建于2021-08-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
sklearn中针对不同分类场景模型评估指标函数概述
在sklearn中,`sklearn.metrics` 模块下实现了一些损失、评分和实用函数来衡量分类性能。某些指标可能需要正类(positive class)、置信度值(confidence val
对离散特征进行数据预处理:独热编码、标签编码及二值化
使用机器学习时,会存在不同的特征类型:连续型特征和离散型特征。 针对连续性特征,我们通常将其线性缩放到[-1, 1]区间或者
浅析sklearn中的Pipeline
为什么需要pipeline? 在日常机器学习项目开发中,可能会经过数据缩放、特征组合以及模型学习拟合等过程;并且,当问题更为
浅述解决数据不平衡的几种方案
我们在实际场景开发机器学习模型的时候,数据集的样本(特别是分类问题上),不同标签的样本比例很可能是不均衡的。因此,如果直接使
浅述几种文本和图像数据增强的方法
在现实场景中,我们往往收集不到太多的数据,那么为了扩大数据集,可以采用数据增强手段来增加样本,那么平常我们应该怎么做数据增强的
sklearn中多标签分类场景下的常见的模型评估指标
在sklearn中,提供了多种在多标签分类场景下的模型评估方法,本文将讲述sklearn中常见的多标签分类模型评估指标。在多标签分类中我们可以将模型评估指标分为两大类,分别为不考虑样本部分正确的模型评
多标签分类场景下的模型评估指标
前言 指标在机器学习或深度学习领域扮演着相当重要的角色。 我们从指标选择问题开始,以了解特定模型的基线分数。 在本博客中,我们研究了多标签分类的最佳和最常用的指标,以及它们与常用指标的不同之处。 接下
浅析命名实体识别(NER)的三种序列标注方法
小知识,大挑战!本文正在参与“程序员必备小知识”创作活动 简述序列标注 序列标注(Sequence Tagging)是NLP中最基础的任务,应用十分广泛,如分词、词性标注(POS tagging)、命
浅析sklearn中的数据预处理方法
这是我参与8月更文挑战的第28天,活动详情查看:8月更文挑战 简介 通过特征提取,我们能得到未经处理的特征,这时的特征可能有以下问题: 不属于同一量纲:即特征的规格不一样,不能够放在一起比较。无量纲化
数据缺失值可视化利器-missingno
这是我参与8月更文挑战的第27天,活动详情查看:8月更文挑战 背景 数据探索和预处理是任何数据科学或机器学习工作流中的重要步骤。在使用教程或训练数据集时,可能会出现这样的情况:这些数据集的设计方式使其
机器学习可视化利器-Yellowbrick
这是我参与8月更文挑战的第26天,活动详情查看:8月更文挑战 Yellowbrick简介 Yellowbrick是一款用于促进机器学习模型选择的可视化分析和诊断工具。它在scikit-learn的ap
使用sklearn进行特征选择
这是我参与8月更文挑战的第24天,活动详情查看:8月更文挑战 背景 一个典型的机器学习任务,是通过样本的特征来预测样本所对应的值。如果样本的特征少,我们会考虑增加特征。而现实中的情况往往是特征太多了,
sklearn中的文本特征提取方法
这是我参与8月更文挑战的第20天,活动详情查看:8月更文挑战 什么是特征提取 特征提取就是将一些原始的输入的数据维度减少或者将原始的特征进行重新组合以便于后续的使用。 比如: 我们知道有的时候原始数据
十分钟掌握聚类算法的评估指标
这是我参与8月更文挑战的第18天,活动详情查看:8月更文挑战 前言 聚类算法属于非监督学习,它并不像分类算法那样可以使用训练集或测试集中的数据来计算准确率、召回率等。 那么如何评估聚类算法得好坏呢?
十分钟掌握回归算法的评估指标
这是我参与8月更文挑战的第17天,活动详情查看:8月更文挑战 什么是回归算法? 回归算法就是对历史数据进行拟合,形成拟合方程。接下来使用该方程对新数据进行预测。如果是一元数据的拟合方程,则拟合一条线,
十分钟掌握分类算法的评估指标
这是我参与8月更文挑战的第16天,活动详情查看:8月更文挑战 什么是评估指标? 评估指标是针对模型性能优劣的一个定量指标。一种评价指标只能反映模型一部分性能,如果选择的评价指标不合理,那么可能会得出错