首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Unkrible
掘友等级
大数据开发/算法
|
在读
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
14
文章 14
沸点 0
赞
14
返回
|
搜索文章
最新
热门
处理类别不平衡
更多的数据打败聪明的算法,更好的数据打败更多的数据,显示了在机器学习中数据规模和数据质量的重要性。在分类任务中,类别是否不平衡是评价数据集质量的重要指标,指分类任务中不同类别的训练样例数目差距很大的情况。如果不同类别的训练样例数目差距过大,例如998个正例、2个负例,学习方法只…
自然语言处理:从词频到word embedding到Bert模型
由于模型以张量为输入,因此面对nlp数据集,第一个任务就是将文本转为向量,是本文谈论的重点。其中大概有以下几种方法: 利用词频、tf-idf等信息,直接对文本进行编码。这些特征可能在word分布比较平均的时候没有多大作用 利用传统特征如词频、tf-idf等对文本进行编码,然后扔…
AutoNLP2019赛事总结
赛题介绍AutoNLP2019赛事的主要目的是对自然语言问题的分类任务设计一套general的解决方案,线上线下一共提供了10个数据集,涉及多种nlp任务,本次比赛一共提供了3种baseline方法:
略谈OS存储管理
存储管理是OS的重要组成部分,负责管理计算机系统的重要资源——内存存储器。任何程序和数据都需要一个载体存储,以在计算机中执行或处理。 1. 存储器体系层次 因此我们需要通过建立良好的存储体系以克服高速RAM容量小且昂贵、容量大便宜的磁盘外存访问速度低等缺陷,从而充分发挥CPU的…
个人成就
文章被点赞
5
文章被阅读
6,858
掘力值
123
关注了
50
关注者
1
收藏集
1
关注标签
12
加入于
2017-12-14