首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
自然语言处理
致Great
创建于2022-01-01
订阅专栏
自然语言处理
等 22 人订阅
共74篇文章
创建于2022-01-01
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Bert预训练新法则
论文简介:还应在遮蔽语言模型中使用 15% 的遮蔽概率吗? 论文标题:Should You Mask 15% in Masked Language Modeling? 论文链接:https://arx
文本分类还停留在BERT?对偶对比学习框架也太强了
论文简介:对偶对比学习:如何将对比学习用于有监督文本分类 论文标题:Dual Contrastive Learning: Text Classification via Label-Aware Dat
比赛推送 图像/表格/CV/NLP,多线程开启
H&M Personalized Fashion Recommendations Happywhale - Whale and Dolphin Identification Ubiquant Mark
训练更快,泛化更强的Dropout:Multi-Sample Dropout
论文简介:大幅减少训练迭代次数,提高泛化能力:Multi-Sample Dropout 论文标题:Multi-Sample Dropout for Accelerated Training and B
没想到Mixup还可以用于文本:SSMix
论文标题:SSMix: Saliency-Based Span Mixup for Text Classification 论文链接:https://arxiv.org/pdf/2106.08062.
【论文笔记】当Bert炼丹不是玄学而是哲学:Mengzi模型
论文标题:Mengzi: Towards Lightweight yet Ingenious Pre-trained Models for Chinese 论文链接:https://arxiv.org
山东算法赛网格事件智能分类topline
赛题链接:http://data.sd.gov.cn/cmpt/cmptDetail.html?id=67 baseline:https://aistudio.baidu.com/aistudio/p
NLP系列(二)基于Siamese Network进行问题句子相似性判定
问题句子相似度计算,即给定客服里用户描述的两句话,用算法来判断是否表示了相同的语义。 今年和去年前后相继出现了多个关于句子相似度判定的比赛,即得定两个句子,用算法判断是否表示了相同的语义或者意思。
NLP系列(一) pkuseg-python:一个比jieba准确度更高的中文分词工具包
pkuseg是由北京大学语言计算与机器学习研究组研制推出的一套全新的中文分词工具包。pkuseg具有如下几个特点: 高分词准确率。相比于其他的分词工具包,我们的工具包在不同领域的数据上都大幅提高了分词的准确度。根据我们的测试结果,pkuseg分别在示例数据集(MSRA和CTB8…
Pytext上手——Intent-Slot 模型实战
槽位填充可以理解为一个序列标注的问题,我们训练范例{(x^((n)),y^((n)) ):n=1,……,N},然后我们想要识别学到一个函数f∶x→y,这个函数能够匹配输入序列x和相应的标签序列y。在槽位填充中,输入序列和标签序列长度相同,因此排列是准确的。 ATIS数据集包含4…
基于Siamese Network进行问题句子相似性判定
问题句子相似度计算,即给定客服里用户描述的两句话,用算法来判断是否表示了相同的语义。 项目地址:https://github.com/yanqiangmiffy/sentence-similarity 今年和去年前后相继出现了多个关于句子相似度判定的比赛,即得定两个句子,用算法…
文本分类(下)-卷积神经网络(CNN)在文本分类上的应用
原先写过两篇文章,分别介绍了传统机器学习方法在文本分类上的应用以及CNN原理,然后本篇文章结合两篇论文展开,主要讲述下CNN在文本分类上的应用。 如图所示,输入层是句子中的词语对应的wordvector依次(从上到下)排列的矩阵,假设句子有 n 个词,vector的维数为 k …
Word2Vec教程-Negative Sampling 负采样
这篇word2vec教程2中(教程1 Word2Vec教程-Skip-Gram模型),作者主要讲述了skip-gram 模型优化的策略-Negative Sampling,使得模型更加快速地训练。
文本数据处理的终极指南-[NLP入门]
实现任何程度或者级别的人工智能所必需的最大突破之一就是拥有可以处理文本数据的机器。值得庆幸的是,全世界文本数据的数量在最近几年已经实现指数级增长。这也迫切需要人们从文本数据中挖掘新知识、新观点。从社交媒体分析到风险管理和网络犯罪保护,处理文本数据已经变得前所未有的重要。 ima…
自然语言处理与深度学习简介
自然(人工)语言为什么如此特别?自然语言是一个专门用来表达语义的系统,并且它不是由任何形式的物质表现产生。正因为如此,人工语言与视觉或者其他任何机器学习任务非常不同。 大多数单词只是一个超语言实体的符号:单词是映射到一个表征(想法或事物)的记号。例如,“火箭”一词是指火箭的概念…