首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
文本分类
订阅
赵剑辉
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
Java 正则表达式详解
Java 提供了功能强大的正则表达式 API,在 java.util.regex 包下。本教程介绍如何使用正则表达式 API。
使用CNN进行网站文本分类
本文主要讲述一些自然语言处理的基础知识,以及使用如何CNN模型对从网上爬取下来的网站网页文本进行分类。 词向量技术就是将词转化成向量形式,因为我们的分类器最后处理的都是向量,所以进行自然语言的预处理往往就是需要进行向量化。在sklearn库中使用svm对文本分类之前可以通过使用…
kmeans实现文本聚类
需求 拿到的需求是输入n个文本,对文本进行聚类,由于这些输入不能通过历史数据进行训练,所以这个主要就是用无监督学习来解决。 kmeans 谈到聚类就会想到kmeans,它的核心思想是给定的K值和K个初始质心将样本中每个点都分到距离最近的类簇中,当所有点分配完后根据每个类簇的所有点…
用机器学习的方法鉴别红楼梦后四十回作者
在学界一般认为,《红楼梦》后 40 回并非曹雪芹所著。本文尝试应用机器学习的方法来分析原著文本中作者的用词习惯,从技术角度去说明《红楼梦》前 80 回和后 40 回的写作风格差别,继而可以确认后 40 回非原作者所写。
用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践
介绍了应用深度学习解决文本分类的相关的思路、做法和部分实践的经验。
中文正则表达式匹配-正则中文匹配
中文正则表达式匹配-正则中文匹配