首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
故事挺秃然
掘友等级
NLP工程师
在代码与思想的交汇点,一起学点有用的、有趣的、能落地的东西,让学习成为持续进化的快乐旅程。 公粽号:“一起学点什么吧” 个人号:“故事挺秃然”
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
BERTopic详解--主题建模利器
本文将系统拆解BERTopic的技术内核,从工作流程到子模块实现,从C-TF-IDF算法原理到LLM微调实践,辅以代码示例与可视化演示,助你快速掌握这一主题建模利器。
中文分词:分词工具及使用实践总结
本文总结了13种主流中文分词工具,包括jieba、cutword、pkuseg、baidu lac、jiagu、HanLP等,为开发者在项目中快速选型和应用提供参考。
中文分词:机械分词算法详解与实践总结
本文系统梳理中文分词中的机械分词算法 ,涵盖以下核心内容:经典算法解析与python代码实战:正向/逆向最大匹配、双向匹配、全切分法、DAG动态规划、N-最短路径等主流方法原理与实现差异。
MCP(模型上下文协议)——AI生态的“万能插座”
MCP的诞生,不仅是技术协议的迭代,更是人工智能从“工具孤岛”走向“协作大陆”的第一步。它像一座桥梁,连接着模型的智能与现实世界的复杂需求。
中文分词:历程、发展、问题总结
分词是NLP的基石,尤其在中文语境下,其复杂性远超想象。从传统的规则匹配到现代的深度学习模型,分词算法不断进化,以应对歧义、未登录词等挑战。
TF-IDF算法的代码实践应用——关键词提取、文本分类、信息检索
**通过纯Python手写实现与调用`sklearn`工具包两种方式**,带你一步步完成TF-IDF在真实场景中的应用:关键词提取、文本分类、信息检索
TF-IDF算法详解与实践总结
本文主要介绍TF-IDF的算法内容以及面试中对于TF-IDF的相关问题,两种方式实现TF-IDF,一种是纯python实现一个TF-IDF,然后利用TF-IDF实现关键词提取,另一种是调用相关依赖实现
BM25算法详解与实践总结
BM25(Best Matching 25)是一种用于信息检索(Information Retrieval)和文本挖掘的算法,它被广泛应用于搜索引擎和相关领域。
个人成就
文章被点赞
1
文章被阅读
2,791
掘力值
134
关注了
1
关注者
2
收藏集
0
关注标签
250
加入于
2021-06-30