首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
算法
订阅
扣钉日记
更多收藏集
微信扫码分享
微信
新浪微博
QQ
14篇文章 · 0订阅
自然语言处理中句子相似度计算的几种方法
在做自然语言处理的过程中,我们经常会遇到需要找出相似语句的场景,或者找出句子的近似表达,这时候我们就需要把类似的句子归到一起,这里面就涉及到句子相似度计算的问题,那么本节就来了解一下怎么样来用 Python 实现句子相似度的计算。 下面我们来一一了解一下这几种算法的原理和 Py…
数据对齐-编辑距离算法详解(Levenshtein distance)
在信息论、语言学和计算机科学中,Levenshtein distance是用于测量两个字符串之间差异的字符串度量。非正式的说就是两个单词之间的Levenshtein distance是将一个单词更改为另一个单词所需的单字符编辑(插入,删除或替换)的最小步骤。 它以苏联数学家弗拉…
进击算法:字符串匹配的 BM 算法
各种文本编辑器的 "查找" 功能(Ctrl+F),大多采用 Boyer-Moore 算法。Boyer-Moore 算法不仅效率高,而且构思巧妙,容易理解。1977 年,德克萨斯大学的 Robert S. Boyer 教授和 J Strother Moore 教授发明了这种算法…
大规模数据的去重与排序
业务中可能需要对很大量级(比如 100 亿)的数据(几十 G)进行排序或是去重等操作,在不使用 Hadoop 等工具的情况下如何本地处理呢?
Boyer-Moore 算法
最详细的讲解,没有之一!
LCS,给你一个不一样的模糊匹配
1. 什么是LCS 2. 为什么说需要LCS来解决模糊匹配 3. 实现原理 第一反应可能是穷举扫描,但是呢,我们也知道,如果字符串太长,暴力方法运行的时间是我们不能忍受的。 然后我们又会想到,将大问题拆分成小问题,用递归的思想解决。 至此为止,我们找到了求解最长公共子序列的方法…
经典排序算法总结 -- 冒泡、快排、插入、希尔、归并、选择
经典排序算法总结 -- 冒泡、快排、插入、希尔、归并、选择
高效的多维空间点索引算法 — Geohash 和 Google S2
每天我们晚上加班回家,可能都会用到滴滴或者共享单车。打开 app 会看到如下的界面: app 界面上会显示出自己附近一个范围内可用的出租车或者共享单车。假设地图上会显示以自己为圆心,5公里为半径,这个范围内的车。如何实现呢?最直观的想法就是去数据库里面查表,计算并查询车距离用户…
数据结构思维 第八章 索引器
数据结构思维 第八章 索引器