首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
算法
订阅
wythezhou
更多收藏集
微信扫码分享
微信
新浪微博
QQ
30篇文章 · 0订阅
推荐系统与应用随记
用户画像刻画一些用户维度的信息,例如这个人的学历,经济收入状况等等,以后无论是用户推荐,分类,排序,都会有用户画像的相关应用。 对式子除以T,使得其与测试样本T无关。得到用户在每个物品上平均的一个差异度。 你能拿到用户对商品的一个评分,例如:一颗星,两颗星或者直接的一个分数值。…
算法(八):图解KNN算法
K最相邻算法(K-NearestNeighbor Classification Algorithm,KNN)是数据挖掘分类技术中最简单的方法之一,所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻居来代表。 KNN算法的核心思想是如果一个样本在特征空…
Impossible Mission - 单机百亿文件的极致索引(设计篇)
一. 背景 当下信息社会每天都产生大量需要保存的数据,这些数据在刺激海量存储技术发展的同时也带来了新的挑战。比如,海量数据为存储系统增加了大量的小文件,这些小文件的元数据如何管理?如何控制定位某个文件的时间和空间开销? 随着对数据实时性要求的提高, 文件也越来越趋于碎片化,像短…
用 Golang 写一个搜索引擎(0x06)--- 索引构建
不知不觉写到第七篇了,按这个节奏,估计得写到 15 到 20 篇左右才能写完,希望自己能坚持下去,之前写代码的时候很多东西并没有想得那么细致,现在每写一篇文章还要查一些资料,确保文章的准确性,也相当于自己复习了一下吧,呵呵。 先说一下,关于倒排文件,其实还有很多东西没有讲,到后面再统一…
RSA 原理探究
讨论 RSA 原理之前,我们先了解一下密码学的发展史。因为 RSA 最终形成的数学算法,也是不断演变而来的。 中国 话说历史上最早的加密算法的记载出自于周朝兵书《六韬.龙韬》中的《阴符》和《阴书》。其原理是使用文字拆分和符号代替等方式来加密数据。其实密码学的诞生,就是为了运用在…
深入理解hashmap(三)哈希表和二叉搜索树的恩怨情仇
前面两篇文章介绍了hashmap的源码和理论,今天把剩余的部分红黑树讲一下。理解好红黑树,对我们后续对hashmap或者其他数据结构的理解都是很有好处的。比方说为什么后面jdk要把hashmap中的单链表更新成红黑树? 父节点和子节点,这个我就不多说了。应该都知道。 如果某几个…
用 Golang 写一个搜索引擎(0x07)--- 正排索引
最近各种技术盛会太多,朋友圈各种刷屏,有厂商发的各种广告,有讲师发的各种自拍,各种参会的朋友们各种自拍,好不热闹,不知道你的朋友圈是不是也是这样啊,去年还没这么多技术会议,今年感觉爆发了,呵呵,真是一个互联网技术的好时代,而且还有各种撕 B 可看,真想八一八,怕得罪人,我们这种码农…
用 Golang 写一个搜索引擎 (0x00)--- 从零开始
很早就想写一系列的这样的文章了,之前在一个电商公司做搜索,对搜索引擎有一些认识,来到一个新的创业公司以后非常高兴还有机会继续做这方面的事情,虽然领域已经变了,而且不是做搜索了,但是技术还是那些技术,并且有机会接触到了 Go 语言,对于一个将近 10 年 C/C++ 的程序员来说,Go 的一些…
五分钟学会一个有意思的排序:计数排序
由于LeetCode上的算法题很多涉及到一些基础的数据结构,为了更好的理解后续更新的一些复杂题目的动画,推出一个新系列 -----《图解数据结构》,主要使用动画来描述常见的数据结构和算法。本系列包括十大排序、堆、队列、树、并查集、图等等大概几十篇。 计数排序是一种非基于比较的排…
图论深度优先搜索
已删!