首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
wakacaca
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
海量数据索引与近似最近邻随记
将次数看成向量,然后我们就可以比对向量的距离(欧式距离,余弦距离)。数据中会有一些异常点,这些异常点会导致结果的不稳定。 这种思想非常的不稳定,因为他只基于一个样本来做最后类别的判定。 少数服从多数。 Jaccard:并不是每个人都会点击或者购买这么高强度的行为,因为购买是需要…
PageRank 算法随记
递归的意思是:假如现在要求C,指向C的入链只有B,那么得先求B的重要度,B重要度的大小取决于指向B的入链以及这些入链的重要度。 “随机”的解释:从i这个页面开始,它可能有di种选择,而且他做每一种选择的时候,选择的概率是相同的,即他决定到下一个页面是一个随机的选择(应该跳到那个…
海量高维数据与维度约减随记
降维具体到技术就是奇异值分解SVD,SVD怎么去实现数据降维,怎么把这些维度在尽量少的损失原始信息的情况下达到比较好的效果,这是SVD的要做的核心。 损失掉很小的一部分信息,将他们降到一个低维度的子空间,这损失掉的一部分信息中也有可能是些噪声信息。 矩阵的行秩和列秩是相等的。 …
推荐系统与应用随记
用户画像刻画一些用户维度的信息,例如这个人的学历,经济收入状况等等,以后无论是用户推荐,分类,排序,都会有用户画像的相关应用。 对式子除以T,使得其与测试样本T无关。得到用户在每个物品上平均的一个差异度。 你能拿到用户对商品的一个评分,例如:一颗星,两颗星或者直接的一个分数值。…
数据分类与排序随记
分类问题中如果数据量不大的情况下用SVM会多一些。 做排序的话用LR和NN比较多,像GBDT这种模型也是可以输出概率值。 能不能找一函数将连续的y值约束到某一个范围内,常见的范围是0-1(概率)。 将离散值压缩到0-1之间的连续值。 分类问题实际上是在n维空间里面试图找到一条曲…
词嵌入随记
样本的构造方式,用一个长度为n的滑动窗口,在语料当中去滑动,每取出来那个连在一起的词,用前n-1个词去预测第n个词。 在很多个这些样本上去求交叉熵损失,然后最小化这个交叉熵损失。 4D*1是指将各自输入计算的结果拼接在一块。 projection之前要做一个拼接的操作,这个拼接…
计算机视觉-图像检索随记
电商上的应用:找相似,找同款。 CNPR,用卷积神经网络学习出来一个分桶的编号。预先把图像做一些分桶或者说把他先丢到空间不同的区域,然后检索时只是找其中某个区域的图片。 以未知点为圆心画圆,他所属的类别取决于圆内类别最多的点。你得先计算他们之间的相近度,每个图片抽取出来的fea…
计算机视觉(5)随记
DoG是IoG的一种简化算法,通过对原图像不断做高斯模糊,高斯模糊的量可以都是σ也可以是kσ,k平方σ。SIFT是DoG算法的一种实现,在这种方法中,它的每一层高斯模糊量是不同的,它在DoG的基本实现方法基础上又做了一个高斯金字塔。 一层octave结束之后,选取某一个位置对其…
计算机视觉(4)随记
y = mx + b 这种直线表达有个缺点,当直线垂直X轴的时候,斜率是无穷大,在Haugh空间没法表示。为了避免这种情况,我们使用极坐标表示。 将xy坐标上的点映射到极坐标空间。ρ与θ的关系就是个sin函数。表达意思和y=mx+b一样,只是曲线的形状变了。voting时要注意…
计算机视觉(3)随记
我们常指的滤波是指空间滤波和频率滤波。 在图像处理里面,管图像复原,去噪,可以说为图像复原,图像滤波,他是我们拿到图像的第一步操作,受到噪声污染的图像叫做退化,去噪就是复原。常见的噪声有加性噪声(与信号有关,一般把加性的随机性看成是系统的背景声),乘性噪声(传输过程中的信道不理…
下一页
个人成就
文章被点赞
39
文章被阅读
41,224
掘力值
1,226
关注了
0
关注者
14
收藏集
0
关注标签
7
加入于
2018-07-16