掘友等级
获得徽章 0
#与A-SOUL一起成为更好的自己# day2,extension,广延,是物体占有空间的属性,locke认为所有的实体都占有一定的空间,因此都具有广延性,但berkeley认为实体的定义中本来就是物质去掉了所有的性质,因此不应该具有extension,产生矛盾,故实体的定义是不对的。
#与A-SOUL一起成为更好的自己# 要说明一个距离空间的完备性,需知道基本序列的概念:(X, d)中的点列,对任意epsilon>0,存在N当n,m>=N时有d(xn,xm)<epsilon,则称点列为基本序列。但需要注意,收敛序列必是基本序列,基本序列未必是收敛的,例如基本序列 1/n 在(X, d)中就没有极限。
#JUEJIN FRIENDS 好好生活计划# 学到bert模型,有博客说深度学习进入了大模型时代,感觉好有道理,例如bert,gpt,elmo等等动辄几个G几十个G,bert large的参数就有3.4亿个(虽然340MB感觉也不大😐)。不过训练起来真的慢
#JUEJIN FRIENDS 好好生活计划# 所谓一维搜索以为非常简单,随机撒点或者二分搜索不也是一维搜索吗,开始编程才发现不简单,梯度下降、牛顿法拟牛顿法、共轭梯度法、或nelder mead法等,无一不需要一维搜索来确定最佳步长,才发现区间确定也是难题,goldenstein准则或wolfe准则提供的理论又较难,最后还是调用scipy.optimize.line_search.linear_search_wolfe2(fun, grad, pk, ...)
#JUEJIN FRIENDS 好好生活计划# 普通的哈希不具有可伸缩性,当服务器增多或者减少的时候,散列就乱了。
一致性哈希是一个抽象的环状,范围0到2^32 -1(实际上是一个映射函数,而非真的这么长的数组)当来了一个数据,经过Hashing后映射到0-2^32-1的某个数,然后顺时针寻找第一个服务器,就是对应存储的服务器。增加或减少服务器的时候,原本该服务器上存储的Hashing,按顺时针放到下一台服务器上。如果环上的服务器距离太近,负载不均衡(Nodes are very close.)就需要虚拟节点(Virtual Node)再来一次Hash。具体就是,在环空间中设置多个位置,即“虚拟服务器”,这些位置比较分散,然后将它们映射到一个服务器上。每一个服务器都对应多个这样的节点。那么来一个新的数据经过Hashing后,放到虚拟节点上,实际存储到该虚拟节点对应的服务器上。
#JUEJIN FRIENDS 好好生活计划# 学习打卡day21。今日整数规划分支限界法和多阶段最优决策动态规划。整数规划使用分支限界法求解和搜索图可以等价,最终呈现出来的搜索空间和排序树一样,虽然称为分支限界算法,不过终归还是通过诸如牛顿法这种无约束优化来计算,分支限界是一种搜索策略。多阶段决策优化和动态规划等价,都要基于最优性原理逆向每一阶段最优输入参数,如果输入是整数那么通过分支限界,连续数值的话从最后一阶段开始求导(很像反向传播)计算。
#JUEJIN FRIENDS 好好生活计划# 学习打卡d20。今天试了下图数据挖掘在国内的一个挺厉害的工作,spartan2这个中科院开发的库,以及在此之上实现的大图数据挖掘、流图数据挖掘和时间序列分析模块。fraudar、holoscope、flowscope,BeatGAN......
#JUEJIN FRIENDS 好好生活计划# 学习打卡day19。图数据挖掘的一个问题“异常检测”,例如欺诈检测,还是稠密子图问题,通过Fraudar算法实现,依据是欺诈者在图结构中度数会非常高。Fraudar是一个理论完整的算法,定义了全局度量density,估计了解的下界g/2。
#JUEJIN FRIENDS 好好生活计划# 学习打卡day19。学习了mpi,openmp,cuda,为什么学这么多?期末成绩构成里面,这三个较为重要,但是初学并行感觉好难
#JUEJIN FRIENDS 好好生活计划# 学习打卡day18 大图数据挖掘的一个重要问题,稠密子图挖掘。图数据的特征主要是度数,度分布通常呈现指数分布,度数越高分布频数越低。稠密子图可用于异常数据检测。要挖掘图数据也要表示出图的特征,度数、直径、密度、奇异向量、谱......
下一页