首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
ThomasLau
掘友等级
Java/Linux/ES/Lucene/python...
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
赞
7
文章 6
沸点 1
赞
7
返回
|
搜索文章
最新
热门
海量数据计数的一个方法分析
接一需求,一顿抽丝剥茧去干扰取核心后才弄清楚原始的需求:即时的计算资源累积UV,即对uid去重后进行计数,超阈值则上报。 自然想到了Redis的 Hyperloglog[以下简称HLL] 数据结构计数。 HLL是一种类似bitmap的计数原理,但由于采用了多次高离散的hash函…
Maven Profile的两个技巧和一个注意事项
写了个 xx-service 的基于maven项目,借助spring配置文件可执行,现在有需求是希望将该项目以SDk方式打包到maven仓库以便使用其中某些service类(暂不论合理与否),如何通过maven profile实现在编辑器里不同开发人员默认用不同的 active…
Https模式下Nginx+SpringSecurity+SSO的一个交互问题
有一个基于SpringBoot+Spring Security和CAS SSO的应用A,端口是8080,前端为Nginx,Nginx对外为https,即443端口,nginx内部反向代理到A就是常规的http协议了,应用A配置了正确的SSO login url和service …
卡马克是最快的开根号方法吗
intro1:卡马克算法时最快的开根号方式吗?C/Java语言本身是怎么实现开根号的? intro2: java的内置sqrt和c的内置sqrt哪个更快?Java的编译/JIT优化和GCC的编译优化是否有不足之处? intro3: java的C2优化效果一定比C1效果好吗(对性…
如何在kafka-streams实现两次group操作
如何通过kafka-streams实现去重后再groupBy统计频率? 使用Kafka-Streams做流计算的大家想必知道,它本身提供了 groupBy 操作可以方便我们做一些聚合计算,比如统计每分钟内每个人发出的消息数量,这个时候就可以 groupBy 用户的uid去,统计…
Elasticsearch[曾]在布尔类型字段设计上犯的错
intro: 对于布尔类型字段的处理,Elasticsearch 曾犯了一个错,直到数年后 发布6.0版本才修正过来,这个设计或多或少会遇到,只是没留意,但是查询的时候结果还是让人困惑的。 前几天刚到公司,同事抛出一个问题,就是发现前一天某个搜索查询条件没有结果,但是第二天却出…
日志传输工具Logstash使用中遇到的几个问题(1)
intro:去年记录的logstash几个问题,因为涉及较多且杂乱,主题并不是那么清晰,今天整理时候发现写起来太长了,所以打算分成2-4篇文章,几个小块逐个讨论。 系统概况: 1)各服务产生事件(日志)另有一套Event机制支持,本文讨论的是如何跨数据中心(机房)传输。 2)普…
Elasticsearch删除特殊字符索引
长话短说,查看生产环境Elasticsearch (5.6版本) 时,发现一些如下有着非ascii码的索引 上面是某系统因为历史缘故,使用用户的数据创建索引了,因暂时无法推动其做修改,于是需要考虑用脚本定时删除。 如果你对过程不感兴趣,可以考虑跳到 总结2 直接看方法。 题外话…
python 2.6.6 SimpleHTTPServer耗时的bug
之前因为时间紧迫的缘故,在公司的CentOS 7 机器上部署一个快速实现的数据收集工具,考虑到避免其他语言发布和变更起来麻烦,于是就用 python+bash 实现。 服务端就是最简单不引入任何python包的SimpleHTTPServer+Handler实现的。 偶然一次看…
为什么 LR 模型要使用 sigmoid 函数
在看西瓜书的逻辑回归这一章时,对作者引入了sigmoid函数觉得突兀,于是搜索到了知乎上的提问,为什么 LR 模型要使用 sigmoid 函数 里获赞最高的答案。 但正如马化腾先生说的,这么说,也对也不对。 看完后,上面其他回答各种理由,而匿名回答是最大熵的,并不是原因,甚至,…
下一页
个人成就
文章被点赞
8
文章被阅读
9,139
掘力值
115
关注了
526
关注者
12
收藏集
1
关注标签
85
加入于
2017-07-26