首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
zzz风控
掘友等级
风控数据挖掘工程师
|
字节跳动
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
2
文章 1
沸点 1
赞
2
返回
|
搜索文章
最新
热门
Scala中infinite无穷值的正确使用姿势
在写算数类的程序时可能会经常遇到无穷值的问题。比如说a/b,如果b=0那么计算出的值就是无穷值。本文会介绍一下infinite无穷值的正确使用姿势。
【内推】直播 - 风里雨里,我们等你!【直播业务风控专家】急招贤士!!
北京/深圳 两地同步开展,深入了解直播或视频内容、游戏等生态问题优先! 五月来了,当生如夏花!(没错就是你,绽放光芒的伯乐吖~🥳)
风控算法-iForest
算法假设 iForest(孤立森林)是一个无监督、高性能的异常挖掘算法,它利用异常点的两个基本特性:1)它们是数据集中的少数 2)它们的某些属性取值很不同于正常数据
风控算法-Synchrotrap
摘要 一句话总结,SynchroTrap是Facebook提出的基于用户之间相似性的聚类算法。它的基本想法是作弊账号在社交网络中的行为比较同步,即通过行为去捕捉作弊者团伙性。
风控算法-TrustRank
算法背景 TrustRank是2004年提出适用于web搜索引擎链接作弊(web spam)场景的算法。虽然算法原理比较简单,但是在具备实锤作弊黑样本的情况下还是比较有用的
风控算法-CopyCatch
CopyCatch是Facebook的一个风控算法,它的核心是基于用户行为和时间的双聚类。值的借鉴的是它提出的lockstep behavior的想法。
Graphx中处理字符串类型的ID
Graphx是Spark中的高性能的分布式图处理框架,但是它的结点ID只能是Long型的,但是在实际的业务中有时会遇到字符串类型的ID,这时需要建立一个结点ID映射的处理机制。
谈谈SQL编码规范
有不少搞数据的同学自嘲为SQL Boy/Girl,而这也恰恰说明了使用SQL进行各种数据处理/分析在日常的工作中比重比较大,那么养成良好的SQL书写习惯也就成了一个比较重要的事情(基本功)。写SQL和
Graphx中的三角计数
在网络中计算节点的重要性有着比较多的应用, 比如找到一些大点进行信息传播或者找到一些异常点进行风险判定等。 有几种常用的方法: betweeness(界数):首先找到网络中的所有最短路径,然后对每个最
Spark+Python ML库进行分布式预测
很多机器学习库往往都只有python的版本,但是由于都是本地单机版的,所以并不适用于线上大规模的例行离线预测。Spark虽然也有mllib,但是支持度并不够,很多有用的算法并没有集成。所以需要考虑如何
下一页
个人成就
文章被点赞
1
文章被阅读
8,271
掘力值
260
关注了
0
关注者
3
收藏集
1
关注标签
5
加入于
2021-03-07