首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
分区器
订阅
用户1600890608864
更多收藏集
微信扫码分享
微信
新浪微博
QQ
2篇文章 · 0订阅
布隆过滤器(Bloom Filter)
一种高效的匹配算法,用于判断某值是否存在。 对需要处理的值进行每个hash函数的计算,得到k个结果,每个结果对应bit数组中的一个bit位,分别将对应的bit位结果置1。 随着插入的值越来越多,被置为1的bit位就越多,这是可能会存在一个值A,进行k个hash函数得到的结果在…
Hive 和 Spark 分区策略剖析
随着技术的不断发展,大数据领域对于海量数据存储和处理的技术框架越来越多。在离线数据处理生态系统最具代表性的分布式处理引擎当属Hive和Spark,它们在分区策略方面有着一些相似之处,但也存在不同之处。