首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
wgf5544
更多收藏集
微信扫码分享
微信
新浪微博
QQ
9篇文章 · 0订阅
【大数据面试之对线面试官】MapReduce/HDFS/YARN面试题70连击
热身30题1.描述一下HDFS的写流程2.描述一下HDFS的读流程3.详细讲解一下HDFS的体系结构4.如果一个datanode出现宕机,恢复流程是什么样的?5.通常你是如何解决Haddop的Name
BloomFilter 原理,实现及优化
引言 最近在做性能优化相关的事情,其中涉及到了 BloomFilter,于是对 BloomFilter 总结了下,本文组织结构如下: BloomFilter 的使用场景 BloomFilter 的原理 BloomFilter 的实现及优化 本文同步发布在个人博客 http://oserror…
No.14 【大数据算法】BitMap的原理和实现
你的大数据学习路线
本文的目的是希望给所有大数据初学者规划一条比较清晰的学习路线,帮助他们开启大数据学习之旅。鉴于大数据领域内的技术绚丽繁复,每位大数据初学者都应该根据自己的实际情况制定专属的学习路径。
一文学会目前最火热的大数据技术
Elasticsearch是当前主流的分布式大数据存储和搜索引擎,可以为用户提供强大的全文本检索能力,广泛应用于日志检索,全站搜索等领域。Logstash作为Elasicsearch常用的实时数据采集引擎,可以采集来自不同数据源的数据,并对数据进行处理后输出到多种输出源,是El…
【面试被虐】如何只用2GB内存从20亿,40亿,80亿个整数中找到出现次数最多的数?
对于算法题还是有点信心的,,,,于是,发现了如下对话。 小秋:(嗯?怎么感觉和之前的那道判断一个数是否出现在这 40 亿个整数中有点一样?可是,如果还是采用 bitmap 算法的话,好像无法统计一个数出现的次数,只能判断一个数是否存在),我可以采用哈希表来统计,把这个数作为 k…
惊!史上最全的select加锁分析(Mysql)
如果你能清楚的说出,这六句sql在不同的事务隔离级别下,是否加锁,加的是共享锁还是排他锁,是否存在间隙锁,那这篇文章就没有看的意义了。 之所以写这篇文章是因为目前为止网上这方面的文章太片面,都只说了一半,且大多没指明隔离级别,以及where后跟的是否为索引条件列。在此,我就不一…
大数据分页方案
软件开发中,常用要用到分页、计算总数,数据量超过千万、上亿的时候,往往 count 的需要超过 1s 的执行时间,甚至 3-5s,对于一个追求性能的前沿团队来说,这个不能忍啊!
史上最全的 “大数据” 学习资源(下)
当今 “大数据” 一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代。为了帮助大家更好深入了解大数据,云栖社区组织翻译了 GitHub Awesome Big Data 资源,供大家参考。本资源类型主要包括:大数据框架、论文等实用资源集合。