首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
sunny落花生
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
451
文章 448
沸点 3
赞
451
返回
|
搜索文章
sunny落花生
赞了这篇文章
美图数据技术团队
@美图
·
7年前
关注
Hello Spark! | Spark,从入门到精通
Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架,是专为大规模数据处理而设计的快速通用的大数据处理引擎及...
157
5
分享
sunny落花生
赞了这篇文章
ShowMeAI
资深算法专家
·
3年前
关注
图解大数据 | 海量数据库查询-Hive与HBase详解
HBase是建立在Hadoop文件系统之上的、分布式面向列的数据库。Hive是基于Hadoop的一个数据仓库工具,用于结构化数据的查询、分析和汇总。...
5
评论
分享
sunny落花生
赞了这篇文章
是Vzn呀
架构师
·
3年前
关注
吃透JAVA的Stream流操作,多年实践总结
笔者结合在团队中多年的代码检视遇到的情况,结合项目编码实践经验,对Stream的核心要点与易混淆用法、典型使用场景等进行了详细的梳理总结,希望可以帮助大家对Stream有个...
1.7k
222
分享
sunny落花生
赞了这篇文章
青Cheng序员石头
AI 应用开发工程师 @Love On
·
4年前
关注
Java集合框架 | ArrayList、Vector、LinkedList(一)
ArrayList和Vector 都用一个初始的容量大小,当存储它们里面的元素超出阈值,就需要增加两个集合的分别的存储空间,考虑到扩容的成本, 不是只增加一个存储单元,而是...
46
6
分享
sunny落花生
关注了
美图数据技术团队
sunny落花生
赞了这篇文章
西兰花是真的菜
5年前
关注
Spark的Shuffle是怎么回事
Shuffle的中文含义是混洗,官方定义是:一种让数据重新分布以使得某些数据被放在同一分区里的一种机制。Shuffle的过程中,存在着大量的网络消耗传输数据,会在磁盘上产生...
3
评论
分享
sunny落花生
赞了这篇文章
摸鱼专家
高级摸鱼工程师
·
4年前
关注
Spark 常规性能调优 之 并行度调节、广播大变量、Kryo序列化
常规性能调优四:并行度调节 Spark作业中的并行度指各个stage的task的数量。 如果并行度设置不合理而导致并行度过低,会导致资源的极大浪费...
131
评论
分享
sunny落花生
赞了这篇文章
有赞技术
技术 @杭州有赞科技有限公司
·
6年前
关注
SparkSQL 在有赞的实践
有赞数据平台从2017年上半年开始,逐步使用 SparkSQL 替代 Hive 执行离线任务,目前 SparkSQL 每天的运行作业数量5000个,占离线作业数目的55%,...
13
评论
分享
sunny落花生
赞了这篇文章
摸鱼专家
高级摸鱼工程师
·
4年前
关注
Spark核心编程的三大数据结构 之 RDD基础编程 (二)
RDD依赖关系 4.1 RDD 血缘关系 RDD只支持粗粒度转换 5.RDD持久化 6.RDD分区器 7.RDD文件读取与保存...
141
评论
分享
sunny落花生
赞了这篇文章
摸鱼专家
高级摸鱼工程师
·
4年前
关注
Spark核心编程的三大数据结构 之 RDD基础编程 (一)
在Spark中创建RDD的创建方式可以分为四种: 从集合(内存)中创建RDD 从集合中创建RDD,Spark主要提供了两个方法:parallelize和makeRDD...
137
评论
分享
sunny落花生
赞了这篇文章
七牛云
七牛官方 @七牛云
·
7年前
关注
是时候学习真正的 spark 技术了
spark sql 可以说是 spark 中的精华部分了,我感觉整体复杂度是 spark streaming 的 5 倍以上,现在 spark 官方主推 structed ...
32
2
分享
sunny落花生
赞了这篇文章
大数据小禅
公众号:大数据小禅 | VX:r310623949a
·
3年前
关注
【精通Linux系列】服务器之间的telnet与scp命令用法,进程管理命令之ps -ef与ps aux详解
linux服务器之间telnet与scp命令的用法 telnet命令用法: scp命令:用于服务器之间的文件或者文件目录拷贝 用法2:从别的机器拷贝文件到本地目录 scp ...
6
1
分享
sunny落花生
赞了这篇文章
MacroZheng
公众号:macrozheng
·
5年前
关注
Elasticsearch快速入门,掌握这些刚刚好!
记得刚接触Elasticsearch的时候,没找啥资料,直接看了遍Elasticsearch的中文官方文档,中文文档很久没更新了,一直都是2.3的版本。最近又重新看了遍6....
213
10
分享
sunny落花生
赞了这篇文章
心城以北
Java 架构师 @某软件公司
·
4年前
关注
Kafka 常用操作命令
小知识,大挑战!本文正在参与「程序员必备小知识」创作活动 本文已参与 「掘力星计划」 ,赢取创作大礼包,挑战创作激励金。 Kafka 常用操作命令 操作命令 查询系统的所有...
52
1
分享
sunny落花生
赞了这篇文章
程序员cxuan
公众号:程序员cxuan
·
6年前
关注
真的,Kafka 入门一篇文章就够了
Kafka 是由 Linkedin 公司开发的,它是一个分布式的,支持多分区、多副本,基于 Zookeeper 的分布式消息流平台,它同时也是一款开源的基于发布订阅模式的消...
725
43
分享
sunny落花生
赞了这篇文章
AI贺贺
AI产品开发
·
6年前
关注
入门Hbase,看这一篇就够了
团队内部要分享HBase的知识,之前研究了一段时间,知识比较零散,这一次就系统化的整理一番,之后在想到Hbase的时候,看着一篇就够了。 Hbase是一种NoSQL数据库,...
162
7
分享
sunny落花生
赞了这篇文章
小孩子4919
公众号 『我们都是小青蛙』
·
6年前
关注
MySQL事务隔离级别和MVCC
MySQL是一个服务器/客户端架构的软件,对于同一个服务器来说,可以有若干个客户端与之连接,每个客户端与服务器连接上之后,就可以称之为一个会话(Session)。我们可以同...
325
57
分享
sunny落花生
赞了这篇文章
老錢
资深洞主 @公众号【码洞】
·
7年前
关注
跟着动画来学习TCP三次握手和四次挥手
TCP三次握手和四次挥手的问题在面试中是最为常见的考点之一。很多读者都知道三次和四次,但是如果问深入一点,他们往往都无法作出准确回答。 本篇尝试使用动画来对这个知识点进行讲...
1.7k
69
分享
sunny落花生
赞了这篇文章
落寞的搬运工
7年前
关注
Hadoop Shuffle详解
每个任务最重要的一个过程就Shuffle过程,这个过程会把所有的数据进行洗牌整理,排序,如果数据量大,将会非常的耗时。如图1.1所示,是一个从map端输出数据到合并成一个文...
8
1
分享
sunny落花生
赞了这篇文章
lshua
大数据开发
·
5年前
关注
mapreduce之shuffle
shuffle是mapreduce任务中耗时比较大的一个过程,面试中也经常问。简单来说shuffle就是map之后,reduce之前的所有操作的过程,包含map task端...
6
评论
分享
下一页
关注了
62
关注者
0
收藏集
30
关注标签
18
加入于
2020-02-09