首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
霍云
掘友等级
数据开发
|
字节跳动
无他,唯手熟尔
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
25
文章 23
沸点 2
赞
25
返回
|
搜索文章
最新
热门
git随手记
git最好的学习地点是官方出的pro-git,还是中文的。 svn是集中式的,有一个中央服务器,这上面记录了各个版本。客户端只有最新的版本。如果想回到过去的某个版本,那么需要和中央服务器进行通信。这时候中央服务器会有单点故障,是个问题。 git是分布式的,每个机器上都有一份完整…
es使用经验
断路器。 生产上配置的比较简单,数据没有分冷热,例如60天过后直接删除索引。在kibana上可以通过界面配置 极客时间ES中的视频对应章节75-76 es默认network.host绑定是的本地回环localhost,这时候他默认你是用来测试的。不会启动bootstrap ch…
kibana使用经验
我们的kibana需要被nginx代理一下。涉及到如下配置项 个别页面上出现的乱码,例如"娣诲姞", 这种词在 zh-CN.json中可以找到,把他改对即可。
Notify和NotifyALL
面试的时候,面试官让我写一个阻塞队列。其实他的意思就是让我写一个生产者消费者。且不谈Lock等JUC的东西。他实际考察的是sync、notify、notifyall这些东西。 我用了两把锁,一个生产者锁,一个消费者锁。我当时在牛客上写了算是伪代码。 他跟我说notify会造成死…
Java 指令重排序
cpu会对代码进行优化,导致真正执行起来的顺序和我们想的可能不一样。经典的一道面试题就是单例模式为什么要用DBL,并且要不要加volatile volatile保证了线程之间的可见性,也能防止指令重排。创建对象的具体过程可以通过javap -c看看字节码 面试场合也会谈起这个东…
Java-cacheline
我们都知道cpu的速度和内存不匹配,为了解决这个问题有了缓存。在不同厂商cpu中缓存的大小也不一样。以intel为例,缓存行为64k,也就是8个long 两个变量在同一个缓存行中,但是这是两个不相关的变量。有两个线程分别对齐进行读写,这样就导致缓存频繁的失效,导致效率低下。 先…
kafka-offset
实时计算中,source端和sink端很有可能都是kafka,涉及到如何在整个过程中能够不丢数据也就是at-least-once,在这个基础上如何再做到exactly-once。在工作中,比如告警数据,这种是不能丢的,丢了的话高等级告警报不出来,你得背多大一口锅?😹 先从ka…
再谈Shuffle(Spark&MR)
Map的输出并不是简单的直接写到磁盘,先写到缓冲区,当缓冲区要spill磁盘的时候对缓冲区内容进行排序。 每个MapTask(计算一个split)都有一个环形缓冲区(默认100MB,这是一个调优点,不过应该再也不写MR了),当缓冲区达到阈值(80%,这也是个可调优的地方),有一…
Spark Streaming SlidDuration&BatchDuration
此文章旨在记录学习源码的过程,欢迎私信交流。 spark streaming任务的产生是由JobGenerator定时产生的。 当没有使用窗口函数的时候,我们的任务就是3秒产生一个。 代码中的window用法意思是每6秒计算过去9秒的数据。这时候启动程序,看看ui 看到job(…
Spark Streaming微批到底是什么
此文章主要作为学习源码的过程,有想交流的朋友欢迎联系。 在receiver模式中,已经知道了receiver如何在executor上启动的,接下来探究一下receiver接受到数据后怎么进行的后续工作。也就是说接收到的数据,怎么变成微批的。 废话不多说,接着往里看Receive…
下一页
个人成就
文章被点赞
16
文章被阅读
41,424
掘力值
1,249
关注了
21
关注者
10
收藏集
0
关注标签
9
加入于
2019-02-14