首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
阿菜4500
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
76
文章 76
沸点 0
赞
76
返回
|
搜索文章
赞
文章( 76 )
沸点( 0 )
小白也能看懂的 Hive 调优
Hive 一个常用的大数据组件,影响它的性能的从来都不是因为数据量过大的问题,而是数据倾斜,冗余,Job 和 IO 过多,MapReduce 分配不合理···等
YGC问题排查,又让我涨姿势了!
在高并发下,Java程序的GC问题属于很典型的一类问题,带来的影响往往会被进一步放大。不管是「GC频率过快」还是「GC耗时太长」,由于GC期间都存在StopTheWorld问题,因此很容易导致服务超时
丢弃掉那些BeanUtils工具类吧,MapStruct真香!!!
在前几天的文章《为什么阿里巴巴禁止使用Apache Beanutils进行属性的copy?》中,我曾经对几款属性拷贝的工具类进行了对比。 然后在评论区有些读者反馈说MapStruct才是真的香,于是我就抽时间了解了一下MapStruct。结果我发现,这真的是一个神仙框架,炒鸡香…
深入 Elastic Search: ES 性能优化总结
ssd 好处不用说了,但是可能不是我们能决定的,这个知道就行。 ElasticSearch 是一个非常非常吃内存的搜索引擎,搜索过程中的 sort(排序)、agg(聚合),分词过程中的 fieldadd、倒排索引等等,一直在消耗着内存,一定要有足够的 JVM HEAP 在维持这…
一个实用的开源项目,可以快速将 Elasticsearch 数据导出到 csv
在实际业务中,数据导出应该算是一个强需求了,很多场景都用得到。 如果是 MySQL 的话,则无需多言,支持导出的工具一大堆,根据自己需求选择即可。 虽然没有 MySQL 那么多,但肯定是有的。如果部署了 Kibana,那一定是首选,不止导出功能强大,还有一整套可视化功能,很实用…
面试官:一千万数据,怎么快速查询?
B哥:直接分页查询,使用limit分页。 也许有些人没遇过上千万数据量的表,也不清楚查询上千万数据量的时候会发生什么。 代码创建一千万?那是不可能的,太慢了,可能真的要跑一天。可以采用数据库脚本执行速度快很多。 MySQL 支持 LIMIT 语句来选取指定的条数数据, Orac…
IntelliJ IDEA 2020.2正式发布,诸多亮点总有几款能助你提效
各位小伙伴大家好,我是A哥。IDEA上个较大版本的发布,要追溯到4月份了: 时隔近4个月,北京时间2020-07-28深夜,IntelliJ IDEA再迎更新,这是2020年的第二个里程碑版本。 之前提到过,2020年是Jetbrain公司的20周年(小伙子长成大男孩了),有理…
Elastic Search Java Api
前文我们提到过Elastic Search 操作索引的 Rest Api。实际上 Elastic Search 的 Rest Api 提供了所有的操作接口。在编程语言中可以直接这么使用 Rest Api 可以调用 Elastic Search 的所有功能,但是非常的不方便和直观…
看图轻松理解数据结构与算法系列(NoSQL存储-LSM树)
推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。 LSM树,即日志结构合并树(Log-Structured Merge-Tree)。其实它…
Elasticsearch学习笔记
一. 基本概念 1. 分片 最小级别的工作单元,保存索引中一部分数据。是一个Lucene实例,本身就是一个完整的搜索引擎。但是应用程序不会直接与分片通讯。 2. 文档 文档是不可修改的。update是先删除,再新建一个新的 删除的文档并不会被立即移除,只是标记为删除。之后后台再…
下一页
个人成就
文章被点赞
108
文章被阅读
8,359
掘力值
333
关注了
7
关注者
1,032
收藏集
1
关注标签
7
加入于
2017-08-23