首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
爱Rap篮球写代码的蔡徐
掘友等级
复制粘贴工程师
每天进步一点点
获得徽章 7
动态
文章
专栏
沸点
收藏集
关注
作品
赞
166
文章 166
沸点 0
赞
166
返回
|
搜索文章
最新
热门
细品数据倾斜(建议收藏)
数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将会海阔天空!迈不过去,就要做好准备:很可能有几周甚至几月都要头疼于数据倾斜导致的各类诡异的问题。 话题比较大,技术要求也比较高,笔者尽最大的能…
漫谈数仓整理编
01. 架构演进 离线数据仓库到实时数据仓库,从lambda架构到kappa架构、再到混合架构。本文不再多再介绍,之前文章已有深入介绍,如有兴趣可看这篇文章:数据仓库介绍与阿里实时数仓案例 (点击链接)。 02. 逻辑分层 数仓分层,一般按ods->dw->dm整体架构。不同的…
数据仓库建模
数据仓库建模包含了几种数据建模技术,除了之前在数据库系列中介绍过的ER建模和关系建模,还包括专门针对数据仓库的维度建模技术。 本文将详细介绍数据仓库维度建模技术,并重点讨论三种基于ER建模/关系建模/维度建模的数据仓库总体建模体系:规范化数据仓库,维度建模数据仓库,以及独立数据…
Elasticsearch之中文分词器插件es-ik的自定义热更新词库
原文出处:http://www.cnblogs.com/zlslch/p/6441315.html前提Elasticsearch之中文分词器插件es-ik的自定义词库先声明,热更新词库,需要用到,we
Elasticsearch 索引设计实战指南
随着 Elastic 的上市,ELK Stack 不仅在 BAT 的大公司得到长足的发展,而且在各个中小公司都得到非常广泛的应用,甚至连“婚庆网站”都开始使用 Elasticsearch 了。随之而来的是 Elasticsearch 相关部署、框架、性能优化的文章早已铺天盖地。…
一次SQL查询优化原理分析(900W+数据,从17s到300ms)
id为自增主键,val为非唯一索引。 时间相差很明显。 查询到索引叶子节点数据。 根据叶子节点上的主键值去聚簇索引上查询需要的全部字段值。 像上面这样,需要查询300005次索引节点,查询300005次聚簇索引的数据,最后再将结果过滤掉前300000条,取出最后5条。MySQL…
HBase1.x实战:BulkLoad批量导入数据代码实例
1.概述: HBase包含几种将数据加载到表中的方法。最直接的方法是使用MapReduce作业中的TableOutputFormat类,或者使用客户端api;然而,这些并不总是最有效的方法。
最全hbase shell命令
最全hbaseshell命令HBaseshell常用命令查询服务器状态查看HBase版本信息可以通过help'命名名称'来查看命令行的具体使用,包括命令的作用和用法显示当前登录用户信息:列出所有表li
合集 | Java进阶架构师 共500篇优质技术文章整理
【面经】面试面试鹅厂,我三面被虐的体无完肤。。。 【面经】:为了拿到字节跳动offer,鬼知道我经历了啥... 【面经】PDD面试官竟然问我new一个对象背后发生了什么?这太难了... 面试官问我:一个 TCP 连接可以发多少个 HTTP 请求?我竟然回答不上来...
4个MySQL优化工具AWR,帮你准确定位数据库瓶颈!
今天和大家分享几个mysql 优化的工具,你可以使用它们对你的mysql进行一个体检,生成awr报告,让你从整体上把握你的数据库的性能情况。 是mysql一个常用的数据库性能诊断工具,主要检查参数设置的合理性包括日志文件、存储引擎、安全建议及性能分析。针对潜在的问题,给出改进的…
下一页
个人成就
优秀创作者
文章被点赞
2,552
文章被阅读
398,200
掘力值
12,768
关注了
34
关注者
3,950
收藏集
19
关注标签
36
加入于
2016-11-02