首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
宝哥大数据
掘友等级
CTO
|
闫成数字科技
大数据, 机器学习 Flink, Spark, Hbase, Kafka, ES......
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
Elasticsearch 源码解析与优化实战----笔记
6.3、Elasticsearch 源码解析与优化实战----笔记 第1章 走进Elasticsearch 第2章 准备编译和调试环境 第3章:集群启动流程 第4章:节点启动和关闭
数据仓库思维导图
数据仓库思维导图,CSDN优先更新 一、数据仓库 1.1、什么是数据仓库 1.1.1、四个特性 面向主题 ,集成化的 ,稳定性 ,随着时间变化的 1.2、数据仓库发展 1.3、数据库
Hive优化
一、修改引擎 默认处理引擎是MapReduce 可以修改处理引擎位Spark 修改为Spark引擎后速度提升10多倍 二、参数设置 2.1、启动时提示下面需要设置 reduce数量由以下三个参数决定,
Hbase写数据,存数据,读数据的详细过程
HBase架构 Region-Store-ColumnFmily的关系 逻辑分层:HRegion由一个或者多个Store组成 物理分层: 每个store保存一个columns family 一、写操作
Flink实时数仓--DWD层数据准备
一、需求分析及实现思路 1.1、 分层需求分析 建设实时数仓的目的,主要是增加数据计算的复用性。每次新增加统计需求时,不至于从原始数据进行计算,而是从半成品继续加工而成。我们这里从 kafka 的
Flink实时数仓--日志数据采集
一、日志数据采集 1.1、模拟日志生成器的使用 这里提供了一个模拟生成数据的 jar 包,可以将日志发送给某一个指定的端口,需要大数据程序员了解如何从指定端口接收数据并数据进行处理的流程。 1.2、行
Flink实时数仓--数据采集层
一、电商实时数仓介绍 1.1、普通实时计算与实时数仓比较 普通的实时计算优先考虑时效性,所以从数据源采集经过实时计算直接得到结果。如此做时效性更好,但是弊端是由于计算过程中的中间结果没有沉淀下来,
ES--经纬度查询
参考官网 Elasticsearch Reference [7.10] » Query DSL » Geo queries @[TOC] 一、准备数据 1.1、geo_point ES中特有的类型
ES--highlight(高亮)查询
@[TOC] 一、高亮查询 高亮查询就是你输入的关键字,以一定的特殊字符样式展示给用户,让用户知道为什么这个结果被检索出来 高亮展示的数据,本身就是文档中的一个field,单独将field以highl
ES--ids查询
参考: Elasticsearch Reference [7.10] » Query DSL » Term-level queries » IDs 一、ID 查询 ES每一行数据,即文档都会有一个
下一页
个人成就
文章被点赞
19
文章被阅读
73,740
掘力值
929
关注了
0
关注者
15
收藏集
0
关注标签
3
加入于
2021-06-18