首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
rochy_he
掘友等级
研发工程师
|
EJY
大数据、搜索、爬虫、音乐
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
68
文章 55
沸点 13
赞
68
返回
|
搜索文章
最新
热门
ES7.15.1 索引模板
```js { "index_patterns": [ "*" ], "priority": 1, "template": { "settings": { "index": { "refresh_in
Kafka 精确一次语义
本文主要介绍 Kafka 精确一次语义的相关实现,主要通过思维导图的形式展示了三种不同的应用场景以及数据流图;思维导图介绍的可能不够详细,请参阅参考文章了解更多信息。 扫码关注『AnyCode』,编程路上,一起前行。
ELK 使用小技巧(第 5 期)
pipeline.batch.size:设置单个工作线程在执行过滤器和输出之前收集的最大事件数,较大的批量大小通常更高效,但会增加内存开销。输出插件会将每个批处理作为一个输出单元。;例如,ES 输出会为收到的每个批次发出批量请求;调整 pipeline.batch.size 可…
ES 入门(一):安装部署与基本概念
对于 Windows 系统,安装 Elasticsearch 最为简单,直接从官方网址下载 ES 的安装包(.zip),下载完成后解压到本地磁盘的某个文件夹;待解压完成后,进入安装根路径的 bin 目录,双击 elasticsearch.bat 即可开始使用。 Linux 单节…
《重构—改善既有代码的设计》手法汇总
1. 坏代码的味道; 2. 重构的手法。
Hive 与 ElasticSearch 的数据交互
本文将详细介绍利用 ES 与 Hive 直接的数据交互;通过 Hive 外部表的方式,可以快速将 ES 索引数据映射到 Hive 中,使用易于上手的 Hive SQL 实现对数据的进一步加工。 Hive 在 Hadoop 生态系统中扮演着数据仓库的角色,借助 Hive 可以方便…
ELK 使用小技巧(第 4 期)
pipeline.batch.size:设置单个工作线程在执行过滤器和输出之前收集的最大事件数,较大的批量大小通常更高效,但会增加内存开销。输出插件会将每个批处理作为一个输出单元。;例如,ES 输出会为收到的每个批次发出批量请求;调整 pipeline.batch.size 可…
使用 ES-Hadoop 将 Spark Streaming 流数据写入 ES
本文将详细介绍利用 ES-Hadoop 将 Spark 处理的数据写入到 ES 中。 很显然是缺少 httpclient 相关依赖造成的,对比开源版本与 CDH 版本的 Spark,发现开源版本多出了 commons-httpclient-3.1.jar,因此上述 Maven …
Spark Streaming 之 Kafka 偏移量管理
本文主要介绍 Spark Streaming 应用开发中消费 Kafka 消息的相关内容,文章着重突出了开发环境的配置以及手动管理 Kafka 偏移量的实现。 由于 spark、spark-streaming、zookeeper 等均为大数据集群中必备的组件,因此与之相关的依赖…
基于 HanLP 的 ES 中文分词插件
在 ES 中,分词器的作用是从文本中提取出若干词元(token)来支持索引的存储和搜索,分词器(Analyzer)由一个分解器(Tokenizer)、零个或多个词元过滤器(TokenFilter)组成。 分解器用于将字符串分解成一系列词元,词元过滤器的作用是对分词器提取出来的词…
下一页
个人成就
文章被点赞
373
文章被阅读
131,310
掘力值
2,905
关注了
18
关注者
4,211
收藏集
12
关注标签
29
加入于
2018-07-10