首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
武子康
掘友等级
后端工程师
永远好奇 无限进步
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
292
文章 215
沸点 77
赞
292
返回
|
搜索文章
赞
文章( 215 )
沸点( 77 )
大数据-192 DataX 3.0 架构与实战:Reader/Writer 插件模型、Job/TaskGroup 调度、speed/errorLimit 配置速
DataX(DataX 3.0)是阿里体系广泛使用并开源的离线数据同步/数据集成工具,面向企业级异构数据源同步(MySQL、Oracle、SQLServer、PostgreSQL、HDFS、Hive、
大数据-191 Elasticsearch 集群规划与调优:节点角色、分片副本、写入与搜索优化清单
Master / Data / Coordinating 三类节点职责与生产落地的角色隔离策略,给出容量规划的推算抓手(JVM Heap 30–32GB 上限、冷热数据与磁盘/IO 约束、水平扩容路径
大数据-190 Filebeat→Kafka→Logstash→Elasticsearch 实战
Filebeat 采集 Nginx access.log 写入 Kafka,Logstash 从 Kafka 消费后按字段(app/type)条件解析 message 内嵌 JSON,叠加 GeoIP
大数据-187 Logstash Filter 插件实战:grok 解析控制台与 Nginx 日志(7.3.0 配置可复用)
在 Logstash 7.3.0 环境下,用 grok 从控制台 stdin 与 Nginx 访问日志中提取结构化字段(IP、time_local、method、request、status、body
大数据-188 Logstash Output 插件实战:stdout/file/Elasticsearch 输出配置与调优
Logstash Output 插件(Logstash 7.3.0)给出可复用的工程化落地:stdout(rubydebug)用于联调验数,file 输出用于本地归档与排障留痕
大数据-189 Nginx JSON 日志接入 ELK:ZK+Kafka+Elasticsearch 7.3.0+Kibana 实战搭建
通过 Nginx 配置 log_format json 输出结构化 access_log(包含 @timestamp、request_time、status、request_uri、ua 等字段)
大数据-186 Logstash JDBC vs Syslog Input:原理、场景对比与可复用配置(基于 Logstash 7.3.0)
Logstash Input 插件对比,拆解 JDBC Input 与 Syslog 采集链路的技术差异、适用场景与关键配置。JDBC 通过 JDBC 驱动连接 MySQL 等关系型数据库
大数据-185 Logstash 7 入门实战:stdin/file 采集、sincedb/start_position 机制与排障
先用 stdin{} + stdout{codec=>rubydebug} 验证 pipeline 运行链路,再切到 file{} 监听真实日志文件,解释 sincedb 如何记录读取偏移
大数据-184 Elasticsearch Doc Values 机制详解:列式存储如何支撑排序/聚合/脚本
索引时生成的磁盘列式数据结构,面向排序、聚合与脚本取值优化;多数支持类型默认开启,text 字段默认不提供 doc values,需通过 keyword 子字段或启用 fielddata 才能聚合
大数据-182 Elasticsearch 倒排索引底层拆解:Terms 字典、FST、SkipList 与 Lucene 索引文件
Elasticsearch 倒排索引 的核心数据结构展开:Terms Dictionary(词典)、Posting List(倒排表)、以及 Lucene 的 FST(有限状态转换器) 与 Skip
下一页
个人成就
优秀创作者
文章被点赞
288
文章被阅读
23,805
掘力值
5,657
关注了
2
关注者
84
收藏集
0
关注标签
10
加入于
2019-11-11