首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据
大数据老司机
创建于2022-04-16
订阅专栏
大数据
等 74 人订阅
共130篇文章
创建于2022-04-16
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Spark开源REST服务——Apache Livy(Spark 客户端)
一、概述 提交Scala、Python或是R代码片段到远端的Spark集群上执行; 提交Java、Scala、Python所编写的Spark作业到远端的Spark集群上执行; 提交批处理应用在集群中运
列式存储的分布式数据库——HBase Shell与SQL实战操作(HBase Master高可用实现)
HBase 是一个面向列式存储的分布式数据库,其设计思想来源于 Google 的 BigTable 论文。HBase 底层存储基于 HDFS 实现,集群的管理基于 ZooKeeper 实现。HBase
列式存储的分布式数据库——HBase(环境部署)
HBase 是一个面向列式存储的分布式数据库,其设计思想来源于 Google 的 BigTable 论文。HBase 底层存储基于 HDFS 实现,集群的管理基于 ZooKeeper 实现。HBase
高性能分布式对象存储——MinIO实战操作(MinIO扩容)
MinIO 是在 GNU Affero 通用公共许可证 v3.0 下发布的高性能对象存储。它与 Amazon S3 云存储服务 API 兼容。使用 MinIO 为机器学习、分析和应用程序数据工作负载构
高性能分布式对象存储——MinIO(环境部署)
MinIO 是在 GNU Affero 通用公共许可证 v3.0 下发布的高性能对象存储。它与 Amazon S3 云存储服务 API 兼容。使用 MinIO 为机器学习、分析和应用程序数据工作负载构
列式数据库管理系统——ClickHouse实战演练
ClickHouse有2类解析器:完整SQL解析器(递归式解析器),以及数据格式解析器(快速流式解析器) 除了 INSERT 查询,其它情况下仅使用完整SQL解析器。 官方文档:https://cli
列式数据库管理系统——ClickHouse(version:22.7.1 环境部署)
ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。ClickHouse不单单是一个数据库, 它是一个数据库管理系统。
大数据Hadoop之——DorisDB核心概念介绍与简单使用(StarRocks)
StarRocks 是一款高性能分析型数据仓库,使用向量化、MPP(Massively Parallel Processing:大规模并行处理) 架构、可实时更新的列式存储引擎等技术实现多维、实时、高
大数据Hadoop之——DorisDB介绍与环境部署(StarRocks)
一、Apache Doris 和 DorisDB、StarRocks之间的关系 Doris 最早是解决百度凤巢统计报表的专用系统,随着百度业务的飞速发展对系统进行了多次迭代,逐渐承担起百度内部业务的统
分布式实时搜索和分析引擎——Elasticsearch
一、概述 二、节点类型&作用 1)master节点(主节点) 配置 【注意】node.master和node.data默认都是true, 但还是建议显式配置 作用 索引的创建或删除 跟踪哪些节点是集群
MySQL原理介绍
一、Mysql中有哪几种锁? 1)表级锁 2)行级锁 3)页面锁 二、MySQL索引类型 1)存储方式区分 1、B-Tree索引 它使用B-Tree数据结构来存储数据,实际上很多存储引擎使用的是B+T
MySQL高可用实战( MHA)
MHA Manager有监控MySQL master、控制master故障转移等管理程序。 MHA 节点具有故障转移辅助脚本,例如解析 MySQL 二进制/中继日志,识别中继日志位置,中继日志应从哪
Redis原理介绍与环境部署(主从模式、哨兵模式、集群模式)
一、概述 REmote DIctionary Server(Redis) 是一个由 Salvatore Sanfilippo 写的 key-value 存储系统,是跨平台的非关系型数据库。 Redis
Redis原理介绍
一、什么是Redis 二、数据类型 1)String(字符串) string 是 redis 最基本的类型,你可以理解成与 Memcached 一模一样的类型,一个 key 对应一个 value。 “
大数据Hadoop之——Kafka Streams原理介绍与简单应用示例
一、Kafka Streams概述 官网文档:https://kafka.apache.org/32/documentation/streams/ 1)Kafka Streams是什么 2)流式计算与
大数据Hadoop之——Zookeeper鉴权认证(Kerberos认证+账号密码认证)
一、Zookeeper概述与安装 Zookeeper概述与安装请参考我之前的文章:分布式开源协调服务——Zookeeper Zookeeper的安装方式有两种,两种方式都会讲,其实大致配置都是一样的,
大数据Hadoop之——Kafka鉴权认证(Kafka kerberos认证+kafka账号密码认证+CDH Kerberos认证)
一、Kerberos概述与安装 Kerberos概述与安装可以参考我之前的文章:Kerberos认证原理与环境部署 二、Kafka Kerberos认证 Kafka安装可以参考我以前的文章: 大数据H
Kerberos认证原理与环境部署
一、概述 官网:https://www.kerberos.org/ 官方文档:http://web.mit.edu/kerberos/krb5-current/doc/ 1)应用场景 2)功能特性 安
企业级日志系统架构——ELK(Elasticsearch、Filebeat、Kafka、Logstash、Kibana)
一、概述 大致流程图如下: 1)Elasticsearch 存储 2)Filebeat 日志数据采集 目前Beats包含六种工具: Packetbeat:网络数据(收集网络流量数据) Metricbe
Kafka原理介绍+安装+基本操作(kafka on k8s)
一、Kafka概述 1)Kafka的特性 高吞吐量、低延迟:kafka每秒可以处理几十万条消息,它的延迟最低只有几毫秒 可扩展性:kafka集群支持热扩展 持久性、可靠性:消息被持久化到本地磁盘,并且
下一页