首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
heibaiying
掘友等级
所有文章都分类整理至 GitHub:https://gi
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
MyCat 读写分离与分库分表
支持 MySQL、Oracle、DB2、SQL Server、PostgreSQL 等数据库常见的 SQL 语法。 能够基于心跳机制进行自动地故障切换,支持读写分离,支持M...
4
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
MySQL 高可用架构之 PXC 集群
Percona XtraDB Cluster (简称 PXC) 是 Percona 公司开源的实现 MySQL 高可用的解决方案。它将 Percona Server 和 P...
2
1
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
MySQL 二进制日志复制、GTID 复制与半同步复制
MySQL 二进制日志是进行主从复制的基础,它记录了所有对 MySQL 数据库的修改事件,包括增删改查和表结构修改。当前 MySQL 一共支持三种二进制日志格式,可以通过 ...
5
2
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
MySQL常用备份策略详解 —— mysqldump、mysqlpump 和 Xtrabackup
物理备份:备份的是完整的数据库目录和数据文件。采用该模式会进行大量的 IO 操作,但不含任何逻辑转换,因此备份和恢复速度通常都比较快。 逻辑备份:通过数据库结构和内容信息来...
14
1
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
MySQL 核心三剑客 —— 索引、锁、事务
InnoDB 组织数据时默认按照主键进行聚簇,从而可以提高主键查找的效率。对于频繁访问的数据,InnoDB 还会为其建立哈希索引,从而提高等值查询的效率,这也称为自适应哈希...
18
3
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
GitHub 新仓库 —— 全栈工程师手册
这篇文章主要是分享一下自己在GitHub上的新仓库——Full-Stack-Notes,之所以创建这个项目主要是希望从2020年开始,能够在这个新仓库中将自己的所见、所学和...
2
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(八)—— Flink Standalone 集群部署
Flink 支持使用多种部署模式来满足不同规模应用的需求,常见的有单机模式,Standalone Cluster 模式,同时 Flink 也支持部署在其他第三方平台上,如 ...
6
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(六)—— Flink 窗口模型
在大多数场景下,我们需要统计的数据流都是无界的,因此我们无法等待整个数据流终止后才进行统计。通常情况下,我们只需要对某个时间范围或者数量范围内的数据进行统计分析:如每隔五分...
2
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(五)—— Flink Data Sink
在使用 Flink 进行数据处理时,数据经 Data Source 流入,然后通过系列 Transformations 的转化,最终可以通过 Sink 将计算结果进行输出,...
3
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(四)—— Flink Data Transformation
Flink 的 Transformations 操作主要用于将一个和多个 DataStream 按需转换成新的 DataStream。它主要分为以下三类: Physical...
0
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(三)—— Flink Data Source
1. readTextFile(path):按照 TextInputFormat 格式读取文本文件,并将其内容以字符串的形式返回。示例如下: 2. readFile(fil...
3
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(二)—— Flink 开发环境搭建
Flink 分别提供了基于 Java 语言和 Scala 语言的 API ,如果想要使用 Scala 语言来开发 Flink 程序,可以通过在 IDEA 中安装 Scala...
1
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
5年前
关注
Flink 系列(一)—— Flink 核心概念综述
Apache Flink 诞生于柏林工业大学的一个研究性项目,原名 StratoSphere 。2014 年,由 StratoSphere 项目孵化出 Flink,并于同年...
8
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十六)—— Spark Streaming 整合 Kafka
本文使用的 Kafka 版本为 kafka_2.12-2.2.0,故采用第二种方式进行整合。 在示例代码中 kafkaParams 封装了 Kafka 消费者的属性,这些属...
2
5
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
大数据常用软件安装指南
由于 Apache Hadoop 原有安装包之间兼容性比较差,所以如无特殊需求,本仓库一律选择 CDH (Cloudera's Distribution, includin...
0
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十五)—— Spark Streaming 整合 Flume
Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming 提供了...
0
2
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十四)—— Spark Streaming 基本操作
这里先引入一个基本的案例来演示流的创建:获取指定端口上的数据并进行词频统计。项目依赖和代码实现如下: 此时控制台输出如下,可以看到已经接收到数据并按行进行了词频统计。 Sp...
1
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十三)—— Spark Streaming 与流处理
在流处理之前,数据通常存储在数据库,文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。Hadoop 采用 HDFS 进行数据...
0
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十二)—— Spark SQL JOIN 操作
本文主要介绍 Spark SQL 的多表连接,需要预先准备测试数据。分别创建员工和部门的 Datafame,并注册为临时视图,代码如下: Cross (or Cartesi...
0
评论
分享
heibaiying
所有文章都分类整理至 GitHub:https://gi
·
6年前
关注
Spark 系列(十一)—— Spark SQL 聚合函数 Aggregations
通常在使用大型数据集时,你可能关注的只是近似值而不是准确值,这时可以使用 approx_count_distinct 函数,并可以使用第二个参数指定最大允许误差。 获取 D...
1
评论
分享
下一页
个人成就
优秀创作者
文章被点赞
489
文章被阅读
356,083
掘力值
6,775
关注了
0
关注者
607
收藏集
0
关注标签
3
加入于
2019-01-20