首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Natasha_
掘友等级
大数据开发
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
47
文章 47
沸点 0
赞
47
返回
|
搜索文章
最新
热门
使用Datax将数据从Mysql导到Elasticsearch7.x的填坑过程和使用记录
前提:业务需要将Tidb(Mysql内核)中8亿多条数据从Mysql导到Elasticsearch7中。 一开始我首先想到,“那就使用久负盛名的ELK来做数据迁移呀!”。Logstash的作用就是一个数据收集器,可以将各种格式的数据通过过滤后,格式化地输入到Elasticsea…
编译Flink1.11保姆级教程及解决遇到的坑
一. flink-runtime-web 其中,一直编译失败的是flink-runtime-web模块,故先cd flink-runtime-web进行单独编译。 坑2:编译卡在 Running 'npm ci –cache-max=0 –no-save'flink 。因为编译…
(一)Spark RDD的基础概念
1. MapReduce和Spark的对比 MapReduce是一种计算模型,将大型数据分解成很多单个任务在集群中并行执行,然后将计算结果合并起来得到最终的结果。具体关于MapReduce的介绍可以看之前写过的文章(三)通俗易懂地理解MapReduce的工作原理。 需要写很多底…
(四)Hive 数据查询详解
1. 数据准备 2. 单表查询 Hive 支持使用 GROUP BY 进行分组聚合操作。 如果是字符串,则按照字典序排序。 使用 sort by 时只会在每个 Reducer 中进行排序,这可以保证每个 Reducer 的输出数据是有序的,但不能保证全局有序。 由于 order…
(三)Hive的视图,分区表,分桶表,索引
1. 视图 Hive 中的视图和 RDBMS 中视图的概念一致,都是一组数据的逻辑表示,本质上就是一条 SELECT 语句的结果集。 视图是纯粹的逻辑对象,没有关联的存储,当查询引用视图时,Hive 可以将视图的定义与查询结合起来。 在 Hive 中可以使用 CREATE VI…
(二)Hive的数据类型,常用 DDL操作,常用DML 操作
1. 数据类型 Hive的ARRAY和MAP与java中的Array和Map类似,而STRUCT与C语言中的Struct类似,它封装了一个命名字段集合,复杂数据类型允许任意层次的嵌套。 Hive的原子数据类型是可以进行隐式转换的,例如某表达式使用INT类型,TINYINT会自动…
(一)Hive的基本概念
1. 简介 Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 查询功能,用于查询的 SQL 语句会被转化为 MapReduce 作业,然后提交到 Hadoop 上运行。 2. Hive的特点 操作接口采用类SQL语法,避免…
(三)Elasticsearch的基本操作
1. 索引的操作 2. 文档的操作
(二)Elasticsearch的基本数据结构,检索类型和聚合类型
1. Elasticsearch的基本数据结构 string:在ElasticSearch 旧版本中使用较多,从ElasticSearch 5.x开始不再支持string,改为由text和keyword类型替代。 text:当一个字段被全文搜索时,如Email内容、产品描述,应…
(一)Elasticsearch的简介和基本概念
1. Elasticsearch简介 你运行一个在线网上商店,让你的客户能够搜索你销售的产品。在这种情况下,你可以使用Elasticsearch存储整个产品目录和库存,并为其提供搜索和自动填充建议。 你要收集日志或事务数据,并且你想分析和挖掘此数据以查找趋势,统计信息,摘要或异…
下一页
个人成就
文章被点赞
82
文章被阅读
40,459
掘力值
1,016
关注了
6
关注者
34
收藏集
1
关注标签
22
加入于
2020-11-02