首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
浪法师
掘友等级
CV法师
我有一把大砍刀(长49米)
获得徽章 23
动态
文章
专栏
沸点
收藏集
关注
作品
赞
4.9K
文章 4.6K
沸点 340
赞
4.9K
返回
|
搜索文章
最新
热门
hive 修改-导入导出操作
hive数仓的基本操作-数据库的创建,修改,删除,创建分区,创建分桶等方式的操作步骤,array,map,struct等类型
hive分区与分桶的区别
- 分区表:是一个或多个目录;使用`partitioned by`指定字段,指定字段为伪列,需要指定字段类型; 分区的个数可以增长; 分区表避免全表查询,根据指定字段提高了查询速度。 - 分桶表:是一
hive操作
hive数仓的基本操作-数据库的创建,修改,删除,创建分区,创建分桶等方式的操作步骤,array,map,struct等类型
hive
`hive`是基于`hadoop`的数据仓库工具,用来进行数据的提取、转化、加载,是一种可以存储、查询和分析存储在`hadoop`中的大规模数据机制。`hive`将结构化的数据文件映射为一张数据库表,
MapReduce
MapReduce是一种编程模型,用于大规模数据集的并行运算。是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(规约)函数,用来保证所有映射的键值对中的每一个
体育馆的人流量
这里计算人流量大于等于100的数据是比较容易的,但是去查找连续id,这个不好搞懂,这里这是假名t1,t2,t3;对数据id的距离进行判断,这里比较不好理解。
部门工资前三高的所有员工
这里内连接将薪水和部门连接起来,但最重要的一点是where后的条件,这里的`DISTINCT e2.Salary`是对薪水的去重,`COUNT`是计算有多少种薪水,`e2.Salary > e1.Sa
换座位
- mod():**MOD函数**用于返回N除以M后的余数,这里用于判断是奇数还是偶数 - case when then else end:可以根据条件列表的值返回多个可能的结果表达式中的一个。
部门工资最高的员工
- Join on : 内连接,用于返沪i满足连接条件的记录,与此相关的是外连接,是对内连接的扩展。默认情况下没有指定任何连接的为内连接。on 作为临时表的筛选条件,主要针对关联表,where作为最终
连续出现的数字
- distinct: distinct只能在select语句中使用,表示对后面的所有参数的拼接取不重复的记录,即查出的参数凭借每行记录都是唯一的。也会与count(distinct)在一起使用,起的
下一页
个人成就
文章被点赞
4,082
文章被阅读
95,393
掘力值
7,639
关注了
209
关注者
135
收藏集
8
关注标签
61
加入于
2018-01-08