首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
真情流露
掘友等级
学生
大数据工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
22
文章 22
沸点 0
赞
22
返回
|
搜索文章
赞
文章( 22 )
沸点( 0 )
大数据概述:传统数据与大数据的区别
1、企业内部管理系统 ,如员工考勤(打卡)记录。 1、数据增长速度比较缓慢,种类单一。 2、数据量为GB级别,数据量较小。 1、数据保存在数据库中。处理时以处理器为中心,应用程序到数据库中检索数据再进行计算(移动数据到程序端) 1、数据量越来越大、数据处理的速度越来越慢。 2、…
大数据基础知识_什么是集群?
==集群是一组相互独立的、通过高速计算机网络互联的计算机==,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。 计算机集群简称集群是一种计算机系统, 它通过一组松散集成的计算机软件/硬件连接起来高度紧密地协作完成计算工作。在某种…
大数据基础知识:什么是服务器?
服务器: 也称伺服器,是一种高性能计算机,提供计算服务的设备。 服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似。 由于服务器需要提供高可靠的服务,所以在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。 服务器和电脑功能都是一样的,也可…
大数据项目流程介绍
做一道“西红柿炒鸡蛋”需要哪些步骤?项目流程
linux集群 ntp时间同步
联网状态下与互联网上提供的时钟服务器进行同步同步命令:ntpdatentp4.aliyun.com配置离线状态下的时钟同步1、设置时钟同步服务器的时间(node042012-12-1212:12:12
MapReduce综合练习案例(把这练习会了MapReduce代码你就全搞定了)
提供两个文件:information.txt:student.txt:题目要求不分区前的结果(结果在本地):分区后的结果(分区要在集群上运行)代码POM.xml==如果需要maven库就私信我==不分
Hive自定义函数:UDF
1)Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。 2)当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:user-defined function)。
Hive参数配置方式
开发Hive应用时,不可避免地需要设定Hive的参数。设定Hive的参数可以调优HQL代码的执行效率,或帮助定位问题。然而实践中经常遇到的一个问题是,为什么设定的参数没有起作用?这通常是错误的设定方式导致的。 用户自定义配置会覆盖默认配置。 另外,Hive也会读入Hadoop的…
Hive分组 条件 分区排序 CLUSTER BY, Sort By,DISTRIBUTE BY
GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。 (1)where针对表中的列发挥作用,查询数据;having针对查询结果中的列发挥作用,筛选数据。 (2)where后面不能写分组函数,而having后面可以使用分组函数…
下一页
个人成就
文章被点赞
24
文章被阅读
12,077
掘力值
176
关注了
19
关注者
2
收藏集
0
关注标签
9
加入于
2019-11-29