首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
煎饼
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 3
沸点 0
赞
3
返回
|
搜索文章
最新
热门
kafka总结
kafka包括若干个producr、broker、consumer以及一个zookeeper集群。其中kafka中的消息以topic(主题)进行归类,生产者负责将消息发送到特定的主题,消费者负责订阅主题消费 冗余:消息队列把数据进行持久化直到他们已经被完全处理,通过这一方式规避…
hive调优
1)首先sql输入的是字符串,hive需要通过antlr(解析器生成器)将字符串分解成自己能明白的树结构,生成的代码会返回给你astnode。如例子所示会转化成以tok_select标记为根结点的树,树的叶子结点ProjectionList子树(dept,count(*)),F…
hive难以记住的函数
SUM(), MIN(),MAX(),AVG(),COUNT()这些常见的聚合函数配合窗口函数使用,rows between 3 preceding and current row可以定义窗口的范围,count(distinct xxx)在窗口函数里是不允许使用的,也可以用si…
Python数据分析
本文使用jupyter notebook进行python数据分析代码的练习编写,jupyter notebook是一个开源的web application,可以创建和分享包含代码、视图注释文档,可以用于数据统计、分析、建模、机器学习等领域。首先在https://www.anac…
个人成就
文章被点赞
10
文章被阅读
5,818
掘力值
212
关注了
3
关注者
5
收藏集
0
关注标签
6
加入于
2019-09-15