首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
想做个好程序员
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
8
文章 8
沸点 0
赞
8
返回
|
搜索文章
赞
文章( 8 )
沸点( 0 )
大数据物流项目面试题 整理终版
持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第21天,点击查看活动详情 物流项目问题 1、物流项目的背景介绍 项目背景:本项目基于一家大型物流公司研发的智慧物流大数据平台。该物
实时即未来,大数据项目车联网之原始数据实时ETL落地HBase(8)
1. 原始数据实时ETL落地HBase 存储hive数据用作离线分析经过ETL后的原始数据;存储hbase数据用作实时指标分析经过ETL后的原始数据 一份数据作为备份:即可把存储hive数据看做是hb
一文带你认清数据仓库「维度模型设计」与「分层架构」
1. 纬度建模基本概念 维度模型是数据仓库领域大师Ralph Kimall所倡导,它的《数据仓库工具箱》,是数据仓库工程领域最流行的数仓建模经典。维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复…
一套高级大数据开发面试题(刷起来!!!)
一千个读者眼中有一千个哈姆雷特,一千名 大数据 程序员心目中就有一千套 大数据面试题。本文就是笔者认为可以用来面试大数据 程序员的面试题。 这套题的题目跟公司和业务都没有关系,而且也并不代表笔者本人可以把这些题回答得非常好,笔者只是将一部分觉得比较好的题从收集的面试题里面抽出来…
一文带你过完Spark RDD的基础概念
上一篇权当吹水了,从这篇开始进入正题。 RDD(Resilient Distributed Dataset)叫做 弹性分布式数据集 ,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合. 一个分区(Partition)列表,组成了该RDD的数据…
Linux运维面试总结
1.ssh远程连接的问题? 第一种是远程连接慢的问题: (1)可以通过ssh -v 来检测哪个步骤出现的问题。根据对应的问题,来针对性的进行解决。 (2)可能是DNS反向解析不正确导致的.正常情况下默
用Python生成马赛克画
大家知道马赛克画是什么吗?不是动作片里的马赛克哦~~ 马赛克画是一张由小图拼成的大图,本文的封面就是我们的效果图,放大看细节,每一块都是一张独立的图片,拼在一起组成一张大图,感觉像是用马赛克拼出来的画,所以叫马赛克画。看到网上的一些马赛克画觉得很酷,于是自己用Python实现了…
个人成就
文章被阅读
1,449
掘力值
66
关注了
14
关注者
0
收藏集
2
关注标签
31
加入于
2016-06-29