BigData - ubi2014的收藏集 - 掘金

BigData

更多收藏集

11篇文章 · 0订阅

开源 BI，我最终选择了 Metabase

我们都知道 BI 的意思是商业智能（Business Intelligence），但商业智能是一个笼统的概念。何谓智能？如何智能？其实 BI 既不是某种特定技术，也不是可视化报表平台，而是对于一种通用商业需求的解决方案，即：用一系列技术手段对数据加工和分析，转化为知识进而支持…

磊仔
5年前
18k
23
8

开源 BI，我最终选择了 Metabase

实战数据分析: 利用开源项目 Superset 搭建自助数据分析平台

数据分析（Data Analytics）是很多企业实现数字化战略的重要业务模块。本文将介绍如何使用开源项目 Superset 打造数据分析平台

MarvinZhang
3年前
12k
12
2

superset 开发环境搭建

superset 最新版本前端开发环境搭建教程。官网文档写的模糊不清，百度、chrome 教程早就过时很久，经过多次尝试，终于搭建好开发环境，特此记录。

yzqzy
4年前
7.7k
3
5

目录：我的大数据学习笔记

可以通过长按二维码关注我的公众号，不过会先在掘金更新后同步过去。 PC端的这个右侧的目录找东西确实好找点，我每次写也非常注意看这块排版工不工整🤣，用这里去直接跳到对应的内容真的还算方便，所以就想着做个目录，以后如果写了新的，也会在这篇写上标题。按照不同技术框架的划分形式。已…

说出你的愿望吧
6年前
6.0k
75
20

从Hadoop到Spark、Flink，大数据处理框架十年激荡发展史！

当前这个数据时代，各领域各业务场景时时刻刻都有大量的数据产生，如何理解大数据，对这些数据进行有效的处理成为很多企业和研究机构所面临的问题。本文将从大数据的基础特性开始，进而解释分而治之的处理思想，最后介绍一些流行的大数据技术和组件，读者能够通过本文了解大数据的概念、处理方法和流…

皮皮鲁的科技星球
6年前
3.5k
8
评论

安装spark详细步骤

Spark具有从存储在HDFS或者HadAPI(Hive、HBase等)中的任何文件创造分布式弹性数据集的能力。Spark+Hadoop 的结合能够提供内存级性能的企业级应用的威力。安装前准备名称版本 JDK 1.8.0 Hadoop 2.7.2 scala 2.11.6 h...

蹊源的奇思妙想
5年前
1.1k
6
评论

Kafka 学习笔记（一）：为什么需要 Kafka？

我们在学习一个东西的时候，往往只有真正了解它背后的含义，才能一步一步的掌握它，直到运筹帷幄。对于Kafka来说，我也是一个小白，本篇文章我就以一个小白的角度来初探一下Kafka，本篇文章基于官方文档，顺便说一句官方文档真的很重要，且读且珍惜。 Kafka最早是由LinkedIn…

ScalaCool
8年前
13k
130
9

kafka运维常用操作，你知道几个？

每当Broker停止或崩溃时，该broker的分区的领导权就转移到其他副本。为了避免这种不平衡，kafka提供了一种优先副本的概念preferred replicas. 如果一个分区的副本列表是1、5、9，那么节点1比节点5或节点9更适合作为leader，因为它位于副本列表的…

CloudNativeOps
6年前
1.9k
3
评论

ELK+FileBeat+Kafka搭建日志管理平台

Connection to node -1 could not be established. Broker may not be available.

清风许许
7年前
4.8k
12
评论

Kafka 原理以及分区分配策略剖析

一、简介ApacheKafka是一个分布式的流处理平台（分布式的基于发布/订阅模式的消息队列【MessageQueue】）。流处理平台有以下3个特性：1.1消息队列的两种模式1.1.1点对点模式生产者

vivo互联网技术
5年前
1.5k
15
3