首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
BigData
订阅
ubi2014
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
开源 BI,我最终选择了 Metabase
我们都知道 BI 的意思是商业智能(Business Intelligence),但商业智能是一个笼统的概念。何谓智能?如何智能? 其实 BI 既不是某种特定技术,也不是可视化报表平台,而是对于一种通用商业需求的解决方案,即:用一系列技术手段对数据加工和分析,转化为知识进而支持…
实战数据分析: 利用开源项目 Superset 搭建自助数据分析平台
数据分析(Data Analytics)是很多企业实现数字化战略的重要业务模块。本文将介绍如何使用开源项目 Superset 打造数据分析平台
superset 开发环境搭建
superset 最新版本前端开发环境搭建教程。官网文档写的模糊不清,百度、chrome 教程早就过时很久,经过多次尝试,终于搭建好开发环境,特此记录。
目录:我的大数据学习笔记
可以通过长按二维码关注我的公众号,不过会先在掘金更新后同步过去。 PC端的这个右侧的目录找东西确实好找点,我每次写也非常注意看这块排版工不工整🤣,用这里去直接跳到对应的内容真的还算方便,所以就想着做个目录,以后如果写了新的,也会在这篇写上标题。 按照不同技术框架的划分形式。已…
从Hadoop到Spark、Flink,大数据处理框架十年激荡发展史!
当前这个数据时代,各领域各业务场景时时刻刻都有大量的数据产生,如何理解大数据,对这些数据进行有效的处理成为很多企业和研究机构所面临的问题。本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流…
安装spark详细步骤
Spark具有从存储在HDFS或者HadAPI(Hive、HBase等)中的任何文件创造分布式弹性数据集的能力。Spark+Hadoop 的结合能够提供内存级性能的企业级应用的威力。安装前准备 名称 版本 JDK 1.8.0 Hadoop 2.7.2 scala 2.11.6 h...
Kafka 学习笔记(一) :为什么需要 Kafka?
我们在学习一个东西的时候,往往只有真正了解它背后的含义,才能一步一步的掌握它,直到运筹帷幄。对于Kafka来说,我也是一个小白,本篇文章我就以一个小白的角度来初探一下Kafka,本篇文章基于官方文档,顺便说一句官方文档真的很重要,且读且珍惜。 Kafka最早是由LinkedIn…
kafka运维常用操作,你知道几个?
每当Broker停止或崩溃时,该broker的分区的领导权就转移到其他副本。 为了避免这种不平衡,kafka提供了一种优先副本的概念preferred replicas. 如果一个分区的副本列表是1、5、9,那么节点1比节点5或节点9更适合作为leader,因为它位于副本列表的…
ELK+FileBeat+Kafka搭建日志管理平台
Connection to node -1 could not be established. Broker may not be available.
Kafka 原理以及分区分配策略剖析
一、简介ApacheKafka是一个分布式的流处理平台(分布式的基于发布/订阅模式的消息队列【MessageQueue】)。流处理平台有以下3个特性:1.1消息队列的两种模式1.1.1点对点模式生产者