首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
lifetruthlife
更多收藏集
微信扫码分享
微信
新浪微博
QQ
17篇文章 · 0订阅
Kylin, Mondrian, Saiku 系统的整合
本文主要介绍有赞数据团队为了满足在不同维度查看、分析重点指标的需求而搭建的 OLAP 分析工具。这个工具对 Kylin、Mondrian 以及 Saiku 做了一个整合,主要工作包括一些定制化的修改以及环境的配置。 目前这个系统还处于一个需要优化、完善的过程,这篇博文也会相应地更新。
记一次小机器的 Python 大数据分析
机缘巧合,公司突然要搞一波大量数据的分析。属于客流类的分析。 数据量级也还算不错,经过 gzip 压缩,接近 400 个 点位的 SQL 文件 (MySQL innoDB),大小接近 100GB 左右,原始记录数据估测在 180 亿左右。 解压后...... 差不多一个 T 吧…
巧用Superset大数据分析平台搞定各类图表
前言 其实大数据图表展示的这类平台有很多,Superset是其中之一,最近有个需求对各类图表展示的开发较多,索性将工作量交给这个平台。 介绍 Superset的中文翻译是快船,而Superset其实是一个自助式数据分析工具,它的主要目标是简化我们的数据探索分析操作,它的强大之处在…
携程机票大数据架构最佳实践
从技术选型、用户交互、团队能力建设透析携程大数据平台。
链家大数据多维分析引擎实践
前言:大数据背景下,传统关系型多维分析 ROLAP 引擎遇到极大挑战,因而链家转向基于 Hadoop 生态的 MOLAP(Kylin)及 HOLAP (多引擎)。在由七牛云和链家联合主办的架构师实践日北京站中,链家大数据集群架构组负责人邓钫元进行演讲,分享了链家在多维分析引擎方面的一些实践经验
Apache Kylin实践:链家数据分析引擎的演变史
伴随链家业务线的拓宽和发展,以及数据生态的建设,数据规模快速增长。从 2015 年大数据部门成立至今,集群数据存储量为 9PB,服务器规模为 200 台 +。与此同时,数据需求也随着业务的发展落地不断增长,如统计分析、指标 API、运营报表等,不同业务需求差异较大,维度越来越多,
ALLUXIO在携程大数据平台中的应用与实践
本文介绍了携程大数据平台是如何引入Alluxio来解决HDFS停机维护影响实时作业的问题,并在保证实时作业不中断的同时,减少对HDFSNameNode的压力,以及加快部分Spark SQL作业的处理效率。
斗鱼大数据的玩法
猫友会希望建立更多高质量垂直细分社群,本次是 "大数据学习交流付费群" 的第一次分享。 “大数据学习交流付费群” 由猫友会联合,斗鱼数据平台总监吴瑞诚,卷皮 BI 技术总监柴楹,盛天网络大数据平台负责人王欢发起,希望带动武汉的技术分享氛围, 欢迎大家加入!(文末有入群方式)
Spark“并行”写
几行代码提速60%以上