数据 - Justinzhang的收藏集 - 掘金

数据

更多收藏集

13篇文章 · 0订阅

基于 MaxCompute + Hologres 的人群圈选和数据服务实践

简介：本文主要介绍如何通过 MaxCompute 进行海量人群的标签加工，通过 Hologres 进行分析建模，从而支持大规模人群复杂圈选场景下的交互式体验，以及基于API的数据服务最佳实践。本文

阿里云云栖号
4年前
1.5k
点赞
评论

基于 MaxCompute + Hologres 的人群圈选和数据服务实践

最强最全面的数仓建设规范指南（一）

「这是我参与11月更文挑战的第16天，活动详情查看：2021最后一次更文挑战」。目录：一、数据模型架构原则数仓分层原则主题域划分原则数据模型设计原则二、数仓公共开发规范层次调用规范数据

五分钟学大数据
4年前
1.7k
1
评论

52条SQL语句性能优化策略，建议收藏

1、对查询进行优化，应尽量避免全表扫描，首先应考虑在 WHERE 及 ORDER BY 涉及的列上建立索引。 2、应尽量避免在 WHERE 子句中对字段进行 NULL 值判断，创建表时 NULL 是默认值，但大多数时候应该使用 NOT NULL，或者使用一个特殊的值，如 0，-…

码猿技术专栏
5年前
9.3k
192
4

带你入坑大数据（三） --- MapReduce介绍

简单回顾一下HDFS的写流程，MapReduce基础知识及机制了解，更详细的可以到我主页之后的MapReduce章节去查看

说出你的愿望吧
6年前
4.3k
27
4

Flink 面试通关手册

概述2019年是大数据实时计算领域最不平凡的一年，2019年1月阿里巴巴Blink（内部的Flink分支版本）开源，大数据领域一夜间从Spark独步天下走向了两强争霸的时代。Flink因为其天然的流式

王知无
6年前
7.2k
35
1

带你入坑大数据（四）--- 资源调度框架Yarn

在MapReduce的时候也许很多人会有这种疑问：写了MR后，map task和reduce task是如何在多节点上并行执行的，而且又是怎么决定哪个任务执行再哪个节点上的？其实这些问题都是和这个Yarn有关。因为Yarn这个框架其实不仅仅是支持MR，还可以运行各种各样的程序。…

说出你的愿望吧
6年前
5.2k
38
2

推荐系统--完整的架构设计和算法(协同过滤、隐语义)

1. 什么是推荐系统推荐系统是利用电子商务网站向客户提供商品信息和建议，帮助用户决定应该购买什么产品，模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为，向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大，商品个数和种类快速增长，顾客需要花…

mantch
6年前
8.1k
27
2

用Flink取代Spark Streaming！知乎实时数仓架构演进

“数据智能” (Data Intelligence) 有一个必须且基础的环节，就是数据仓库的建设，同时，数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲，数据的结果代表了用户的反馈，获取结果的及时性就显得尤为重要，快速的获取数据反馈能够帮助公司…

Flink_China
6年前
730
8
评论

一套高级大数据开发面试题（刷起来！！！）

一千个读者眼中有一千个哈姆雷特，一千名大数据程序员心目中就有一千套大数据面试题。本文就是笔者认为可以用来面试大数据程序员的面试题。这套题的题目跟公司和业务都没有关系，而且也并不代表笔者本人可以把这些题回答得非常好，笔者只是将一部分觉得比较好的题从收集的面试题里面抽出来…

风火数据
7年前
17k
24
1

HBase和Hive的区别和各自适用的场景

先放结论：Hbase和Hive在大数据架构中处在不同位置，Hbase主要解决实时数据查询问题，Hive主要解决数据处理和计算问题，一般是配合使用。 Hbase： Hadoop database 的简称，也就是基于Hadoop数据库，是一种NoSQL数据库，主要适用于海量明细数据…

王知无
6年前
3.6k
2
评论