首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
哈哈
订阅
Evaner
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
有道精品课实时数据中台建设实践
本期文章中,有道精品课技术团队将和大家分享有道精品课数据中台的架构演进过程以及 Doris 作为一个 MPP 分析型数据库是如何为不断增长的业务体量提供有效支撑并进行数据赋能的。 本文以我们在实时数仓选型的经验为切入点,进一步着重分享使用 Doris 过程中遇到的问题,以及我们…
推荐系统--完整的架构设计和算法(协同过滤、隐语义)
1. 什么是推荐系统 推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。 随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花…
第四期 | 前端的规划如何落地
规划是面试下半场一个哲理性(逃不掉的)问题,它是开放性的,没有标准的答案(一千个读者就有一千个哈姆雷特),其实只要将自己的想法有条理地阐述出来就好,当然它得是适合自己并具有可行性的。抛开前端行业,我们的生活与人生又何尝不是要做一些规划呢。 若本文对你有所助益,手留一赞,若有不同…
我工作中不可或缺的宝贝们!
大家好,我是鱼皮,今天分享下我在日常工作中最最最常用的宝贝软件和工具。 开发 JetBrains 全家桶 JetBrains 系列是我最喜欢也是最常用的开发工具了,工作中,会用 IDEA 写 Java
滴滴数据仓库指标体系建设实践
桔妹导读:指标体系是什么?如何使用OSM模型和AARRR模型搭建指标体系?如何统一流程、规范化、工具化管理指标体系?本文会对建设的方法论结合滴滴数据指标体系建设实践进行解答分析。 #1. 什么是指标体系 指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局…
马蜂窝数据仓库的架构、模型与应用实践
最近几年,数据中台概念的热度一直不减。2018 年起,马蜂窝也开始了自己的数据中台探索之路。 数据中台到底是什么?要不要建?和数据仓库有什么本质的区别?相信很多企业都在关注这些问题。 我认为数据中台的概念非常接近传统数据仓库+大数据平台的结合体。它是在企业的数据建设经历了数据中…
【漫谈数据仓库】 如何优雅地设计数据分层
本文主要讲解数据仓库的一个重要环节:如何设计数据分层!其它关于数据仓库的内容可参考之前的文章。本文对数据分层的讨论适合下面一些场景,超过该范围场景 or 数据仓库经验丰富的大神就不必浪费时间看了。
数据仓库之拉链表
拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。 下面就是一张拉链表,存储的是用户的最基本信息以及每条记录的生命周期。我们可以使用这张表拿到最新的当天的最新数据以及之前的历史数据。 有一些…
数据仓库学习笔记(二)
这一系列主要是美团18年一年的大数据相关的文章分享,倒序。 从中可以看到美团的实时数据系统架构从Storm到Flink的转变和选择。 数据指标越来越多,“烟囱式”的开发导致代码耦合问题严重。 需求越来越多,有的需要明细数据,有的需要 OLAP 分析。单一的开发模式难以应付多种需…
数据仓库建模方法论
访问性能:能够快速查询所需的数据,减少数据I/O。 数据成本:减少不必要的数据冗余,实现计算结果数据复用,降低大数据系统中的存储成本和计算成本。 使用效率:改善用户应用体验,提高使用数据的效率。 数据质量:改善数据统计口径的不一致性,减少数据计算错误的可能性,提供高质量的、一致…