首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
大大de强强
更多收藏集
微信扫码分享
微信
新浪微博
QQ
20篇文章 · 0订阅
大数据学习-HDFS分布式存储原理
Hadoop是Apache的一个开源的分布式计算平台,核心是以HDFS分布式文件系统和MapReduce分布式计算框架构成
Paimon+StarRocks 湖仓一体数据分析方案
阿里云高级开发工程师曾庆栋(曦乐)在 Streaming Lakehouse Meetup 的分享。
10亿数据、查询<10s,论基于OLAP搭建广告系统的正确姿势
由于流量红利逐渐消退,越来越多的广告企业和从业者开始探索精细化营销的新路径,取代以往的全流量、粗放式的广告轰炸。精细化营销意味着要在数以亿计的人群中优选出那些最具潜力的目标受众,这无疑对提供基础引擎支
漫画:什么是Bitmap算法?
1. 给定长度是10的bitmap,每一个bit位分别对应着从0到9的10个整型数。此时bitmap的所有位都是0。 2. 把整型数4存入bitmap,对应存储的位置就是下标为4的位置,将此bit置为1。 3. 把整型数2存入bitmap,对应存储的位置就是下标为2的位置,将此…
字节跳动基于DataLeap的DataOps实践
本文根据 ArchSummit 全球架构师峰会(深圳站)来自抖音数据研发负责人王洋的现场分享实录整理而成(有删减),本次分享主要包含字节跳动数据研发的模式与挑战、DataOps理念在字节的具象 、Da
解决 gRPC 调试难题:试试 Apifox
目前市面上能够兼容 gRPC 接口的接口调试与管理工具十分有限,而 gRPC 现已广泛应用于微服务架构中,并且可以预见的是,它会变得越来越流行。 作为业界领先的接口管理工具,Apifox 现已上线 g
【大数据】Hive 小文件治理和 HDFS 数据平衡讲解
一、Hive 小文件概述 在Hive中,所谓的小文件是指文件大小远小于HDFS块大小的文件,通常小于128 MB,甚至更少。这些小文件可能是Hive表的一部分,每个小文件都包含一个或几个表的记录,它们
秒级数据写入,毫秒查询响应,天眼查基于 Apache Doris 构建统一实时数仓
导读: 随着天眼查近年来对产品的持续深耕和迭代,用户数量也在不断攀升,业务的突破更加依赖于数据赋能,精细化的用户/客户运营也成为提升体验、促进消费的重要动力。在这样的背景下正式引入 Apache Do
【大数据】Hive 分区和分桶的区别及示例讲解
一、概述 在大数据处理过程中,Hive是一种非常常用的数据仓库工具。Hive分区和分桶是优化Hive性能的两种方式,它们的区别如下: 1)分区概述 Hive分区是把数据按照某个属性分成不同的数据子集。
Hive之数据操作DML
Hive之数据操作DML 写在前面 数据导入 向表中装载数据(Load) 通过查询语句向表中插入数据(Insert) 查询语句中创建表并加载数据(As Select) 创建表时通过Location指定