首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大数据
32887 关注,9925 文章
关注
热门
最新
最热
上进小菜猪
12小时前
大数据
大数据处理领域的经典框架:MapReduce详解与应用【上进小菜猪大数据】
上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。 MapReduce是一个经典的大数据处理框架,可以帮助我们高效地处理庞大的数据集。本文将介绍MapReduce的基本原理和实现方法,并给出一
86
点赞
评论
白鲸开源
5天前
大数据
用一杯星巴克的钱,训练自己私有化的ChatGPT
和火山引擎 ByteHouse 达成合作,共同致力于加速莉莉丝游戏的实时数仓建设。此次合作将利用 ByteHouse 的创新技术和功能,为广告运营分析业务提效
2323
点赞
评论
SelectDB
2天前
数据库
大数据
数据分析
知乎运营分析平台 — 舰桥平台如何通过 Apache Doris 实现查询速度 10+ 倍提升?
知乎为实现精细化运营,提高运营效率,依赖 Apache Doris 构建了内部统一的运营分析平台——舰桥平台。
686
1
评论
Flink_China
1天前
后端
Flink
大数据
小米基于 Flink 的实时数仓建设实践
本次分享围绕小米在实时数仓方面的探索与实践展开,主要涉及:Flink+Iceberg 实时数仓架构升级,稳定性与实时性优化;基于当前 Flink 实时数仓的不确定性问题
105
点赞
评论
白鲸开源
5天前
大数据
用一杯星巴克的钱,训练自己私有化的ChatGPT
,地图将数据治理的领域、流程、技术、工具等内容进行系统化整理和分类,为从业者提供全面的学
3874
点赞
评论
白鲸开源
8天前
大数据
一文教会你用Apache SeaTunnel Zeta离线把数据从MySQL同步到StarRocks
是最早应用于主机之间数据传输的基本服务之一,是目前使用最广泛的文件传送协议。FTP文件共享服务器在日常办公中可以实现多人之间文件的传递
250
1
评论
剑九黄
6天前
大数据
Flink部署模式介绍
Flink是一个分布式系统,需要有效分配和管理计算资源,以执行流式应用程序。它与Hadoop YARN和Kubernetes等所有常见的集群资源管理器集成。
1042
点赞
评论
SelectDB
9天前
数据库
大数据
数据分析
一文揭秘高效稳定的 Apache Doris 内存管理机制
Apache Doris 作为基于 MPP 架构的 OLAP 数据库,数据从磁盘加载到内存后,会在算子间流式传递并计算,在内存中存储计算的中间结果,这种方式减少了频繁的磁盘 I/O 操作,充分利
1515
点赞
评论
字节跳动技术团队
2月前
大数据
火山引擎 DataLeap:揭秘字节跳动业务背后的分布式数据治理思路
经过十多年的发展, 数据治理在传统行业以及新兴互联网公司都已经产生落地实践。字节跳动也在探索一种分布式的数据治理方式。
2.3w
4
评论