首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
炮灰乙
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12
文章 11
沸点 1
赞
12
返回
|
搜索文章
赞
文章( 11 )
沸点( 1 )
大厂必问 · 如何防止订单重复?
在电商系统或任何涉及订单操作的场景中,用户多次点击“提交订单”按钮可能会导致重复订单提交,造成数据冗余和业务逻辑错误,导致库存问题、用户体验下降或财务上的错误。因此,防止订单重复提交是一个常见需求。
Apache Paimon 在蚂蚁的应用
本文整理自 Apache Paimon Committer 闵文俊老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享。
数据仓库之拉链表
拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。 下面就是一张拉链表,存储的是用户的最基本信息以及每条记录的生命周期。我们可以使用这张表拿到最新的当天的最新数据以及之前的历史数据。 有一些…
和妹子逛完街,写了个 AI 智能穿搭系统
背景 故事起源在和一个妹子去逛衣服店的时候,试来试去的难以取舍,最终消耗了我一个小时。虽然这个时间不多, 但这个时间黑神话悟空足矣让我打完虎先锋 回家我就灵光一闪,是不是可以搞一个AI智能穿搭...
货拉拉大数据数仓发布准入准出流水线
与传统项目发布不同,货拉拉的大数据离线数仓任务发布主要在大数据离线开发平台项目上进行。然而,目前离线数仓任务发布存在以下问题: 数仓发布流程: 发布流程缺乏严格的控制,导致数仓发布较为...
Spark项目实战:飞机延误预测项目
0x00 教程内容0x01 数据准备1. 下载数据2. 上传数据到HDFS3. 0x02 工程实现1. 依赖准备2. 上传一份数据到本地3. 数据处理代码实现4. 0x03 项目讲解1. 项目整体介绍2. 使用Hadoop和Spark进行预处理3. 1. a. wget http...
小红书离线数仓提效新思路,提升百倍回刷性能
小红书数据仓库团队将 StarRocks 融入到离线处理流程,替换掉部分 Spark 处理的任务,并优化较为耗时的 Cube 计算,回刷时间减少 90%,回刷成本减少 99% 以上。
新东方基于Hologres实时离线一体化数仓建设实践
新东方基于Hologres建设了实时离线一体化数仓,落地报表、画像、圈选等多个场景,为业务提供秒级查询服务的同时,也极大的提升了开发效率,有效的降低了运维成本。
SparkSQL 在企业级数仓建设的优势
Spark 引擎因为自身强大的生态和方便的编程接口被广泛应用在数据处理场景下,Spark 提供的 Spark SQL 模块更是为使用 Spark 支撑企业数据仓库提供了一个良好的基础设施。
前端与HTML | 青训营笔记
这是我参加青训营第一天的课堂笔记,里面简单地描述了今天的课堂内容和我自己在课后写的一些练习以及我个人的一些思考
下一页
个人成就
文章被阅读
23
掘力值
10
关注了
18
关注者
0
收藏集
1
关注标签
1
加入于
2024-11-19