首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
大数据
订阅
用户192048036086
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
6 个月成为 AI 工程师:一条真正能落地的学习路线图
过去一年,AI 工程几乎成了技术圈最热门的能力标签之一。 但一个很现实的问题是: 大多数初学者,并不知道自己到底该学什么。 有人从机器学习理论开始,结果学了很久,依旧不会做产品; 有人沉迷教程视频,看
湖仓架构中的数据(和 AI)治理与安全
数据平台围绕三个关键支柱展开:人员、流程和技术。在前几章中,我们讨论了实现湖仓的各种技术。本章重点关注湖仓实现中的人员和流程方面。本章将帮助你了解湖仓架构如何在所有数据和ML/AI资产中实施统一的治理
货拉拉离线大数据跨云迁移 - 数据迁移篇
本文介绍了公司在离线大数据跨云迁移战略下,团队基于自研 Kirk 数据迁移服务进行功能升级与优化的过程,详述其高性能、可扩展的功能模块及迁移实施步骤,助力高并发、多样化数据高效迁移。
2025大数据技术扫盲
✅ 主流的大数据技术栈划分(2025 年通用结构) 功能层次(模块职责) 划分结构如下: ✅ 1. 数据采集(Ingestion) 负责数据源到大数据平台的“采集和导入”: 类型 常用组件 实时采集
什么是列式存储,一文秒懂
我们最先接触的数据库系统,大部分都是行存储系统。大学的时候学数据库,老师让我们将数据库想象成一张表格,每条数据记录就是一行数据,每行数据包含若干列。所以我们对大部分数据存储的思维也就是一个复杂一点的表格管理系统。我们在一行一行地写入数据,然后按查询条件查询过滤出我们想要的行记录…
2025大数据常用架构体系
✅ 二、新趋势与推荐组件(按层次) 1. 数据采集层 ✅ Apache Kafka:事实标准,超高吞吐,生态成熟。 🔄 Apache Pulsar:分布式特性好、支持多租户,但生态不如 Kafka 成
转转大数据与AI——数据治理安全打标实践
一、导读 这次主要分享介绍的是转转在大数据治理方面应用AI大模型技术实现的自动安全打标,本文主要从以下几个方面逐一介绍,首先是应用背景介绍、技术方案的实现与落地、以及对整个应用的优化实践,最后对后续的
火山引擎 DataLeap:「数据血缘」踩过哪些坑?来看看字节跳动内部进化史
一篇带你读懂字节跳动数据血缘架构。本文将从数据血缘应用背景、发展概况、架构演讲以及未来展望四部分,为大家介绍数据血缘在字节跳动进化史。
大数据平台基础架构hadoop安全分析
内容来源:2017 年 07 月 29 日,威客安全技术合伙人安琪在“CDAS 2017 中国数据分析师行业峰会”进行《大数据平台基础架构hadoop安全分析》演讲分享。IT 大咖说(微信id:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。 分析hado…
云小课|MRS基础原理之Hudi介绍
Hudi是数据湖的文件组织层,对Parquet格式文件进行管理提供数据湖能力,支持多种计算引擎,提供IUD接口,在 HDFS的数据集上提供了插入更新和增量拉取的流原语。