首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
开源技术
阿里云大数据AI技术
创建于2022-05-24
订阅专栏
分享阿里云大数据&AI开源技术
等 10 人订阅
共189篇文章
创建于2022-05-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
万字实战沉淀,阿里云Hologres首发《Serverless OLAP 技术白皮书》
阿里云Hologres团队作为国内Serverless OLAP的先行者,以五年躬身探索为基石,撰写万字实战沉淀,首发《Down to Zero, Serverless OLAP 技术白皮书》。
为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
这是每一个 Elasticsearch 新手在 7.x 版本之后都会遇到的“灵魂发问”。 而在得知“这是 ES 的默认性能优化”后,绝大多数人的第一反应往往是抗拒:“我不想要优化,我要精准的数字!
寻找 AI 全能王——阿里云 Data+AI 工程师全球大奖赛正式开启
2026年1月11日起,阿里云联合NVIDIA正式发起“寻找AI全能王”——Data+AI工程师全球大奖赛,面向全球高校学子与企业开发者,开启一场覆盖“数据处理”与“智能体构建”的全链路AI工程实战。
Hologres Dynamic Table在淘天价格力的业务实践
淘天价格力团队利用Hologres Dynamic Table处理亿级商品价格数据。通过分钟级增量刷新机制,实现数据圈选秒级响应和报表时延从小时级降至分钟级,显著提升大促场景下的运营效率与决策时效性。
EMR AI 助手再升级:支持 Serverless StarRocks
继 EMR AI助手在 EMR on ECS 场景中开启公测后,阿里云 EMR 继续定义大数据集群管理体验。2026年01月09日起,EMR AI助手新增支持 Serverless StarRocks
Agentic Search: AI驱动的下一代企业搜索
Agentic Search 是一种以自主智能体(Agent)为核心驱动,以信息检索与整合为坚实基础的革命性架构。
一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践
本文整理自高德数据开发工程师、赵宇在 Streaming Lakehouse Meetup上的分享。聚焦高德地图轨迹服务在实时湖仓方向的落地实践。
AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中
Hologres 构建了新一代 AI 原生数据引擎——HSAP 2.0 ,即分析和搜索的混合处理架构。
面向 Interleaved Thinking 的大模型 Agent 蒸馏实践
阿里云 PAI 团队结合交错思维的推理机制,构建了涵盖多轮交互的训练数据集,训练更符合交错思维特性的轻量级 Agent 模型,有效提升性能与响应效率。
迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升
在迁移到 EMR Serverless Spark 之后,TCO 明显下降,平台按作业生命周期弹性拉起与回收,只为实际消耗付费;同时,托管化带来了稳定性与调度效率提升;更关键的是交付确定性提升。
一站式构建 AI 数据处理 Pipeline:DataWorks Notebook + MaxCompute MaxFrame 快速入门指南
阿里云数据开发治理平台 DataWorks 联合云原生大数据计算服务 MaxCompute,为您提供一套开箱即用、安全合规、弹性可扩展的 AI 数据开发环境。
StarRocks + Paimon: 构建 Lakehouse Native 数据引擎
StarRocks 通过与 Paimon 的深度融合,正逐步构建一套完整的 Lakehouse Native 解决方案——不仅支持多源联邦分析,更在性能、功能与可观测性上实现系统性突破。
真实案例复盘:从“三套烟囱”到 All in ES,这家企业如何砍掉 40%运维成本?
尝试阿里云 Elasticsearch 企业版,体验 “ All in ES ” 带来的极简与高效。
Apache Paimon 多模态数据湖实践:从结构化到非结构化的技术演进
Paimon 作为新一代流式数据湖存储引擎,正通过一系列底层创新,构建面向 AI 原生时代的统一数据基础设施。
【NeurIPS2025】阿里云PAI团队动态数据调度方案Skrull 入选
阿里云 PAI 团队与中国科学院大学前沿交叉科学学院等单位合作的研究成果——轻量级动态数据调度方案 Skrull,论文被 NeurIPS2025 会议接收。
1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”
立即体验阿里云 ElasticSearch Serverless,用端到端监控,让流量黑洞无处遁形!
DataWorks 又又又升级了,这次我们通过 Arrow 列存格式让数据同步速度提升10倍!
DataWorks数据集成推出基于Apache Arrow列存格式的高性能同步能力,实现从“行式传输”到“列式直通”的技术跃迁。
Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器
阿里云 Hologres 作为高性能实时数仓引擎,原生提供了 Dynamic Table,并基于有状态增量计算模型,在多表关联、聚合等复杂场景下展现出显著性能优势。
OmniThoughtV:面向多模态深度思考的高质量数据蒸馏
OmniThoughtV不仅填补了开源社区在多模态复杂推理数据方面的空白,还通过一套透明、可复现的数据蒸馏机制,实现了对多模态思维链的高效提取与结构化组织。
下一页