首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
开源技术
阿里云大数据AI技术
创建于2022-05-24
订阅专栏
分享阿里云大数据&AI开源技术
等 9 人订阅
共120篇文章
创建于2022-05-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Apache Paimon 多模态数据湖实践:从结构化到非结构化的技术演进
Paimon 作为新一代流式数据湖存储引擎,正通过一系列底层创新,构建面向 AI 原生时代的统一数据基础设施。
【NeurIPS2025】阿里云PAI团队动态数据调度方案Skrull 入选
阿里云 PAI 团队与中国科学院大学前沿交叉科学学院等单位合作的研究成果——轻量级动态数据调度方案 Skrull,论文被 NeurIPS2025 会议接收。
1TB数据,ES却收到了2TB?揪出那个客户端中的“隐形复读机”
立即体验阿里云 ElasticSearch Serverless,用端到端监控,让流量黑洞无处遁形!
DataWorks 又又又升级了,这次我们通过 Arrow 列存格式让数据同步速度提升10倍!
DataWorks数据集成推出基于Apache Arrow列存格式的高性能同步能力,实现从“行式传输”到“列式直通”的技术跃迁。
Hologres Dynamic Table:高效增量刷新,构建实时统一数仓的核心利器
阿里云 Hologres 作为高性能实时数仓引擎,原生提供了 Dynamic Table,并基于有状态增量计算模型,在多表关联、聚合等复杂场景下展现出显著性能优势。
OmniThoughtV:面向多模态深度思考的高质量数据蒸馏
OmniThoughtV不仅填补了开源社区在多模态复杂推理数据方面的空白,还通过一套透明、可复现的数据蒸馏机制,实现了对多模态思维链的高效提取与结构化组织。
打破 IK 分词“架构陷阱”——阿里云 ES Serverless 索引级词典的完美热更新实践
本文将通过一个真实事故的复盘,解析开源 IK 分词器架构设计中的不足,并介绍阿里云 ES Serverless 如何通过“索引级词典”能力,彻底解决热更新引发的搜索错配问题。
在 DataWorks 中一键部署大模型,即刻用于数据集成和数据开发
阿里云 DataWorks 发布大模型服务能力,基于 Serverless 资源组,支持用户 一键部署主流大模型,并可在 数据集成和数据开发任务中直接调用模型 API。
活动报名 | Apache Spark Meetup · 上海站,助力企业构建高效数据平台
2025年12月20日,上海 · 阿里巴巴徐汇滨江园区,Apache Spark Meetup,助力企业构建高效数据平台,欢迎报名!
Forrester发布流式数据平台报告:Ververica首次跻身领导者行列,实时AI能力获权威认可
Ververica 首次跻身 Forrester 流式数据平台领导者行列,实时 AI 能力获权威认可。
Fusion 引擎赋能:七猫如何使用阿里云 EMR Serverless Spark 实现数仓加速
七猫基于阿里云 EMR Serverless Spark 并利用 Fusion 引擎赋能实现数仓加速。
一行代码,让Elasticsearch 集群瞬间雪崩——5000W 数据压测下的性能避坑全攻略
直接让你的集群拥有“防弹护甲”,自动抵御那些足以击穿性能的高危查询。与自建相比,阿里云 ES Serverless 的架构更健壮、更安全,也更省心。
MaxCompute SQL AI:让 SQL 成为你的 AI 语言
MaxCompute SQL AI 全新上线,一句SQL就能用上大模型,零门槛让数据分析师秒变AI高手。
【新模型速递】PAI-Model Gallery云上一键部署DeepSeek-V3.2模型
阿里云 PAI-Model Gallery 已第一时间接入 DeepSeek-V3.2、DeepSeek-V3.2-Speciale 模型,提供企业级部署方案。
PAI Physical AI Notebook 详解(5):基于 Isaac-Cortex 的软件在环验证
在本期,我们隆重介绍 DSW 全新的 noVNC 功能,并结合 Isaac Sim 的协作机器人系统 Cortex,搭建软件在环验证系统(Software-In-Loop System)。
EMR AI 助手开启公测:用 AI 重塑大数据运维,更简单、更智能
阿里云正式推出 EMR AI助手(EMR Agent) ——一款专为大数据场景打造的智能运维助手,标志着EMR运维正式迈入“AI驱动”的新纪元。
朝阳永续基于阿里云 Milvus 构建金融智能投研产品“AI 小二”
通过采用 阿里云向量检索服务 Milvus 版,朝阳永续成功构建了高性能、高可靠的金融语义检索引擎,有效解决了海量非结构化数据下的检索效率、精度与稳定性难题,为“AI 小二”提供了强大的底层支撑,显著
PAI Physical AI Notebook详解4:基于仿真的GR00T-N1.5模型微调
在本期,我们将针对更复杂的VLA模型(以GR00T-N1.5为例)进行微调,同样需要经过人工演示、数据扩增、模仿学习、在环验证这几个步骤。
下一页