首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
开源技术
阿里云大数据AI技术
创建于2022-05-24
订阅专栏
分享阿里云大数据&AI开源技术
等 8 人订阅
共89篇文章
创建于2022-05-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
淘宝闪购基于Flink&Paimon的Lakehouse生产实践:从实时数仓到湖仓一体化的演进之路
本文将从三个维度深入分析淘宝闪购(饿了么)基于Apache Flink和Paimon的 Lakehouse 生产实践:回顾实时数仓的演进历程,深入解析湖仓应用的落地实践,并展望未来的技术发展方向。
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由
为应对数挑战,饿了么数据团队选择StarRocks + Paimon搭建实时湖仓架构,并通过物化视图优化、RoaringBitmap 去重和大查询治理,突破了传统离线架构的瓶颈,为闪购提供坚实数据支撑
阿里云携手MiniMax构建云原生数仓最佳实践:大模型时代的 Data + AI 数据处理平台
阿里云协助MiniMax构建了全球一体化云原生数仓技术架构,以阿里云数据开发治理平台Dataworks为一站式开发治理中枢,实现了异构数据源接入、流批计算融合、实时离线数据协同及数据生命周期全链路管理
【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert: 大数据数据流写业务迁移的实践与突破
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。
[VLDB 2025]阿里云大数据AI平台多篇论文被收录
第51届VLDB Conference将于9月1日至9月5日在伦敦召开,阿里云大数据AI平台共有3篇论文被收录,研究方向包括Flink 2.0 存算分离、跨窗口对比学习异常检测和多模态慢查询根因排序。
🏆 阿里云大数据AI平台登顶 NL2SQL 权威榜单 Spider 2.0
阿里云 PAI 与 DataWorks 团队共同研发了 NL2SQL Agent,该 Agent 使用 PAI团队首创的面向真实业务场景的端到端 NL2SQL 框架 DB-Surfer。
【跨国数仓迁移最佳实践7】基于MaxCompute多租的大数据平台架构
【跨国数仓迁移最佳实践7】基于MaxCompute多租的大数据平台架构 本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战
ODPS 十五周年实录 | Data + AI,MaxCompute 下一个15年的新增长引擎
本文分享了 MaxCompute 在 Data + AI 领域所做工作的介绍,包括面向 Python 生态和 AI 计算场景的演进历史,在 Data + AI 领域构建的核心能力,以及应用场景及案例。
鹰角网络基于阿里云EMR Serverless StarRocks的实时分析工程实践
基于阿里云EMR Serverless StarRocks,鹰角网络成功构建了兼具高性能、高弹性、易运维的实时分析平台,为游戏业务的精细化运营与用户洞察提供了坚实支撑。
阿里云 AI 搜索 DeepSearch 技术实践
阿里云OpenSearch LLM版历经两年打磨,完成了RAG1.0到2.0的跨越。以DeepSearch为代表的多智能体深度搜索架构,在企业知识管理、智能客服、技术文档问答等场景中展现出强大潜力。
MaxCompute聚簇优化推荐功能发布,单日节省2PB Shuffle、7000+CU!
MaxCompute全新推出了聚簇优化推荐功能。该功能基于31天历史运行数据,每日自动输出全局最优 Hash Cluster Key,对于10 GB以上的大型Shuffle场景,直接带来显著成本优化。
ODPS 十五周年实录 | 为 AI 而生的数据平台
在AI时代,ODPS将完全为AI而生,构建下一代技术平台。今年是 ODPS 十五周年,ODPS平台在面对AI浪潮做了全新升级,推出面向Data+AI的新一代数智一体计算平台,融合Data和AI双引擎。
PAIFuser:面向图像视频的训练推理加速框架
阿里云 PAI 团队推出专为视频生成任务设计的 PAIFuser 框架。针对扩散模型尤其是DiT架构,PAIFuser通过高性能一体化训练与推理加速框架,有效解决高计算复杂度、显存消耗大、实时性不足等
【跨国数仓迁移最佳实践6】MaxCompute SQL语法及函数功能增强,10万条SQL转写顺利迁移
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解BigQuery迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第六篇,MaxCompute SQL 语法及函数功能增强。
阿里PAI-ChatLearn:大规模 Alignment高效训练框架正式开源
本文介绍了阿里云PAI团队开源的大规模Alignment高效训练框架PAI-ChatLearn。该框架旨在解决基于大型语言模型(LLM)的对话机器人(如ChatGPT)训练中的资源调度、模型并行处理和
阿里云 EMR StarRocks VS 开源版本功能差异介绍
阿里云 E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务,提供高性能、全场景、极速统一的数据分析体验。
PAI-Diffusion模型来了!阿里云机器学习团队带您徜徉中文艺术海洋
PAI-Diffusion系列模型,包括一系列通用场景和特定场景的文图生成模型,本⽂简要介绍PAI-Diffusion模型及其体验方式。
基于单机最高能效270亿参数GPT模型的文本生成与理解
针对GPT基础模型参数量大,训练&推理硬件资源消耗过高等问题,我们采用GPT+MoE的技术架构路线,探索单机最高能效的绿色低碳GPT大模型训练&推理软硬一体化适配技术在中文文本生成场景的落地可行性。
下一页