亚马逊云科技中国峰会:数新智能CTO原攀峰详解一站式AI原生数智平台DataCyber在Amazon EKS的实践

0 阅读7分钟

6月20日,在上海世博中心举办的亚马逊云科技中国峰会 “在 Amazon EKS 上运行高性能生成式 AI 应用” 分论坛圆满结束。本次分论坛聚焦于 Amazon EKS 在生成式 AI 应用领域的强大支撑作用,数新智能CTO原攀峰凭借其深厚的技术背景和丰富的实践经验,为现场观众带来了一场精彩绝伦且极具深度的演讲。

生成式 AI 挑战与机遇并存,Amazon EKS 成破局关键

随着生成式 AI 的快速发展,从访问多种基础模型及其最新版本到自定义基础模型所遭遇的复杂性,再到数据隐私与安全等难题,都成为制约生成式 AI 进一步发展的关键因素。然而,挑战往往与机遇并存,生成式 AI 作为一种前沿技术,其应用前景广阔,有望在众多领域实现突破和创新。

image.png

EKS 助力生成式 AI 应用:独特优势引领潮流

Amazon EKS 作为亚马逊云科技的托管 Kubernetes 服务,提供标准化、易于扩展且高度灵活的基础设施环境,与亚马逊云科技的 ML 基础设施服务紧密集成,无缝对接,让开发者能充分利用丰富的开源工具生态,快速部署生成式 AI 应用。同时,EKS 在成本优化方面表现出色,企业可根据自身需求灵活掌控数据和基础设施配置,实现生成式 AI 应用的高效运行和成本控制。

image.png

例如,通过集成开源解决方案用于 ML 专用编排,实现 GPU 共享、基于优先级的调度以及预配 / 规模调整等操作,借助 Karpenter 等工具自动执行成本优化编排,提高资源利用率,确保企业在复杂生成式 AI 应用场景中高效运作。

数新智能一站式多云 AI 原生数智平台 赋能企业高速转型

原攀峰首先介绍了数新智能的定位与核心产品。数新智能作为一家专注于一站式多云AI原生数智平台和数据价值流通的服务商,倾力打造了一站式AI原生且开放兼容的数据智能平台——DataCyber。该平台基于 AWS 云底座提供的 EC2、ECR、EKS、RDS、EFS 等基础服务,形成了完备的数据智能产品体系。

image.png

数智引擎CyberEngine基于现代化数据架构,为客户提供云原生存算分离、弹性伸缩、100% 兼容开源且极致成本优化的大数据平台底座。它以 AWS 的 S3 为统一存储,Glue 实现统一元数据管理,并提供 Spark、Flink 等云原生计算引擎,同时兼容亚马逊官方引擎 EMR、Redshift 以及第三方引擎。数据平台 CyberData 聚焦数据仓库、数据湖、湖仓一体等场景,提供一站式、全链路的大数据开发与治理平台,助力企业全方位提升数据生产力。

智能平台 CyberAI则是一站式机器学习平台及大模型 AI 应用平台,赋予开发者智能体开发、企业知识库构建等强大能力。目前,DataCyber 平台已在 AWS 云市场上架,为电商、零售、游戏等多行业数十家企业客户提供优质的数据智能产品服务,广受好评。

大模型 Agent 开发与数据平台的双向赋能

在生成式 AI 浪潮下,数据成为核心驱动力。大模型 Agent 开发对数据有着极高要求,既需要精准的结构化数据,又需融合文本、图片、视频等非结构化数据。传统数据平台难以满足这一复杂需求,而数新智能的 CyberData 数据平台凭借多模态数据湖管理能力脱颖而出。

image.png

它实现数据采集、存储、管理、处理、开放、安全等全生命周期管理,高效加速 AI 应用开发落地。这不仅为大模型 Agent 开发提供了坚实的数据基础,还反哺数据平台,推动其不断优化升级,二者相互促进、协同发展,为 AI 应用创新注入强劲动力。在大数据开发治理场景中,数新智能创新研发的 Data Agent,彻底改变了业务人员分析和获取数据的传统繁琐流程。业务人员只需用自然语言提出需求,Data Agent 便能自主规划任务、执行任务、反馈问题并动态优化,自动完成从数据清洗到 SQL 生成、执行以及报表生成的全流程,无需手动编排,极大地提升数据处理效率与质量,重塑数据开发与治理流程,引领智能化数据管理新趋势。

云上大数据平台的成本优化实践

随着 AI 时代的发展,大数据平台面临着计算存储成本激增的挑战。数新智能基于 CyberData + CyberEngine 产品,在亚马逊 EKS 上展开了深入的成本优化实践。

在数据存储层,采用对象存储和冷热分离技术,有效降低存储成本。数据计算层作为优化重点,从硬件架构选型、K8s 集群弹性伸缩、大数据集群分类以及大数据任务配置智能调优等多维度发力。在硬件架构选型上,精心挑选高性价比的计算资源,为大数据处理提供强大动力的同时控制成本。借助 Karpenter 组件,依据大数据任务的峰谷分布,精准弹性伸缩 K8s 集群,实现计算资源的按需分配,避免资源浪费。针对不同业务特性对大数据集群进行细致分类,制定差异化的资源配置策略,让资源利用更加精细化。

image.png

同时,通过大数据任务配置智能调优工具,深度分析任务运行历史指标数据,给出精准的 CPU、内存等参数调优建议。结合任务调度器,实现任务智能化调优全流程打通,持续提升任务运行效率,降低计算资源消耗。数据平台层与数据应用层则采用 Pod 级别弹性伸缩技术,针对在线微服务进行精细化成本优化,在保障服务稳定高效运行的基础上,进一步削减成本开支,全方位助力企业实现大数据平台的成本管控与效益提升。

Amazon EKS 与 DataCyber 平台推动生成式 AI 发展与企业创新

本次演讲,原攀峰详细阐述了数新智能在亚马逊 EKS 上的创新实践,从大模型 Agent 开发与数据平台的双向赋能,到云上大数据平台的成本优化,全方位展现了数新智能的技术实力与创新能力。这些实践成果不仅为数新智能自身发展筑牢根基,更为行业提供了宝贵经验与参考范式。未来,数新智能将继续深耕技术,携手亚马逊云科技等合作伙伴,推动 Data + AI 技术在更多领域的落地应用,助力企业数字化转型与智能化升级,在大数据与 AI 的融合创新之路上砥砺前行,创造无限可能。 ————————————————

                        版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
                    

原文链接:亚马逊云科技中国峰会:数新智能CTO原攀峰详解一站式AI原生数智平台DataCyber在Amazon EKS的实践