甲骨文发布MySQL自动驾驶仪,提高MySQL HeatWave服务的性能和可扩展性

315 阅读9分钟

甲骨文公司近日宣布推出MySQL Autopilot--MySQLHeatWave服务的一个新组件,这是甲骨文云基础设施(OCI)中MySQL数据库服务的内存查询加速引擎。

根据甲骨文的官方发布,MySQL Autopilot使用先进的机器学习技术来实现HeatWave的自动化,使其更容易使用,并进一步提高性能和可扩展性。没有其他云供应商为其数据库产品提供如此先进的自动化功能。

对于MySQL HeatWave客户来说,Autopilot不需要额外收费。

MySQL Autopilot将实现高查询性能的许多最重要和最具挑战性的方面自动化,包括配置、数据加载、查询执行和故障处理。它使用先进的技术对数据进行采样,收集数据和查询的统计数据,并使用Oracle AutoML建立机器学习模型,为内存使用、网络负载和执行时间建模。这些机器学习模型然后被MySQL自动驾驶仪用来执行其核心能力。

还可以阅读对Oracle JAPAC的Chris Chelliah的采访。

MySQL Autopilot使HeatWave查询优化器随着更多查询的执行而变得越来越智能,从而随着时间的推移不断提高系统性能,这是Amazon Aurora、Amazon Redshift、Snowflake或其他基于MySQL的数据库服务所没有的能力。

MySQL自动驾驶仪包括以下功能。

  • 自动配置通过对需要分析的表数据进行自适应采样,预测运行工作负载所需的HeatWave节点数量。这意味着,客户不再需要手动估计其集群的最佳规模。没有其他数据库服务提供这种能力。
  • 自动并行加载可以通过预测被加载到HeatWave的每个表的最佳并行程度来优化加载时间和内存使用。没有其他云计算供应商提供这种能力。
  • 自动数据 放置预测了应在内存中对表进行分区的列,以帮助实现查询的最佳性能。它还预测了新的列建议在查询性能方面的预期收益。这最大限度地减少了由于操作员在手动选择列时可能做出的次优选择而导致的跨节点数据移动。没有其他数据库服务提供这种能力。
  • 考虑到查询,自动编码可以确定被加载到HeatWave的列的最佳表示。这种最佳表示法提供了最佳的查询性能,并使集群的大小最小化,以使成本最小化。
  • 自动查询计划改进从查询的执行中学习各种统计数据,并可以改进未来查询的执行计划。这提高了系统的性能,因为更多的查询被运行。没有其他数据库服务提供这种能力。
  • 自动查询时间估计可以在执行查询之前估计一个查询的执行时间。这提供了一个查询所需时间的预测,使客户能够决定查询的持续时间是否太长,而是运行一个不同的查询。
  • 自动变更传播可智能地确定 MySQL 数据库中的变更应传播到 HeatWave 横向数据管理层的最佳时间。这有助于确保以正确的最佳节奏传播变化。没有其他云供应商提供这种能力。
  • 自动调度可以确定队列中哪些查询是短时运行的,并以智能方式将其优先于长时运行的查询,以减少整体等待时间。大多数其他数据库使用先进先出(FIFO)机制进行调度。
  • 如果一个或多个HeatWave节点因软件或硬件故障而无法响应,自动错误恢复会提供新节点并重新加载必要的数据。

"甲骨文公司首席企业架构师Edward Screven表示:"带有HeatWave的甲骨文MySQL数据库服务是唯一同时有效支持OLTP和OLAP的MySQL数据库,使用户能够针对其MySQL数据库运行混合工作负载或实时分析,与其他分析或基于MySQL的数据库相比,性能提高10至1000倍,成本却不到一半。

他进一步补充说:"MySQL HeatWave是OCI上增长最快的云服务之一,越来越多的客户正在将他们的MySQL工作负载转移到HeatWave。今天,我们宣布了一些创新,这些创新是甲骨文公司多年研究和先进开发的结果。这些创新的结合带来了自动化、性能和成本方面的巨大改进--进一步将HeatWave与其他数据库云服务区分开来。"

作为此次公告的一部分,甲骨文还推出了MySQL Scale-out数据管理,它可以将重载数据到HeatWave的性能提高100倍。HeatWave现在支持64个节点的集群规模,而以前是24个节点,并且能够处理高达32TB的数据,而以前是12TB。这些新的增强功能进一步加强了HeatWave相对于其主要竞争对手的价格/性能优势。

与所有其他竞争性数据库和分析云服务相比,HeatWave能够以较低的价格为分析和混合工作负载提供更好的性能。具体而言,在测试中,HeatWave出现了。

  • 比采用AQUA的Amazon Redshift的性价比高13倍-6.5倍,成本低一半(TPC-H 10TB)。
  • 比Snowflake的性价比高35倍--7倍的速度,1/5的成本(TPC-H 10TB)。
  • 比Google Big Query性价比高36倍,速度快9倍,成本低1/4(TPC-H 30TB)
  • 比Azure Synapse的性价比高15倍--速度快1/5(TPC-H 30TB)。
  • 在混合工作负载方面,性价比比亚马逊Aurora高42倍,延迟低18倍,吞吐量高110倍,成本低42%(CH-benCHmark 100G)

甲骨文公司正在公开提供基准测试代码,使客户能够通过访问这里自己运行这些基准。甲骨文公司还宣布,行业标准的TPC-DS基准现在可以使用HeatWave进行加速。

迄今为止,从亚马逊迁移到OCI上的MySQL HeatWave的客户 ,他们的成本大幅降低,云工作负载的性能也有了明显改善。

Constellation Research的副总裁兼首席分析师Holger Mueller表示:"随着甲骨文公司加快开发人员的速度,MySQL的演变仍在继续。甲骨文之前为OLTP和OLAP提供了一个单一的统一平台,消除了对多个数据库和跨数据库ETL工具的需求"。

他进一步说:"现在,甲骨文带来了新的创新,这将可能颠覆市场,大大提升了人们对开源云数据库应有的期望。通过自动驾驶仪中基于机器学习的自动化以及内存、节点和存储的扩展,甲骨文让开发人员自由地开发下一代应用程序,与他们可能尝试的任何平台相比,MySQL HeatWave运行得更快、更便宜。"

据IDC数据管理软件研究副总裁Carl Olofson称,"一些云数据库供应商继续为特定的工作负载提供专门的数据库,并假定,特别是在开源领域,开发人员喜欢手动修改参数以优化性能"。

"甲骨文公司在一个不同的轨道上,希望在一个系统中结合数据库功能。它在开源云数据库服务MySQL HeatWave中提供数据库融合和自动化。甲骨文在2020年末推出了MySQL HeatWave,带来了全面的原生云支持,并在一个数据库中统一了OLTP和OLAP,从而消除了对ETL的需求。在这个新宣布的版本中,甲骨文增加了基于机器学习的自动化,从而消除了配置、数据加载、查询执行和故障处理中的猜测和手工劳动。卡尔说:"这些自动化也是HeatWave的性能和价格/性能结果的主要因素,正如该公司公开的可重复基准所报告的那样,提供的指标应该比其他云数据库服务提供商的指标要好。

"Moor Insights & Strategy数据中心计算高级分析师Matt Kimball表示:"对于使用MySQL的企业来说,甲骨文提供了另一个投资其HeatWave产品的理由,它以Snowflake等解决方案的1/5成本提供了7倍的性能。"甲骨文继续根据客户和市场的需求调整其创新和资源。因此,对于那些希望从他们的MySQL环境中获取最大利益的人来说,应该认真看看HeatWave。"

"尚未使用HeatWave的MySQL数据库服务的开源开发者没有理由不尝试一下,"DS咨询公司的创始人兼总裁、Wikibon分析师Marc Staimer说。"Oracle不仅通过统一的OLTP和OLAP MySQL服务简化了他们的生活,而且还消除了对单独的分析数据库或数据仓库以及它们之间ETL的需要。另外,现在它还提供了无可比拟的性能和成本/性能。最新增加的功能包括MySQL自动驾驶,它已将许多繁重的手工任务自动化,从配置到数据加载和查询执行。再加上大规模的扩展能力,这种组合使得MySQL HeatWave融化了Snowflake,并通过AQUA蒸发了Amazon Redshift。"

MySQL HeatWave也被纳入了Oracle的湖心岛。OCI数据目录是湖畔小屋的单一目录,包括来自MySQL数据库服务以及Oracle自主数据库和OCI对象存储的数据。湖畔小屋的用户可以通过目录发现MySQL数据,并根据需要移动它或分析它。其他几个OCI服务,如Oracle分析云和Oracle云数据集成服务,也与MySQL HeatWave集成。

在最新的MySQL HeatWave版本中引入的新功能现在可以在所有30个Oracle云区域的OCI上使用。

Oracle发布MySQL Autopilot以提高MySQL HeatWave服务的性能和可扩展性一文出现在《印度分析杂志》上。