openGauss这么多工具?到底要选哪个?(1129)

66 阅读3分钟

#openGauss #入门 #安装 #数据库 #开源

知识来源:docs-opengauss.osinfra.cn/zh/

架构设计

数据库智能参数调优工具主要架构如下图所示,主要由四部分组成:

  1. 负载生成:

    提取DBMS内部指标和query特征作为负载特征,生成相似负载。

  2. 调优模型:

    以高斯过程作为代理模型并对其进行初始化,利用探索进行参数配置选择,将推荐配置应用到DBMS后,用获得数据更新高斯过程,迭代完成后输出最终推荐配置。

  3. 参数选择:

    对所有参数进行重要性排名,选择top-n参数,以将高维空间映射到低维空间,针对低维空间进行训练。

  4. 知识迁移:

    通过workload mapping方法,进行数据库负载相似度匹配,将历史经验应用到新数据库调优中。 整体调优流程如下图所示,主要分为离线训练和在线调优两个阶段。离线训练阶段主要用于针对不同优化任务进行调优,其目的在于1)积累丰富的历史经验,构建相对 完善的知识库,以支持在在线调优时能够准确匹配出相似负载,实现快速响应;2)利用调优结果识别重要参数,缩减特征空间,提高调优效率。具体来说,首先由负载 生成器根据不同的负载特征组合生成负载,在真实数据库上执行生成的负载,同时观测数据库性能及相关内部指标。之后将观测值传递给调优模型,调优模型给出一组 推荐的参数并应用在数据库上,再次执行负载并观测结果,用于在下一轮调优中更新调优模型参数。重复上述迭代调优流程,直到调优模型收敛或达到停止条件。 基于迭代过程中产生的数据,执行参数选择模块,通过分析历史数据给出参数重要性排名,用于在线调优时缩减特征空间,提高调优效率。最后将负载-最优配置-重要 性排名合并为一条调优历史数据,保存在历史知识库中。 在线调优阶段即在真实生产场景下,快速响应、动态调优。首先从真实负载和数据库内部指标中提取负载特征, 据此在历史知识库中匹配最为相似的历史负载,通过知识迁移选择对应参数作为推荐配置应用在数据库中。如条件允许,可以在其基础上迭代运行安全调优模型,对参数 做进一步微调,直到模型收敛或达到停止条件。调优后的运行结果同样可以作为历史数据记录到知识库中。

#openGauss #入门 #安装 #数据库 #开源

知识来源:docs-opengauss.osinfra.cn/zh/