openGauss这么多工具？到底要选哪个？（1129）#openGauss #入门 #安装 #数据库 #开源知识来源

#openGauss #入门 #安装 #数据库 #开源

知识来源：docs-opengauss.osinfra.cn/zh/

架构设计

数据库智能参数调优工具主要架构如下图所示，主要由四部分组成：

负载生成:

提取DBMS内部指标和query特征作为负载特征，生成相似负载。
调优模型:

以高斯过程作为代理模型并对其进行初始化，利用探索进行参数配置选择，将推荐配置应用到DBMS后，用获得数据更新高斯过程，迭代完成后输出最终推荐配置。
参数选择:

对所有参数进行重要性排名，选择top-n参数，以将高维空间映射到低维空间，针对低维空间进行训练。
知识迁移:

通过workload mapping方法，进行数据库负载相似度匹配，将历史经验应用到新数据库调优中。整体调优流程如下图所示，主要分为离线训练和在线调优两个阶段。离线训练阶段主要用于针对不同优化任务进行调优，其目的在于1）积累丰富的历史经验，构建相对完善的知识库，以支持在在线调优时能够准确匹配出相似负载，实现快速响应；2）利用调优结果识别重要参数，缩减特征空间，提高调优效率。具体来说，首先由负载生成器根据不同的负载特征组合生成负载，在真实数据库上执行生成的负载，同时观测数据库性能及相关内部指标。之后将观测值传递给调优模型，调优模型给出一组推荐的参数并应用在数据库上，再次执行负载并观测结果，用于在下一轮调优中更新调优模型参数。重复上述迭代调优流程，直到调优模型收敛或达到停止条件。基于迭代过程中产生的数据，执行参数选择模块，通过分析历史数据给出参数重要性排名，用于在线调优时缩减特征空间，提高调优效率。最后将负载-最优配置-重要性排名合并为一条调优历史数据，保存在历史知识库中。在线调优阶段即在真实生产场景下，快速响应、动态调优。首先从真实负载和数据库内部指标中提取负载特征，据此在历史知识库中匹配最为相似的历史负载，通过知识迁移选择对应参数作为推荐配置应用在数据库中。如条件允许，可以在其基础上迭代运行安全调优模型，对参数做进一步微调，直到模型收敛或达到停止条件。调优后的运行结果同样可以作为历史数据记录到知识库中。

#openGauss #入门 #安装 #数据库 #开源

知识来源：docs-opengauss.osinfra.cn/zh/