GBASE南大通用技术分享：GBase 8a数据库复杂应用内存配置建议南大通用GBase 8a数据库可从以下几个方面考量

南大通用GBase 8a数据库可从以下几个方面考量运算过程中单个 GBase 集群节点(gnode)各算子的内存需求(假定 10 节点集群):

参与运算的数据量

以一个2 亿行的表与3 千万行的表进行 join 运算，并对 join 运算结果进行 groupby聚集,最终得到的结果行数为 1.5 亿行的场景为例。参与运算的数据量为 2.3 亿行,超过 100GB(不含不参与运算的字段)，得到的结果集也超过 80GB:对于10节点集群，每节点承载的运算数据量超过 8GB，保守评估每节点运算数据量为10GB。

sql执行过程中的中间结果集大小

如两表 join 生成的 hash table 的尺寸大小; sql 执行过程中生成的临时表的大小;这些中间结果集的大小通常不会小于参与运算的原始数据量。延用上例场景，假设每个 gnode 的中间结果集大小也为 10GB。

sql 并发数

客户的业务通常都要求数据库支撑 5~100 个不等的并发。

总结

综上，单个集群节点在上述场景下的内存需求为10-20GB，在10个类似sql场景并发，单个gnode的数据库运算内存需求为 100GB以上，此外还应为gnode分配20GB 以上的内存用于数据缓存。
按照数据库使用操作系统总物理内存 60-80%的比例，在上述场景下，建议单服务器的总物理内存为 120G/0.8=150G 以上。
按照项目工程经验，复杂应用中多以 hashjoin、group by、order by 等数据库运算为主;在 gnode 服务器内存配置为 128G-200G，混合型(包含多种数据库运算)复杂应用中， GBase 集群的算子 buer 大小可如下设置(考虑并发场景，且并发数在10~20 之间):

gbase_buffer_distgrby=2G
gbase_buffer_hgrby=4G
gbase_buffer_hj=4G
gbase_buffer_sj=2G
gbase_buffer_sort=4G
gbase_buffer_result=2G
gbase_buffer_rowset=2G

并发场景情况下，还需考虑GBase集群的gbase parallel degreegbase parallel max thread in pool 参数配置。