2020研究生数学建模B题——汽油辛烷值建模 每一问的解决思路与实验结果展示

817 阅读6分钟

----------------------2021.4.11更新------------------------------

论文下载地址

          找我代码和论文的同学有点多,不过代码是真不能给,涉及到几个课题组的研究方向,现在比赛结束一段时间了,论文倒是可以,有需要的同学自取,可以的话给个关注和点赞 ,哈哈哈哈

          论文下载地址

----------------------2021.4.11更新------------------------------

问题

二、目标 依据从催化裂化汽油精制装置采集的325个数据样本(每个数据样本都有354个操作变量),通过数据挖掘技术来建立汽油辛烷值(RON)损失的预测模型,并给出每个样本的优化操作条件,在保证汽油产品脱硫效果(欧六和国六标准均为不大于10μg/g,但为了给企业装置操作留有空间,本次建模要求产品硫含量不大于5μg/g)的前提下,尽量降低汽油辛烷值损失在30%以上。   三、问题

  1. 数据处理:请参考近4年的工业数据(见附件一“325个数据样本数据.xlsx”)的预处理结果,依“样本确定方法”(附件二)对285号和313号数据样本进行预处理(原始数据见附件三“285号和313号样本原始数据.xlsx”)并将处理后的数据分别加入到附件一中相应的样本号中,供下面研究使用。
  2. 寻找建模主要变量: 由于催化裂化汽油精制过程是连续的,虽然操作变量每3 分钟就采样一次,但辛烷值(因变量)的测量比较麻烦,一周仅2次无法对应。但根据实际情况可以认为辛烷值的测量值是测量时刻前两小时内操作变量的综合效果,因此预处理中取操作变量两小时内的平均值与辛烷值的测量值对应。这样产生了325个样本(见附件一)。 建立降低辛烷值损失模型涉及包括7个原料性质、2个待生吸附剂性质、2个再生吸附剂性质、2个产品性质等变量以及另外354个操作变量(共计367个变量),工程技术应用中经常使用先降维后建模的方法,这有利于忽略次要因素,发现并分析影响模型的主要变量与因素。因此,请你们根据提供的325个样本数据(见附件一),通过降维的方法从367个操作变量中筛选出建模主要变量,使之尽可能具有代表性、独立性(为了工程应用方便,建议降维后的主要变量在30个以下),并请详细说明建模主要变量的筛选过程及其合理性。(提示:请考虑将原料的辛烷值作为建模变量之一)。
  3. 建立辛烷值(RON)损失预测模型:采用上述样本和建模主要变量,通过数据挖掘技术建立辛烷值(RON)损失预测模型,并进行模型验证。
  4. 主要变量操作方案的优化:要求在保证产品硫含量不大于5μg/g的前提下,利用你们的模型获得325个数据样本(见附件四“325个数据样本数据.xlsx”)中,辛烷值(RON)损失降幅大于30%的样本对应的主要变量优化后的操作条件(优化过程中原料、待生吸附剂、再生吸附剂的性质保持不变,以它们在样本中的数据为准)。
  5. 模型的可视化展示:工业装置为了平稳生产,优化后的主要操作变量(即:问题2中的主要变量)往往只能逐步调整到位,请你们对133号样本(原料性质、待生吸附剂和再生吸附剂的性质数据保持不变,以样本中的数据为准),以图形展示其主要操作变量优化调整过程中对应的汽油辛烷值和硫含量的变化轨迹。(各主要操作变量每次允许调整幅度值Δ见附件四“354个操作变量信息.xlsx”)。

思路:

  1. 按照他附表二给定的规则建立两颗决策树,为啥是两颗呢,1、2、3 这两条规则是针对于特征的,而4、5是针对于样本的。然后求平均

在这里插入图片描述

  1. 找主要变量,考虑到传统的PCA这类特征抽取方法得到的低维特征是其他高维特征融合而来,难以有一个具体的物理解释与含义,不好做第四问和第五问,所以我用的是特征选择方法来做数据降维的,用的是一种 混合特征选择方法 。这一问做出来的结果是23个特征
  2. 简单的线性模型应该不行,所以我借鉴了“极限学习机”的思想建立了一个非线性模型,用极限学习机来寻找这个非线性关系
  3. 多目标问题,把问题转化为求解 Pareto 前沿解的问题,采取的是带精英策略的非支配排序的遗传算法(NSGA-II)来求解
  4. 在问题四解得各样本的相应操作变量的最优化方案之后,通过逐步调整各操作变量,并通过调整后的变量预测对应的辛烷值和硫含量。画出调整的辛烷值和硫含量的变化

过程:

                                                     第一问的两个判别树

在这里插入图片描述                                                                      第二问

在这里插入图片描述           混合特征选择的流程图 在这里插入图片描述           在这里插入图片描述

                                                                     第三问

在这里插入图片描述                                                                      第四问

在这里插入图片描述

            用到的快速非支配排序伪码 在这里插入图片描述

                                                                 

结果

                                                                     第一问

在这里插入图片描述

                                                                     第二问

在这里插入图片描述 在这里插入图片描述

                                                                     第三问

在这里插入图片描述 在这里插入图片描述

                                                                     第四问

在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述                                                                      第五问

在这里插入图片描述 在这里插入图片描述