【优化预测】基于matlab鲸鱼算法优化CNN神经网络预测【含Matlab源码 1453期】

·  阅读 879

一、鲸鱼算法及CNN简介

1 鲸鱼优化算法(Whale Optimization Algorithm,WOA)简介 鲸鱼优化算法(WOA),该算法模拟了座头鲸的社会行为,并引入了气泡网狩猎策略。

1.1 灵感 鲸鱼被认为是世界上最大的哺乳动物。一头成年鲸可以长达 30 米,重 180 吨。这种巨型哺乳动物有 7 种不同的主要物种,如虎鲸,小须鲸,鳁鲸,座头鲸,露脊鲸,长须鲸和蓝鲸等。鲸通常被认为是食肉动物,它们从不睡觉,因为它们必须到海洋表面进行呼吸,但事实上,鲸鱼有一半的大脑都处于睡眠状态。 鲸鱼在大脑的某些区域有与人类相似的细胞,这些细胞被称为纺锤形细胞(spindle cells)。这些细胞负责人类的判断、情感和社会行为。换句话说,纺锤形细胞使我们人类有别于其他生物。鲸鱼的这些细胞数量是成年人的两倍,这是它们具有高度智慧和更富情感的主要原因。已经证明,鲸鱼可以像人类一样思考、学习、判断、交流,甚至变得情绪化,但显然,这都只是在一个很低的智能水平上。据观察,鲸鱼(主要是虎鲸)也能发展自己的方言。 另一个有趣的点是关于鲸鱼的社会行为,它们可独居也可群居,但我们观察到的大多数仍然是群居。它们中的一些物种(例如虎鲸)可以在整个生命周期中生活在一个家族中。最大的须鲸之一是座头鲸,一头成年座头鲸几乎和一辆校车一样大。它们最喜欢的猎物是磷虾和小鱼群。图1显示的就是这种哺乳动物。 在这里插入图片描述 图1 座头鲸的气泡网进食行为 关于座头鲸最有趣的事情是它们特殊的捕猎方法了。这种觅食行为被称为气泡网觅食法(bubble-net feeding method)。座头鲸喜欢在接近海面的地方捕食磷虾或小鱼。据观察,这种觅食是通过在圆形或类似数字“9”形路径上制造独特的气泡来完成的,如图 1 所示。在 2011 年之前,这一行为仅仅是基于海面观测的。然而,有研究者利用标签传感器研究了这种行为。他们捕获了9头座头鲸身上300个由标签得到的气泡网进食事件。他们发现了两种与气泡有关的策略,并将它们命名为上升螺旋(upward-spirals)和双螺旋(doubleloops)。在前一种策略中,座头鲸会潜到水下 12 米左右,然后开始在猎物周围制造一个螺旋形的泡泡,并游向水面;后一种策略包括三个不同的阶段:珊瑚循环,用尾叶拍打水面以及捕获循环。这里不展开详细描述。 但是气泡网捕食是只有座头鲸独有的一种特殊行为,而鲸鱼优化算法就是模拟了螺旋气泡网进食策略达到优化的目的。

1.2 数学建模和优化算法 1.2.1 包围捕食(Encircling prey) 座头鲸可以识别猎物的位置并将其包围。由于最优设计在搜索空间中的位置不是先验已知的,WOA 算法假设当前的最佳候选解是目标猎物或接近最优解。在定义了最佳搜索代理之后,其他搜索代理将因此尝试向最佳搜索代理更新它们的位置。这种行为由下列方程表示: 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述   图 2a 描述了等式(2)针对2D问题的基本原理,搜索代理的位置( X , Y )可以根据当前最优解的位置( X ∗ , Y ∗ )进行更新,通过调整向量 A ⃗ 和C的值,可以找到相对于当前位置下一时刻最优代理附近的不同地方。在 3D 空间中搜索代理可能的更新位置如图 2b。通过定义随机向量 r ,可以到达图 2 中所示关键点之间的搜索空间内任何位置,因此等式(2)允许任何搜索代理在当前最优解的邻域内更新其位置,从而模拟了鲸鱼的包围捕食。相似的概念也可以扩展到 n 维搜索空间。注意图2中的两幅图均是在a=1和C=1情况下的。 在这里插入图片描述 在这里插入图片描述 图2 2D和3D位置向量及其可能的下一个位置 1.2.2 气泡网攻击方式(Bubble-net attacking method)(利用阶段) 共设计了两种方法来对座头鲸的气泡网行为进行建模: 收缩包围机制:通过降低式(3)中 a 的值实现。注意 A的波动范围也通过 a降低,换句话说,A 是一个区间[-a,a]内的随机值,a 随着迭代进行从 2 降为 0。设置 A中的随机值在[-1,1]之间,搜索代理的新位置可以定义为代理原始位置与当前最优代理位置之间的任意位置。图 3a 显示了 2D 空间中当 0 ≤ A ≤ 1 0 时从 ( X , Y )靠近 ( X ∗ , Y ∗ ) 所有可能的位置。这种机制本质上就是包围捕食。 螺旋更新位置。如图 3b,该方法首先计算鲸鱼位置 ( X , Y ) 与猎物位置 ( X ∗ , Y ∗ ) 之间的距离,然后在鲸鱼与猎物位置之间创建一个螺旋等式,来模仿座头鲸的螺旋状移动: 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 (a)收缩包围机制 在这里插入图片描述 (b)螺旋更新位置 图3 WOA中实现的气泡网搜索机制 值得注意的是,座头鲸在一个不断缩小的圆圈内绕着猎物游动,同时沿着螺旋形路径游动。为了对这种同时发生的行为进行建模,假设有 50%的可能性在收缩包围机制和螺旋模型之间进行选择,以便在优化过程中更新鲸鱼的位置,数学模型如下: 在这里插入图片描述 其中 p pp 为[0,1]之间的随机数。 1.2.3搜索猎物(Search for prey)(exploration phase) 除了泡泡网方法,座头鲸还会随机寻找猎物,同样基于可变 A向量,事实上,座头鲸会根据彼此的位置进行随机搜索,因此使用随机值大于1或小于-1的 A ⃗ 来迫使搜索代理远离参考鲸鱼。与利用阶段相反,这里将根据随机选择的搜索代理来更新搜索代理在探索阶段的位置,而不是根据目前为止最优的搜索代理。该机制和 ∣ A ⃗ ∣ > 1 强调了探索,并允许WOA算法执行全局搜索。数学模型如下: 在这里插入图片描述 在这里插入图片描述 其中 X → r a n d 为从当前种群中选择的随机位置向量(表示一头随机鲸鱼)。 特定解附近满足 A ⃗ > 1的一些可能解如图 4 所示。 在这里插入图片描述 图4 WOA中的探索机制(X*是一个随机选择的搜索代理) WOA算法首先随机初始化一组解,在每次迭代中,搜索代理根据随机选择的搜索代理或到目前为止获得的最优解更新它们的位置。将 a aa 参数由 2 随迭代次数降为 0,从而由探索逐步到利用。当 ∣ A ⃗ ∣ > 1 时选择随机搜索代理,∣ A ⃗ ∣ < 1 时选择最优解更新搜索代理位置。根据 p pp 的值,WOA可以在螺旋运动和圆环运动之间进行切换。最后,通过满足终止准则来终止WOA算法。WOA算法的伪代码如图5所示。 在这里插入图片描述 图5 WOA算法伪代码 1.3 代码分析 只要明白了原理的基本流程,其实代码就没有说明困难了,咱们主要介绍一下如何实现上述分析的几个重要原理,所要优化的问题的是三十个数的平方和最小(∑ ( x 2 ) \sum(x^2)∑(x 2 ))。 (1)参数初始化。初始时主要设置代理数量和最大迭代次数即可,其他算法相关的参数因为和当前迭代次数相关,需要在迭代中设置。

SearchAgents_no=30; % 搜索代理数量
Max_iteration=500; % 最大迭代次数
``
**(2) 种群初始化**。随机初始化所有代理各个维度上的位置值,需要保证在取值范围内。

```c
Positions=rand(SearchAgents_no,dim).*(ub-lb)+lb;
复制代码

(3)种群评估。评估种群中每个代理的目标值,如有某个代理由于当前最优解,则将其设为最优解。

for i=1:size(Positions,1)
    % 计算每个代理的目标值
    fitness=fobj(Positions(i,:));
    % 更新最优解
    if fitness<Leader_score % 如果是最大化问题,这里就是">"
        Leader_score=fitness; 
        Leader_pos=Positions(i,:);
    end
end

复制代码

(4)设置和迭代次数相关的算法参数。

a=2-t*((2)/Max_iter); % 等式(3)中a随迭代次数从2线性下降至0 
%a2从-1线性下降至-2,计算l时会用到
a2=-1+t*((-1)/Max_iter);
复制代码

(5)对每个代理的每一维度进行位置更新。

% Update the Position of search agents 
for i=1:size(Positions,1)
    r1=rand(); % r1为[0,1]之间的随机数
    r2=rand(); % r2为[0,1]之间的随机数

    A=2*a*r1-a;  % 等式(3)
    C=2*r2;      % 等式(4)

    b=1;               %  等式(5)中的常数b
    l=(a2-1)*rand+1;   %  等式(5)中的随机数l
    p = rand();        %  等式(6)中的概率p
    for j=1:size(Positions,2)
        if p<0.5   
            if abs(A)>=1
                rand_leader_index = floor(SearchAgents_no*rand()+1);
                X_rand = Positions(rand_leader_index, :);
                D_X_rand=abs(C*X_rand(j)-Positions(i,j)); % 等式(7)
                Positions(i,j)=X_rand(j)-A*D_X_rand;      % 等式(8)

            elseif abs(A)<1
                D_Leader=abs(C*Leader_pos(j)-Positions(i,j)); % 等式(1)
                Positions(i,j)=Leader_pos(j)-A*D_Leader;      % 等式(2)
            end
        elseif p>=0.5

            distance2Leader=abs(Leader_pos(j)-Positions(i,j));
            % 等式(5)
            Positions(i,j)=distance2Leader*exp(b.*l).*cos(l.*2*pi)+Leader_pos(j);
        end
    end
end

复制代码

2 CNN简介 1 卷积神经网络(CNN)定义 卷积神经网络(convolutional neural network, CNN),是一种专门用来处理具有类似网格结构的数据的神经网络。卷积网络是指那些至少在网络的一层中使用卷积运算来替代一般的矩阵乘法运算的神经网络。

2 CNN神经网络图 在这里插入图片描述 CNN是一种通过卷积计算的前馈神经网络,其是受生物学上的感受野机制提出的,具有平移不变性,使用卷积核,最大的应用了局部信息,保留了平面结构信息。

3 CNN五种结构组成 3.1 输入层 在处理图像的CNN中,输入层一般代表了一张图片的像素矩阵。可以用三维矩阵代表一张图片。三维矩阵的长和宽代表了图像的大小,而三维矩阵的深度代表了图像的色彩通道。比如黑白图片的深度为1,而在RGB色彩模式下,图像的深度为3。

3.2 卷积层(Convolution Layer) 卷积层是CNN最重要的部分。它与传统全连接层不同,卷积层中每一个节点的输入只是上一层神经网络的一小块。卷积层被称为过滤器(filter)或者内核(kernel),Tensorflow的官方文档中称这个部分为过滤器(filter)。 【注意】在一个卷积层中,过滤器(filter)所处理的节点矩阵的长和宽都是由人工指定的,这个节点矩阵的尺寸也被称为过滤器尺寸。常用的尺寸有3x3或5x5,而过滤层处理的矩阵深度和当前处理的神经层网络节点矩阵的深度一致。 下图为卷积层过滤器(filter)结构示意图 在这里插入图片描述 下图为卷积过程 在这里插入图片描述 详细过程如下,Input矩阵是像素点矩阵,Kernel矩阵是过滤器(filter) 在这里插入图片描述 3.3 池化层(Pooling Layer) 池化层不会改变三维矩阵的深度,但是它可以缩小矩阵的大小。通过池化层,可以进一步缩小最后全连接层中节点的个数,从而达到减少整个神经网络参数的目的。使用池化层既可以加快计算速度也可以防止过拟合。池化层filter的计算不是节点的加权和,而是采用最大值或者平均值计算。使用最大值操作的池化层被称之为最大池化层(max pooling)(最大池化层是使用的最多的磁化层结构)。使用平均值操作的池化层被称之为平均池化层(mean pooling)。 下图分别表示不重叠的4个2x2区域的最大池化层(max pooling)、平均池化层(mean pooling) 在这里插入图片描述 在这里插入图片描述 3.4 全连接层 在经过多轮卷积层和池化层的处理之后,在CNN的最后一般会由1到2个全连接层来给出最后的分类结果。经过几轮卷积层和池化层的处理之后,可以认为图像中的信息已经被抽象成了信息含量更高的特征。我们可以将卷积层和池化层看成自动图像特征提取的过程。在提取完成之后,仍然需要使用全连接层来完成分类任务。

3.5 Softmax层 通过Softmax层,可以得到当前样例属于不同种类的概率分布问题。

二、部分源代码

%%基于鲸鱼算法改进cnn预测

clc;clear;close all

load Y1_all.mat rxSymb
load SINR1_all.mat sinr
%%
%序列的前 90% 用于训练,后 10% 用于测试
shuru=size(rxSymb,2);%输入层数
numTimeStepsTrain = floor(0.90*size(rxSymb,1));%训练样本数
numTimeStepsTest=size(rxSymb,1)-numTimeStepsTrain;%测试样本数
train_x = rxSymb(1:numTimeStepsTrain,:)';%训练集输入
train_y = sinr(1:numTimeStepsTrain,:)';%训练集输出
test_x =rxSymb(numTimeStepsTrain+1:end,:)';%测试集输入
test_y = sinr(numTimeStepsTrain+1:end,:)';%测试集输出
%输入数据是m*n形式的,m代表有多少个输入特征(数据是19个),n是有多少个样本,输出数据是1*n,输出是单输出
%数据归一化(或者标准化,看哪个效果好)
[train_x,minx,maxx, train_yy,miny,maxy] =premnmx(train_x,train_y);%归一化
test_x=tramnmx(test_x,minx,maxx);%归一化
test_y=tramnmx(test_y,miny,maxy);%归一化
%数据的一个转换,转换成MATLAB的CNN的输入数据形式,是4-D形式的,最后一维就是样本数
trainD=reshape(train_x,[shuru,1,1,numTimeStepsTrain]);%训练集输入
testD=reshape(test_x,[shuru,1,1,numTimeStepsTest]);%测试集输入
targetD = train_y;%训练集输出
targetD_test  = test_y;%测试集输出

data = sinr(numTimeStepsTrain+1:end,:)';%测试集输出
%% WOA
lb=0.001;%学习率下限
ub=0.01;%学习率上限
dim=1;%维度,即一个优化参数
SearchAgents_no=2; % 鲸鱼数量
Max_iter=50; % 迭代次数
% initialize position vector and score for the leader
Leader_pos=zeros(1,dim);%初始化领头鲸鱼的位置
Leader_score=inf; %%初始化全局最小值
%
Positions=ceil(rand(SearchAgents_no,dim).*(ub-lb)+lb);%初始化种群
Convergence_curve=zeros(1,Max_iter);%记录每代最佳适应度值
t=0;% 计时器
while t<Max_iter
    t
    for i=1:size(Positions,1)
        %返回搜索代理,超越边界的搜索空间
        Flag4ub=Positions(i,:)>ub;%变量超出上限
        Flag4lb=Positions(i,:)<lb;%变量超出下限
        Positions(i,:)=(Positions(i,:).*(~(Flag4ub+Flag4lb)))+ub.*Flag4ub+lb.*Flag4lb;%更新变量位置
 
      
            'MaxEpochs',100, ...
            'MiniBatchSize',12, ...
            'InitialLearnRate', Positions(i,:), ...%将学习率作为鲸鱼的种群变量
            'GradientThreshold',1, ...
            'Verbose',false,...
                'ValidationData',{testD,targetD_test'});
%             'Plots','training-progress',...
        
        %输入数据都是最后一维为样本数,偏偏输出要第一维为样本数,所以targetD和targetD_test都取了转置
     
predict_value=double(YPred)';%输出是n*1的single型数据,要转换为1*n的double是数据形式
 %预测数据反归一化

        rmse=sqrt(mean((data-predict_value).^2));  %使用先前计算的参数对预测去标准化。
        fitness= mean(rmse)%这里把均方差作为目标适应度值
        % 更新全局适应度值
     
    %% 更新鲸鱼位置
    a=-t*((2)/Max_iter); % a decreases linearly fron 2 to 0 in Eq. (2.3)
    % a2 linearly dicreases from -1 to -2 to calculate t in Eq. (3.12)
    a2=t*((-1)/Max_iter);
    % Update the Position of search agents
    for i=1:size(Positions,1)
        r1=rand(); % r1 is a random number in [0,1]
        r2=rand(); % r2 is a random number in [0,1]
        A=2*a*r1-a;  % Eq. (2.3) in the paper
        C=2*r2;      % Eq. (2.4) in the paper
        
        b=1;               %  parameters in Eq. (2.5)
        l=(a2-1)*rand+1;   %  parameters in Eq. (2.5)
        p = rand();        % p in Eq. (2.6)
        for j=1:size(Positions,2)
            if p<0.5
                if abs(A)>=1
                    rand_leader_index = floor(SearchAgents_no*rand()+1);
                    X_rand = Positions(rand_leader_index, :);
                
                    
                elseif abs(A)<1
                    D_Leader=abs(C*Leader_pos(j)-Positions(i,j)); % Eq. (2.1)
                    Positions(i,j)=Leader_pos(j)-A*D_Leader;      % Eq. (2.2)
                end
                
            elseif p>=0.5
                
                distance2Leader=abs(Leader_pos(j)-Positions(i,j));
                % Eq. (2.5)
                Positions(i,j)=distance2Leader*exp(b.*l).*cos(l.*2*pi)+Leader_pos(j);
                
            end
        end
    end
   
end
figure(1)
subplot(2,1,1)
plot(data(1,:),'-*','linewidth',3)
hold on
plot(YPred_best(1,:),'-s','linewidth',3)
legend('实际值','预测值')
grid on
xlabel('时间')
ylabel('数据值')
title('鲸鱼算法优化cnn预测图')
subplot(2,1,2)
stem(YPred_best(1,:)-data(1,:))
xlabel('时间')
ylabel('均方差值')
title('鲸鱼算法优化cnn预测均方差图 ' )
figure(2)
plot(Convergence_curve)
xlabel('迭代次数')
ylabel('适应度值')
title(['鲸鱼算法优化cnn适应度曲线,最佳学习率=',num2str( Leader_pos)])
复制代码

三、运行结果

在这里插入图片描述 在这里插入图片描述

四、matlab版本及参考文献

1 matlab版本 2014a

2 参考文献 [1] 包子阳,余继周,杨杉.智能优化算法及其MATLAB实例(第2版)[M].电子工业出版社,2016. [2]张岩,吴水根.MATLAB优化算法源代码[M].清华大学出版社,2017. [3]周品.MATLAB 神经网络设计与应用[M].清华大学出版社,2013. [4]陈明.MATLAB神经网络原理与实例精解[M].清华大学出版社,2013. [5]方清城.MATLAB R2016a神经网络设计与应用28个案例分析[M].清华大学出版社,2018. [6]群体智能优化算法之鲸鱼优化算法(Whale Optimization Algorithm,WOA)

分类:
人工智能
标签:
收藏成功!
已添加到「」, 点击更改