矩阵LU分解的MATLAB与C++实现

967 阅读3分钟

一:矩阵LU分解

矩阵的LU分解目的是将一个非奇异矩阵AA分解成A=LUA=LU的形式,其中LL是一个主对角线为11的下三角矩阵;UU是一个上三角矩阵。

比如A=[124372233]A= \begin{bmatrix} 1 & 2 & 4 \\ 3 & 7 & 2 \\ 2 & 3 & 3 \\ \end{bmatrix},我们最终要分解成如下形式:

[100310211][12401100015]\begin{bmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ 2 & -1 & 1 \\ \end{bmatrix} \cdot \begin{bmatrix} 1 & 2 & 4 \\ 0 & 1 & -10 \\ 0 & 0 & -15 \\ \end{bmatrix}

现在主要的问题是如何由矩阵AA计算得到矩阵LLUU呢?我们将在下面详细讨论。

1.1 LU分解原理

首先从矩阵UU入手,因为它是一个上三角矩阵,所以很容易想到高斯消元法,依次把矩阵AA主对角线左下角的元素消为00就得到UU了。

然后计算矩阵LL,这里有个技巧,可以这样想,正是因为有了LL,所以UU的左下部分才能被消为00,所以我们记录一下把UU的左下部分消为00时矩阵AA每行所乘的倍数,这个减去的倍数便是LL左下元素的值!

1.2 LU分解计算举例

A=[124372233](2)3×(1)[1240110233](3)2×(1)[1240110015](3)+1×(2)[12401100015]=UA=\begin{bmatrix} 1 & 2 & 4 \\ 3 & 7 & 2 \\ 2 & 3 & 3 \\ \end{bmatrix} \overset{(2)- \color{red}{3} \times (1)}{\underset{}{\to}} \begin{bmatrix} 1 & 2 & 4 \\ 0 & 1 & -10 \\ 2 & 3 & 3 \\ \end{bmatrix} \overset{(3)- \color{red}{2} \times (1)}{\underset{}{\to}} \begin{bmatrix} 1 & 2 & 4 \\ 0 & 1 & -10 \\ 0 & -1 & -5 \\ \end{bmatrix} \overset{(3)+ \color{red}{1} \times (2)}{\underset{}{\to}} \begin{bmatrix} 1 & 2 & 4 \\ 0 & 1 & -10 \\ 0 & 0 & -15 \\ \end{bmatrix} =U

在运算过程中左下相应元素减去的倍数(上面红色的数字)便是矩阵LL左下角的元素,可以得到:

L=[100310211]L= \begin{bmatrix} 1 & 0 & 0 \\ \color{red}{3} & 1 & 0 \\ \color{red}{2} & \color{red}{-1} & 1 \\ \end{bmatrix}

1.3 计算公式总结

通用计算公式是很重要的,因为有了公式之后,编程起来就方便很多了。我们可以根据上面的推导过程整理出如下伪代码:

for i=1:nfor j=i:n此时i为行下标,j为列下标Uij=Aijk=1i1LikUkjfor x=i+1:n此时x为行下标,i为列下标Lxi=(Axik=1i1LxkUki)/Uiifor \text{ } i = 1 : n \hspace{6cm} \\ for \text{ } j = i : n \quad此时i为行下标,j为列下标\\ \qquad U_{ij}=A_{ij}-\sum_{k=1}^{i-1} L_{ik}U_{kj} \hspace{1cm}\\ \qquad for \text{ } x = i+1 : n \quad 此时x为行下标,i为列下标\\ \qquad L_{xi}=(A_{xi}-\sum_{k=1}^{i-1} L_{xk}U_{ki}) /U_{ii} \hspace{0cm}\\

其中n为方阵的行或列长度,可以看出先计算矩阵UU的第一行,再计算矩阵LL的第一列,再计算矩阵UU的第二行,再计算矩阵LL的第二列,依此类推。


二:矩阵LU分解MATLAB实现

clc,clear all,close all
% 矩阵的LU分解 

%% 自己实现
A = [1 2 4;3 7 2;2 3 3] 
[n,n] = size(A);
L = eye(n,n); % L初始化为单位矩阵
U = zeros(n,n); % U初始化为零矩阵

for i = 1 : n % 根据计算公式实现
    for j = i : n
        U(i,j) = A(i,j) - sum(L(i,1 : i - 1) .* U(1 : i - 1,j)');       
    end
    for x = i + 1 : n
        L(x,i) = (A(x,i) - sum(L(x,1 : i - 1) .* U(1 : i - 1,i)')) ./ U(i,i);        
    end
end
L 
U
%% 内置函数实现

[L1,U1] = lu(A)

三:矩阵LU分解C++实现

#include <iostream>
#include <vector>
using namespace std;

int main()
{
    vector<vector<double>> a = { {1,2,4},{3,7,2},{2,3,3} };
    int n = a.size();
    vector<vector<double>> u(n, vector<double>(n));
    vector<vector<double>> l(n, vector<double>(n));

    for (int i = 0; i < n; i++) //初始化矩阵L和矩阵U
        for (int j = 0; j < n; j++)
        {
            u[i][j] = 0;
            if (i == j) l[i][j] = 1;
        }

    for (int i = 0; i < n; i++)
    {
        double sum = 0;
        for (int j = i; j < n; j++)
        {
            for (int k = 0; k <= i - 1; k++)
                    sum += l[i][k] * u[k][j];
            u[i][j] = a[i][j] - sum; //计算矩阵U
            sum = 0;
        }

        for (int x = i + 1; x < n; x++)
        {
            for (int k = 0; k <= i - 1; k++)
                    sum += l[x][k] * u[k][i];
            l[x][i] = (a[x][i] - sum) / u[i][i]; //计算矩阵L
            sum = 0;
        }
    }

    cout << "A:" << endl; //输出矩阵A
    for (int i = 0; i < n; i++)
    {
        for (int j = 0; j < n; j++)
        {
                printf("%.3f ", a[i][j]);
        }
        cout << endl;
    }

    cout << "L:" << endl; //输出矩阵L
    for (int i = 0; i < n; i++)
    {
        for (int j = 0; j < n; j++)
        {
                printf("%.3f ", l[i][j]);
        }
        cout << endl;
    }

    cout << "U:" << endl; //输出矩阵U
    for (int i = 0; i < n; i++)
    {
        for (int j = 0; j < n; j++)
        {
                printf("%.3f ", u[i][j]);
        }
        cout << endl;
    }
    return 0;
}