LU分解

线性代数数值分析中,LU分解矩阵分解的一种,将一个矩阵分解为一个下三角矩阵和一个上三角矩阵的乘积,有时需要再乘上一个置换矩阵。LU分解可以被视为高斯消元法的矩阵形式。在数值计算上,LU分解经常被用来解线性方程组、且在求逆矩阵和计算行列式中都是一个关键的步骤。

线性代数

向量 · 向量空间  · 行列式  · 矩阵

定义

对于方阵   LU 分解是将它分解成一个下三角矩阵 L 与上三角矩阵 U 的乘积,也就是

 

如果适当的改变  的行的顺序或列的顺序,就可以将  做 LU 分解。

举例来说一个   的矩阵 A ,其 LU 分解会写成下面的形式:

 

事实上,并不是每个矩阵都有 LU 分解。例如,从上式可知  ,若  ,则   等于 0,故 L 或 U 是可逆矩阵,A 必须也是可逆矩阵。然而,存在着可逆矩阵 A 满足  ,这些 A 就是没有 LU 分解的例子。该问题可借由排列 A 的各行顺序来解决,最终会得到一个 A 的 PLU 分解。

PLU 分解

方阵 A 的 PLU 分解是是将它分解成一个置换矩阵 P、一个下三角矩阵 L 与上三角矩阵 U 的乘积,即

 

事实上,所有的方阵都可以写成 PLU 分解的形式,由于左乘排列矩阵  是在交换行的顺序,所以由  推得适当的交换 A 的行的顺序,即可将 A 做 LU 分解。事实上,PLU 分解有很高的数值稳定性,因此实用上是很好用的工具。

有时为了计算上的方便,会同时间换行与列的顺序,此时会将 A 分解成

 

其中 P、L、U 同上,Q 是一个排列矩阵

LDU 分解

方阵 A 的 LDU 分解是是将它分解成一个单位下三角矩阵 L、对角矩阵 D 与单位上三角矩阵 U 的乘积,即

 

其中单位上、下三角矩阵是指对角线上全是 1 的上、下三角矩阵。

事实上,LDU 分解可以推广到 A 是一般的矩阵,而非方阵。此时,L 和 D 是方阵,并且与 A 有相同的行,U 则有和 A 相同的长宽。注意到现在 U 是上三角的定义改为主对角线的下方都是 0,而主对角线是收集所有   满足 i=j。

存在性和唯一性

一个可逆矩阵可以进行LU分解当且仅当它的所有子式都非零。如果要求其中的L矩阵(或U矩阵)为单位三角矩阵,那么分解是唯一的。同理可知,矩阵的LDU可分解条件也相同,并且总是唯一的。

即使矩阵不可逆,LU仍然可能存在。实际上,如果一个k的矩阵的前k个顺序主子式不为零,那么它就可以进行LU分解,但反之则不然。

目前,在任意上一个方块矩阵可进行LU分解的充要条件已经被发现,这些充要条件可以用某些特定子矩阵的秩表示。用高斯消元法来得到LU分解的算法也可以扩张到任意域上。

任意矩阵A(不仅仅是方块矩阵)都可以进行LUP分解。其中的LU矩阵是方阵,P矩阵则与A形状一样。

正定矩阵

如果矩阵A埃尔米特矩阵,并且是正定矩阵,那么可以使,UL共轭转置。也就是说,A可以写成

 

这个分解被称作Cholesky分解。对每一个正定矩阵,Cholesky分解都唯一存在。此外,比起一般的LU分解,计算Cholesky分解更为快捷,并具有更高的数值稳定性

具体的表达式

由于LDU分解唯一存在,对给定的矩阵,可以给出相应三个矩阵LDU的具体的表达式。表达式由A主子式之比构成(因此要求它们不为零)。设 为矩阵D的对角线系数,则有 。对  的值等于A的第 个顺序主子式与第 个顺序主子式之比,其中约定 =1。

算法

LU分解在本质上是高斯消元法的一种表达形式。实质上是将A通过初等行变换变成一个上三角矩阵,其变换矩阵就是一个单位下三角矩阵。这正是所谓的杜尔里特算法(Doolittle algorithm):从下至上地对矩阵A做初等行变换,将对角线左下方的元素变成零,然后再证明这些行变换的效果等同于左乘一系列单位下三角矩阵,这一系列单位下三角矩阵的乘积的逆就是L矩阵,它也是一个单位下三角矩阵。

这类算法的复杂度一般在 左右,对充分消元的分解则不然。

杜尔里特算法

对给定的N × N矩阵

 

 

然后定义对于n = 1,...,N-1的情况如下:

在第n步,消去矩阵A(n-1)的第n列主对角线下的元素:将A(n-1)的第n行乘以 之后加到第i行上去。其中 

这相当于在A(n-1)的左边乘上一个单位下三角矩阵:

 

于是,定义为:设

 

经过N-1轮操作后,所有在主对角线下的系数都为0了,于是我们得到了一个上三角矩阵:A(N-1),这时就有:

 

这时,矩阵A(N-1) 就是U 。 下三角矩阵 的逆依然是下三角矩阵,而且下三角矩阵的乘积仍是下三角矩阵,所以 是下三角矩阵。 于是我们得到分解: 

显然,要是算法成立,在每步操作时必须有 。如果这一条件不成立,就要将第n行和另一行交换,由此就会出现一个置换矩阵P。这就是为什么一般来说LU分解里会带有一个置换矩阵的原因。

例子

将一个简单的3×3矩阵A进行LU分解:

 

先将矩阵第一列元素中a11以下的所有元素变为0,即

 

再将矩阵第二列元素中a22以下的所有元素变为0,即

 
 

还有一种方法是通过方程求解,如下所示,将以下矩阵进行LU分解:

 

由于矩阵阶数只是2,可以直接列方程解:

 
 
 
 

这个线性方程组有无数多组解。因此,可以假设其中一个是单位三角矩阵,比如说L,也就是说其对角线上的两个系数都是1。这时可以解出:

 
 
 
 

也就是说

 

稀疏矩阵分解

对于阶数很大的稀疏矩阵,有特别的简便算法来获得其LU分解:这时的LU也是稀疏矩阵。理论上来说,算法的复杂度约等于非零系数的个数,而不是矩阵的大小阶数。这些算法通过运用行和列的交换,使得过程中零系数因为操作而变成非零系数的次数减到最少。

一般的将零系数因为操作而变成非零系数的次数减到最少的方法是运用图论

应用

求解线性方程

对于给定的线性方程组

 

要解出x,可以进行以下步骤:

  1. 首先,解方程 得到 
  2. 然后解方程  得到 

在两次的求解中,我们遇到的都是三角矩阵,因此运用向前(向后)替代法就可以简洁地求解(参见三角矩阵),而不需要用到高斯消元法。然而,在将A进行LU分解时,仍然要用到高斯消元法。因此,这个方法适合在要对许多个不同的b求解时用。

求逆矩阵

求矩阵A的逆时,可以直接求LU的逆矩阵,然后代入:  。也可以将单位矩阵分解成n个列向量,然后用上面求解线性方程的方法解出逆矩阵的列向量,然后拼起来。后者的复杂度在n2级别[来源请求],较高斯法为优。

计算行列式

矩阵  可以用来快速地计算矩阵 行列式,因为det(A) = det(L) det(U),而三角矩阵的行列式就是对角线元素的乘积。如果要求L 是单位三角矩阵,那么 

同样的方法也可以应用于LUP分解,只需乘上P的行列式,即相应置换的符号差

参见

参考来源

  • Trefethen, Lloyd; Bau, David, Numerical Linear Algebra 
  • Cormen, T.H.; Leisserson, C.E; Rivest, R.L., Introduction to Algorithms 
  • Golub, Gene H.; Van Loan, Charles F., Matrix Computations 3rd, Baltimore: Johns Hopkins, 1996, ISBN 978-0-8018-5414-9 .
  • Horn, Roger A.; Johnson, Charles R., Matrix Analysis, Cambridge University Press, 1985, ISBN 0-521-38632-2 . See Section 3.5.
  • Okunev, Pavel; Johnson, Charles, Necessary And Sufficient Conditions For Existence of the LU Factorization of an Arbitrary Matrix, 1997, arXiv:math.NA/0506382 .
  • Householder, Alston, The Theory of Matrices in Numerical Analysis, 1975 .
  • LU decomposition页面存档备份,存于互联网档案馆) on MathWorld.
  • LU decomposition页面存档备份,存于互联网档案馆) on Math-Linux.
  • LU decomposition页面存档备份,存于互联网档案馆

外部链接