快捷键

torch.linalg.eigh

torch.linalg.eigh(A, UPLO='L', *, out=None)

计算复数厄米或实对称矩阵的特征值分解。

K\mathbb{K}R\mathbb{R}C\mathbb{C} ,复数厄米矩阵或实对称矩阵 AKn×nA \in \mathbb{K}^{n \times n} 的特征值分解定义为

A=Qdiag(Λ)QHQKn×n,ΛRnA = Q \operatorname{diag}(\Lambda) Q^{\text{H}}\mathrlap{\qquad Q \in \mathbb{K}^{n \times n}, \Lambda \in \mathbb{R}^n}

其中,当 QQ 为复数时, QHQ^{\text{H}} 是共轭转置,当 QQ 为实数时, QHQ^{\text{H}} 是转置。在实数情况下 QQ 是正交的,在复数情况下是酉的。

支持输入 float、double、cfloat 和 cdouble 数据类型。也支持矩阵批处理,如果 A 是矩阵批,则输出具有相同的批维度。

假设 A 是厄米(或对称)的,但内部不进行检查,而是:

  • 如果 UPLO = ‘L’(默认),则只使用矩阵的下三角部分进行计算。

  • 如果 UPLO = ‘U’,则只使用矩阵的上三角部分。

特征值按升序返回。

注意

当输入在 CUDA 设备上时,此函数将同步该设备与 CPU。

注意

实对称矩阵或复 Hermitian 矩阵的特征值总是实数。

警告

对称矩阵的特征向量不是唯一的,也不是连续的。由于这种非唯一性,不同的硬件和软件可能会计算出不同的特征向量。

这种非唯一性是由于在实数情况下将特征向量乘以-1 或在复数情况下乘以 eiϕ,ϕRe^{i \phi}, \phi \in \mathbb{R} 会产生矩阵的另一组有效特征向量。因此,损失函数不应依赖于特征向量的相位,因为该量没有明确定义。在计算该函数的梯度时,会检查复数输入。因此,当输入是复数且位于 CUDA 设备上时,该函数梯度的计算将同步该设备与 CPU。

警告

使用特征向量张量计算出的梯度只有在 A 具有不同的特征值时才是有限的。此外,如果任何两个特征值之间的距离接近于零,梯度将数值不稳定,因为它依赖于通过计算 1minijλiλj\frac{1}{\min_{i \neq j} \lambda_i - \lambda_j} 的特征值 λi\lambda_i

警告

用户在 CUDA 版本低于 12.1 更新 1 的 CUDA 设备上运行 eigh 时,如果输入的是大型病态矩阵,可能会看到 PyTorch 崩溃。请参阅线性代数数值稳定性以获取更多详细信息。如果出现这种情况,用户可以(1)调整矩阵输入以减少病态性,或者(2)使用 torch.backends.cuda.preferred_linalg_library() 尝试其他支持的后端。

参见

torch.linalg.eigvalsh() 仅计算厄米矩阵的特征值。与 torch.linalg.eigh() 不同, eigvalsh() 的梯度始终是数值稳定的。

torch.linalg.cholesky() 用于厄米矩阵的不同分解。Cholesky 分解提供了关于矩阵的较少信息,但比特征值分解计算速度快得多。

torch.linalg.eig() 用于计算非必要厄米方阵特征值分解的(较慢)函数。

torch.linalg.svd() 用于计算矩阵(形状为*,n,n)的更通用 SVD 分解的(较慢)函数,其中*为零个或多个批处理维度,包含对称或厄米矩阵。

torch.linalg.qr() 用于另一种(更快)的分解,适用于一般矩阵。

参数:
  • A(张量)- 形状为(*, n, n)的张量,其中*为零个或多个批处理维度,包含对称或厄米矩阵。

  • UPLO('L', 'U',可选)- 控制是否在计算中使用 A 的上三角或下三角部分。默认:'L'。

关键字参数:

out (元组,可选) – 两个张量的输出元组。如果为 None,则忽略。默认:None。

返回值:

一个命名元组(特征值,特征向量),对应于上面的 Λ\LambdaQQ

特征值始终为实数,即使 A 是复数。它还将按升序排列。

特征向量将与 A 具有相同的 dtype,并将包含特征向量作为其列。

示例::
>>> A = torch.randn(2, 2, dtype=torch.complex128)
>>> A = A + A.T.conj()  # creates a Hermitian matrix
>>> A
tensor([[2.9228+0.0000j, 0.2029-0.0862j],
        [0.2029+0.0862j, 0.3464+0.0000j]], dtype=torch.complex128)
>>> L, Q = torch.linalg.eigh(A)
>>> L
tensor([0.3277, 2.9415], dtype=torch.float64)
>>> Q
tensor([[-0.0846+-0.0000j, -0.9964+0.0000j],
        [ 0.9170+0.3898j, -0.0779-0.0331j]], dtype=torch.complex128)
>>> torch.dist(Q @ torch.diag(L.cdouble()) @ Q.T.conj(), A)
tensor(6.1062e-16, dtype=torch.float64)
>>> A = torch.randn(3, 2, 2, dtype=torch.float64)
>>> A = A + A.mT  # creates a batch of symmetric matrices
>>> L, Q = torch.linalg.eigh(A)
>>> torch.dist(Q @ torch.diag_embed(L) @ Q.mH, A)
tensor(1.5423e-15, dtype=torch.float64)

© 版权所有 PyTorch 贡献者。

使用 Sphinx 构建,并使用 Read the Docs 提供的主题。

文档

PyTorch 的全面开发者文档

查看文档

教程

深入了解初学者和高级开发者的教程

查看教程

资源

查找开发资源并获得您的疑问解答

查看资源