RMSNorm¶
- class torch.nn.RMSNorm(标准化形状, eps=None,逐元素仿射=True, device=None, dtype=None)[source][source] ¶
在输入的小批量上应用均方根层归一化。
此层实现了论文《均方根层归一化》中描述的操作。
RMS 是在最后
D
个维度上进行的,其中D
是normalized_shape
的维度。例如,如果normalized_shape
是(3, 5)
(一个二维形状),则 RMS 是在输入的最后 2 个维度上计算的。- 参数:
normalized_shape (int 或 list 或 torch.Size) –
输入形状来自期望的输入大小如果使用单个整数,则将其视为单例列表,此模块将在此特定大小上归一化最后一个维度,该维度预期为该特定大小。
eps(可选[浮点])- 为数值稳定性添加到分母的值。默认:
torch.finfo(x.dtype).eps()
elementwise_affine(布尔值)- 当设置为
True
时,此模块具有可学习的每个元素仿射参数,初始化为 1(对于权重)。默认:True
- 形状:
输入:
输出: (与输入形状相同)
示例:
>>> rms_norm = nn.RMSNorm([2, 3]) >>> input = torch.randn(2, 2, 3) >>> rms_norm(input)