torch.nn.functional¶
卷积函数
对由多个输入平面组成的输入信号应用 1D 卷积。 |
|
对由多个输入平面组成的输入图像应用 2D 卷积。 |
|
对由多个输入平面组成的输入图像应用 3D 卷积。 |
|
对由多个输入平面组成的输入信号应用 1D 转置卷积算子,有时也称为“反卷积”。 |
|
对由多个输入平面组成的输入图像应用 2D 转置卷积算子,有时也称为“反卷积”。 |
|
对由多个输入平面组成的输入图像应用 3D 转置卷积算子,有时也称为“反卷积” |
|
从批处理的输入张量中提取滑动局部块。 |
|
将一系列滑动局部块组合成一个大型包含张量。 |
池化函数
对由多个输入平面组成的输入信号应用 1D 平均池化。 |
|
在 区域通过步长 步应用 2D 平均池化操作。 |
|
在 区域通过步长 步应用 3D 平均池化操作。 |
|
对由多个输入平面组成的输入信号应用 1D 最大池化。 |
|
对由多个输入平面组成的输入信号应用 2D 最大池化。 |
|
对由多个输入平面组成的输入信号应用 3D 最大池化。 |
|
计算部分逆元 |
|
计算部分逆元 |
|
计算部分逆元 |
|
对由多个输入平面组成的输入信号应用 1D 功率平均池化。 |
|
对由多个输入平面组成的输入信号应用 2D 功率平均池化。 |
|
对由多个输入平面组成的输入信号应用 3D 功率平均池化。 |
|
对由多个输入平面组成的输入信号应用 1D 自适应最大池化。 |
|
对由多个输入平面组成的输入信号应用 2D 自适应最大池化。 |
|
对由多个输入平面组成的输入信号应用 3D 自适应最大池化。 |
|
对由多个输入平面组成的输入信号应用 1D 自适应平均池化。 |
|
对由多个输入平面组成的输入信号应用 2D 自适应平均池化。 |
|
对由多个输入平面组成的输入信号应用 3D 自适应平均池化。 |
|
对由多个输入平面组成的输入信号应用 2D 分数最大池化。 |
|
对由多个输入平面组成的输入信号应用 3D 分数最大池化。 |
注意力机制
The torch.nn.attention.bias
模块包含为与 scaled_dot_product_attention 一起使用而设计的 attention_biases。
scaled_dot_product_attention(query, key, value, attn_mask=None, dropout_p=0.0, |
非线性激活函数 §
将阈值应用于输入 Tensor 的每个元素。 |
|
现场版本 |
|
元素级应用修正线性单元函数。 |
|
现场版本 |
|
元素级应用 HardTanh 函数。 |
|
|
|
应用逐元素硬 swish 函数。 |
|
应用逐元素的函数 。 |
|
应用逐元素的指数线性单元(ELU)函数。 |
|
原位版本 |
|
元素级应用, ,与 和 。 |
|
元素级应用, 。 |
|
元素级应用, 。 |
|
|
|
将函数 应用到元素级别,其中权重是一个可学习的参数。 |
|
随机化漏斗型 ReLU。 |
|
|
|
门控线性单元。 |
|
当近似参数为 'none' 时,逐元素应用函数 。 |
|
逐元素应用 。 |
|
逐元素应用硬收缩函数。 |
|
元素级应用, |
|
元素级应用,函数 |
|
元素级应用,函数 。 |
|
应用软最大函数。 |
|
应用 softmax 函数。 |
|
元素级应用软收缩函数。 |
|
从 Gumbel-Softmax 分布中采样(链接 1 链接 2)并可选择进行离散化。 |
|
应用 softmax 后跟对数运算。 |
|
元素级应用, |
|
应用元素级函数 |
|
元素级应用 Hardsigmoid 函数。 |
|
应用 Sigmoid 线性单元(SiLU)函数,元素级。 |
|
应用 Mish 函数,逐元素应用。 |
|
对每个通道在整个数据批次上应用批量归一化。 |
|
对最后若干维度应用组归一化。 |
|
对每个数据样本中的每个通道独立应用实例归一化。 |
|
应用层归一化于最后若干维度。 |
|
在输入信号上应用局部响应归一化。 |
|
应用根均方层归一化。 |
|
在指定维度上对输入执行 归一化。 |
线性函数 ¶
对传入数据进行线性变换: . |
|
对传入数据进行双线性变换: |
Dropout 函数 ¶
在训练过程中,以概率 |
|
对输入应用 alpha dropout。 |
|
随机屏蔽整个通道(通道是一个特征图)。 |
|
随机将整个通道置为零(通道是一个 1D 特征图)。 |
|
随机将整个通道置零(通道是一个二维特征图)。 |
|
随机将整个通道置零(通道是一个三维特征图)。 |
稀疏函数 ¶
生成一个简单的查找表,用于在固定字典和大小中查找嵌入。 |
|
计算嵌入包的总和、平均值或最大值。 |
|
接受形状为 |
距离函数
详细信息请见 |
|
在 dim 维度上计算 |
|
计算输入中每一对行向量的 p 范数距离。 |
损失函数
测量目标概率和输入概率之间的二元交叉熵。 |
|
计算目标与输入 logits 之间的二元交叉熵。 |
|
泊松负对数似然损失。 |
|
详细内容请见 |
|
计算输入 logits 与目标之间的交叉熵损失。 |
|
应用连接主义时序分类损失。 |
|
高斯负对数似然损失。 |
|
详细内容请见 |
|
计算 KL 散度损失。 |
|
取元素间平均绝对值差的函数。 |
|
测量元素间的平均平方误差,可选加权。 |
|
详细信息请见 |
|
详细信息请见 |
|
详细信息请见 |
|
详细信息请见 |
|
计算负对数似然损失。 |
|
计算 Huber 损失,可选加权。 |
|
计算平滑 L1 损失。 |
|
详细内容请见 |
|
计算给定输入张量之间的三元组损失,并设置一个大于 0 的间隔。 |
|
使用自定义距离函数计算输入张量的三元组间隔损失。 |
沉浸式翻译功能
将形状为 的张量元素重新排列为形状为 的张量,其中 r 是 |
|
通过将形状为 的张量元素重新排列为形状为 的张量来反转 |
|
填充张量。 |
|
对输入进行下/上采样。 |
|
上采样输入。 |
|
使用最近邻像素值对输入进行上采样。 |
|
使用双线性上采样对输入进行上采样。 |
|
计算网格样本。 |
|
根据一批仿射矩阵生成 2D 或 3D 流场(采样网格) |
DataParallel 函数(多 GPU、分布式)¶
data_parallel¶
|
在给定的 device_ids 中并行评估 module(input)模块。 |